先週のことですがKDDIの回線にトラブルがありauの携帯電話が数日間使えなくなる問題がありました。ビジネスにも多大な影響がありました。

今回の問題は、KDDIの携帯電話サービスのシステムの中の一部のルーターを交換したことを発端に始まっています。ルーターの交換に伴って行われたネットワーク網の一部の組み換えがうまくいかず、一部の音声通話が15分ほど不通となりました。問題に気付いてすぐに元に戻しましたが、サービスの停止状態が3日間続くことになりました。

通信障害が3日間も続いた背景は、携帯電話サービスを支えるシステムが15分の通話不通で起こったデータの差異を自己修復しようとして頑張った結果ということのようです。電話システムを支えるために作られた自己修復の高度なプログラムが、過剰に動作して自らのシステムをダウンさせた格好です。

莫大なデータ通信を担っているシステムのメンテナンスがいかに難しいかが分かる事故だと思います。銀行システムなども近いですが、やはり動いているシステムを動かしながらメンテナンスするのは相当に難しいということです。KDDIにはクレームが多数寄せられたそうですが、システム開発に携わる者としましては、許してあげてほしい、と思ってしまいます。

規模こそ小さいですが、オーセブンも橘サーバーなどの年中無休のサービスを運用しています。ですから、こういう事故を見ると気が引き締まる思いもするのですが、それにも増して、同情の思いが強くなります。ユーザーさんを便利にしようとすればそれだけ、安全に運用しようと頑張ったがために、事故のインパクトが大きくなるように見えるからです。