Skypeの障害は「パッチのせい」か?

Microsoftのパッチを適用したユーザーがマシンを再起動した影響で、サービス障害が起きたとSkypeは説明しているが、果たしてそこに真の原因があるのだろうか。

» 2007年08月21日 18時21分 公開
[Larry Seltzer,eWEEK]
eWEEK

 おっとごめんなさい。Skypeは自社ネットワークが先週2日にわたってダウンした理由を説明するエントリでこんなふうに言っている。実のところ、わたしは3日目になっても問題を抱えていたが、今は復旧して無事に動いている。

 簡単に言うと、Microsoftが月例パッチをリリースした後で、コンピュータのリブートが必要になり、非常に多くのSkypeクライアントがリブートし、それからほぼ同時にログインを試みた。Skypeネットワークはこの過負荷を処理できなかった。通常は同社のネットワークは「自己修復」するが、ログインが非常に多かったことから、この機能のバグが明らかになった。Skypeは以下のように説明している。

 多数の再起動によって、Skypeのネットワークリソースが影響を受け、これがログイン要求の殺到につながり、P2Pネットワークリソースの不足と相まって重大な結果をもたらしました。

 Skypeの仕組みについては多くのことが明らかにされている――ここにその技術的な分析(PDF)がある――が、同社は自社プロトコルの詳細を公開していない。今回の障害に関しては、特に「スーパーノード」に関して、Skypeが部分的にP2Pシステムであることが重要だったようだ。スーパーノードは、特にファイアウォール内で制御データを中継するための特別なクライアントのことだ。

 Skypeがダウンした理由に関する説の1つに、数少ないスーパーノードにあまりに多くのノードが接続しようとしたというものがある。あるユーザーはおそらく典型的と言えるシナリオを説明している。彼のネットワークのスーパーノードは大量のログイン要求を送りつけられ、彼はそれをDDoS(分散型サービス停止)攻撃と勘違いした。いや、これは勘違いだったのだろうか? 実質的にはDDoS攻撃だった。

 それから、Skypeの説明をバグ修正の報告だと勘違いしてはいけない。Skypeはどこにも問題を修正したとは書いていない。問題が特定されたと書いているだけだ。Skype Journalブログによると、Skypeは次に挙げることを明らかにしていない

  • 自己修復のバグが完全に解明されたかどうか(特定されただけでなく)
  • そのバグが修正されたか(発見されただけでなく)
  • 今回のようなネットワーク障害はもう再発しない(再発し得ない)のか

 復旧は自然発生的なものだった可能性もある。Skypeはそれを否定することは何も言っていない。「われわれは問題を修正した」とも言っていない。

 だから、来月またSkypeで同じ問題が起きるかもしれない。Skypeだけではない。ほかのサービスだって同様の問題に見舞われるかもしれない。月例パッチの日に同じような理由で、ほかのネットワークがダウンする可能性は想像に難くない。プログラムをロードすると、多くのソフトはブート時にアップデートをチェックする。

 当然、ここぞとばかりにMicrosoftを非難している人もいる。だが、何のためにそんなことをするのか分からない。たとえMicrosoftがリブートが必要なパッチを毎月1つリリースしても、問題は同じだ。伝えるべきことは明らかだ。多数のWindowsクライアントを抱えているサービスは、Skypeよりもきちんと大規模リブートのシナリオを想定したテストを行わなければならない。

関連キーワード

Skype | パッチ | バグ | Microsoft


Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.

注目のテーマ