1999/4/16 運営委員会
資料 2-11
システム管理業務に関する報告(1999年3月18日~1999年4月15日)
項目一覧
1. ワクチンソフトの緊急導入に関する報告
2. whoisサービスの障害および緊急対策に関する報告
1. ワクチンソフトの緊急導入
4月1日から4月5日にかけて、事務局のすべての Windows マシンについて、
ワクチンソフトの緊急導入および全てのファイルに対する感染チェック
を実施した。
その結果、現時点でウイルスの感染は発見されなかった。
2. whoisサービスの障害および緊急対策
3月30日から4月12日までの間、whoisサーバ上の過負荷により、whois サー
ビスが断続的に不安定となる状況が発生した。
ここでは、今回の障害に関する経過報告、事務局で実施した緊急対策の
内容、および今後の障害防止対策の方針について報告する。
1) 障害に関する経過報告
・3月30日 15:10~17:46
第1回目の障害発生(whoisサーバが過負荷状態となり、アクセスに支
障が発生)。
該当時間において whois サーバへのアクセス数の極端な増大を観測。
・4月1日 19:15~22:15
第2回目の障害発生。
前日と同様、whois サーバへのアクセス数の極端な増大を観測。
この日以降、事務局における対策が完了する4月12日までのほぼ毎日、
平日のアクセス集中時に whois サーバの障害の発生を観測。
2) 緊急対策の内容
今回緊急対策として、
[1]whoisサーバの処理能力を向上させるための対策
[2]whoisサーバの信頼性の向上を図るための対策
の2点を行った。以下、それぞれの内容について報告する。
§1 whoisサーバの処理能力向上のための対策
(1)アクセス状況の記録の際のIPアドレス逆引きの抑制
whoisサーバ側でアクセス状況を記録する際のIPアドレス逆引きを
抑制し、統計情報の収集の際に別途一括変換する方式に変更した。
(2)データ更新処理の改良
複数のwhoisデータベース更新プロセスが同時に動作しないよう、
排他制御の機構を改良した。
(3)高効率化(必要なプロセス数の抑制)
whoisサーバプログラムを改良し、従来複数の子プロセスで行ってい
たアクセス状況の記録、漢字コードの変換等の処理を同一プロセスに
統合化することにより、1件あたりの検索に必要なプロセス数を抑制
し、効率化を図った。
(4)入力タイムアウト値の調整
一定期間whoisサーバへの入力が得られなかった場合の処理を改良し、
不必要なコネクションが残存しないよう対策した。
(5)データベースディスク格納構成の変更
参照頻度の多いドメイン情報、ネットワーク情報、および1件あたり
の情報量の大きい接続情報をそれぞれ別の物理ディスクに分離し、
I/O負荷の分散および効率化を図った。
(6)データベースサーバにおける設定値の最適化
データベースサーバ(Sybase)における各種設定値を見直し、最適化を
行った。
(7)最大接続数の設定
過負荷状態に陥るのを防止するため、whoisサーバへの最大接続数
(最大500)を設定した。
※今回の対策終了後は、本上限値への到達は現在まで観測されていない。
§2 whoisサーバの信頼性向上のための対策
(1)データベースディスクのミラー化
Sybase側でデータベースのミラー化し、すべてのデータについて2つ
の異る物理ディスク上に保持する設定を行い、データの信頼性の向上
を図った。
(2)LocalDirectorの活用
LocalDirectorによる二重化の設定準備を行った(下記参照)。
2) 今後の障害防止対策の方針
現在、whoisサーバ自体を複数個準備(二重化)することにより、whoisサー
ビスのパフォーマンスおよび信頼度を向上させる作業が進行中である。
現在、既に LocalDirector 側の設定、試験および二重化対象のサーバマ
シンのシステム側の設定は終了しており、今後事務局内における二重化
のテスト等を経た上で、運用を開始する予定である。
また、同一ホストからの大量検索に対する対策もあわせて行う予定である。