1998/11/13 運営委員会
資料 2-11
システム管理業務に関する報告
◎項目一覧
月例報告
・システム障害報告
・システム更新・増強報告
・ネットワーク運用状況
個別報告事項
・APTLDサーバ設置について
・whoisサーバ更新について
作業予定
◎月例報告
§システム障害報告
1998年10月16日から本日までに発生したシステム障害について報告する。
1. 空調の故障によるサーバ障害について
* 障害の状況
10月19日早朝、事務局マシンルームの空調に障害が発生しマシンルーム内
が高温になったため、データベース処理サーバがサーバがダウンした。
* 障害の原因
室外機のファンモータ故障によるもの。
なお、今回の障害ではハードウェアには特に障害は発生しなかった。
* 障害からの復旧
故障部品の緊急修理により復旧した。
* 今後の対策
監視の強化(業者の導入等)を検討する。
2. 申請メールの到着遅延について
* 障害の状況
10月26日から27日にかけて、一部の会員プロバイダからの申請メールの
到着が遅延する障害が発生した。
* 障害の原因
今回の DB 更新作業により whois サーバ切り替え作業が必要になった影
響で、メールリレーサーバの切り替え作業を急遽行う必要が生じた。
このため、新メールリレーサーバのセットアップおよび MX レコードの切
り替え作業を10月24日(土)に行った。
26日(作業日)の時点でほとんどのネームサーバの設定が更新されていたこ
とを確認していたが、一部のネームサーバに古い記述が残っていたため、
26日から27日にかけて、該当プロバイダからのメールの到着遅延が発生し
た。
ただし、NSPIXP2 ルータでのアクセスコントロールにより旧アドレスでの
メールを停止していたため、受信メールのロストは確認されていない。
* 障害からの復旧
27日の午後前後から、自然に復旧したとの報告を受けている。
* 反省点
本障害については、十分な計画性(DNS が切り替わるまで、もう数日の猶
予を取る、同一 IP アドレスで仮リレーサーバを立てておく等)を持った
移行作業を行うことで、十分防止することができたものであった。
3. whois.nic.ad.jpにおけるシステム障害について
* 障害の状況
10月28日の午前7:00ごろから午前10:50まで、システムハングアップのた
め whois.nic.ad.jp (更新前の旧サーバ)のサービスが中断した。
* 障害の原因
障害発生時に、該当マシン(UltraEnterprise4000)のシステム LED 等は
異常を示しておらず、また syslog 等にも異常を示すログはとられていな
かったため、原因は現在に至るまで不明である。
なお、後日の調査により本障害の原因と考えられる項目として、該当マシ
ンのファームウェアはバージョンが古く、特定の条件下においてシステム
の I/O バスがハングアップする障害が報告されていたことが判明した。
* 障害からの復旧
該当マシンの緊急リセットにより復旧した。
* 障害への対応
現在の whois.nic.ad.jp は、もう1台の UltraEnterprise4000 で動作し
ており(別項を参照)、本マシンについてはセットアップ時にファームウェ
アを最新バージョンに更新している。
なお該当マシンについては、ファーム、システム等を最新版に更新後、
whois のバックアップサーバとしてセットアップすることを予定している。
4. whois サービスの再開の遅延について
* 障害の状況
システム作業の遅延により、本来復旧予定であった11月2日午前までに
whois サーバが復旧せず、当日の午後5時5分まで whois サービスが中断
した。
* 障害への対応
緊急に、whois ポートに障害を示すメッセージが出力されるプログラムを
動作させ、JPNIC の WWW サーバにおいても同様の報告を行った。
§システム更新・増強報告
1998年10月から本日までに行ったシステム上の主な更新、増強作業について
報告する。
1. 事務局メーリングリストサーバの更新について
* 作業日時・内容
10月7日に、事務局メーリングリストサーバを、本年度に導入したサーバ
用マシン(msgmgr)に移行し、同時に sendmail および CF のバージョンを
それぞれ最新(8.9.1+3.1W, 3.7Wpl2)に更新した。
2. 外部メールリレーサーバの更新について
* 作業日時・内容
10月24日に、外部からのメールリレーサーバを、本年度に導入したサーバ
マシン(extsv1: KDD ハウジングスペースに設置)に移行し、同時に sendmail
および CF のバージョンをそれぞれ最新(8.9.1+3.1W, 3.7Wpl2)に更新し
た。
3. whoisサーバシステム更新について
* 作業日時・内容
10月末から11月にかけて、whois サーバの新規導入を行った。
作業内容等については、別途報告を参照のこと。
4. ネームサーバ SOA レコードのバージョン番号の更新について(2000 年対応)
* 作業日時・内容
11月12日更新分より、JPNICが管理しているゾーンファイルの SOA 部の
バージョン番号を、従来の YYMMDDVV フォーマットから、
YYYYMMDDVV(年の部分を4桁とする)フォーマットを出力するように変更した。
§ネットワーク運用状況
NSPIXP2(KDDハウジングスペース)等における、ネットワーク運用状況につい
て報告する。
1. peering 状況等
* 10月26日に TTNet(AS4716)と覚え書き(先方のフォーマット)を交換し、
NSPIXP2 経由でのトラフィックの交換を開始した。
* 現在、JPNIC では NSPIXP2 において 39 箇所の組織等と peering を行っ
ている。
2. 今後について
* JPNICの公共性を考慮した場合、基本的に NSPIXP2 のすべての組織と
peering を行うことが望ましいと考えられる。
* 今後、準備が出来次第 NSPIXP2 におけるトラフィック等の利用状況に関
する情報も徐々に分析していきたいと考えている。
◎個別報告事項
システム関連の作業のうち、特に詳細に報告すべき事項について報告する。
§APTLDサーバ設置について
APTLD サーバを KDD ハウジングスペース内に設置し、WWW サーバ、メール
サーバ環境等のセットアップを行った。
サーバマシンの納品が遅れたため、現在データディスクを別マシンに設置し、
バーチャルホスト機能を用いて運用中である。
(下記作業予定も参照のこと)
§whoisサーバ更新について
10月末から11月にかけて、DB システム更新に伴う whois サーバの更新作業
を行った。ここでは、主としてシステム関連の作業内容について報告する。
* 作業内容
(1)OSの更新
- ファームウェアの更新(パッチ 103346-13)
- 従来の Solaris2.5.1 から、Solaris2.6 98/5 Hardware release に更新
- 最新の Recommended パッチのアプライ
(2)Solstice DiskSuiteの導入
- Sybase のデータディスク、トランザクションログディスクのミラー化
- アクセスログ保存用ディスクの Raid 5 化
- DiskSuite へのパッチ(104172-10)の適用
* バグの除去
* 2,000 年問題への対応
(3)システム設定のチューニング
- 1プロセスが同時にオープン可能なファイルを従来の 64 から 1024 に変更
- /var、スワップの増強
- 共有メモリ領域を 256M に増強(Sybase 用)
(4)Sybase関連の更新
- バージョン10からバージョン11(最新版)に更新
- トランザクションログの自動処理(自動運転に対応)
- Sybase が使用するデータ領域を従来の UNIX ファイルから raw デ
バイスに変更(アクセス速度増強を図るため)
- 同時に接続可能なユーザ数をデフォルトの 25 から 100 に変更
- ストアド・プロシージャのキャッシュ領域を2倍に変更
- 該当マシンは 4CPU モデルのため、dataserver プロセスが常に3つ
常駐するように設定(1つは一般ジョブ用)
◎作業予定
今後1ヶ月以内に予定されているシステム関連の作業について報告する。
§APTLD サーバインストール
APTLD サーバマシンが10月20日に納品され、現在システムの設定作業を行っ
ている。作業が完了次第現在のサーバ(一時的に別サーバと共存)を、独立し
たサーバに変更予定。
§旧 whois サーバの更新
旧 whois サーバマシンを現在の whois サーバマシンと同様のシステム構成
に更新し、whois サーバとして設定するための準備作業を行う予定。
§事務局設備の増強
人員増加に伴い、事務局のホームディレクトリ用ディスク、ネットワーク
設備(スイッチングハブ)等の増強を行う予定。
(以上)