苦戦solaris
勤め先の3000人が使用しているメールシステムはだいたい20台くらいのSunの安物サーバで動いています。
で、今日はそのうちの1台、社外からのメールを受けているサーバがくたばりました。
始めはディスクのミラーリングがはずれただけかと思ったんですが、
監視ログを見てみると頻繁にリブートしてる。本体の/var/adm/messagesにもリブートの跡が。
なんか panic[cpu0] could not install isa driver とか出てるし。
で、保守契約してるとこに電話して、メールで metastat と iostat と messages を送りつけて。
結局ハードウェア交換になりました。
初回、metadb を片発にするのを忘れていたために、ハードウェアとスペアディスクを交換したものの boot せず。
保守作業員と苦戦した後に、metadb で片発にするマニュアルを発見。
で、片発にしたあとに、ハードウェアとスペアディスクを取り替えて boot 。
であとは metadb を元のミラーリング状態に戻して、再起動。
resyncingがかかったところで保守対応は完了。
結局、こんだけでした。知ってたら30分。でも知らなかったので半日潰れた。。。
ちなみにこの間、DNSを書き換えて、メール受信は送信用のサーバで代用させてた。
ちゃんと動いていた。過剰設備???
リース期限がきたら、ちょっと構成を考え直さなきゃなあ。。。