サーバ(Solaris11)のDISKが壊れた!!!3

夜勤で夜な夜な仕事していたら携帯電話のバイブレーションが。


またかYO!!!

1回目:2015年6月25日(日立)
2回目:2016年6月20日(Seagate)
3回目:2017年1月17日(WD)

3回目のDISK故障です。そろそろ慣れっこですネ。

あーあ。

 

3回目ともなると手順も確立されてるので、あまり改めて書くこともないのですが、
このサーバを停止している時にだけ表示されるメンテナンスページを作っています。

インターネットからのトラフィックはリバースプロキシである、
「GameWatch」サーバ(ラズパイ)からWebサーバに向けられるのですが、
Webサーバが停止する場合は「GameWatch」自身がWebサーバになって
Sorryページを表示する仕組みです。
デザインもへったくれもない。

シェルスクリプトで簡単に切り替えられるようにしています。
(confファイルのシンボリックリンク張り替えてnginx restartしてるだけです。)

リバプロからWebサーバを監視して自動でSorry表示もできるのですが、
それはそれで外部からの監視で気づけないので敢えてしていません。
(リバプロから通報させればいいのだけれど。)
話を戻して、夜勤明けで買ってきたHDDと壊れたディスクを交換してreplace。

あとはディスクのリビルドを待つだけです。ZFS超扱いやすいですよね!

今回買ってきたディスクはWD20EZRZという5700rpmなのですが、
実使用量600GBで4時間程度でリビルドが完了しました。
RAID5とかと違って、使った分だけでリビルドが完了してくれるのが、
ZFSのRAID-Zの良いところですね。

夜勤明けなので仮眠して起きた頃にはリビルドが終わり、
サーバからの復旧通知も飛んできました。一件落着。

HDD代の6770円が痛い・・。

Comments are closed.