4年ぶりに Solaris11 ZFS でディスクエラーを検知したので交換しました。
経緯
4年くらい経つしそろそろディスク壊れるかなーって思って scrub したら、
予兆エラーが出たので交換することに。
あーあ。
scrub 中も kernel メッセージが出ていましたし、「iostat -En」でも Hard Erros 記録。
サーバ構成
TERADRIVE。
Solaris 11 の ZFS で RAID-Z (RAID5 相当)を組んでいます。2TB x3。
詳細は以下にまとめております。フヒヒ。
以前はこの Weblog もホストしていたのですが、今は AWS に移行したので止め放題です。
やったぜ!
ディスク交換
バックアップ
半年に1回くらい外付け HDD にバックアップしているので今回も直前で実施。
これさえ終わらせておけばデータ喪失はありません。
交換ディスク手配
今回はシーゲイトの ST2000DM001 でエラーが出力されたので、
おなじシーゲイト社製の新型 ST2000DL003 に交換しました。
ディスクは「TOSHIBA」「WD」「SEAGATE」
・・・と、ロット障害回避のためなんとなくメーカーを分けています。
(時期がズレたので、一斉入れ替えとかしない限りはもうメーカーを気にしなくて良いのだけど。)
交換作業
電源停止。
# shutdown -y -g 0
富士通の PC サーバ PRIMAGY TX100S1 を使っているので、
ディスク交換はドライバー使わず5分で終わります。最高か。
ちなみに今回はライブ配信の休憩時間の間に済ませました。
ありがとうファミコンバンド!( #FCB15th )
交換が終わったら電源投入し、OS にディスクの交換をしたことを伝えます。
zpool replace raidpool c3t3d0
はい、おしまい。あとは待つだけです。
リビルド
RAID-Z は使っている分しかリビルドしないという理解なのですが、
今回は結構かかったな。(33時間)
終わりに
ハードディスクは消耗品で定期的に壊れるから、交換予算を積んでおこうね!