サーバ(Solaris11)の DISK が壊れた!!!4

この記事は約3分で読めます。

4年ぶりに Solaris11 ZFS でディスクエラーを検知したので交換しました。

経緯

4年くらい経つしそろそろディスク壊れるかなーって思って scrub したら、
予兆エラーが出たので交換することに。

あーあ。

scrub 中も kernel メッセージが出ていましたし、「iostat -En」でも Hard Erros 記録。

サーバ構成

TERADRIVE。

Solaris 11 の ZFS で RAID-Z (RAID5 相当)を組んでいます。2TB x3。
詳細は以下にまとめております。フヒヒ。

以前はこの Weblog もホストしていたのですが、今は AWS に移行したので止め放題です。
やったぜ!

ディスク交換

バックアップ

半年に1回くらい外付け HDD にバックアップしているので今回も直前で実施。
これさえ終わらせておけばデータ喪失はありません。

交換ディスク手配

今回はシーゲイトの ST2000DM001 でエラーが出力されたので、
おなじシーゲイト社製の新型 ST2000DL003 に交換しました。

ディスクは「TOSHIBA」「WD」「SEAGATE」
・・・と、ロット障害回避のためなんとなくメーカーを分けています。

(時期がズレたので、一斉入れ替えとかしない限りはもうメーカーを気にしなくて良いのだけど。)

交換作業

電源停止。

# shutdown -y -g 0

富士通の PC サーバ PRIMAGY TX100S1 を使っているので、
ディスク交換はドライバー使わず5分で終わります。最高か。

ちなみに今回はライブ配信の休憩時間の間に済ませました。
ありがとうファミコンバンド!( #FCB15th

FCB!! ゲーム音楽を演奏。ファミコンバンド(FCB)

交換が終わったら電源投入し、OS にディスクの交換をしたことを伝えます。

zpool replace raidpool c3t3d0

はい、おしまい。あとは待つだけです。

リビルド

RAID-Z は使っている分しかリビルドしないという理解なのですが、
今回は結構かかったな。(33時間)

終わりに

ハードディスクは消耗品で定期的に壊れるから、交換予算を積んでおこうね!

過去ログ

タイトルとURLをコピーしました