うちのファイルサーバーは、FreeBSDを使って 2.5TB×4でRAIDZ(ZFSを使ったRAID5)で7.5TBの大容量を誇っていた。このたび手狭になったのとエラーにより、HDDを新調して容量を拡張した時の作業記録を記す。
入手
で、早速、6TBのHDDを4個買ってきたわけです。
ディスクアレイのHDDが1台死んだ……
でもこれはチャンス
RAIDZなら「zpool replace」4回でストレージプールの容量が7.5TBから18TBに"圧倒的成長"
Sunと開発者に圧倒的「感謝」 pic.twitter.com/Ndp92tbbML— 太鼓屋P%手うが (@taikoyaP) December 10, 2014
ヨドバシ.comで、単価32770円(10%ポイント付き)。12/10の朝に注文したらその日の夜に届いた(笑)
作業(その1)
早速、壊れているとおぼしきHDD(/dev/ada1)を外して、zpool replaceでRAIDZを再構築する。
で、再構築は終了したのだが、残ったHDDの中にエラーが起きている部分があったので、データがいくつか死んでいた。
「不幸なことと幸運なことがあります」「不幸なことは」「ごちうさの第一羽にエラーが見つかりました」「幸運なことは」「1月から再放送があります」 pic.twitter.com/cq3ty2Ruwj
— 太鼓屋P%手うが (@taikoyaP) December 10, 2014
この写真では1個だけのエラーだったが、最終的には20個ぐらいのファイルにエラーが生じていた。
「まぁしょうがないかな」と思い、「でも不安だから」と、2個目の再構築はHDDの交換ではなく、新しいHDDをUSB接続してreplaceすることにした。
しかしその作業中に気になるのが、replaceが終了したはずの/dev/ada1が、まだreplacing中の状態になっている。その中では、old /dev/ada1 のHDDは REMOVED 状態になっていた(上の写真も参照)。ここでピンときた。「もしかして、/dev/ada1のHDDが壊れてなければ、そのHDDを追加で接続すれば、情報を吸い上げて、新しいHDDに書き込んでくれて、結果としてエラーがなくなるのでは?」
ということで、早速eSATA対応のHDDケースを買ってきて、古い/dev/ada1のHDDを接続したところ、ちゃんとHDDが認識されて、再構築の結果データエラーがなくなった! よかったよかった。
あとはeSATAのケースを活用して、HDDをreplaceしていくだけだ。
(続く)
「構築済みのRAIDZを、ディスクを交換しながら容量を拡張した(2:作業)」への2件の返信
[…] Newer […]
[…] Older […]