うちのファイルサーバーは、FreeBSDを使って 2.5TB×4でRAIDZ(ZFSを使ったRAID5)で7.5TBの大容量を誇っていた。このたび手狭になったのと後述の理由により、HDDを新調して容量を拡張した時の作業記録を記す。
読んでられない人向けのまとめです。
- RAIDZは、HDDを全部大きいものに入れ替えてから「zpool online -e (ディスクのうちの1つ)」するとアレイの容量を拡張できます。
- HDDを入れ替えるときは、古いHDDを外して付け替えるのではなく、外付けHDDケースなどを使って、古いHDDと新しいHDDが同時に見える状態で「zpool replace」しましょう。
- HP Proliant Microserver固有の問題もありました。
きっかけ
実は以前からディスクに不良が出ており、zpool scrubすると、read/writeエラーこそ出ないがchecksumにエラーがカウントされるという状況で、当該HDDのS.M.A.R.T.エラーも観測される状況だった。これはおそらくHDDでセクタの代替処理が行われたので、そのセクタを含むブロックがチェックサムエラーになって、他のHDDの情報を参考に回復処理が行われたものと思われる。で、冬のボーナスが出たらHDDを買い換えようとは思っていた。
この画像では/dev/ada2にエラーが出ているが、その後/dev/ada3にもエラーが出始め、まずい状況ではあった。
きっかけ(その2)
FreeBSD 10.1-RELEASEに更新した(あとで重要になる)後のある日、いきなり/dev/ada1が見えなくなった。
ぎゃー、と思いながらdmesgをチェック。
すでに2台のHDDでエラーが出てるのに別の1台が完全に死んだらデータ失われるぞこりゃ、ということで、すぐさまHDDの確保に走ったのであった。
続く。
「構築済みのRAIDZを、ディスクを交換しながら容量を拡張した(1:きっかけ)」への1件の返信
[…] Older […]