彷徨えるフジワラ

年がら年中さまよってます

ZFS rpool の HDD が壊れる

自宅 Solaris サーバへの ssh アクセスが死ぬほど遅い。さっき再起動したばかりなので、諸々の読み込みに時間が掛かっているのかな?とか、DNS 逆引きとかでアレしているのかも?などとも思ったが、もうそんな次元を通り越して応答が返って来ない。

で、console からアクセスして状況を確認してみると....

port 1 のデバイスahci からの要求に応えてくれないよー!(意訳)

というログ出力が。しかも出力頻度が相当に高くなっている。

あちゃー、HDD が駄目になったか?
とりあえず問題の HDD を引っこ抜いて、再起動をかけると....は? "no active partition" ?

また installgrub のし忘れか?と思ったのだが、アレの場合は "Bad PBR sig..." だしなぁ。

兎に角、確認出来ることは確認しておこう、ということで、USB boot から以下の確認作業を。

  1. "cfgadm -l": SATA HDD が認識されているか? → OK
  2. "format" 〜 "fdisk": rpool のパーティションが ACTIVE か? → OK
  3. "zpool import -f" ("-R" 指定付き): rpool の管理情報等が無事か? → OK

ということで、特に問題無さげ。うーむ、縁起物ということで installgrub しておくか?.... やっぱり boot しない .... orz

現状の Solaris のバージョンが 134 だから、111(= 2009/06) の boot USB の installgrub だと上手く行かないとか? .... 134 の boot USB でも駄目だった .... orz

あーもー、どーせーっちゅーのよ?!駄目元で別の SATA ポートに繋ぎ変えたら .... あれ?ブートしやがった!!

あれぇ〜?今回駄目になった HDD が繋がっていたポートでも boot しなかったのに?何故に?何故に?

自宅サーバで使用している GA-D525TUD は、チップセットIntel NM10 が持っている SATA ポートと、GIGABYTE 独自の SATA チップのポートの2種類あるのだが、以前は rpool 系 HDD は全て NM10 側に繋いでいて、それで問題なく boot 出来ていたのに、今回は GIGABYTE 独自 SATA チップ側じゃないと boot 出来なくなっていた。

BIOS メニューとか見ても、特に問題無さそうなんだけど、何か起動系の設定を変えちゃったか? > 自分

まぁ、とりあえず復旧できたから良しとするか。っつーか、全く蓄積しがいの無い結論だったなぁ .... orz > ポート繋ぎ変えたら問題解決

後は壊れた HDD の代替品を調達しないとなぁ。