ネットワーク管理者の憂鬱な日常

とある組織でネットワーク管理に携わる管理者の憂鬱な日常を書いてみたりするブログ

RAID不調(1)

2年ちょっと前に構築したRAID5なストレージが不調.急に書き込みが遅くなったので,ログを見てみたらこんなエラーがいっぱい(泣).

twa0: ERROR: (0x03: 0x0202): Drive ECC error: port=1
(da0:twa0:0:0:0): WRITE(16). CDB: 8a 0 0 0 0 3 17 eb 9 62 0 0 0 80 0 0
(da0:twa0:0:0:0): CAM Status: SCSI Status Error
(da0:twa0:0:0:0): SCSI Status: Check Condition
(da0:twa0:0:0:0): MEDIUM ERROR asc:11,0
(da0:twa0:0:0:0): Unrecovered read error
(da0:twa0:0:0:0): Retries Exhausted
g_vfs_done():da0p1[WRITE(offset=6802524766208, length=131072)]error = 5


Drive ECC error: port=1ってことなので,port0〜port7まで実装しているHDDの1番目がご臨終なのか?

# camcontrol devlist
<AMCC 9550SX-8LP DISK 3.08> at scbus0 target 0 lun 0 (pass0,da0)

って感じなので,明示的にport=1となっているのを疑ってみようw

こんな時のために,smartctlは導入しとかねばなりませぬ(泣).
・・って,連休でちょうどよかったと考えるべきか.気兼ねなくメンテナンスできるし.orz

でも,ぼちぼち分散ファイルシステムあたりへの移行を検討してみるか.
これだけHDDの容量が大きくなると,RAIDのパリティ整合取るだけでも,1日かかりそうだしw

スポンサーリンク