BLOGTIMES
2010/04/22

再度ディスクを交換

  server  sakura  customersupport 
このエントリーをはてなブックマークに追加

先日、このブログをホストしているサーバの RAID の片系障害の保守を業者に行ってもらった話を書きましたが、その際に生き残っているはずのディスクからブートすることが出来なかったので、壊れているディスクを元に復旧を試みるという荒療治になりました。が、やはりこのディスクは壊れているらしく 4/20 に障害が再発してしまいました。

Apr 20 01:05:11 sailane kernel: 3w-9xxx: scsi0: AEN: ERROR (0x04:0x0009): Drive timeout detected:port=0.
# /opt/AMCC/CLI/tw_cli info c0 Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy ------------------------------------------------------------------------------ u0 RAID-1 OK - - - 232.82 ON ON Port Status Unit Size Blocks Serial --------------------------------------------------------------- p0 DEVICE-ERROR u0 232.88 GB 488397168 WD-WCAT15661540 p1 OK u0 232.88 GB 488397168 VFA100R1D6M5UK

ということで、今度は先日交換した port1 の新しいディスクを元に、port0 のディスクを付け替えるという保守を再度試みることになりました。

相変わらず良くわからないステータス表示

前回と同じく、RAID のステータスは OK なものの port0 は DEVICE-ERROR というちょっとおかしなステータスです。
試しに RAID コントローラーのライトキャッシュのフラッシュをかけさせたら、ステータスが OK に戻ってしまいました。。。。。。

# tw_cli flush Flushing write-cache on unit /c0/u0 ...Done. # /opt/AMCC/CLI/tw_cli info c0 Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy ------------------------------------------------------------------------------ u0 RAID-1 OK - - - 232.82 ON ON Port Status Unit Size Blocks Serial --------------------------------------------------------------- p0 OK u0 232.88 GB 488397168 WD-WCAT15661540 p1 OK u0 232.88 GB 488397168 VFA100R1D6M5UK

今回のメンテナンスは20分

Apr 22 18:23:48 sailane shutdown[7989]: shutting down for system reboot ・・・・ Apr 22 18:43:55 sailane syslogd 1.4.1: restart.

担当者さんからは「30分もあれば完了します」ということでしたが、実際にメンテナンスにかかった時間をログで確認すると約20分でした。
このあたりの時間がぴったり合うところはさすがサーバを沢山抱えているだけのことはありますね。

# /opt/AMCC/CLI/tw_cli info c0 Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy ------------------------------------------------------------------------------ u0 RAID-1 REBUILDING 2 - - 232.82 ON ON Port Status Unit Size Blocks Serial --------------------------------------------------------------- p0 DEGRADED u0 232.83 GB 488282256 GEK234RS0J1ASA p1 OK u0 232.88 GB 488397168 VFA100R1D6M5UK

最後に担当さんから復旧連絡の電話もらって、今回の保守内容の説明(シングルユーザーモードで起動したこととか、その状態でどのファイルをどういじったとか)を受けました。
新しいディスクのブロックサイズがちょっと小さいのが気になりますが、ひとまず両方のディスクが新しいものになったのでこれで一安心です。これで枕を高くして眠れそうです。


    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/3522
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    コメントは承認後の表示となります。
    OpenIDでログインすると、即時に公開されます。

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン