BLOGTIMES
2014/11/17

S.M.A.R.T. のどの値を気にすれば良いか?

  hdd  systemmanagemant  paper 
このエントリーをはてなブックマークに追加

オンラインバックアップサービスの Backblaze が約40,000台の運用結果から、 HDD の S.M.A.R.T. のどの値に注目すれば良いか述べていたのでメモ。S.M.A.R.T. からは様々な値を取ることができますが、Backblaze は下記の5つの値に注目すればよいとしています。

Hard Drive SMART Stats | Backblaze Blog

From experience, we have found the following 5 SMART metrics indicate impending disk drive failure:
  • SMART 5 – Reallocated_Sector_Count.
  • SMART 187 – Reported_Uncorrectable_Errors.
  • SMART 188 – Command_Timeout.
  • SMART 197 – Current_Pending_Sector_Count.
  • SMART 198 – Offline_Uncorrectable.
We chose these 5 stats based on our experience and input from others in the industry because they are consistent across manufacturers and they are good predictors of failure.

CrystalDiskInfo では16進数になっていることが多いので併記すると、「5(0x05): 代替処理済みのセクタ数」「187(0xBB): 報告された訂正不可能なエラー(ハードウェアECCで回復できなかったエラー)」「188(0xBC): コマンドタイムアウト」「197(0xC5): 代替処理保留中のセクタ数」「199(0xC6): 回復不可能セクタ数」という感じでしょうか。僕も定期的にディスクをチェックしてみて、これらの値が0を示さなくなったらディスクの予防保守はかけています。S.M.A.R.T. 値と HDD 故障についての考察については Google が行った Failure Trends in a Large Disk Drive Population*1 が有名ですが、基本的には見ている値はこれと大きく違わないという印象です。

  • *1: Eduardo Pinheiro, Wolf-Dietrich Weber, Luiz André Barroso, "Failure Trends in a Large Disk Drive Population," Proc. of the 5th USENIX Conference on File and Storage Technologies (FAST ’07), pp.17-29, February 13-16, 2007, San Jose, CA, USA.

トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/7194
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

Identity URL: Yahoo! JAPAN IDでログイン