BLOGTIMES
2019/08/27

AWS の障害原因は空調管理の障害によるサーバのオーバーヒート

  aws  systemdown 
このエントリーをはてなブックマークに追加

先日の AWS 東京リージョンの障害では、多数のサービスに影響が出ていましたが、その原因が AWS からアナウンスされていたのでメモ。

これによると、冗長化されているセンター冷却のための制御システムが多重障害を起こしてセンターが冷却できない状況になってしまったため、サーバがオーバーヒートしてしまったようですね。あまりなじみのない人には「たかが空調くらいで?」という感じがするかもしれませんが、大電力を消費するサーバが多数格納されているデータセンターは空調が止まると、室温がすぐに 50℃ とかになります

Summary of the Amazon EC2 Issues in the Asia Pacific (Tokyo) Region (AP-NORTHEAST-1)

日本時間 2019年8月23日 12:36 より、東京リージョン (AP-NORTHEAST-1) の単一のアベイラビリティゾーンで、オーバーヒートにより一定の割合の EC2 サーバの停止が発生しました。この結果、当該アベイラビリティゾーンの EC2 インスタンスへの影響及び EBS ボリュームのパフォーマンスの劣化が発生しました。このオーバーヒートは、影響を受けたアベイラビリティゾーン中の一部の冗長化された空調設備の管理システム障害が原因です。


    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/11178
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン