BLOGTIMES
2012/08/06

AWSの障害テストツール「Chaos Monkey」

  systemmanagemant  aws  netflix 
このエントリーをはてなブックマークに追加

NetflixChaos Monkey という AWS 用の障害テストツールを公開したようなのでメモ。

米Netflix、AWSに対応するクラウドインフラ向け障害テストツール「Chaos Monkey」をリリース - SourceForge.JP Magazine : オープンソースの話題満載

Chaos Monkeyはクラウドシステムで運用中のインスタンスをランダムに無効にし障害を引き起こす機能を持つ。これにより、アプリケーションが設計通りに動くかどうかを確認できるという。実際にNetflix社内で活用されており、昨年一年で運用・テスト環境にあるインスタンス65000以上を終了させたという。柔軟性のあるアーキテクチャを持ち、AWS以外のクラウドサービスでも動くとしている。障害問題を解決して学習できるよう、デフォルトでは平日の午前9時から午後3時に動くよう設定されている。

説明を読む限り、起動しているインスタンスを実際にシャットダウンして、システム全体に影響を及ぼさないかどうかをテストするというなかなかに過激なツールになっています。障害を起こすツールとしては、 Trouble-Maker というシステムに設定ミスを埋め込むんで本当の障害を起こすというツールがありましたが、これは隔離環境で訓練を実施するものでした。それに対して、このChaos Monkeyは本番に対して障害を引き起こすという、多重化されていることが前提のクラウド環境らしい斬新なアイディアですね。システムテストツールとしてこういう方向性も面白いと思います。

参考

 ・NetflixがChaos Monkeyをオープンソースに


    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/5142
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    コメントは承認後の表示となります。
    OpenIDでログインすると、即時に公開されます。

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン