BLOGTIMES
2017/11/06

Slackの大規模障害の原因は

  slack  systemdown 
このエントリーをはてなブックマークに追加

Slack の先日の大規模障害で大変だった人も多いと思いますが、Slack から障害の詳細が公表されていたのでメモ。

ポイントは以下の2点になりますが、不具合であるという直接的な表現は含まれていません

  • 定期的なサーバへのソフトウェアの更新作業(の不具合?)によって全てのユーザーとの接続が切断され、再接続できなくなった。
  • 問題を認識後に大量のリクエスト(おそらく切断されたユーザーの再接続処理)を捌くためにハードウェアを増強し、システムの過負荷を避けるために再接続対して流量制限を行った。

参考

Slack System Status

This was the result of a routine internal deployment of software to our servers which unfortunately caused all of our customers to become disconnected, and left them unable to reconnect.
Once we identified the problem, we worked to scale up new hardware to process the bulk of the requests. To avoid further overloading the system when folks came back online, we used standard rate limits to allow for gradual reconnection.

    トラックバックについて
    Trackback URL:
    お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
    このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/9741
    Trackbacks
    このエントリにトラックバックはありません
    Comments
    愛のあるツッコミをお気軽にどうぞ。[policy]
    古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
    コメントはありません
    Comments Form

    コメントは承認後の表示となります。
    OpenIDでログインすると、即時に公開されます。

    OpenID を使ってログインすることができます。

    Identity URL: Yahoo! JAPAN IDでログイン