Amazon Web Servicesの安定性と9月13日の障害

原文(投稿日：2013/09/20)へのリンク

9月13日の朝、Amazon Web Services (AWS)のUS East 1リージョンで障害が発生した。この障害によってこのAWS最大で最古のロケーションを使っているHeroku、Github、CMSWireなど多くの人気アプリケーションが動作しなくなった。

この最新の障害が起きる数日前、Ben Kepes氏は次のように書いていた。'AWSで障害が起きるときはいつも、西部のゾーンがサービス停止する。'氏は続けてアナリストのRené Büst氏の記事に言及している。この記事にはUS East 1リージョンを'古く安くて壊れやすい'と説明している。

Amazonは詳しい事後報告をしていないが、この障害はネットワークに関する問題が原因のようだ。2011年4月の障害もネットワーク関連だったが、2012年12月と2012年10月の障害はElastic Load Balancer (ELB)とElastic Block Storage (EBS)が原因だとされている。ネットワークとEBSの障害が特に致命的になってしまうのは、このふたつの障害はアベイラビリティゾーン全体の障害を引き起こしたり、さらに上位の耐障害性を提供するサービス(ELBのような)のダウンを引き起こしてしまうからだ。

普通アプリケーションの所有者はクラウド向けの不安定さを前提とした設計ではなく、従来のアーキテクチャを使い、ひとつのリージョンの中の複数のアベイラビリティゾーンを使ったり、複数のリージョンを使ったりしていない。しかし、障害を前提とした設計をしても障害を確実に防げるとは限らない。Netflixと'simian army chaos monkeys'はクラウド向け設計のお手本のように言われる。彼らは定期的に故意に障害を発生させ動作確認をしているが、ときには(クリスマスイブの障害のような)負荷に対処するためのキャパシティが足りない場合もあり、サービス低下が原因で離れていってしまった顧客もいる。

US East 1の障害や障害を防ぐためのサービスの障害によってAmazonは競合に付け入るすきを与えてしまっている。Googleは最近Google Compute Engine向けに負荷分散サービスを提供しており、しっかりとしたシステムとして設計することを推奨している。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは Cloud です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco