最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

ログインして、InfoQのすべての体験をアンロックしましょう！お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。

ログイン

または

アカウントをお持ちでない方

登録

あなたにとって重要なトピックや同僚の最新情報を入手しましょう最新の洞察とトレンドに関する最新情報を即座に受け取りましょう。
継続的な学習のために、無料のリソースに手軽にアクセスしましょうミニブック、トランスクリプト付き動画、およびトレーニング教材。
記事を保存して、いつでも読むことができます記事をブックマークして、準備ができたらいつでも読めます。

Logo - Back to homepage

ニュースアーティクルプレゼンテーションポッドキャスト Eブック

Topics

デベロップメント

注目のデベロップメント

Spring BootによるAPIバックエンド構築実践ガイド第2版

何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

のすべてを見る development

設計/アーキテクチャ

注目の設計/アーキテクチャ

アーキテクチュラル・インテリジェンス – 次のAI

アーサー・C・クラーク氏の有名な言葉に、「十分に進歩したテクノロジーは魔法と区別がつかない」と言いました。現在、その「魔法」のような技術がAIとして知られるようになっている。人工知能は素晴らしい包括的な用語であり、マーケティングには最適だが、我々のソフトウェアに単純に追加できる特定のものを意味するものではない。それにもかかわらず、プロダクトオーナーやCEO、マーケティングチームは、あらゆるものに人...

のすべてを見る architecture-design

AIと機械学習、データエンジニアリング

注目の AIと機械学習、データエンジニアリング

AIトレンドがソフトウェアチームに変革をもたらす

クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中にあり、AIの普及でソフトウェア構築・運用・インタラクションが根本的に変わろうとしている。筆者は、SOAからマイクロサービスへの移行、コンテナからサーバーレスへの移行といった近年のIT業界の大きな変化を見届けて発表してきたが、AIはさらなる根本的な変化をもたらそうとしているように感じている。AIの影響は、コーディング作業の自動化...

のすべてを見る ai-ml-data-eng

カルチャー＆手法

注目のカルチャー＆手法

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

David Grizzanti氏が、「スタッフ・プラス」への道と、それを「科学」というより「芸術」としてとらえ、芸術を創作することとソフトウェアを創作すること、そして組織のダイナミクスに対処することの類似性について語っている。

のすべてを見る culture-methods

運用/インフラ

注目の DevOps

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

ここ数年でプラットフォーム・エンジニアリングがホットなトピックになっている。過去10年間にわたり、NetflixやSpotify、Googleがプラットフォームの構築や「ゴールデンパス」の作成、開発者エクスペリエンスの醸成に注力してきたことで先駆者となったが、現在では多くの組織が意図的に組織内開発者プラットフォームを構築し、それに倣おうとしている。スピード、安全性、効率性をもってソフトウェアを提供...

のすべてを見る devops

役に立つリンク集

地域を選ぶ

AIオールスターズ2025

“AI活用”をキーワードに「AIを使い倒し／使いこなす」企業の最前線をお届けします。

InfoQ Architect Certification

Join Luca Mezzalira for this 5-week online cohort. Master socio-technical architecture leadership.

Register Interest.

QCon London 2026

Learn what works in AI, architecture, data, security & FinTech.

Early Bird ends March 10.

QCon AI Boston

Learn how leading engineering teams run AI in production—reliably, securely, and at scale.

Early Bird ends March 10.

QCon San Francisco

Learn what's next in AI and software, from teams already doing it.

Early Bird ends March 10.

InfoQ ホームページニュース自分の冒険を選択せよ - カオス工学、QCon New York 2017にて

自分の冒険を選択せよ - カオス工学、QCon New York 2017にて

2017年10月2日読了時間 5 分

作者：

Pierre-Luc Maheu

翻訳者

h_yoshida

原文(投稿日：2017/08/22)へのリンク

NetflixのシニアカオスエンジニアであるNora Jones氏が、QCon New York 2017でカオス工学(chaos engineering)について講演した。その中で氏は、カオス工学の導入に関するさまざまなステージを示すとともに、JetとNetflixでの自身の経験について話した。

Jones氏の講演は、カオス工学の背景にある論理的根拠の説明から始まった。カオス工学は、失敗は避けられない、遅かれ早かれ必ず起こるものだ、という事実を認めるものだ。Jones氏はそれを、コンピュータは複雑である、従って故障する、という例で説明する。

可用性を確保する方法は、ユニットテストや回帰テスト、統合テストというように、さまざまなテスト手法を通じて確立されている。カオス工学はこれに新たなレベルを加える。２つのグループのいずれかのみが必要だという考え方もあるが、氏は、最高の可用性を達成するにはどちらも必要だと考えている。

カオス工学では、実験を通じてシステムを強化する。その哲学を取り入れた初期のツールとして広く知られているのが、サービスをシャットダウンすることでそのレジリエンスをテストするように設計された自動ツールであるChaos Monkeyだ。Chaos Monkeyは数年前のものだが、カオス工学が登場したのは最近である。

組織にカオスを導入する過程として、Jones氏は５つのフェーズを提示する。各フェーズはその前のフェーズよりも洗練されており、より具体的なシナリオをカバーし、新たなツールを導入する。

最初のフェーズはカオスの初期導入だ。すでにカオス(渾沌)が存在する組織にカオスを導入するのは難しい、とJones氏は指摘する。実験的に生み出したカオスと、実際の問題や機能停止を原因とするカオスの区別が付かなくなるからだ。従って、定常状態が出発点として必要となる。

次の問題は、どうやってカオスを始めるのか、ということだ。Jones氏が勧めるのは、すでに起きた状態の再現から始める方法だ。穏やかな低下と再始動は、小さく始めるには適切な出発点になる。例えば、余分なWebサーバあるいはデータベースサーバを起動すれば、想定されるような障害がほとんどのシステムで発生する。小規模から始める方法としては、QA環境で実行するという方法も推奨できる。

Jones氏はさらに、さまざまなフェーズを通じて導入する方法を重視する。運用中のシステムを故意にシャットダウンするような方法は過激であり、導入作業は繊細に扱われなくてはならない。

第２のフェーズは、カスケード故障(Cascading failure)の発生に関するものだ。カスケード故障とは故障の連鎖で、ひとつのシステムの故障が他のシステムの故障を引き起こすことで始まり、それが続くものだ。カスケード故障は、非常にまれな状況によってそれが引き起こされるまで、長期に渡って潜んでいる場合が少なくない。

Jones氏は、自身がJetで行なった実験について説明する。氏のチームは、発生させたい障害の種別を決定して、QA内で実行した。その結果、想定とは異なる障害が発生し、QAが１週間にわたって停止する事態となったのだ。この実験は潜在的な運用障害を明らかにしたという点で成功すると同時に、このようなアプローチのメリットを明らかにするという重要性を再確認させるものでもあった。障害は常に何らかの不都合を引き起こすものだが、このような障害が運用時にコントロール不能な状況で発生した場合、その損害は極めて大きなものになるということを、開発者とステークホルダは認識する必要がある。

次のフェーズは障害注入ライブラリ(failure injection library)の構築である。このライブラリは、コードを通じてカオスを直接注入することにより、カオス実験をより詳細にコントロールできる。Jones氏は、サンプルのF#ライブラリをGitHubで公開している。次のスニペットは、カオスを注入するエントリポイントとなる関数を定義するものだ。

let chaos (name:string) (shouldChaos:unit -> bool) (chaos:Async<unit>) : AsyncFilter<_,_,_,_> =
    fun (service:AsyncArrow<_,_>) req -> async {
       if shouldChaos() then 
            printfn "%s" name
            do! chaos
        return! service req 
}

第4のフェーズは、Chaos Automation Platform (ChAP)による連続的なカオスだ。ChAPはFITの欠点を克服すべく設計されたもので、FITと同じくNetflixが開発した。ChAPの目標は、あらゆるものに対してカオス実験を継続的に実行することだ。ChAPは爆発半径の最小化を重視している。特定のインスタンスに障害を集中させる。FITにオーケストレーションを追加する。

最後となる5番目のフェーズは、システム内の対象領域へのカオスの注入だ。Jetでの経験では地理的レプリケーションを対象とした。このシステムはKafkaに強く依存しており、いくつかの問題を抱えていた。チームはカオステストの対象とするKafkaに特化した、一連のシナリオを作成した。そこで得た教訓は、前述したように、カオス実験で引き起こした障害と通常の障害との区別が困難であるということだ。カオス実験を行なう前には、定常状態が必要である。

最後の言葉としてJones氏は、カオス工学の採用戦略の定義を提案している。この戦略を最も効果的にするには、企業の文化に合わせた調整が必要となる。例えば、強制的な適用が効果的か、あるいはチームやメンバを納得させる必要があるか、というような点だ。

この記事を評価

提出

提出著者連絡

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

自分の冒険を選択せよ - カオス工学、QCon New York 2017にて

この記事に星をつける

このコンテンツのトピックは QCon です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco

自分の冒険を選択せよ - カオス工学、QCon New York 2017にて

この記事に星をつける

このコンテンツのトピックは QCon です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター