BT

最新技術を追い求めるデベロッパのための情報コミュニティ

English edition
Chinese edition
Japanese edition
French edition

寄稿

ここに入力

電子メール

パスワード

InfoQアカウントのメール

再設定用のメールを再送する

Login with:

Google Microsoft Twitter Facebook

アカウントをお持ちでない方

サインアップ/ログイン

Logo - Back to homepage

ニュースアーティクルプレゼンテーションポッドキャスト Eブック

Topics

デベロップメント

Java
Clojure
Scala
.Net
モバイル
Android
IoT
HTML5
JavaScript
Functional Programming

注目のデベロップメント

Spring BootによるAPIバックエンド構築実践ガイド第2版

何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。この本では、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

のすべてを見る development

設計/アーキテクチャ

Architecture
エンタープライズアーキテクチャ
パフォーマンス&スケーラビリティ
Design
デザインパターン
セキュリティ

注目の設計/アーキテクチャ

12のソフトウェア・アーキテクチャの落とし穴とその避け方

成功するソフトウェアアーキテクチャを開発するのはシンプルだが、簡単ではない。QARを理解し、QARを最大限に満たすトレードオフを理解し、実行するには、洞察力と経験が必要であり、その多くはアーキテクチャ自体の実験を繰り返すことで集めなければならない。プロセス自体は単純だが、考慮すべきトレードオフはしばしば難しく、簡単な答えはめったにない。

のすべてを見る architecture-design

AIと機械学習、データエンジニアリング

Big Data
データベース

注目の AIと機械学習、データエンジニアリング

AI、ML、データエンジニアリングのInfoQトレンドレポート - 2023年9月

In this annual report, the InfoQ editors discuss the current state of AI, ML, and data engineering and what emerging trends you as a software engineer, architect, or data scientist should watch. We cu...

のすべてを見る ai-ml-data-eng

カルチャー＆手法

Agile
リーダーシップ
Team Collaboration
テスト
UX
Scrum
Lean/Kanban

注目のカルチャー＆手法

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

As an engineering manager, it is your responsibility to help facilitate creative thinking skills among the development team, but that's easier said than done. This article provides advice on how can y...

のすべてを見る culture-methods

運用/インフラ

Automation
Containers
クラウドコンピューティング

注目の DevOps

Low Code/No Codeを採用する：確認するべき6つの適性

LCNC（ローコード/ノーコード）プラットフォームは、プログラマーだけでなくプログラマーでなくても、最小限のコーディングとワンクリックのデプロイメントで、アプリケーションソフトウェアを開発できるよう設計されている。ドラッグ＆ドロップ方式のインターフェースなどを利用することで、開発・デプロイメントプロセスを簡素化し、効率的なアプリケーション開発とデプロイメントを実現する。

のすべてを見る devops

役に立つリンク集

InfoQについて
InfoQのライター
寄稿
C4Mediaについて
Diversity

地域を選ぶ

En
中文
日本
Fr

QCon London

Discover new ideas and insights from senior practitioners driving change in software. Attend in-person.

InfoQ Dev Summit Boston

Discover transformative insights to level up your software development decisions. Register now with early bird tickets.

InfoQ Dev Summit Munich

Get practical advice from senior developers to navigate your current dev challenges. Register now with early bird tickets.

QCon San Francisco

Level up your software skills by uncovering the emerging trends you should focus on. Register now.

InfoQ ホームページニュース Twillioにおけるカオスエンジニアリング

Twillioにおけるカオスエンジニアリング

ブックマーク

2018年1月31日読了時間 3 分

作者：

Hrishikesh Barua

翻訳者

h_yoshida

原文(投稿日：2017/12/25)へのリンク

読者の皆様へ: あなたのリクエストに応じて、大切な情報を見逃すことなく、ノイズを減らす機能を開発しました。お気に入りのトピックを選択して、メールとウェブで通知をもらいましょう。

Twilioチームがカオスエンジニアリングへの進出について説明している。Gremlinを使って自社製のキューシステムの一部に障害を注入し、自動回復のテストを行なう。

Twilioは、アプリケーション開発者がコードから呼び出し可能なAPIを通じて、SMSおよび電話へのゲートウェイサービスを提供している。そのアーキテクチャの中核をなすのは、分散キューとレート制限システムである。これらはメッセージ処理におけるシステム障害や遅延を処理し、メッセージ消失を防ぐための永続的なキューを提供する。Twilloチームが構築したこのシステムはRatequeueと呼ばれる。Ratequeueは、多数の一時待ちキュー – 電話番号毎に独自のキューがある – に対するデキュー率を制限する。レート制限が必要なのは、開発者が可能な限り速くTwillio APIを呼び出せるようにするためだが、Twilloがこれら電話ネットワークにプッシュする速度をコントロールする必要がある。RatequeueはRedis上に構築されており、アイソレーションとロードバランシングの目的から水平方向に分割されている。ひとつの分割単位(シャード)の障害が他に影響することはない。各シャードはマスタと、HAのためのレプリカで構成されている。

プライマリシャードがRatequeue内で障害を起こした場合、従来は人が介在して、手動でレプリカをマスタに昇格させていた。このためには、プライマリと同じシャード番号を持ったホストを見つけ出して、それをLBに追加する必要があった。この手動プロセスを廃止するため、チームは２つのシステム – 自動フェールオーバシステムと、それをテストするための障害注入システムを開発した。カオスエンジニアリングの実例として紹介されたのは、この障害注入システムである。このシステムは、さまざまなレベルの障害をランダムに発生させて、障害復旧の能力をテストする。

試験の最大の目標はデータ消失をゼロにすることだった。その他、障害の自動検出と新マスタの導入も目標とされた。チームはAmazon KinesisとNagios、そして同社のクラスタ自動化サービスであるLazarusを使って、独自のソリューションを構築した。各Ratequeueのレプリカがマスタの正常性に関するハートビートをNagiosにプッシュする。それがしきい値を越えると、Nagiosが通知をKinesisにプッシュする。LazarusはこれらのイベントをKinesis上で監視していて、クラスタの状態を独自にチェックし、必要であればフェールオーバのプロセスを起動する。

自動障害回復をテストするため、チームはRatequeue Chaosというツールを開発した。このツールは選択したシャードのプライマリを強制終了し、リカバリを監視する。障害を発生させてシステムに注入し、フェールオーバを発生させるのには、Gremlinというサービスを使用する。GremlinはAPI経由でRatequeue Chaosによって起動され、スタックの任意の部分にコントロールされた障害を注入することができる。このプロセスが、Twillioのステージング環境で4時間毎に実行される。

一連のプロセスで得られた知見として、チームは、仮説ベースのテストモデル、テストを実行するフレームワーク、実環境で実行する場合のロールバック計画についても公開している。

この記事を評価

採用ステージ

スタイル

編集者評
編集長アクション

提出

提出著者連絡

この記事に星をつける

おすすめ度

スタイル

Author Contacted

このコンテンツのトピックは DevOps です。

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

あなたのメールアドレスはこちら

国を選んでください。

InfoQ.com がプライバシーポリシーに従って私の個人情報を扱うことに同意します。

We protect your privacy.

デベロップメント
設計/アーキテクチャ
カルチャー＆手法
AIと機械学習、データエンジニアリング
DevOps

InfoQ ニュースレター

毎週火曜日に前週のまとめコンテンツをお送りいたします。（日本語版は不定期リリース）25万人のシニアな開発者コミュニティーにぜひご参加ください。サンプルを見る

様々なイノベーターとアーリーアダプターがお送りするテクノロジーの概要を見る。
自分がまだ知らないことに気づいていないと知る
あなたが興味のあるトピックスをいつでも最新な情報に。

あなたのメールアドレスはこちら

国を選んでください。

InfoQ.com がプライバシーポリシーに従って私の個人情報を扱うことに同意します。

We protect your privacy.

ホームアカウントを作る QCon Conferences Events 寄稿 InfoQのライター InfoQについて C4Mediaについて Diversity

Events

QCon London
APRIL 8-10, 2024
InfoQ Live Roundtable
APRIL 23, 2024
InfoQ Dev Summit Boston
JUNE 24-25, 2024
InfoQ Dev Summit Munich
SEPTEMBER 26-27, 2024
QCon San Francisco
NOVEMBER 18-22, 2024

Follow us on

Stay in the know

The InfoQ Podcast

Engineering Culture Podcast

The Software Architects' Newsletter

サイト全般について feedback-jp@infoq.com 記事 editors-jp@infoq.com

BT

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

12のソフトウェア・アーキテクチャの落とし穴とその避け方

AI、ML、データエンジニアリングのInfoQトレンドレポート - 2023年9月

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

Low Code/No Codeを採用する：確認するべき6つの適性

役に立つリンク集

地域を選ぶ

Twillioにおけるカオスエンジニアリング

この記事に星をつける

このコンテンツのトピックは DevOps です。

関連記事:

関連記事

関連スポンサーコンテンツ

開発環境マネージャー Daytonaがオープンソースに

Spring BootによるAPIバックエンド構築実践ガイド第2版

Erlangランタイムの静的型付け関数型言語Gleamがバージョン1.0に到達

Decathlon社、Backend for Frontend (BFF)パターンを採用し、フロントエンドチームを強化

HashnodeがStep Functions、EventBridge、RedisでAWS上にスケーラブルなフィードアーキテクチャを構築

エクスペディア、マイクロ・フロントエンドとGraphQL最適化でフライト検索を高速化

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

ソフトウェア開発における"実験文化"の育成

技術的負債を防ぎ、返済する方法：チームと技術リーダー、マネージャーができること

研究者らが、LLMジェイルブレイク攻撃の防御アルゴリズム"SafeDecoding"のオープンソース化を発表

OpenAI、"Transformer Debugger"ツールをリリース

RWKVプロジェクト、LLM "Eagle 7B"をオープンソース化

CNCF、Kubernetes上のKafkaを簡素化するStrimziをインキュベートする

オラクル、ARMとKubernetes 1.28をサポートするOracle Cloud Native 1.8を発表

SUSE、Kubernetesとエッジ管理製品のアップグレードを発表

QCon London

InfoQ Live Roundtable

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco