InfoQ ホームページ フォールトトレランス に関するすべてのコンテンツ
-
マイクロサービスの人間的側面
マクロサービスアーキテクチャは、純粋に技術的なソリューションではなく、チームのコミュニケーションにとってのゲームチェンジャーだ。チーム間に安定した直接的なコミュニケーションチャンネルがない場合、彼らが作るソフトウェアはひどいものになるだろう。マイクロサービス実装を成功させるのに不可欠な5つの重要な特性は、ゼロコンフィグレーション、オートディスカバリ、高い冗長性、自己修復、フォールトトレランスだ。
-
レジリエントなアーキテクチャを実現する方法
スケールするシステムを管理するには限界ぎりぎりまでシステムを追い込んでも、回復できるようにする必要がある。そして、障害を受け止めることも必要だ。Adrian Hornsby氏はふたつのブログ記事で、自身の10年以上にわたる大規模システム運用の経験と発見したパターンを共有している。
-
LinkedInのカオスエンジニアリング - "LinkedOut"障害注入テストフレームワーク
LinkedIn Engineeringチームが先日、自らの“LinkedOut”障害注入テストフレームワークについて説明した。サービスのレジリエンスに関する仮説を構築し、LinkedInのA/BテストフレームワークであるLiXや、Invocation Context(CI)フレームワークを使用したコールスタックを通じて渡されるクッキー内のデータを介して、 障害トリガを注入することができる。障害シナリオにはエラー、遅延、タイムアウトなどがある。
-
IstioとKubernetesを使ったマイクロサービスの回復力と耐障害性
IBMのAnimesh Singh氏とTommy Li氏は最近のKubeCon + CloudNativeCon North America 2017 Conferenceで、Istioフレームワークを活用したマイクロサービスの回復力と耐障害性について語った。また、Istioを使用してサーキットブレーカやその他の回復機能を設定および使用する方法も示しました。
-
Twillioにおけるカオスエンジニアリング
Twilioチームがカオスエンジニアリングへの進出について説明している。Gremlinを使って自社製のキューシステムの一部に障害を注入し、自動回復のテストを行なう。
-
Expediaにおけるサイトのレジリエンス向上への取り組みとカオステストの導入 - QCon SFでの講演より
QCon SFにおいて、Sahar Samiei、Willie Wheeler両氏が“Expedia's Journey Toward Site Resiliency”と題したプレゼンテーションを行い、Expediaでのレジリエンステストに関するプラクティスのコミュニティ構築について論じた。結果は概ね望ましいものだった – 運用システムでは5月15日以降、NetflixのChaos Monkeyが毎日実行されるようになり、4つのTier 1サービスパイプラインにレジリエンステストが追加された。
-
MicroProfile 1.2の最新情報
EclipseファウンデーションはMicroProfileのバージョン1.2をリリースした。このリリースでマイクロサービス間のコミュニケーション改善、システム障害への返答、JSON Web Toolkit (JWT)といった新しいAPIを追加した。IBM所属でCDIとMicroProfileの開発リードであるEmily Jiang氏と、Payara所属でJavaミドルウェアのコンサルタントであるMichael Croft氏は、InfoQにこの最新リリースについて語った。
-
マイクロサービスのための機能サービス設計の再考:Uwe Friedrichsen氏がmicroXchgにて
microXchgマイクロサービス会議のオープニングトークでは、Uwe Friedrichsenが "Resilient Functional Service Design"について講演した。主な重要事項は次の通りである。マイクロサービス開発者は、フォールトトレラントなデザインパターンとキャッシングについて学んだほうがよい。ドメイン駆動設計(DDD)とモジュール性を理解することは不可欠である。コンポーネントについて再利用でなく交換可能であることを目指す。
-
GoogleがGit Ketchをキックオフ - フォールトトレラントなGit管理システムの実現へ
開発が始まったばかりではあるが,GoogleがGit Ketchの最初のコミットを発表した。レジリエンスとスケーラビリティを目的として複数のGitサーバに情報を複製する,マルチマスタのGit管理システムである。JavaベースのGitサーバであるJGitをベースとして変更を加えているが,それ以外のGitサーバでもマルチマスタのクラスタに参加することができる。
-
監視を提供するAWS Trusted Advisor
AWSは近頃、AWS Trusted AdvisorをAWS Management Consoleへ統合し、無料で4つのセキュリティとサービスリミットのチェックをできるようにした。セキュリティ、性能、耐障害性、コスト最適化の追加のチェックは、ビジネス&エンタープライズサポートの範囲内だ。
-
NetflixのAPI最適化
NetflixのAPI最適化の物語は興味深い。彼らはAPIを汎用的なひとつで全部のサイズに対応する静的なAPIから動的な設計に変更した。クライアントチームの力を借りて、カスタムのサービスエンドポイントを定義し配置したのだ。InfoQはBen Christensen氏に話を聞いた。
-
10gen: MongoDBのフォールトトレラントの正当性を主張
コーネル大学の教授が,MongoDBのフォールトトレランスシステムに "設計上の欠陥がある" と主張している。10genでは,同社のテクニカルディレクタがこれに対して反論する。
-
Netflix Hystrix - 複雑な分散システムへのレイテンシとフォールトトレランス
Netflixは、待ち時間や障害を許容して、リモートシステム、サービス、サードパーティライブラリへのアクセスポイントを制御するために設計されたライブラリであるHystrixをリリースした。 Hystrixは、スレッドやセマフォを分離して、フォールバックとサーキットブレーカー、リクエストキャッシュとリクエスト収縮、モニタリングと構成と言った機能を提供する。
-
Windowsの新ファイルシステム: ReFS
1993年以来初めて、Microsoftは新ファイルシステムのアーキテクチャを発表した。Resilient File System (ReFS)と呼ばれるこのファイルシステムは、信頼性を向上させ、NTFSが提供する時代遅れの機能を削除するように設計されている。
-
Future、性能、依存性の低減など多くの改善がされたAkka 1.1リリース
性能やFuture機能に多くの改善が行われたAkka 1.1がリリースされた。Akkaの基本機能はScala 2.以外には依存していない。InfoQはAkkaの現在とこれからについてJonas Bonér氏に話を聞いた。