InfoQ ホームページ Resilience に関するすべてのコンテンツ
-
Chaos Monkey 2.0はSpinnaker経由で動作する
Netflixは最近、Chaos Monkey 2.0のソースコードを公開した。このレジリエンスツールの最新リリースは、Spinnakerとイベントトラッキングシステムに完全に統合され、SSHサポートが削除されている。
-
GoogleがGit Ketchをキックオフ - フォールトトレラントなGit管理システムの実現へ
開発が始まったばかりではあるが,GoogleがGit Ketchの最初のコミットを発表した。レジリエンスとスケーラビリティを目的として複数のGitサーバに情報を複製する,マルチマスタのGit管理システムである。JavaベースのGitサーバであるJGitをベースとして変更を加えているが,それ以外のGitサーバでもマルチマスタのクラスタに参加することができる。
-
Microsoft、マイクロサービス構築のためのプラットフォームを公開
MicrosoftがAzure Service Fabric (ASF)を発表し、そのプレビューを公開した。これはマイクロサービスを作成、実行、管理するための、ランタイムおよびライフサイクルマネジメントツールを含むクラウドプラットフォームだ。ASFマイクロサービスは、AzureもしくはWindows Serverのプライベートクラウドおよびホステッドクラウド上のオンプレミスにデプロイできる。将来はLinuxもサポートされるようだ。
-
失敗を扱うアンチパターン
Oliver Hankeln氏が、組織で失敗を扱う場合のアンチパターンを紹介する。アンチパターンには、失敗を隠すこと、お互いに非難し合うこと、非難し続けること、臆病になることがあり、それぞれの対処方法を提案する。
-
Netflixは218台のCassandraノード再起動にどう対処したのか
Amazonは9月末,メジャーアップデートメンテナンスを実施した。同社クラウドサーバ群のおよそ10%に影響する,Xenハイパーバイザのセキュリティ上の脆弱性に対するパッチの実施が目的だ。今回のアップデートではそれらのサーバを再起動する必要があったため,結果的に同社の最大顧客であるNetflixを含むAWSユーザ,およびその提供するサービスに影響が及んだ。
-
TypeSafeのKevin Webber氏が語る,リアクティブシステムにおけるアクタベースの並行性
先日のMediumの記事で,TypeSafeのKevin Webber氏は,リアクティブプログラミングについて,レスポンシブでレジリエント,スケーラブルなシステム構築を支援する意味から,"単なる新たなトレンドではなく,現代のソフトウェア開発者が学ぶべきパラダイム"である,と論じた。さらに,リアクティブシステムにおいてもっとも有益な基盤となるのはアクタベースの並行性だ,とも述べている。
-
監視を提供するAWS Trusted Advisor
AWSは近頃、AWS Trusted AdvisorをAWS Management Consoleへ統合し、無料で4つのセキュリティとサービスリミットのチェックをできるようにした。セキュリティ、性能、耐障害性、コスト最適化の追加のチェックは、ビジネス&エンタープライズサポートの範囲内だ。
-
Simian Armyを使わないPagerDutyの復元性テスト
PagerDutyのDoug Barth氏が,特別な自動化作業を前もって用意することなくシステムの復元性テストを開始するという,同社で実施したアプローチについて,DevOps Days Londonで講演した。目標としたのは障害発生点の早期発見と,1週間に1時間の時間枠を設けて,その対処方法についてオープンに議論することだ。
-
Amazon Web Servicesの安定性と9月13日の障害
9月13日の朝、Amazon Web Services (AWS)のUS East 1リージョンで障害が発生した。この障害によってこのAWS最大で最古のロケーションを使っているHeroku、Github、CMSWireなど多くの人気アプリケーションが動作しなくなった。