BT

InfoQ ホームページ Failure に関するすべてのコンテンツ

  • Cloudflare、27分間のサービスについて説明

    Cloudflareで先頃、部分的なサービス停止が発生し、27分間にわたって続いた。これにより同社ネットワークのトラフィックが50パーセント低下している。

  • New LiveRecorder for Java Enables Software Failure Replay

    LiveRecorder for Javaは、新たにリリースされたソフトウェア障害再生アプリケーションだ。これにより、開発者はアプリケーションの障害を記録し、IntelliJ で再生して障害の原因を見つけられる。特に間欠的故障を伴うデバッグ時間の短縮に役立つ。

  • 障害モードとレジリエントなシステムの構築 - Adrian Cockcroft氏のQCon SFでの講演より

    Adrian Cockcroft氏は先頃、障害発生時においても正常に運用できるレジリエントなシステムの構築方法について、自身の考えを公開した。氏は先日のQCon San Franciscoでも、継続的レジリエンスの考え方を備えたシステム構築において望まれる、クラウドのレジリエンスパターンについての私見を述べている。

  • どうやってうまくいっているのか?Netfixが教える、インシデントからの学び方 - QCon New YorkでのRyan Kitchens氏の講演より

    QCon New Yorkで、Ryan Kitchens氏が、"How Did Things Go Right? Learning More from Incidents"と題して講演した。主なポイントは次のとおりだ。リカバリは予防に優る; インシデントは"最悪の状況"が起きた時に発生するのであるから、根本原因(root cause)というものは存在しない; ユーザの幸福が何より重要である; システムがうまくいっている理由を知ることには大きな価値がある。

  • 失敗を恐れないチームを育むには - QCon London Q&A

    失敗を責めないこと(blameless failure)は,失敗を認め,共有し,調べ,修正し,予防する文化の構築から始まる – DevOpsおよびクラウドコンサルタントのEmma Button氏は,QCon London 2019でこのように述べた。CI/CDプラクティスによってシステムの健全性と状態を視覚化すれば,信頼性とオーナシップが向上するだけでなく,問題が発生した時の支援も受けやすくなる。

  • Twillioにおけるカオスエンジニアリング

    Twilioチームがカオスエンジニアリングへの進出について説明している。Gremlinを使って自社製のキューシステムの一部に障害を注入し、自動回復のテストを行なう。

  • 継続的デリバリの計測方法

    継続的デリバリを導入する場合、安定性とスループットを計測できる。このふたつのメトリクスは不確実性を減らし、とのようなやり方を拡大したり縮小したりするべきかについてより良い選択肢を提示し、継続的デリバリのプロセスを正しい方向に進めるのに役に立つ。

  • Azure IaaS Disaster Recoveryパブリックプレビュー発表

    先日の発表でMicrosoftは、Azure Site Recovery(ASR)を使用したIaaS(Infrastructure-as-a-Service)ディザスタリカバリのパブリックプレビューに関する詳細をリリースした。ASRサービスを使用することで、ひとつのAzureリージョン内のIaaSワークロードを保護すると同時に、同じ地理クラスタ内の別のAzureリージョンに複製することができる。

  • デッドコードは取り除かなければならない

    デッドコードは、見つけて、取り除く必要がある。デッドコードを残しておくと、プログラマの理解と行動を妨げることがあり、コードが実行されて、重大な問題を引き起こすリスクもある。 デッドコードの削除は、技術的な問題ではない。それは考え方と文化の問題だ。

  • 人為的ミスにより AWS S3 が US-EAST-1 で停止

    手違いによって本来より多くの S3 サーバが停止した。これには2つの重要なサブシステムも含まれていた。S3は不具合を起こし、S3 サービスやこれに依存する他のサービスにも影響は及んだ。復旧にはおよそ4時間が掛かった。

  • インプロビゼーション実行者のコードとQConSF

    即興(インプロビゼーション)ゲームを通じて,Ted DesMaisons氏とLias Rowland氏は,よりよい生活をおくるための3つのハックとして,“失敗を受け入れる,“はい”を言う,コントロールを共有する”,という3つを紹介した。

  • 未来のソフトウェアのための技術

    クラウド、コードによるインフラ構築、APIにより連合されたアーキテクチャとアンチフラジャイルなシステム。Mary Poppendieck氏が主張するところによると、これらは目的に素早く到達するソフトウェアシステムを開発するための技術である、とMary Poppendieck氏は主張した。システムはクラウドに向けて進化を続けており、APIは中央集権のデータベースを置き換え、IoTを可能とする。失敗を受け入れるアンチフラジャイルなシステムを開発する必要がある。

  • 詐欺師症候群への対処

    詐欺師症候群というのは、"詐欺"が露見することを恐れる人々のことを指す。彼らは、自分が本来存在する場所に属しておらず、獲得した成功は賞賛には値せず、他人が考えるほど自分は賢くないと考えている。アジャイルコーチであるGitte Klitgaard氏によると、多くの地位を獲得している人物が詐欺師症候群により苦しんでいる。そのせいで人々は業務を妨げられ、自身の夢を追いかけることをやめてしまう。

  • Spotifyは失敗が得意でありたい

    いつでも実験のできる,失敗の得意な企業でありたい – エンジニアリングディレクタのMarcus Frödin氏は,Spotifyをこのように言う。Spark the Change London 2016で氏は,失敗から学んで成功を生むという概念をプレゼンテーションして,Spotifyが失敗から学んだ実例について紹介した。

  • Richard Rodger氏の講演"Surviving Microservices"より - メッセージ,パターンマッチング,障害

    ベルリンで開催されたmicroXchg 2016カンファレンスでRichard Rodger氏は,“Surviving Microservices”と題したプレゼンテーションを行なった。マイクロサービスアーキテクチャの安定稼働を維持したいと望む開発者を対象とした,実践的なガイドだ。講演で議論されたおもなテーマは,メッセージ思考システムのメリット,サービス間コミュニケーションにおけるパターンマッチング,障害時の対処,Seneca.jsなどだ。

BT

あなたのプロファイルは最新ですか?プロフィールを確認してアップデートしてください。

Eメールを変更すると確認のメールが配信されます。

会社名:
役職:
組織規模:
国:
都道府県:
新しいメールアドレスに確認用のメールを送信します。このポップアップ画面は自動的に閉じられます。