BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Amazonが自動対応プランのインシデントマネージャーを発表

Amazonが自動対応プランのインシデントマネージャーを発表

原文(投稿日:2021/05/21)へのリンク

AWSは最近、AWS Systems Managerの新機能であるIncident Managerを発表した。これは、顧客がアプリケーションとインフラストラクチャのインシデントに対する準備、対応をサポートするものである。

Incident Managerは、Runbookアクション、インシデントの更新、チャットベースのコラボレーションを使って、自動応答計画と応答を管理します。それと並行して、割り当てられた連絡先に自動的に通知を行う。AWSのグローバルテクニカルエバンジェリストであるJulien Simon氏は、新しいサービスの主な使用例について次のように説明している。

ページャへの通知が頻繁になるにつれて、勤務中のエンジニアはサービスを回復するために奮闘し、秒刻みで動きます(...)適切なRunbookと手順を見つけてアクセスする時間を無駄にするわけにはいきません(...)深刻な問題にはエスカレーションが必要になることがよくあります。チームメンバーの助けを借りることは素晴らしいことですが、コラボレーションと迅速な解決には効率的なコミュニケーションが必要です。そうでなければ、まとまりのない努力は状況を混乱させたり悪化させたりする事故につながる可能性があります。大事なことを言い忘れましたが、インシデントとそれにどのように対応したかを文書化することも同様に重要です。

新しいインシデントがトリガーされると、ダッシュボードがSystem Managerコンソールに自動的に作成される。コンソールは、エスカレーションの管理に関係するすべてのコンポーネントの参照ポイントとして機能する。ダッシュボードには、インシデントの概要、CloudWatchのメトリクスとアラーム、Incident Managerによって追加されたすべてのイベントのタイムライン、レスポンダーによって手動で追加されたカスタムイベントが含まれる。このサービスでは、Slackを介してレスポンダーに通知することができ、自動化されたRunbookの使用をサポートする。

AWSのシニアクラウドインフラストラクチャアーキテクトであるHarshitha Putta氏と、AWSのクラウドアーキテクトであるGuyu Ye氏の2つの記事のシリーズでは、どのようにして顧客がIncident Managerを使って障害を軽減し、エスカレーションプランを作成し、Amazon CloudWatchと統合するかが示されている。彼らは、新しいリリースがAmazonの内部プロジェクトから来ていると説明している。

顧客から、インシデントを社内でどのように管理しているかをよく聞かれます。インシデント対応管理をシンプルにするために、Amazonの内部インシデント管理のベストプラクティスを組み込んだ新しいAWS Systems Manager機能であるIncident Managerをリリースしました。

出典: https://aws.amazon.com/blogs/aws/resolve-it-incidents-faster-with-incident-manager-a-new-capability-of-aws-systems-manager/

数人のユーザが、正式名称AWS Systems Manager Incident Managerについて質問が挙がっている。Adobeのソフトウェア開発エンジニアであるGabriel Mangiurea氏は、次のようにツイートしている。

AWS Systems Manager Future-product Manager Naming Manager Wheel of fortune Managerで、すべてのCloudwatchログなどを使って、将来の製品のネーミング管理を管理しやすい方法で管理できると確信しています。

Redditスレッドにあるが、オンコールシステムがないことに驚いている人もいる。

オンコール機能があるとうまくいかないように見えるが。エスカレーションプランがあることはわかりますが、連絡先をローテーションできるかどうかはわかりません。

新しいサービスの料金は、応答プランとSMSおよび音声メッセージの数に依る。応答プランごとに月額7ドルから始まり、100のSMSまたは音声メッセージが含まれる。

 

この記事に星をつける

おすすめ度
スタイル

BT