A note to our readers: You asked so we have developed a set of features that allow you to reduce the noise: you can get email and web notifications for topics you are interested in. Learn more about our new features.
ここ数年、我々はサイトリライアビリティエンジニアリング(SRE)と、特にそのグループがGoogleなどの企業の主領域であった時点から、金融や医療といった他の業界でも期待されるようになるまでいかに成長したかの役割について論じてきた。 最近、技術ジャーナリストのAlex Handy氏はSREとマイクロサービスアーキテクチャがいかにフィットするかについて述べている。
[...] SREとマイクロサービスは世界のソフトウェア企業の中で並行して進化してきましたが、前者が生き残るのは後者に比べてはるかに難しいことです。
Handy氏にとってその理由は明確だ。
[...] SREは、彼らが維持・最適化するシステム全体をフルスタックに見ることに一喜一憂します。その役割は開発者のスキルと管理者のスキルを融合し、システムがダウンしたときにプロダクション環境のアプリケーションをデバッグできる従業員を作り出すことです。
Handy氏は続けてSREの背景をいくつか取り上げ、Googleを例としてその機能がいかに大規模に作用するか、またGoogleのSREディレクターの一人であるTodd Underwood氏の言葉を引用しながら、開発グループが、分散システムの合意のためにPaxosを用いるといった技術アプローチと同様に信頼性と可用性について考えられるようにするため、Googleがいかに運用方法とシステムを導入しているかについて述べた。
Underwood氏はSREの仕事におけるもう1つの側面を強調していますが、ここでは可視性が重要です。定期的に変化するクラウドベースのサーバーやコンテナー、データベースのエコシステムを通してマイクロサービスが数十億のパケットを送信している場合、どんな種類の問題を対処するにも、どこで何が問題を引き起こしているかを明らかにすることが大事になります。ここでSREの仕事のフルスタックな見方の出番です。
GoogleのプロダクトマネージャーであるMorgan McLean氏によれば、ここで鍵となるのはマイクロサービスのトレーサビリティを監視することであり、他の人物も過去に述べており我々は他の場所で取り上げている。Handy氏による記事では、Googleがリリースしたその問題に取り組むためのツールをいくつか紹介されている。
[...] Googleは先日Stackdriver Trace、Stackdriver Debugger、そしてStackdriver Profilerをリリースしました。これらのツールが伝統的なエンタープライズベンダーによる古臭いテスト・運用ツールのように聞こえるのには理由があります。これらは開発者や運用者が慣れ親しんだ伝統的なトラブルシューティング作業を行うものです。しかし、これはマイクロサービスにフォーカスし、クラウドでその責務を果たすものです。
Morgan McLean氏の言葉を引用したHandy氏の記事では、これらのツールがSREグループでマイクロサービスベースのアーキテクチャがいかに管理しやすくなるかが要約されており、また、トレースも重要だが、これらのツールについてGoogleはプロファイリングとデバッグの側面は現段階で固有のものであり開発者とSREにとって有用であると述べられている。そしてHandy氏はさらに監視やメトリクス、可観測性についてGoogleや他の業界の企業を例として取り上げて記事を結んでいる。今後さらに多くの企業に関連してくるであろうことから、検討の価値がある。
マイクロサービスを採用し、SREチームを既に使用している、あるいは使用し始めている多くの開発者と企業が増えるなかで、開発者とSREチームが協働して信頼性、可用性、一貫性などを保証するためにアーキテクチャとツールがどのように進化していくのかは興味深い。もしあなたがこの件について経験があれば、ポジティブでもネガティブでも、それを発信することはこの大きなコミュニティにとって有用だろう。
Rate this Article
- Editor Review
- Chief Editor Action