InfoQ ホームページ observability に関するすべてのコンテンツ
-
AWS、EKS Dashboardを発表。マルチクラウドKubernetesの複雑性に対応
Amazon Web Services社は、Amazon EKS Dashboardの一般提供を開始したと発表した。この新しい集中管理インターフェースは、複数のAWSリージョンやアカウントに展開されたKubernetesクラスターを統一的に可視化する機能を提供する。ダッシュボードは、異なるAWSリージョンやアカウントで分散型Kubernetesを運用する組織が直面する運用上の課題に対応するものだ。
-
Grafana 12.1がビルトイン診断機能と強化アラートを提供
Grafana LabsはGrafana 12.1、システムの信頼性、アラート管理、ダッシュボードのインタラクティビティを向上させるために設計された新機能をリリースした。主な追加機能にはGrafana Advisor、再設計されたアラートインターフェース、トレンドライン変換、変数処理の改善、最新の認証およびクラウド統合のサポートが含まれる。
-
新オープンソースツールSubtrace、コンテナ環境にネットワーク解析をもたらす
Y CombinatorスタートアップのSubtraceがコンテナ化アプリケーションからのネットワークトラフィックを解析するためのオープンソースツールをリリースした。開発者たちは「コンテナ用Wireshark」と位置づけ、DockerとKubernetes環境でのネットワークデバッグをシンプル化することを目指している。
-
Amazon API Gateway、ヘッダーとパスに基づく動的ルーティングを追加
AWSは Amazon API Gatewayに、カスタムドメイン名用動的ルーティングルールを搭載した新機能を導入した-ユーザーがHTTPヘッダーの値に基づいて、独立して、またはURLパスと組み合わせてAPIリクエストをルーティングできるようにする。
-
AWS Shield Network Security Director:ネットワークトポロジーの可視化と改善ガイダンス
AWS Shieldは分散サービス拒否(DDoS)保護で知られているが、新機能のプレビュー:AWS Shield Network Security Director、Shield の役割をDDoS緩和だけに留めず、ネットワーク構成の包括的な可視化を提供し、セキュリティ問題を特定、AWSリソースに対する実用的な改善提案を提供する機能を導入した。
-
AWS Lambda、スキーマレジストリ統合によりKafkaイベントに対するネイティブAvroおよびProtobufサポートを獲得
AWSは、Provisioned ModeでApache Kafkaイベントソースマッピング(ESM)を利用する際に、AWS LambdaでApache AvroおよびProtocol Buffers(Protobuf)形式のイベントに対するネイティブサポートを発表した。同社によると、この機能強化により、AWS Glue Schema Registry(GSR)、Confluent Cloud Schema Registry(CCSR)、および自己管理型Confluent Schema Registry(SCSR)などの人気のあるスキーマレジストリと直接統合することで、効率的なバイナリKafkaイベントの処理が大幅に簡素化される。
-
AWS LambdaがCloudWatch Logsに対して階層型料金を導入、ログ記録先を拡大
AWSはLambdaロギング機能に大きなアップデートを発表、Amazon CloudWatch Logsに対してボリュームベースの階層型料金を導入し、さらにAmazon S3およびAmazon Data Firehoseを新しいコスト効率の高いLambdaログの送信先として追加した。2025年5月1日より有効となるこれらの変更は、大量のLambdaデプロイメントにおけるロギングコストの削減を目的としており、より広範な監視ツールとの連携に対する柔軟性も提供する。
-
オブザーバビリティがLLMベースのシステムのユーザーエクスペリエンスを向上させる方法:KubeCon EUでのHoneycombのCEOの洞察
KubeCon Europeの基調講演で、HoneycombのCEO兼共同設立者であるChristine Yen氏は、ソフトウェアシステムにおけるLLMの統合によってもたらされた急速なシフトに対処するために、オブザーバビリティどのように役立つかについての洞察を説明した。LLMの統合は、ソフトウェア開発方法だけでなく、リリース方法論にも大きな変革をもたらした。彼女は、本番環境の観測結果に基づいて開発のフィードバックループを適応させる方法を説明した。
-
ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report
Cockroach Labsが発表したThe State of Resilience 2025 Reportによると、ほとんどの組織で障害は日常的に発生しており、55%の企業で毎週、14%の企業で毎日障害が発生していると報告している。驚くべきことに調査参加者の100%が障害による収益損失を経験しており、過去12ヶ月間で100万米ドル以上の損失を報告した企業(8%)もあった。
-
PreziのPrometheusからVictoriaMetricsへの道のり
Prezi社のエンジニアリングチームは最近、Prometheusベースの監視システムからVictoriaMetricsへの移行について、コストの最適化、パフォーマンスの向上、アーキテクチャのシンプルさにフォーカスして議論した。この移行により、コストは約30%削減され、重いクエリの完了速度は30秒以上から3-7秒に短縮された。
-
PinterestによるCI可視性向上とビルド安定性強化のためのHoneycomb活用
最近、Pinterest社のMobile BuildsチームはHoneycomb、データ可視化プラットフォームを活用して継続的インテグレーション(CI)プロセスの効率と安定性を向上させた方法について議論した。チームは2021年にHoneycombを導入し、ビルドメトリクスを監視し、トレンドを分析し、パフォーマンスのボトルネックに対処できるようになった。
-
Netflixがレジリエンシー向上のためにサービスレベルで優先順位付き負荷制御を提供開始
Netflixはシステムのレジリエンスをさらに向上させるために優先順位付き負荷制御の実装を個々のサービスレベルに拡張した。このアプローチは、障害分離のために個別クラスターを維持する代わりに、必要な場合にのみ優先度の低いリクエストを制御することでクラウド容量をより効率的に使用する。
-
AWS、Elastic Container Serviceにオブザーバビリティを強化したコンテナインサイトを追加
AWSは最近、Amazon Elastic Container Service (ECS)向けにオブザーバビリティを強化したContainer Insights with Enhanced Observabilityを発表した��これは、以前Amazon Elastic Kubernetes Service (EKS)に導入された同様の機能に沿ったものだ。この新機能は、コンテナ・ワークロードのモニタリングとトラブルシューティングを改善することを目的としている。
-
Prometheus(プロメテウス)3.0は新しいUI、OpenTelemetryのサポートなどをもたらす
人気のオープンソース監視システムPrometheusのバージョン3.0がリリースされた。このツールの7年ぶりのメジャーアップグレードとなる。様々な新機能が追加され、ユーザー・エクスペリエンスの向上とワークフローの合理化を目的とした改良が施されている。
-
OpenTelemetryが継続的プロファイリングを採用、Elasticがエージェントを提供
OpenTelemetryは継続的プロファイリングをテレメトリのコア信号として取り入れたことを発表し、Elasticは継続的プロファイリング・エージェントをOpenTelemetryプロジェクトに寄贈した。