InfoQ ホームページ Monitoring JP に関するすべてのコンテンツ
-
AWS、EKS Dashboardを発表。マルチクラウドKubernetesの複雑性に対応
Amazon Web Services社は、Amazon EKS Dashboardの一般提供を開始したと発表した。この新しい集中管理インターフェースは、複数のAWSリージョンやアカウントに展開されたKubernetesクラスターを統一的に可視化する機能を提供する。ダッシュボードは、異なるAWSリージョンやアカウントで分散型Kubernetesを運用する組織が直面する運用上の課題に対応するものだ。
-
Grafana 12がコードとしての可観測性と動的ダッシュボード機能を搭載して登場
Grafana Labsは、可視化およびダッシュボードプラットフォームに大幅な更新をもたらすGrafana 12を発表した。Git Sync、動的ダッシュボード、コード不要のポイントアンドクリックによるデータインサイトを提供するDrilldownの改善、クラウド移行アシスタントなど、いくつかの新しい主要機能が一般提供されている。
-
Grafana 12.1がビルトイン診断機能と強化アラートを提供
Grafana LabsはGrafana 12.1、システムの信頼性、アラート管理、ダッシュボードのインタラクティビティを向上させるために設計された新機能をリリースした。主な追加機能にはGrafana Advisor、再設計されたアラートインターフェース、トレンドライン変換、変数処理の改善、最新の認証およびクラウド統合のサポートが含まれる。
-
新オープンソースツールSubtrace、コンテナ環境にネットワーク解析をもたらす
Y CombinatorスタートアップのSubtraceがコンテナ化アプリケーションからのネットワークトラフィックを解析するためのオープンソースツールをリリースした。開発者たちは「コンテナ用Wireshark」と位置づけ、DockerとKubernetes環境でのネットワークデバッグをシンプル化することを目指している。
-
Amazon API Gateway、ヘッダーとパスに基づく動的ルーティングを追加
AWSは Amazon API Gatewayに、カスタムドメイン名用動的ルーティングルールを搭載した新機能を導入した-ユーザーがHTTPヘッダーの値に基づいて、独立して、またはURLパスと組み合わせてAPIリクエストをルーティングできるようにする。
-
AWS Shield Network Security Director:ネットワークトポロジーの可視化と改善ガイダンス
AWS Shieldは分散サービス拒否(DDoS)保護で知られているが、新機能のプレビュー:AWS Shield Network Security Director、Shield の役割をDDoS緩和だけに留めず、ネットワーク構成の包括的な可視化を提供し、セキュリティ問題を特定、AWSリソースに対する実用的な改善提案を提供する機能を導入した。
-
AWS Lambda、スキーマレジストリ統合によりKafkaイベントに対するネイティブAvroおよびProtobufサポートを獲得
AWSは、Provisioned ModeでApache Kafkaイベントソースマッピング(ESM)を利用する際に、AWS LambdaでApache AvroおよびProtocol Buffers(Protobuf)形式のイベントに対するネイティブサポートを発表した。同社によると、この機能強化により、AWS Glue Schema Registry(GSR)、Confluent Cloud Schema Registry(CCSR)、および自己管理型Confluent Schema Registry(SCSR)などの人気のあるスキーマレジストリと直接統合することで、効率的なバイナリKafkaイベントの処理が大幅に簡素化される。
-
AWS LambdaがCloudWatch Logsに対して階層型料金を導入、ログ記録先を拡大
AWSはLambdaロギング機能に大きなアップデートを発表、Amazon CloudWatch Logsに対してボリュームベースの階層型料金を導入し、さらにAmazon S3およびAmazon Data Firehoseを新しいコスト効率の高いLambdaログの送信先として追加した。2025年5月1日より有効となるこれらの変更は、大量のLambdaデプロイメントにおけるロギングコストの削減を目的としており、より広範な監視ツールとの連携に対する柔軟性も提供する。
-
Meta社がうるう秒を処理するためにPrecision Time Protocolを使用する方法
多くのシステムは、調整、ログ記録、セキュリティ、分散オペレーションにおいて、正確で一貫性のある時間管理に依存している。金融取引、データベースのレプリケーション、スケジュールされたタスクなど、時間に敏感なプロセスでは、1秒のズレでさえ障害を引き起こす可能性がある。分散データベース、テレメトリーパイプライン、イベント駆動アーキテクチャのような厳密な同期が必要なシステムでは、うるう秒の取り扱いを誤ると、データの損失、重複、不整合につながる可能性がある。そのため、うるう秒を正確に管理することで、高精度の時刻に依存する環境全体のシステムの信頼性と一貫性を確保できる。
-
オブザーバビリティがLLMベースのシステムのユーザーエクスペリエンスを向上させる方法:KubeCon EUでのHoneycombのCEOの洞察
KubeCon Europeの基調講演で、HoneycombのCEO兼共同設立者であるChristine Yen氏は、ソフトウェアシステムにおけるLLMの統合によってもたらされた急速なシフトに対処するために、オブザーバビリティどのように役立つかについての洞察を説明した。LLMの統合は、ソフトウェア開発方法だけでなく、リリース方法論にも大きな変革をもたらした。彼女は、本番環境の観測結果に基づいて開発のフィードバックループを適応させる方法を説明した。
-
ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report
Cockroach Labsが発表したThe State of Resilience 2025 Reportによると、ほとんどの組織で障害は日常的に発生しており、55%の企業で毎週、14%の企業で毎日障害が発生していると報告している。驚くべきことに調査参加者の100%が障害による収益損失を経験しており、過去12ヶ月間で100万米ドル以上の損失を報告した企業(8%)もあった。
-
PreziのPrometheusからVictoriaMetricsへの道のり
Prezi社のエンジニアリングチームは最近、Prometheusベースの監視システムからVictoriaMetricsへの移行について、コストの最適化、パフォーマンスの向上、アーキテクチャのシンプルさにフォーカスして議論した。この移行により、コストは約30%削減され、重いクエリの完了速度は30秒以上から3-7秒に短縮された。
-
PinterestによるCI可視性向上とビルド安定性強化のためのHoneycomb活用
最近、Pinterest社のMobile BuildsチームはHoneycomb、データ可視化プラットフォームを活用して継続的インテグレーション(CI)プロセスの効率と安定性を向上させた方法について議論した。チームは2021年にHoneycombを導入し、ビルドメトリクスを監視し、トレンドを分析し、パフォーマンスのボトルネックに対処できるようになった。
-
AWSがCloudFormationのデバッグ支援ツールとしてデプロイタイムラインビューを導入
Amazon Web Services(AWS)は、CloudFormationサービス強化の一環として、新たにデプロイタイムラインビューを導入した。今回新たなビューで、開発者やクラウドエンジニアがインフラストラクチャのデプロイプロセスをより直観的に追跡、把握できるようになることに加え、依存関係に関する新たな洞察も得られている。
-
Netflixがレジリエンシー向上のためにサービスレベルで優先順位付き負荷制御を提供開始
Netflixはシステムのレジリエンスをさらに向上させるために優先順位付き負荷制御の実装を個々のサービスレベルに拡張した。このアプローチは、障害分離のために個別クラスターを維持する代わりに、必要な場合にのみ優先度の低いリクエストを制御することでクラウド容量をより効率的に使用する。