InfoQ ホームページ Monitoring JP に関するすべてのコンテンツ
-
ほとんどの企業が毎週障害を経験:The State of Resilience 2025 Report
Cockroach Labsが発表したThe State of Resilience 2025 Reportによると、ほとんどの組織で障害は日常的に発生しており、55%の企業で毎週、14%の企業で毎日障害が発生していると報告している。驚くべきことに調査参加者の100%が障害による収益損失を経験しており、過去12ヶ月間で100万米ドル以上の損失を報告した企業(8%)もあった。
-
PreziのPrometheusからVictoriaMetricsへの道のり
Prezi社のエンジニアリングチームは最近、Prometheusベースの監視システムからVictoriaMetricsへの移行について、コストの最適化、パフォーマンスの向上、アーキテクチャのシンプルさにフォーカスして議論した。この移行により、コストは約30%削減され、重いクエリの完了速度は30秒以上から3-7秒に短縮された。
-
PinterestによるCI可視性向上とビルド安定性強化のためのHoneycomb活用
最近、Pinterest社のMobile BuildsチームはHoneycomb、データ可視化プラットフォームを活用して継続的インテグレーション(CI)プロセスの効率と安定性を向上させた方法について議論した。チームは2021年にHoneycombを導入し、ビルドメトリクスを監視し、トレンドを分析し、パフォーマンスのボトルネックに対処できるようになった。
-
AWSがCloudFormationのデバッグ支援ツールとしてデプロイタイムラインビューを導入
Amazon Web Services(AWS)は、CloudFormationサービス強化の一環として、新たにデプロイタイムラインビューを導入した。今回新たなビューで、開発者やクラウドエンジニアがインフラストラクチャのデプロイプロセスをより直観的に追跡、把握できるようになることに加え、依存関係に関する新たな洞察も得られている。
-
Netflixがレジリエンシー向上のためにサービスレベルで優先順位付き負荷制御を提供開始
Netflixはシステムのレジリエンスをさらに向上させるために優先順位付き負荷制御の実装を個々のサービスレベルに拡張した。このアプローチは、障害分離のために個別クラスターを維持する代わりに、必要な場合にのみ優先度の低いリクエストを制御することでクラウド容量をより効率的に使用する。
-
AWS、Elastic Container Serviceにオブザーバビリティを強化したコンテナインサイトを追加
AWSは最近、Amazon Elastic Container Service (ECS)向けにオブザーバビリティを強化したContainer Insights with Enhanced Observabilityを発表した。これは、以前Amazon Elastic Kubernetes Service (EKS)に導入された同様の機能に沿ったものだ。この新機能は、コンテナ・ワークロードのモニタリングとトラブルシューティングを改善することを目的としている。
-
Prometheus(プロメテウス)3.0は新しいUI、OpenTelemetryのサポートなどをもたらす
人気のオープンソース監視システムPrometheusのバージョン3.0がリリースされた。このツールの7年ぶりのメジャーアップグレードとなる。様々な新機能が追加され、ユーザー・エクスペリエンスの向上とワークフローの合理化を目的とした改良が施されている。
-
分散型トレースツールJaegerがOpenTelemetryを中核としたバージョン2をリリース
オープンソースの分散トレーシングプラットフォームであるJaegerのバージョン2がリリースされた。このリリースには、JaegerとそのコンポーネントをOpenTelemetryフレームワークに取り込むという、重要なアーキテクチャの変革が含まれている。
-
Meta社がテールユーティライゼーションの向上によりAI推論を最適化
Meta社(旧Facebook社)は、テールユーティライゼーションの最適化に注力することで、機械学習モデル提供インフラの効率性と信頼性が大幅に改善されたことを報告した。
-
OpenTelemetryが継続的プロファイリングを採用、Elasticがエージェントを提供
OpenTelemetryは継続的プロファイリングをテレメトリのコア信号として取り入れたことを発表し、Elasticは継続的プロファイリング・エージェントをOpenTelemetryプロジェクトに寄贈した。
-
Ngrok Traffic Inspectorがネットワーク・トラフィックのオブザーバビリティを提供
ngrok Traffic Inspectorは、APIやサービスに向かうトラフィックのオブザーバビリティを提供し、何が起きているかをよりよく理解し、問題を特定するのに役立つ。今年初めにプレビューされて以来、Traffic Inspectorはユーザーからのフィードバックに基づいて新しい機能を獲得し、ngrokダッシュボードから正式に利用可能になった。
-
CO2.js、開発者によるアプリケーションの二酸化炭素排出量の追跡を支援
グリーンウェブ財団は、開発者がグリーンウェブAPIにアクセスし、アプリ、ウェブサイト、ソフトウェアに関連する二酸化炭素排出量の予測を可能にするJavaScriptライブラリ、CO2.jsの新しいリリースを発表した。CO2.jsは、サイトのカーボンバジェットを作成したり、モニタリングツールに二酸化炭素排出量の推定値を含めたい開発者をサポートする。
-
AWS、CloudWatch Application SignalsにPythonアプリケーションの自動計測を追加
AWSは、Amazon Cloudwatch アプリケーションシグナル機能にPythonアプリケーションの自動計測をサポートすることを発表した。アプリケーションシグナルは、AWS Distro for OpenTelemetry (ADOT)を使用して、コードを変更することなくPythonアプリケーションの計測を可能にする。アプリケーションシグナルは、サービスレベル目標(SLO)の監視を可能にし、いくつかのAWSのオブザーバビリティとモニタリングツールと連携する。
-
Microsoft AzureがRetinaを発表:クラウドネイティブ・コンテナ・ネットワーキング・オブザーバビリティ・プラットフォーム
Microsoft Azure Container Networkingチームは最近、Retinaというオープンソースプロジェクトを発表した。このクラウドネイティブなコンテナネットワーキング観測可能プラットフォームによって、DevOpsエンジニアと管理者は、多様な環境にわたるワークロード・トラフィックを可視化、デバッグ、分析できるようになる。
-
エクスペディア、マイクロ・フロントエンドとGraphQL最適化でフライト検索を高速化
エクスペディアは、Webアプリケーションとモバイルアプリケーションに様々な最適化を適用することで、フライト検索を最大52%高速化した(ページ使用可能時間)。これらの改善をサポートするため、同社はアプリケーションのオブザーバビリティを改善した。Expedia FlightsのWebアプリケーションは、柔軟性、再利用性、より優れた最適化を可能にするため、マイクロ・フロントエンド・アーキテクチャ (MFA)に移行された。