BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ MonitoringTools に関するすべてのコンテンツ

  • AWS が Amazon Managed Service for Grafana と Amazon Managed Service for Prometheus を発表

    re:Invent 2020の最新の発表の1つで、AWSはAmazon Managed Service for Grafanaのプレビューを紹介した。これは、自動バージョン更新とセキュリティパッチを使用して、コンピューティングとデータベースインフラストラクチャを自動的にスケーリングするマネージドGrafanaだ。AWSはさらに、Amazon Managed Service for Prometheusのプレビューも導入した。

  • Amazon Cloudwatchダッシュボードが共有をサポート

    AWSは最近、AWSアカウントにアクセスしないユーザで共有するAmazon CloudWatchダッシュボード機能を導入した。この機能は、大画面でのメトリックや情報の共有や、公開ページへのリアルタイム情報の埋め込みなど、ダッシュボードの新しいユースケースを提供する。

  • Periskop:SoundCloudの例外監視サービス

    SoundCloudのエンジニアリングチームは、Periskopと呼ばれる例外監視ソフトウェアについて書いた。これは、サーバ間で例外を収集して集約し、分析のために中央サーバに報告する。

  • Netflix Presents Telltale、アプリケーションヘルスモニタリングツール

    Netflixエンジニアリングチームは先頃、さまざまなデータソースを利用してアプリケーションの一般的な状態を学習する監視およびアラートツールであるTelltaleについてブログを投稿した。Telltaleは、アプリケーションからの関連データのみを表示する。近くのデプロイメントやリージョンのトラフィック退避などの重要なイベントに関する情報もある。

  • Brenda - AIのチームメンバ

    Brendaは、マシンラーニングした人工知能を使用して、インフラストラクチャの監視、品質保証チェックとトラブルシュートのサポート、警告の処理と重大な問題の通知、自動修復を行うシステムだ。SwisscomのSree Rama Murthy Pakkala氏とCollin Mendons氏は、Swiss Testing Day 2020で、自社の品質向上を支援するBrendaという名のAI/MLフレームワークについて講演する予定である。

  • Logz.ioの調査により可観測性の大きな課題が明らかに

    Logz.ioが、DevOps業界の年次調査をリリースした。今回の重点は可観測性(observability)である。調査の結果から、DevOpsと可観測性に関するツールのスプロール(sprawl)が問題化していることと、アーキテクチャの複雑化が可観測性のソリューション実装において大きな課題となっていることが明らかになった。今後1年間で、分散トレースを中心とした可観測性への投資が増大するだろう、と同社では予測している。

  • AmazonがAWS Firelensを発表、コンテナログの新たな管理方法

    Amazonは先頃、新たなログ集約サービスを、AWS Firelensという名称で発表した。Amazon ECS、Amazon EKS、Amazon Fargateを含む、すべてのAWSコンテナサービスに対して、ログのフィルタリングとルーティングを統一するサービスである。

  • Athena - Dropbox開発チームのビルド状況自動監視システム

    Dropboxのエンジニアたちは、35,000近いビルドと数百万の自動テストを実行しており、不正なコミットや環境条件によってテストがフェールすることも多い。そのためチームは、不安定なテストを検出および隔離し、コード作者に通知するために必要な手作業操作を最小限にする監視システムを構築した。

  • Expo:Walmart LabsでのSpark StreamingとKafkaを使ったリアルタイムA/Bテストとモニタリング

    WalmartLabsのエンジニアリングチームは、Expoと呼ばれるリアルタイムのA/Bテストツールを開発した。これは、ユーザエンゲージメントメトリックを収集し分析するものである。Spark Structured Streamingを使用して受信データを処理し、メトリクスをKairosDBに格納する。

  • Booking.comにおけるGraphiteのスケールアップ

    Booking.comのエンジニアリングチームは、小規模クラスタで運用していた同社のGraphiteデプロイメントをスケールアップし、毎秒数百万のメトリック処理を可能にした。スケールアップの過程において、同チームは、Graphiteのコアコンポーネントであるcarbon-relayとcarbon-cache、レンダリングAPIの修正と最適化を実施した。

  • Coinbaseにおけるメトリクスコレクションとログアグリゲーションの進化

    CoinbaseのソフトウェアエンジニアであるLuke Demi氏は、2018年半ばからCoinbaseで実施されてきたモニタリングとロギングの変更に関する記事を書いている。Coinbaseは、ログ分析とメトリクス視覚化という2つの目的を果たすセルフマネージドのElasticsearchクラスタから、メトリクスコレクション用のDatadogとログアグリゲーション用のAWSのマネージドElasticsearchへと移行した。

  • 自社開発ソリューションuMonitorとMerisによるUberの可観測性スケールアップ

    Uberのインフラストラクチャは,モバイルアプリケーションやインフラストラクチャや内部サービスをサポートする数千のマイクロサービスで構成されている。これらのサービスに高い可観測性(obervability)を提供するため,UberのObservabilityチームは2つの監視ソリューションを構築した。時系列でメトリクスベースの警告を行うuMonitorと,ホストレベルのチェックとメトリクスを扱うNerisである。

  • AmazonがAWSクラウドマップ「クラウドリソースのためのサービスディスカバリ」を発表

    最近のブログ記事で、Amazonはクラウドリソースを発見し追跡するAWS Cloud Mapと呼ばれる新しいサービスを紹介した。マイクロサービスアーキテクチャの出現に伴い、これらのアーキテクチャで動的リソースを管理することがますます困難になっている。しかし、AWS Cloud Mapを使用すると、開発者はデータベース、キュー、マイクロサービス、およびその他のクラウドリソースの状態をカスタム名で監視できる。

  • Grafanaが時系列メトリクスにログデータ相関を追加

    Grafanaチームは、メトリクスクエリやビジュアライゼーションといったGrafana機能と連携したロギングプラットフォーム、Lokiのαバージョンを発表した。Lokiは、新しいクライアントエージェントpromtailと、ログメタデータのインデックスとストレージのためのサーバーサイドコンポーネントを追加する。

  • Stack Overflow のモニタリングシステムの中身

    Stack Exchange のアーキテクチャリードである Nick Craver 氏は最近、彼らのモニタリングシステムについて記事を書いた。彼はそのモニタリング戦略の背後にある哲学と動機について議論し、そのツール群、 Bosun、Grafana、Opserverなどについて語った。

BT