InfoQ ホームページ Monitoring JP に関するすべてのコンテンツ
-
AmazonがAWS Firelensを発表、コンテナログの新たな管理方法
Amazonは先頃、新たなログ集約サービスを、AWS Firelensという名称で発表した。Amazon ECS、Amazon EKS、Amazon Fargateを含む、すべてのAWSコンテナサービスに対して、ログのフィルタリングとルーティングを統一するサービスである。
-
Solandra、TypeScriptファーストなアルゴリズミックアートフレームワーク
Solandraはアルゴリズミックアートを作成するためのオープンソースのTypeScriptファーストなフレームワークだ。HTML Canvasを利用して、アート作成のためのラピッド開発フレームワークを提供する。
-
AmazonがCloudWatchによるAmazon ECS、EKS、Kubernetes用コンテナ監視を可能に
先頃Amazonは、Amazon CloudWatch Container Insightsを使用して、コンテナ化されたアプリケーションとマイクロサービス環境の監視、分離、診断が可能になったと発表した。Cloud Insightsは、DevOpsエンジニア、開発者、サイト信頼性エンジニア(SRE)、ITマネージャを対象とした、AWSのフルマネージドな監視および観測サービスであるAmazon CloudWatchの一部である。
-
Oliver Gould氏、Linkerdサービスメッシュとトラフィック管理を語る
LinkerdのプロダクトリーダでBuoyant CTOのOliver Gould氏が、先週{のQCon New York 2019 Conferenceで、Linkerdサービスメッシュについて、トラフィック管理機能を中心に講演した。
-
Athena - Dropbox開発チームのビルド状況自動監視システム
Dropboxのエンジニアたちは、35,000近いビルドと数百万の自動テストを実行しており、不正なコミットや環境条件によってテストがフェールすることも多い。そのためチームは、不安定なテストを検出および隔離し、コード作者に通知するために必要な手作業操作を最小限にする監視システムを構築した。
-
Expo:Walmart LabsでのSpark StreamingとKafkaを使ったリアルタイムA/Bテストとモニタリング
WalmartLabsのエンジニアリングチームは、Expoと呼ばれるリアルタイムのA/Bテストツールを開発した。これは、ユーザエンゲージメントメトリックを収集し分析するものである。Spark Structured Streamingを使用して受信データを処理し、メトリクスをKairosDBに格納する。
-
HashiCorp、レイヤ7オブザーバビリティと集中型コンフィギュレーションを備えたConsul 1.5.0をリリース
Hashicorpは、同社のサービスメッシュアプリケーション兼キーバリューストアである、Consulのバージョン1.5.0をリリースした。今回のリリースは、新たなロードマップ上てリリースされた最初のバージョンであり、EnvoyによるL7オブザーバビリティとロードバランシングのサポー���、集中型コンフィギュレーション、信頼済サードパーティアプリケーションのACL認証サポートを含んでいる。
-
Booking.comにおけるGraphiteのスケールアップ
Booking.comのエンジニアリングチームは、小規模クラスタで運用していた同社のGraphiteデプロイメントをスケールアップし、毎秒数百万のメトリック処理を可能にした。スケールアップの過程において、同チームは、Graphiteのコアコンポーネントであるcarbon-relayとcarbon-cache、レンダリングAPIの修正と最適化を実施した。
-
カオスエンジニアリングと可観測性 - Russ Miles氏に聞く
O'Reillyの新しいレポート "Chaos Engineering Observability: Bringing Chaos Experiments into System Observability"では,筆者のRuss Miles氏が,可観測性とカオスエンジニアリングは"密接に関連している"と考える理由が論じられている。エンジニアがカオス試験を実施する場合には,試験の対象とする下位システムに関して多くの問いかけをする必要が生じるはずだ,と氏は主張する。
-
New York Timesエンジニアリングチームによるスケーリング,インシデント管理,コラボレーション
The New York Timesのエンジニアリングチームが、2018年11月の米国中期選挙でのトラフィック増加を背景とした、 スケーリングとインシデント管理への取り組みについての記事を書いている。
-
ElasTestで実現するテスト時の可観測性
分散アプリケーションでは,非分散アプリケーションで一般的に使用されているデバッグテクニックを使うのは困難である。テスト環境においても運用時のような可観測性を実現すれば,バグの検出が容易になる,とFrancisco Gortázar氏は,European Testing Conference 2019で主張し,可観測性を使って複雑な分散システムのテストと評価を行うツールとして,ElasTestを紹介した。
-
マイクロサービスを始める時にすべきこと - Ben Sigelman氏のQCon Londonでの講演より
Ben Sigelman氏はGoogleに在籍していた数年間,我々が現在マイクロサービスアーキテクチャと呼んでいるものを開発していた。この開発中になされたいくつかの過ちが,今日では業界全体で繰り返されている,というのが氏の意見だ。QCon London 2019で行ったプレゼンテーションの中で氏は,マイクロサービスを始める時,このような過ちを避けるために行うべきことについて説明した。
-
複雑な分散システムをテストする
分散システムの複雑性はコードの中ではなく、サービスや機能の間にある。テストには問題の発見と価値提供のバランスという意味があるのだ – Sarah Wells氏はEuropean Testing Conferenceで、このように説明した。テスタはしばしば、システム動作の最大の理解者である。システムのどこが悪いのかについて優れた仮説を持ち、それを極めて短期間に検証することができるのは彼らなのだ。
-
Coinbaseにおけるメトリクスコレクションとログアグリゲーションの進化
CoinbaseのソフトウェアエンジニアであるLuke Demi氏は、2018年半ばからCoinbaseで実施されてきたモニタリングとロギングの変更に関する記事を書いている。Coinbaseは、ログ分析とメトリクス視覚化という2つの目的を果たすセルフマネージドのElasticsearchクラスタから、メトリクスコレクション用のDatadogとログアグリゲーション用のAWSのマネージドElasticsearchへと移行した。
-
自社開発ソリューションuMonitorとMerisによるUberの可観測性スケールアップ
Uberのインフラストラクチャは,モバイルアプリケーションやインフラストラクチャや内部サービスをサポートする数千のマイクロサービスで構成されている。これらのサービスに高い可観測性(obervability)を提供するため,UberのObservabilityチームは2つの監視ソリューションを構築した。時系列でメトリクスベースの警告を行うuMonitorと,ホストレベルのチェックとメトリクスを扱うNerisである。