InfoQ ホームページ Monitoring JP に関するすべてのコンテンツ
-
Thanos - 無制限ストレージを備えたスケーラブルなPrometheus
ImprobableのエンジニアリングチームがThaosをオープンソースとして公開した。Thaosはクロスクラスタフェデレーション、無制限ストレージ、クラスタを越えたグローバルクエリによって、Prometheusインストレーションの高可用性を実現するコンポーネントセットである。
-
AppDynamicsがビジネストランザクショントレースをSAP環境にまで拡大
アプリケーションのインテリジェンスとパフォーマンス管理に関するベンダで、Cisco傘下のAppDynamicsが、AppDynamics for SAPの提供開始を発表した。新たなABAPコードレベルの監視により、ユーザ向け製品からミッションクリティカルなSAPビジネスアプリケーションまで、コードレベルの洞察からユーザのタップやスワイプやクリックに至るまで、カスタマエクスペリエンスの可視化が可能になる。
-
DevOps考古学でプロダクションを理解する
Continuous Lifecycle Londonで、Lee Fox氏は、今日の複雑なシステムとインフラを理解するのに役立つツールと手法について語った。彼はこれをDevOps考古学と呼んでいる。
-
Appraiseでビジュアルテストを自動化する
ルックアンドフィールが成功の鍵を握るアプリケーションの開発においては、自動化されたビジュアルテストが有効な場合がある。GitHub上でMITライセンスで公開されているオープンソースツールのAppraiseは、“例示による仕様”というアプローチを採用することにより、視覚検査によってWebページの変更を検証し、承認する作業を支援する。
-
GoogleのStackdriverモニタリングがKubernetesのデプロイ向けサポートを強化
最近終了したKubeConで、GoogleはKubernetes向けのStackdriverモニタリングのベータ版リリースを発表した。主な機能には、既存のStackdriverダッシュボードの他のメトリックとともに、Kubernetesの統一されたコンテナメトリックとログを一元的に参照できる。また、Prometheusサポートが改善した。
-
SRE(Site Reliability Engineer)の役割とは - Catchpointの調査より
Site Reliability Engineeringとは、ソフトウェアエンジニアリングとITオペレーションを横断するもので、Googleが2003年に開発し、2016年に書籍“Site Reliability Engineering, How Google Runs Production Systems”で詳説したアプローチである。ディジタルエクスペリエンスとインテリジェンスのプロバイダであるCatchpointは、416名のSRE(Site Reliablity Engineer)を対象に、SREの意味の理解を目的とする調査を実施した。
-
オブザーバビリティはテストにどう影響するのか
オブザーバビリティ(observability)は現在のシステム状況を明らかにし、ある種のテストを置き換えることができる。低リスクのアプリケーション分野であれば、オブザーバビリティをテストの代役とすることで、継続的デリバリによる迅速なフィードバックと、短時間の変更リリースが可能になる。
-
MeilleursAgentsでの分散タスク・キューの監視
不動産販売者が不動産のリストを作成して、その不動産の見積もり価格を取得できるようにするウェブサイトであるMeilleursAgentsは、Celeryベースの分散タスクキューの監視方法の詳細を共有した。Python、StatsD、Bucky、Graphite、Grafanaの組み合わせによりパイプラインが形成され、タスクのライフサイクルと実行速度が監視される。
-
MakeMyTripの大規模Eコマースサイト監視方法
オンライン旅行会社であるMakeMyTripが、モニタリングについての考え方を披露し、いくつかの記事を書いている。同社は、オープンソースのツールを使って、ハイブリッドなインフラをスタックをまたがって監視している。
-
ING銀行はいかにSREを実践したか
ING NetherlandsのJanna Brummel、Robin van Zijll両氏がロンドンのVelocityカンファレンスで講演し、インターネットバンキングシステムの可用性の低さが同行のSRE文化導入の契機となった経緯について語った。オランダ本部にSREチームが結成され、ツーリングやコンサルティング、信頼性に関する教育をプロダクトチーム(社内ではBizDevOpsチームと呼ばれている)に提供した。
-
マイクロサービスの監視 - 2018年を予測する
マイクロサービスの監視と分散トレースは、長年にわたって課題のひとつとして認識されている。RisingStack CTOのPéter Márton氏は先頃、OpenTracingの取り組みを含むさまざまなアプローチに関する自身の経験と推奨、サンプルコード、将来の展望などを記事にした。
-
クラウドネイティブアプリケーションの観測可能性と監視
Cindy Sridharan氏は先日の記事で、クラウドネイティブアプリケーションの監視における観測可能性(observability)とその関連について、自身の考えを要約している。観測可能性(observability)は監視やログ集約、メトリクス、分散トレースなどを含む思想で、システムのより深い、アドホックな洞察の獲得を可能にするものだ。
-
CNCFがDocker Notary(セキュリティ)、Lyft Envoy(サービスメッシュ)、Uber Jaeger(トレース)各プロジェクトを新たにホスト
Cloud Native Computing Foundation(CNCF)は先月、新たにホスト対象とした4つのプロジェクトを発表した。DockerのNotary、The Update Framework(TUF)、LyftのEnvoy、そしてUberのJaegerだ。
-
CloudFlareのグローバルネットワークをPrometheusで監視する
Matt Bostock氏がSREcon 2017 Europeで行なった講演で、メトリックベースの監視ツールであるPrometheusが、CDNとDNS、およびDDoS対策プロバイダであるCloudFlareの持つ世界規模の分散インフラストラクチャおよびネットワーク監視においてどのように利用されているか、という話題が取り上げられた。
-
NGINXがマイクロサービスプラットフォーム, OpenShift Ingressコントローラ、Service Meshプレビュー版をリリース
NGINX IncがNGINX Application Platformをリリースした。マイクロサービス開発者のための“ワンストップショップ”を目標に、Red Hat OpenShift Container Platformでロードバランシングを実現するためのKubernetes Ingress Controllerソリューションと、Istioメッシュコントロールプレーン用サービスプロキシを含む。