InfoQ ホームページ Performance に関するすべてのコンテンツ
-
カオスエンジニアリングと可観測性 - Russ Miles氏に聞く
O'Reillyの新しいレポート "Chaos Engineering Observability: Bringing Chaos Experiments into System Observability"では,筆者のRuss Miles氏が,可観測性とカオスエンジニアリングは"密接に関連している"と考える理由が論じられている。エンジニアがカオス試験を実施する場合には,試験の対象とする下位システムに関して多くの問いかけをする必要が生じるはずだ,と氏は主張する。
-
New York Timesエンジニアリングチームによるスケーリング,インシデント管理,コラボレーション
The New York Timesのエンジニアリングチームが、2018年11月の米国中期選挙でのトラフィック増加を背景とした、 スケーリングとインシデント管理への取り組みについての記事を書いている。
-
ElasTestで実現するテスト時の可観測性
分散アプリケーションでは,非分散アプリケーションで一般的に使用されているデバッグテクニックを使うのは困難である。テスト環境においても運用時のような可観測性を実現すれば,バグの検出が容易になる,とFrancisco Gortázar氏は,European Testing Conference 2019で主張し,可観測性を使って複雑な分散システムのテストと評価を行うツールとして,ElasTestを紹介した。
-
マイクロサービスを始める時にすべきこと - Ben Sigelman氏のQCon Londonでの講演より
Ben Sigelman氏はGoogleに在籍していた数年間,我々が現在マイクロサービスアーキテクチャと呼んでいるものを開発していた。この開発中になされたいくつかの過ちが,今日では業界全体で繰り返されている,というのが氏の意見だ。QCon London 2019で行ったプレゼンテーションの中で氏は,マイクロサービスを始める時,このような過ちを避けるために行うべきことについて説明した。
-
複雑な分散システムをテストする
分散システムの複雑性はコードの中ではなく、サービスや機能の間にある。テストには問題の発見と価値提供のバランスという意味があるのだ – Sarah Wells氏はEuropean Testing Conferenceで、このように説明した。テスタはしばしば、システム動作の最大の理解者である。システムのどこが悪いのかについて優れた仮説を持ち、それを極めて短期間に検証することができるのは彼らなのだ。
-
Orchestrator、Consul、HAProxyを使用したWePayの高可用性MySQLクラスタリング
WePayのエンジニアリングチームが,HAProxy,Consul,Orchestratorで構築された新しい高可用性MySQLクラスタについて語っている。ダウンタイムを30分から40~60秒に短縮することで,それまでのアーキテクチャを改善している。
-
Coinbaseにおけるメトリクスコレクションとログアグリゲーションの進化
CoinbaseのソフトウェアエンジニアであるLuke Demi氏は、2018年半ばからCoinbaseで実施されてきたモニタリングとロギングの変更に関する記事を書いている。Coinbaseは、ログ分析とメトリクス視覚化という2つの目的を果たすセルフマネージドのElasticsearchクラスタから、メトリクスコレクション用のDatadogとログアグリゲーション用のAWSのマネージドElasticsearchへと移行した。
-
自社開発ソリューションuMonitorとMerisによるUberの可観測性スケールアップ
Uberのインフラストラクチャは,モバイルアプリケーションやインフラストラクチャや内部サービスをサポートする数千のマイクロサービスで構成されている。これらのサービスに高い可観測性(obervability)を提供するため,UberのObservabilityチームは2つの監視ソリューションを構築した。時系列でメトリクスベースの警告を行うuMonitorと,ホストレベルのチェックとメトリクスを扱うNerisである。
-
インクリメンタルなアーキテクチャアプローチ
世界中のアプリケーションのほとんどのうち、おそらく90%は、モノリシックなアプローチで動いている。オーバーエンジニアリングを避けるために、私たちはシンプルなアーキテクチャから始めて、必要に応じて進化させなくてはならない、Randy Shoup氏はReactive Summit 2018でこう語った。彼は最近発表したプレゼンテーションで、小さく始まり、やがて大規模でグローバルなインターネット会社に成長した企業での経験について説明した。
-
AmazonがAWSクラウドマップ「クラウドリソースのためのサービスディスカバリ」を発表
最近のブログ記事で、Amazonはクラウドリソースを発見し追跡するAWS Cloud Mapと呼ばれる新しいサービスを紹介し��。マイクロサービスアーキテクチャの出現に伴い、これらのアーキテクチャで動的リソースを管理することがますます困難になっている。しかし、AWS Cloud Mapを使用すると、開発者はデータベース、キュー、マイクロサービス、およびその他のクラウドリソースの状態をカスタム名で監視できる。
-
Grafanaが時系列メトリクスにログデータ相関を追加
Grafanaチームは、メトリクスクエリやビジュアライゼーションといったGrafana機能と連携したロギングプラットフォーム、Lokiのαバージョンを発表した。Lokiは、新しいクライアントエージェントpromtailと、ログメタデータのインデックスとストレージのためのサーバーサイドコンポーネントを追加する。
-
Stack Overflow のモニタリングシステムの中身
Stack Exchange のアーキテクチャリードである Nick Craver 氏は最近、彼らのモニタリングシステムについて記事を書いた。彼はそのモニタリング戦略の背後にある哲学と動機について議論し、そのツール群、 Bosun、Grafana、Opserverなどについて語った。
-
リアクティブサービスのためのパフォーマンステスト
Reactive Summitで、Pivotusのエンジニアリング担当ディレクターであるLilit Yenokyan氏は、リアクティブサービスのためのパフォーマンステストについて発表した。Yenokyan氏はパフォーマンステストの種類について説明し、テストを実行して結果を分析するために必要なツールについて紹介した。
-
NGINXインタビュー: ソフトウェアロードバランシング、APIゲートウェイ、サービスメッシュの企業導入について
InfoQは先日、NGINX IncのRob Whiteley, Sidney Rabsatt, Liam Crilly各氏と席を共にして、ネットワークとデータセンタコミュニケーションの将来について、彼らのビジョンを聞くことができた。同社では、テクノロジの現状と自らの目標を鑑みながら、ソフトウェアロードバランサ、Ingressゲートウェイ、サービスメッシュの活用を目指す企業の“信頼できるアドバイザ”として、導入の“敷居を低くする(easy on-ramp)”ことを目標としている。
-
低コストでシンプルなサイト監視ツール“Checkless” - 開発者とのQ&A
Steve Elliott氏は、Webサイトの稼働時間を監視する簡単で安価な方法を必要としていた。ほとんどの既製ツールは、氏にとって複雑過ぎたり、費用が高過ぎるものだったのだ。pingベースのチェックでサイトの稼働時間を監視するサーバレスツールのChecklessを氏が開発したのは、このような理由からだ。使い方次第で、さまざまな用途に利用することができる。