InfoQ ホームページ パフォーマンス&スケーラビリティ に関するすべてのコンテンツ
-
LinkedInがREST+JSONではなくgRPC+Protobufを選んだ理由:Karthik Ramgopal氏とMin Chen氏とのQ&A
LinkedInは、Microservices platformのサービス間通信にProtocol Buffersを使ったgRPCに移行すると発表した。従来は、オープンソースのRest.liフレームワークが主要なシリアライゼーションフォーマットとしてJSONと共に使われていた。
-
Amazon Aurora Limitless Databaseによる自動水平スケーリング
AWSは最近、Amazon Aurora Limitless Databaseのプレビューを発表した。この新機能は、毎秒数百万の書き込みトランザクション処理し、一つのAuroraデータベースでペタバイトのデータを管理し、自動水平スケーリングをサポートする。
-
HubSpotがワークフロー・アクションをタイムリーに処理するためにApache Kafkaスイムレーンを使用する方法
HubSpotは、コンシューマーグループの遅延の蓄積を回避し、リアルタイムのトラフィックの処理を優先するために、同じプロデューサーの複数のKafkaトピック(スイムレーンと呼ばれる)上でメッセージをルーティングすることを採用した。トラフィック急増の自動検知と手動検知を組み合わせて使用することで、同社は顧客の大半のワークフローが遅延なく実行されるようにしている。
-
LinkedIn、EspressoをHTTP2に移行し、接続数を88%、待ち時間を75%削減
LinkedInは、EspressoデータベースをHTTP/1.1からHTTP/2に移行することで、接続数、待ち時間、ガベージコレクション時間を削減し、性能と拡張性を劇的に向上させた。これらを改善するために、チームはNettyのデフォルトHTTP/2スタックを最適化し、ニーズに合わせる必要があった。
-
マイクロソフトがWell-Architected Frameworkをアップデート
マイクロソフトは先日、Azure上で最適化されたワークロードを設計・実行するためのWell-Architected Framework(WAF)の包括的なアップデートを発表した。
-
AWS、Well-Architected Frameworkを再編・統合
AWSは、Well-Architected Frameworkの6つの柱すべてに変更を加え、新たなアップデートを発表した。パフォーマンス効率とオペレーショナルエクセレンスの柱は、ベストプラクティスの数を減らすために再構築・統合された。その他の柱では、再利用可能なアーキテクチャパターンに関する推奨事項や手順など、実装ガイダンスが改善されている。
-
DoorDashはどのようにキャッシュをリアーキテクトし、スケーラビリティとパフォーマンスを向上させたか?
DoorDashは、すべてのマイクロサービスで使用していたヘテロ環境(相互接続・連携に保証のないハードウェアやソフトウェアを混在させて利用している状況のこと)のキャッシュシステムを再構築し、汎用的なメカニズムを提供する共通の多層キャッシュを作成した。
-
Contentsquare、通知配信にマイクロサービスとApache Kafkaを起用
Contentsquareは、プラットフォーム内の多くのユースケースで通知機能を必要としていた。そこで同社は、マイクロサービス・アーキテクチャの一部として、複数のサービスにまたがる汎用的なソリューションを作成。この実装で、開発者はオブザーバビリティを改善し、スケーラビリティの課題を克服する必要があった。
-
本番環境におけるLLM最適化のための、Hugging Faceのガイド
大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経験に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。
-
Cadence1.0:Uberがスケーラブルなワークフロー・オーケストレーション・プラットフォームをリリース
Uberは6年間の開発期間を経て、Cadenceと名付けられたワークフロー・オーケストレーション・プラットフォームのメジャーバージョンをリリースした。Uberや他の企業は、ネイティブのプログラミング言語を使ってステートフルなサービスを大規模に構築するためにCadenceを使用している。チームは、使いやすさ、オブザーバビリティ、効率性の向上を目標に次のリリースに取り組んでいる。
-
AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始
AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供(GA)を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。
-
パフォーマンス向上、コスト最適化するAzure Cosmos DBの新機能
マイクロソフト社がコスト効率を高め、パフォーマンスを向上、順応性を高めたAzure Cosmos DBの新機能を発表した。新しく発表された機能はバースト容量 、階層パーティション・キー、1TBのサーバーレス・コンテナ・ストレージ、プライオリティ・ベースの実行である。
-
Datadog、スケーラブルなデータインジェストアーキテクチャを構築する
原文リンク(2023-06-16)Datadogは、第3世代のログストレージシステムHusky専用のデータインジェストアーキテクチャを開発した。このイベント駆動型アーキテクチャ(EDA) により正確なセマンティクスを実現、マルチテナントプラットフォームのトラフィックのバーストに対応し、妥当なインジェストレイテンシーと許容できる運用コストで対応できる。
-
Slackのリアルタイムメッセージングアーキテクチャ
Slackは最近、世界中で毎日数百万件のリアルタイムメッセージを送信する方法を公開した。同社は、リアルタイムメッセージを大規模に管理するために設計されたPub/Subアーキテクチャについて包括的な洞察を提供している。この記事では、異なるタイムゾーンや地域をまたぐリアルタイムメッセージの配信がもたらす独自の課題と、それを処理するためにSlackのエンジニアがどのようにインフラを設計したかが紹介されている。
-
BBCの新たなサーバーレスプラットフォームによりスケーラビリティとパフォーマンスが向上
新しいWebCoreサーバーレスプラットフォームへの移行から1年後、BBCは、アーキテクチャのメリットを享受し始めた。このアーキテクチャにより、パフォーマンスと運用上の課題を解決するエンジニアの負担を取り除くことができ、顧客に提供する価値に集中できるようになった。