InfoQ ホームページパフォーマンス&スケーラビリティに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

設計/アーキテクチャ

Discord、単一サーバーで100万人以上のオンラインMidJourneyユーザーに拡大

Discordは、応答性の高いユーザー体験を維持しながら、単一サーバーで100万人以上のオンライン・ユーザーにサービスを提供するためにプラットフォームを最適化した。同社は、システム観測可能性とパフォーマンスチューニングに支えられた一連のパフォーマンスとスケーラビリティの改善で、何十億ものメッセージ通知を扇状に流す役割を担うギルドコンポーネントを進化させた。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2024年2月5日午前7時30分
設計/アーキテクチャ

LinkedInがREST+JSONではなくgRPC+Protobufを選んだ理由：Karthik Ramgopal氏とMin Chen氏とのQ&A

LinkedInは、Microservices platformのサービス間通信にProtocol Buffersを使ったgRPCに移行すると発表した。従来は、オープンソースのRest.liフレームワークが主要なシリアライゼーションフォーマットとしてJSONと共に使われていた。

Rafal Gancarz 翻訳者 Kumi Yoshikawa
投稿日 2024年1月18日午前2時30分
Cloud

Amazon Aurora Limitless Databaseによる自動水平スケーリング

AWSは最近、Amazon Aurora Limitless Databaseのプレビューを発表した。この新機能は、毎秒数百万の書き込みトランザクション処理し、一つのAuroraデータベースでペタバイトのデータを管理し、自動水平スケーリングをサポートする。

Steef-Jan Wiggers 翻訳者 Takashi Kawase
投稿日 2023年12月21日午前5時31分
設計/アーキテクチャ

HubSpotがワークフロー・アクションをタイムリーに処理するためにApache Kafkaスイムレーンを使用する方法

HubSpotは、コンシューマーグループの遅延の蓄積を回避し、リアルタイムのトラフィックの処理を優先するために、同じプロデューサーの複数のKafkaトピック（スイムレーンと呼ばれる）上でメッセージをルーティングすることを採用した。トラフィック急増の自動検知と手動検知を組み合わせて使用することで、同社は顧客の大半のワークフローが遅延なく実行されるようにしている。

Rafal Gancarz 翻訳者 Naoko Koshimura
投稿日 2023年12月19日午前12時7分
設計/アーキテクチャ

LinkedIn、EspressoをHTTP2に移行し、接続数を88％、待ち時間を75％削減

LinkedInは、EspressoデータベースをHTTP/1.1からHTTP/2に移行することで、接続数、待ち時間、ガベージコレクション時間を削減し、性能と拡張性を劇的に向上させた。これらを改善するために、チームはNettyのデフォルトHTTP/2スタックを最適化し、ニーズに合わせる必要があった。

Rafal Gancarz 翻訳者 Takashi Kawase
投稿日 2023年12月12日午前2時31分
Cloud

マイクロソフトがWell-Architected Frameworkをアップデート

マイクロソフトは先日、Azure上で最適化されたワークロードを設計・実行するためのWell-Architected Framework（WAF）の包括的なアップデートを発表した。

Steef-Jan Wiggers 翻訳者 Takashi Kawase
投稿日 2023年11月22日午前7時31分
設計/アーキテクチャ

AWS、Well-Architected Frameworkを再編・統合

AWSは、Well-Architected Frameworkの6つの柱すべてに変更を加え、新たなアップデートを発表した。パフォーマンス効率とオペレーショナルエクセレンスの柱は、ベストプラクティスの数を減らすために再構築・統合された。その他の柱では、再利用可能なアーキテクチャパターンに関する推奨事項や手順など、実装ガイダンスが改善されている。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2023年11月20日午前5時30分
設計/アーキテクチャ

DoorDashはどのようにキャッシュをリアーキテクトし、スケーラビリティとパフォーマンスを向上させたか？

DoorDashは、すべてのマイクロサービスで使用していたヘテロ環境（相互接続・連携に保証のないハードウェアやソフトウェアを混在させて利用している状況のこと）のキャッシュシステムを再構築し、汎用的なメカニズムを提供する共通の多層キャッシュを作成した。

Sergio De Simone 翻訳者 Takamasa Sugawara
投稿日 2023年11月17日午前10時30分
設計/アーキテクチャ

Contentsquare、通知配信にマイクロサービスとApache Kafkaを起用

Contentsquareは、プラットフォーム内の多くのユースケースで通知機能を必要としていた。そこで同社は、マイクロサービス・アーキテクチャの一部として、複数のサービスにまたがる汎用的なソリューションを作成。この実装で、開発者はオブザーバビリティを改善し、スケーラビリティの課題を克服する必要があった。

Rafal Gancarz 翻訳者 Mitsuru Takatsuki
投稿日 2023年11月7日午前7時30分
AIと機械学習、データエンジニアリング

本番環境におけるLLM最適化のための、Hugging Faceのガイド

大規模言語モデル(LLM)を実運用に導入する場合、2つの大きな課題は、それらが必要とする膨大な量のパラメータと、文脈情報を表現するための非常に長い入力シーケンスを扱う必要性から生じる。 Hugging Faceは、このようなモデルを扱った経��に基づき、これらのハードルに取り組むためのテクニックのリストを文書化した。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2023年10月16日午前5時31分
設計/アーキテクチャ

Cadence1.0：Uberがスケーラブルなワークフロー・オーケストレーション・プラットフォームをリリース

Uberは6年間の開発期間を経て、Cadenceと名付けられたワークフロー・オーケストレーション・プラットフォームのメジャーバージョンをリリースした。Uberや他の企業は、ネイティブのプログラミング言語を使ってステートフルなサービスを大規模に構築するためにCadenceを使用している。チームは、使いやすさ、オブザーバビリティ、効率性の向上を目標に次のリリースに取り組んでいる。

Rafal Gancarz 翻訳者 Naoko Koshimura
投稿日 2023年8月24日午前12時39分
Cloud

AWS、AI/MLおよびHPCワークロード向けAmazon EC2 P5インスタンスの一般提供を開始

AWSはこのほど、AI/MLおよびHPCワークロードで高いパフォーマンスとスケーラビリティを必要とするユーザー向けに、最新のNVIDIA H100 Tensor Core GPUを搭載したAmazon EC2 P5インスタンスの一般提供（GA）を発表した。今回のGAは、先に発表されたインフラストラクチャの開発に続くものである。

Steef-Jan Wiggers 翻訳者 Tomoo Morikawa
投稿日 2023年8月19日午前12時52分
Cloud

パフォーマンス向上、コスト最適化するAzure Cosmos DBの新機能

マイクロソフト社がコスト効率を高め、パフォーマンスを向上、順応性を高めたAzure Cosmos DBの新機能を発表した。新しく発表された機能はバースト容量、階層パーティション・キー、1TBのサーバーレス・コンテナ・ストレージ、プライオリティ・ベースの実行である。

Steef-Jan Wiggers 翻訳者 Tetsuya Hanakawa
投稿日 2023年8月4日午前8時2分
設計/アーキテクチャ

Datadog、スケーラブルなデータインジェストアーキテクチャを構築する

原文リンク(2023-06-16)Datadogは、第3世代のログストレージシステムHusky専用のデータインジェストアーキテクチャを開発した。このイベント駆動型アーキテクチャ(EDA) により正確なセマンティクスを実現、マルチテナントプラットフォームのトラフィックのバーストに対応し、妥当なインジェストレイテンシーと許容できる運用コストで対応できる。

Rafal Gancarz 翻訳者 Tetsuya Hanakawa Ayako Ueno
投稿日 2023年7月12日午前5時43分
設計/アーキテクチャ

Slackのリアルタイムメッセージングアーキテクチャ

Slackは最近、世界中で毎日数百万件のリアルタイムメッセージを送信する方法を公開した。同社は、リアルタイムメッセージを大規模に管理するために設計されたPub/Subアーキテクチャについて包括的な洞察を提供している。この記事では、異なるタイムゾーンや地域をまたぐリアルタイムメッセージの配信がもたらす独自の課題と、それを処理するためにSlackのエンジニアがどのようにインフラを設計したかが紹介されている。

Eran Stiller 翻訳者 Ayako Ueno
投稿日 2023年5月24日午後3時49分