HashnodeがStep Functions、EventBridge、RedisでAWS上にスケーラブルなフィードアーキテクチャを構築

原文リンク(2024-03-15)

Hashnodeは、数千人のユーザーのフィードデータを構成するためのスケーラブルなイベント駆動アーキテクチャ（EDA）を構築した。同社は、Lambda、Step Functions、EventBridge、Redis Cacheを含むAWS上のサーバーレスサービスを使用した。このソリューションは、Step Functionsの分散マップ機能を活用し、高度な並行処理を可能にしている。

同社は以前、パーソナライズされたユーザーフィードを提供するソリューションを実装していたが、すぐにそのソリューションがページ読み込みの遅さや、ユーザーフィードをその場で構成する際に高コストなクエリを実行するためデータベースが不安定になる潜在的なリスクを抱えていることが判明した。HashnodeのソフトウェアエンジニアであるFlorian Fuchs氏は、フィード計算を最適化するための全体的なアイデアについて説明している。

ページスピードを最適化するためには、ユーザー用のフィードを事前に計算することが最良の選択肢だと判明しました。これは、ユーザーがフィードページにアクセスするたびにフィードを計算する必要がないことを意味します。その代わり、キャッシュからフィードを返し、ページの読み込み時間をより速くすることができます。そのために重要なのが、キャッシュを使うことです。キャッシュが提供する高速アクセスによって、そこから直接フィードを読み込んでユーザーに提示できます。

エンジニアは、フィード計算ロジックをAWS Step Functionsに実装し、2つのワークフローを使用した。最初のワークフローでは、3つのLambda関数を使用して、フィード計算のためにユーザーデータを準備する。Lambda関数はデータベースから関連データを抽出し、AWS ElastiCache（Redis）キャッシュに保存する。2つ目のワークフローは、実際のフィード計算を担当する。ユーザーに対してキャッシュされたメタデータが見つかるかどうかに応じて、フィード計算ロジックは、Redisキャッシュからソースされたメタデータに完全に基づくか、データベースのユーザーメタデータを抽出する必要がある。

新しいアーキテクチャでは、フィードの再計算は、投稿の作成や更新のイベントによってトリガーされ、AWS EventBridgeに公開されるか、EventBridgeスケジューラーの支援を受けて定期的に行われる。

Hashnodeチームは、並列ワークロードのオーケストレーションに役立つStep FunctionsのMapステートを活用した。Mapステートは、処理要件に応じて2つのモードをサポートする。デフォルトのインラインモードは、並行性が制限され、入力としてJSON配列のみを受け付ける。分散モードは大規模な並列ワークロードに適しており、S3に保存されたデータソースの処理をサポートする。分散モードでは、Step Functionsは10,000以上の並列子ワークロードを実行可能だ。

分散MapステートによるStep Functions（出典：AWSドキュメント）

このソリューションでは、分散モードでMapステートを使用する2つのStep Functionsが採用されている。1つはキャッシュされたメタデータを持つユーザー用、もう1つはメタデータが見つからなかったユーザー用だ。開発者の報告によると、今のところ、数千人のユーザーに対するフィードの完全な再計算には、わずか26秒しかかからないという。チームはさらに、古いキャッシュデータが定期的に削除されるよう、定期的なキャッシュ・パージ・ロジックを実装した。

作者について

Rafał Gancarz

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Rafał Gancarz

この記事に星をつける

このコンテンツのトピックは Event Driven Architecture です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

AnthropicがClaude Code品質苦情の6週間を3つのプロダクト変更の重なりと特定

GitHub社、Free、Pro、およびPro+ユーザーからのCopilotインタラクションデータを、AIモデルのトレーニングに使用する方針

23年間潜伏していたリモート悪用可能なLinuxカーネル脆弱性の発見にClaude Codeが使われた

CloudflareがProject Thinkを発表：AIエージェント向け永続ランタイム

Dropbox社がGitHub社と協力し、モノレポのサイズを87GBから20GBに削減

Anthropicが3エージェント・ハーネスを設計、長時間稼働するフルスタックAI開発を支援

プラットフォームエンジニアリングのインパクトをドライブし、測定する

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

AnthropicのCode with ClaudeがManaged Agents、プロアクティブワークフロー、ケイパビリティカーブを発表

GoogleがGemma4をApache 2.0ライセンスでリリース、マルチモーダルおよびエージェント機能搭載

AnthropicがClaude Platformを提供開始、AWS上で

Googleがノードプール自動作成速度を向上、GKEクラスタ向け

Argo CD 3.3、安全なGitOps削除と円滑な日常運用を実現

Teleport社、企業インフラ全体でAIエージェントを保護するAgentic Identity Frameworkを発表

Online InfoQ AI Engineering Certification

Online InfoQ Architect Certification

Online InfoQ AI Security & Privacy Engineering Program

QCon San Francisco

QCon London 2027

HashnodeがStep Functions、EventBridge、RedisでAWS上にスケーラブルなフィードアーキテクチャを構築

作者について

Rafał Gancarz

この記事に星をつける

このコンテンツのトピックは Event Driven Architecture です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター