Netflix Studio Search：ElasticsearchとApache Flinkを使ってフェデレーションGraphQLデータのインデックス付け

原文(投稿日：2022/04/19)へのリンク

Netflixのエンジニアは最近、どのようにStudio Searchの構築したかを公開した。そこでは、Apache Kafkaストリーム、Apache Flinkベースのデータメッシュプロセス、Elasticsearchシンクを使ってインデックスが管理される。彼らは、NetflixのフェデレーションGraphQLグラフの要素を抽出し、それを検索可能にするプラットフォームを設計した。現在、Studio Searchでは、組織内の多くのアプリケーションのユーザエクスペリエンスに関して重要な部分が強化されている。

Netflixのコンテンツエンジニアリングでは、各チームが独自にドメイングラフサービス（DGS）を構築・運用している。そして、同時に、フェデレーションゲートウェイによって公開される統合GraphQLスキーマでドメインを他のドメインに接続する。この構造を前提として、NetflixのエンジニアのAlex Hutter氏、Falguni Jhaveri氏、Senthil Sayeebaba氏は、Studio Searchの動機について次のように説明している。

エンティティ[...]がグラフで利用できるようになると、関連するエンティティの属性に基づいてクエリを実行し、エンティティを特定することが一般的になるでしょう。例えば「Ryan Reynolds氏が俳優として参加する現在撮影中のすべての映画をください」というクエリです。

ユーザが検索対象とするグラフ内で、リンクしているエンティティの例
出典: https://netflixtechblog.com/how-netflix-content-engineering-makes-a-federated-graph-searchable-5c0c1c7d7eaf

著者によると、フェデレーショングラフアーキテクチャでは、各サービスが「エンドポイントを提供し、そのエンドポイントが、そのサービスで所有していないデータに適用されるクエリとフィルターを受け入れる必要がある」。そして、それを使って、返すべき適切なエンティティを特定する必要がある。悪いことに「サービスを所有するすべてのエンティティがこの処理を行う必要がある」。フェデレーショングラフを検索できるようにする上で、この共通の問題がStudio Searchの作成につながった。

Studio Searchのインデックス作成アーキテクチャ
出典: https://netflixtechblog.com/how-netflix-content-engineering-makes-a-federated-graph-searchable-5c0c1c7d7eaf

上の図は、Studio Searchのアーキテクチャと、どのようにしてフェデレーショングラフの要素に対するインデックスを維持するかを示している。アプリケーションイベントとChange Data Capture（CDC）イベントは、スキーマ化されたKafkaストリームにストリーミングされる。Apache Flinkのデータメッシュプロセスではこういったイベントが消費され、フェデレーションゲートウェイに対してユーザが提供するGraphQLクエリを使ってデータが強化される。フェッチされたドキュメントは別のスキーマ化されたKafkaトピックに配置される。そしてその後、Data MeshでElasticsearchシンクによって処理され、Elasticsearchにインデックス付けされる。

チームは早い段階から手作業で統合を行っていた。しかし、Studio Searchとの統合のリクエストで没となったため、これは広がらなかった。「パイプラインのプロビジョニングを可能な限り自動化できるツールを構築する必要があった。」

自動化するために、チームは1つのYAML設定ファイルを定義した。このファイルによって、ユーザがパイプラインに関する高レベルの説明を記述できるようになる。次に、この設定を使って、データメッシュにインデックスパイプラインをプログラムで作成する。

サンプルの.yaml設定
出典: https://netflixtechblog.com/how-netflix-content-engineering-makes-a-federated-graph-searchable-5c0c1c7d7eaf

チームは、設定ファイルのGraphQLクエリテンプレートから、スキーマ化されたKafkaストリームに必要なApache Avroスキーマと、Elasticsearchに必要なインデックステンプレートを生成する。最後に、Pythonベースのコマンドラインインターフェイス（CLI）ツールを介してセルフサービスによるデプロイができる。

チームが現在直面している課題は、新しいインデックスをどのようにブートストラップするかである。そして、その際に、システムに過負荷をかけず、逆引き参照の使用を改善し、古いデータや欠落データに対するインデックスの一貫性と耐性を改善することが必要である。

作者について

Eran Stiller

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Eran Stiller

この記事に星をつける

このコンテンツのトピックは Architecture です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

GitHub社、Free、Pro、およびPro+ユーザーからのCopilotインタラクションデータを、AIモデルのトレーニングに使用する方針

23年間潜伏していたリモート悪用可能なLinuxカーネル脆弱性の発見にClaude Codeが使われた

AI搭載ボットがGitHub Actionsワークフローを侵害、Microsoft、DataDog、CNCFプロジェクトにわたり

Anthropicが3エージェント・ハーネスを設計、長時間稼働するフルスタックAI開発を支援

Claude Codeオートモードの内側：人間承認ゲートを備えたAnthropicの自律コーディングシステム

Cloudflare社、AIエージェント向けにトークン使用量を最適化するCode Mode対応MCPサーバーを発表

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

NVIDIAがIsingオープンモデルを発表、量子コンピューティング向け

MySQL 9.6で外部キー制約とカスケード処理が変更

Anthropicの論文がLLMでの感情様メカニズムの行動影響を検証

Cloudflare社は、自社のエッジにアクティブなAPI脆弱性スキャンを追加

GitHub Copilot CLI一般提供開始

Platform Engineering Labs社、formaeをマルチクラウド対応に拡張

Online InfoQ AI Engineering Certification

Online InfoQ Architect Certification

QCon San Francisco

QCon London 2027

Netflix Studio Search：ElasticsearchとApache Flinkを使ってフェデレーションGraphQLデータのインデックス付け

作者について

Eran Stiller

この記事に星をつける

このコンテンツのトピックは Architecture です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター