BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Cloudflare社、AIエージェント向けにトークン使用量を最適化するCode Mode対応MCPサーバーを発表

Cloudflare社、AIエージェント向けにトークン使用量を最適化するCode Mode対応MCPサーバーを発表

原文リンク(2026-04-16)

Cloudflare社は、、AIエージェントが複雑なAPIへアクセスする手法を大きく進化させるCode Modeを活用した新たなModel Context Protocol(MCP)サーバーを発表した。これにより、同社のフルAPIプラットフォームとの連携コストを大幅に削減できる。今回のアプローチは、MCPエコシステムにおけるエージェントとツールの統合手法に新たな方向性を示した。

MCPは、大規模言語モデル(LLM)が外部ツールやAPIと連携可能にする新興標準である。実行中にモデルが呼び出せる構造化ツールを公開することで実現する。従来は、エージェントに公開される各APIエンドポイントが個別のツール定義として扱われていた。この方式は単純である一方、各ツール仕様がモデルの限られた入力予算内でトークンを消費するため、ユーザーのタスクを推論するためのコンテキスト領域を圧迫するという大きなコストがあった。

Cloudflare社のソリューションエンジニアであるLuuk Hofman氏は次のように述べている。

そこで私たちは試しました。MCPツールをTypeScript APIに変換し、LLMに対してそれに基づくコードを書いてもらうという方法です。

Cloudflare社のCode Modeは、search()execute()の2つのツールのみを公開する方式である。型認識対応SDKを基盤とし、モデルがセキュアなV8アイソレート内でJavaScriptを生成・実行できる。これにより、エージェントの計画を小規模なコードスニペットへとコンパイルし、OpenAPI仕様に対して複数の操作をオーケストレーションできる。すべてのエンドポイント定義をコンテキストに読み込む必要がなくなる。

従来型MCPとCloudflare Code Modeの比較(出典: Cloudflare社ブログ記事

実務上の効果は大きい。Cloudflare社によれば、コードモードを使用することで、2,500以上のAPIエンドポイントとの連携に必要なトークン量は、従来の117万トークン超から約1,000トークンへと削減された。約99.9%の削減である。この固定的なフットプリントはAPIの規模に依存しないため、大規模かつ高機能なプラットフォーム全体にわたり、モデルのコンテキストを枯渇させることなくエージェントを動作させることが可能だ。

Cloudflare社はRedditへの投稿で強調している。

チームは、広範なAPIスキーマを最小限のコンテキストウィンドウに収めつつ、機能的な精度を損なわないための特化したエンコーディング戦略を活用しました。

エージェントはまずsearch()を使用し、製品領域、パス、またはメタデータに基づいてOpenAPI仕様を検索する。仕様自体はモデルのコンテキストには入らない。その後、execute()がページネーション処理、条件分岐ロジック、連鎖的なAPI呼び出しを単一サイクルで実行する。これによりラウンドトリップのオーバーヘッドを削減できる。

Cloudflare社は、実行時のセキュリティおよびサンドボックスモデルも強調している。サーバーは、ユーザー生成コードをDynamic Workerアイソレート内で実行する。ファイルシステムへのアクセスはなく、環境変数も公開されず、外部リクエストは明示的なハンドラーを通じて制御される。この設計により、信頼されていないコードの実行に伴うリスクを軽減しつつ、エージェントの自律性を維持できる。

この新しいMCPサーバーは、DNS、Zero Trust、Workers、R2といった既存サービスを含むCloudflare社の全APIを対象としており、開発者は即時に統合可能だ。またCloudflare社は、同社のAgents SDKの一部としてCode Mode SDKをオープンソース化し、サードパーティーによるMCP実装でも同様のパターンを実現可能にした。

アナリストや実務家は、Code Modeを単一サービスとの単純な連携を超え、複数APIにまたがる自動化へとエージェント型ワークフローを拡張するための重要な一歩と見ている。今後1年で、業界各社が本番環境向けAIエージェントにおけるコンテキストコストとオーケストレーションの複雑性に対処する中で、この手法は標準的なMCPサーバー設計およびエージェントフレームワークの双方に影響を与える可能性が高い。

作者について

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT