InfoQ ホームページ Architecture に関するすべてのコンテンツ
-
Cloudflare社、AIエージェント向けにトークン使用量を最適化するCode Mode対応MCPサーバーを発表
Cloudflare社は、、AIエージェントが複雑なAPIへアクセスする手法を大きく進化させるCode Modeを活用した新たなModel Context Protocol(MCP)サーバーを発表した。これにより、同社のフルAPIプラットフォームとの連携コストを大幅に削減できる。今回のアプローチは、MCPエコシステムにおけるエージェントとツールの統合手法に新たな方向性を示した。
-
AnthropicがManaged Agentsを発表、AIエージェントのデプロイをシンプルに
Anthropicは同社のClaudeプラットフォーム上にManaged Agents、エージェントベース・ワークフロー開発と運用を支援するために設計されたマネージド実行レイヤーを導入した。本機能により開発者はエージェントの振る舞い、ツール、制約を定義できる一方で、オーケストレーション、サンドボックス化、セッション状態管理、認証情報管理、永続化といった実行時責任をプラットフォームに委譲できる。
-
Dropbox社、企業向け知識検索のためのスケーラブルなコンテキストエンジンを構築
Dropbox社のエンジニアは、Dropbox Dashの背後にあるコンテキストエンジンをどのように構築したかを詳述した。そこでは、インデックスベースの検索、ナレッジグラフ由来のコンテキスト、そして継続的評価への移行が示され、企業向けAI知識検索を大規模に支える仕組みが明らかになった。この設計は、企業向けアシスタント全体に広がりつつある傾向を示している。すなわち、チームはライブでのツール利用を意図的に制約し、事前処理され権限を考慮したコンテキストにより強く依存することで、レイテンシを短縮し、品質を向上させ、トークン消費の圧力を軽減しているのである。
-
AWSが動画エンコーディングサービスに対する特許侵害保護を撤廃
AWSが動画トランスコーディングおよびストリーミングサービスを利用する顧客に対する法的保護を廃止、顧客がコーデック権利保有者から特許侵害で訴えられる可能性が発生している。この変更はファイルベースの動画処理サービス MediaConvertやライブ動画エンコーディングサービス MediaLiveを含む6つのサービスに影響する。
-
AIコーディングアシスタントはデリバリーを加速しない、なぜならコーディングがこれまでボトルネックではなかったから
Agodaは最近、AIコーディングツールが個々の開発者の生産性を測定可能な形で向上させている一方で、プロジェクトレベルでのベロシティ向上は驚くほど限定的であるとする見解を発表した。なぜならコーディングがこれまで本当のボトルネックではなかったからである。同記事はこれらの領域が人的判断を必要とするため、ボトルネックは上流工程の仕様策定や検証へシフトしたと主張している。この変化はエンジニアリングチームの構成方法に重大な示唆を与える。
-
Cloudflare社、Rust向けQUICおよびHTTP/3を容易にするtokio-quicheをオープンソース化
Cloudflare社は、非同期QUICおよびHTTP/3用Rustライブラリtokio‑quicheをオープンソース化したと発表した。これは、実戦で検証済みのquiche実装をTokioランタイムと組み合わせ高性能なQUICアプリケーションの開発を簡素化するためのものだ。このライブラリは、エッジサービス、Oxy HTTPプロキシ、MASQUEベースのトンネルを支える内部用途で利用されてきたもので、WARPクライアントではWireGuardベースのトンネルを置き換えている。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
Uberのクエリアーキテクチャ:レイヤーの簡素化とオブザーバビリティの向上
Uber社は、Apache Pinotのクエリアーキテクチャを再設計し、実行の簡素化、より豊かなSQLのサポート、内部分析ワークロードの予測可能性の向上を図った。従来のNeutrinoシステムは、PrestoとPinotを重ねたものであったが、軽量なプロキシ「Cellar」に置き換えられ、Pinotのマルチステージエンジンライトモードを使用することになった。この再設計は、複雑さを軽減し、実行制限を強化し、複数のテナントに対するより強固な隔離を提供することを目的としている。
-
Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上
Meta社は、Instagramにおいて新しい機械学習フレームワークを導入した。このフレームワークは多様性アルゴリズムを適用し、繰り返し表示されるコンテンツを減らしながらユーザーエンゲージメントを維持できるものだ。この多様性を意識したランキングシステムは、同じコンテンツ作成者や製品タイプへの過剰な露出を軽減するために、既存のエンゲージメントモデルに乗算ペナルティを導入している。
-
AWSが「リージョン別の AWS 機能」ツールをリリース
AWSは最近、「リージョン別の AWS 機能」、グローバルなリージョンネットワーク全体でのサービス、機能、リソースのアベイラビリティをアーキテクト、プラットフォームエンジニア、開発者が詳細に把握できるよう設計された新しい計画ツールをリリースした。
-
Deno 2.5がパーミッションセットおよびテストAPIフックのサポートを提供
Deno、Ryan Dahl氏により開発されたJavaScriptランタイムはバージョン2.5をリリースし、パーミッションセットの追加、新しいテストフック、Websocketの改善などの改良をもたらした。今回のリリースの一環として多くのパフォーマンス改善も行われている。
-
AWSがC8iおよびC8i-flex EC2インスタンスを発表、カスタムIntel Xeon 6を搭載
AWSは最近、カスタムIntel Xeon 6プロセッサを搭載したコンピュート最適化C8iおよびC8i-flexインスタンスの一般提供(GA)を発表した。Webサーバー、キャッシング、Apache Kafka、ElasticSearch、バッチ処理、分散分析、高性能コンピューティング(HPC)、サーバー、非常にスケーラブルなマルチプレイヤーゲーム、ビデオエンコーディングのような計算集約型ワークロードを実行するのに適している。
-
Mezzalira氏のQCon London講演:「マイクロフロントエンド~設計から企業メリットと社内実装まで~」
QCon Londonでのプレゼンテーションで、AWSのプリンシパルアーキテクトLuca Mezzalira氏は、理想的なマイクロフロントエンドプラットフォームを構築する中で得られた知見を共有した。また、マイクロフロントエンドと自社の適性を判断するヒントや、個別ユースケースに最適なアーキテクチャを設計するために押さえておきたい基本原則、分散型アーキテクチャのデプロイ戦略も紹介されている。
-
AWSがマルチリージョン・フェイルオーバーをシンプル化、ARC Region Switchで
AWSはAmazon Application Recovery Controller(ARC) Region Switch、組織がRegion Switchをプラン、実践、オーケストレーションするためのフルマネージドで高可用性の機能を最近導入した。
-
Google Stax、AIモデル評価を開発者向けによりアクセシブルに
Google StaxはAIモデルの主観的評価を、客観的かつデータ駆動型で再現可能なプロセスに置換えるためにデザインされたフレームワークだ。Googleは汎用ベンチマークに頼るのではなく、AI開発者は彼らの特定ユースケースに合わせて評価プロセスをテーラリングできるようになると言っている。