InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
OpenAIがResponses APIを拡張、自律型エージェント基盤として
OpenAIはShellツールのサポート、組み込みエージェント実行ループ、ホスト型コンテナワークスペース、コンテキスト圧縮、再利用可能エージェントスキルを追加し、開発者がエージェント型ワークフローをより容易に構築できるようResponses APIを拡張すると発表した。
-
Dropbox社、企業向け知識検索のためのスケーラブルなコンテキストエンジンを構築
Dropbox社のエンジニアは、Dropbox Dashの背後にあるコンテキストエンジンをどのように構築したかを詳述した。そこでは、インデックスベースの検索、ナレッジグラフ由来のコンテキスト、そして継続的評価への移行が示され、企業向けAI知識検索を大規模に支える仕組みが明らかになった。この設計は、企業向けアシスタント全体に広がりつつある傾向を示している。すなわち、チームはライブでのツール利用を意図的に制約し、事前処理され権限を考慮したコンテキストにより強く依存することで、レイテンシを短縮し、品質を向上させ、トークン消費の圧力を軽減しているのである。
-
AWSがStrands Labsを発表、実験的AIエージェントプロジェクト向け
Amazon Web ServicesはStrands Labs、エージェントベースAI開発に関連する実験的プロジェクトをホストするために作られた新GitHub組織を発表した。本取り組みはStrands Agents SDK、開発者がPythonまたはTypeScriptを使用してAIエージェントを構築できるオープンソースツールキットにリンクしている。
-
GoogleがGemini CLI Conductorに自動レビュー機能を追加
GoogleはGemini CLIエクステンション、Conductorに自動レビューサポートを追加することにより拡張した。同社によればこのアップデートによりConductorは「単なる計画と実行を超えて検証へと進む」ことが可能となり、AI生成コードの品質やガイドライン遵守を確認可能になることで、AI支援開発ワークフローにおける信頼性、安全性、統制を強化する。
-
Googleの8つの基本的マルチエージェント設計パターン
Googleは最近、シーケンシャルパイプラインからhuman-in-the-loopアーキテクチャまで網羅するマルチエージェントシステム向けの8つの重要なデザインパターンを概説するガイドを公開した。このガイドはGoogleのAgent Development Kit向けのサンプルコードとともに各パターンについて具体的に解説している。
-
NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開
NVIDIAが言語、エージェント型AI、ロボティクス、自動運転、バイオメディカル研究を対象としたオープンモデル、データセット、開発ツール群を公開した。今回のアップデートでは既存のNVIDIAモデルファミリーが拡張され、関連する学習データとリファレンス実装がGitHub、Hugging Face、NVIDIAの開発者向けプラットフォームを通じて提供される。
-
オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に
Agent Sandboxは、安定したアイデンティティと永続ストレージを備えた単一のステートフルPodを管理するための宣言的APIを提供する、オープンソースのKubernetesコントローラーである。信頼できないLLM生成コードを実行するための隔離環境の構築に特に適しており、他のステートフルワークロードの実行にも向いている。
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
Microsoft Foundry Agent Service、長期メモリのプレビュー版で状態管理をシンプル化
Microsoftは年次カンファレンスIgniteにてFoundry Agent Serviceのメモリ機能、Agent serviceにネイティブ統合されたフルマネージド長期メモリストア、のパブリックプレビュー版を発表した。
-
Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張
Memoriは、AIエージェントに長期的で構造化されたクエリ可能なメモリを提供��るために設計された、フル機能を備えたオープンソースのメモリシステムへと成熟した。これにより、従来のプロプライエタリなベクトルストアではなく、標準的なデータベースを使用できる。Memoriは、アドホックなプロンプトや一時的なセッション状態に依存する代わりに、インタラクションからエンティティ、事実、関係、コンテキストを継続的に抽出し、それらをSQLやMongoDBのバックエンドに保存する。それにより、エージェントは手動でのオーケストレーションを行うことなく、セッションをまたいで情報を記憶し再利用が可能だ。
-
Android GenAIプロンプトAPI、Gemini Nanoで自然言語リクエストを実現
ML Kit GenAI Prompt APIIがアルファ版で利用可能となり、Android開発者はデバイス上で動作するGemini Nanoに自然言語およびマルチモーダルリクエストを送信できるようになった。このAPIは、初期のGenAIリリースで導入されたテキスト要約や画像説明の機能を拡張するものである。
-
Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM(大規模言語モデル)として評価された。
Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri(Parallel Exploration Tool For Risky Interactions)による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。