InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
OpenAIがResponses APIを拡張、自律型エージェント基盤として
OpenAIはShellツールのサポート、組み込みエージェント実行ループ、ホスト型コンテナワークスペース、コンテキスト圧縮、再利用可能エージェントスキルを追加し、開発者がエージェント型ワークフローをより容易に構築できるようResponses APIを拡張すると発表した。
-
Dropbox社、企業向け知識検索のためのスケーラブルなコンテキストエンジンを構築
Dropbox社のエンジニアは、Dropbox Dashの背後にあるコンテキストエンジンをどのように構築したかを詳述した。そこでは、インデックスベースの検索、ナレッジグラフ由来のコンテキスト、そして継続的評価への移行が示され、企業向けAI知識検索を大規模に支える仕組みが明らかになった。この設計は、企業向けアシスタント全体に広がりつつある傾向を示している。すなわち、チームはライブでのツール利用を意図的に制約し、事前処理され権限を考慮したコンテキストにより強く依存することで、レイテンシを短縮し、品質を向上させ、トークン消費の圧力を軽減しているのである。
-
AWSがStrands Labsを発表、実験的AIエージェントプロジェクト向け
Amazon Web ServicesはStrands Labs、エージェントベースAI開発に関連する実験的プロジェクトをホストするために作られた新GitHub組織を発表した。本取り組みはStrands Agents SDK、開発者がPythonまたはTypeScriptを使用してAIエージェントを構築できるオープンソースツールキットにリンクしている。
-
GoogleがGemini CLI Conductorに自動レビュー機能を追加
GoogleはGemini CLIエクステンション、Conductorに自動レビューサポートを追加することにより拡張した。同社によればこのアップデートによりConductorは「単なる計画と実行を超えて検証へと進む」ことが可能となり、AI生成コードの品質やガイドライン遵守を確認可能になることで、AI支援開発ワークフローにおける信頼性、安全性、統制を強化する。
-
MicrosoftがEvals for Agent Interopスターターキットをオープンソース化、エンタープライズAIエージェントのベンチマーク向け
MicrosoftはEvals for Agent Interop、AIエージェントが現実的なデジタル業務シナリオにおいてどの程度相互運用できるかを評価するためのオープンソース・スターターキットを発表した。このキットは厳選されたシナリオ、代表的なデータセット、評価ハーネスを提供し、チームがメール、カレンダー、ドキュメント、コラボレーションツールなどの各種サーフェスにまたがってエージェントの評価を実行できるようにしている。この取り組みはエージェント型AIシステムがエンタープライズワークフローへと移行する中で、体系的かつ再現可能な評価への業界全体のシフトを反映している。
-
Googleの8つの基本的マルチエージェント設計パターン
Googleは最近、シーケンシャルパイプラインからhuman-in-the-loopアーキテクチャまで網羅するマルチエージェントシステム向けの8つの重要なデザインパターンを概説するガイドを公開した。このガイドはGoogleのAgent Development Kit向けのサンプルコードとともに各パターンについて具体的に解説している。
-
NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開
NVIDIAが言語、エージェント型AI、ロボティクス、自動運転、バイオメディカル研究を対象としたオープンモデル、データセット、開発ツール群を公開した。今回のアップデートでは既存のNVIDIAモデルファミリーが拡張され、関連する学習データとリファレンス実装がGitHub、Hugging Face、NVIDIAの開発者向けプラットフォームを通じて提供される。
-
DeepSeek-V3.2が推論タスクでGPT-5を上回る
DeepSeekはDeepSeek-V3.2、オープンソース推論およびエージェント型AIモデル群をリリースした。高計算量版DeepSeek-V3.2-Specialeは、複数の推論ベンチマークにおいてGPT-5を上回り、Gemini-3.0-Proと同等の性能を示している
-
オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に
Agent Sandboxは、安定したアイデンティティと永続ストレージを備えた単一のステートフルPodを管理するための宣言的APIを提供する、オープンソースのKubernetesコントローラーである。信頼できないLLM生成コードを実行するための隔離環境の構築に特に適しており、他のステートフルワークロードの実行にも向いている。
-
AWS Transform Customが技術的負債に挑む
AWS社は最近、AWS Transformの一部であるAWS Transform Customを発表した。この機能は、開発者がカスタムコードをモダナイズし、リファクタリング可能にする。
-
OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引
OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減らす。
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
Meta社とHugging Face社、エージェント環境の共有ハブ「OpenEnv」を発表
コミュニティからのフィードバックを集めるため、OpenEnv Hubと同時にOpenEnv 0.1仕様(RFC)がリリースされた。最初のRFCでは、環境がエージェントとどのようにインタラクトすべきか、パッケージ化と分離をどのように処理すべきか、そして統一されたアクションスキーマの下にツールをカプセル化すべきかが概説されている。開発者は既に公開リポジトリにあるサンプル環境を探索し、強化学習(RL)エージェントをトレーニングする前に、ローカルのDocker環境を使って動作をテストすることができる。
-
AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに
Cloud Native Computing Foundationがan analysis of modern cybersecurity practicesを出版、人工知能を使用した攻撃が現在、重大な脅威になっていることを明らかにした。このレポートは人工知能が脅威の状況と、企業が利用できる防御手段の両方を変革する中で、組織が多層防御戦略を採用することの重要性を強調している。
-
OpenAI、QCon AI NYCで企業向けのファインチューニングを発表
QCon AI NYC 2025において、OpenAIのWill Hang氏は、ツールを使用するエージェントの性能を向上させることを目的とした強化学習型ファインチューニングアプローチであるAgent RFTの概要を発表した。