InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Dreamer 4: オフラインデータからの想像力トレーニングで目標達成を学ぶ
Google DeepMindの研究者たちは、環境との直接的な相互作用ではなく、ビデオ映像のみを用いて知能エージェントに複雑で長期的なタスクを解決する方法を教える新しいアプローチを最近発表した。彼らの新しいエージェントDreamer 4は、実際にゲームをプレイすることなく、ビデオで訓練された後にMinecraftでダイヤモンドを採掘する能力を示した。
-
OWASPがAgentic AIにおけるツール誤用を重大な脅威として警告
今年初め、OWASPはAgentic AI - Threats and Mitigationsと呼ばれるAgentic AIセキュリティに関するガイダンスをリリースした。この文書はこの新興技術を安全にデプロイする際のユニークな課題をハイライトし、防御のための緩和策やアーキテクチャパターンを提案している。
-
PayPal社の新たなエージェントツールキットで、MCPでAIフレームワークが決済APIと接続可能に
PayPal社は、モデルコンテキストプロトコル(MCP)を介したPayPal APIスイートとAIフレームワークの接続用のエージェントツールキットを発表した。今回発表となるツールキットで、決済API、請求書API、チャージバックAPI、配送追跡API、カタログ管理API、サブスクリプションAPI、分析機能用のAPIがAIフレームワークから直接利用可能になる。
-
Enterprise EditionにMySQL AI導入
Oracleは最近MySQL AI、MySQL Enterprise Editionでのみ利用可能な新しいAI活用機能群であり、大規模導入における分析やAIワークロード対象としている、を発表した。ベンダーロックインの懸念や最近の内部レイオフを受けて、MySQLコミュニティ全体でポピュラーなCommunity Editionの将来に対する懸念が高まっている。
-
Google DeepMind社、Gemini Robotics-ER 1.5でエンボディド推論を実現
Google DeepMind社が、ロボットアプリケーション向けの新たなエンボディド推論モデル「Gemini Robotics-ER 1.5」を発表した。現在、Google AI StudioやGemini APIを通じたプレビュー版の利用が可能だ。
-
Google Stax、AIモデル評価を開発者向けによりアクセシブルに
Google StaxはAIモデルの主観的評価を、客観的かつデータ駆動型で再現可能なプロセスに置換えるためにデザインされたフレームワークだ。Googleは汎用ベンチマークに頼るのではなく、AI開発者は彼らの特定ユースケースに合わせて評価プロセスをテーラリングできるようになると言っている。
-
Claude Code、ストリーム可能なHTTPによるリモートMCPサーバーのサポートを実装
Anthropic社は最近、Claude CodeにリモートMCPサーバーへの接続をサポートする機能を導入した。これにより、開発者は手動でローカルサーバーを設定することなく、外部ツールやリソースを統合可能になった。
-
アーキテクチャ設計からデプロイまで:AI駆動型ツールキットで開発者ワークフローを統合
開発者ツールは変化の一途をたどっており、AIの役割も当初のコード補完ツールから複数段階のソフトウェア開発ワークフローを一本化する一元化管理ツールにまで発展を遂げている。昨今のGitHub Copilot WorkspaceやClaude 3のシステムレベルの推論のリリースからも、AIの役割が当初のコーディングアシスタントとしての役割から、計画構想・ドキュメント作成・テスト支援へと広がりだしている変化を伺うことができる。DevFlowをはじめとする新たなプロジェクトでは、ドキュメント生成・テストの提案・アーキテクチャダイアグラム作成機能が統合されている。こうした業界傾向で、近い将来の開発者環境がどう再構築されていくか、その変貌の初期段階に関する洞察が得られるだろう。
-
Anthropicがアプリ構築機能をClaude Artifactsにアップグレード
Anthropic社は、Claudeに新たなアプリ構築機能を追加し、ユーザーがテキストプロンプトから直接AIアプリケーションを作成、ホスト、シェアできるようにした。この機能はArtifactsとして知られ、データアナライザーやフラッシュカードジェネレーター、学習支援のような実用的なツールを、ユーザーがアイデアをシンプルに記述するだけで構築できるようにする。プログラミングスキルがない人でも高度なアプリケーションを作成できるよう、Claudeが裏でコーディングする。
-
Cloudflare、Quicksilverをマルチレベルキャッシュに移行し数十億のリクエストを処理
Cloudflare社のエンジニアリングチームは最近、内部のグローバルキーバリューストアであるQuicksilverを階層型キャッシュアーキテクチャに移行した方法を共有した。彼らは、すべてのデータをすべての場所に保存する従来の方法から、分散型キャッシュシステムを採用するまでの段階的な取り組みを説明し、ストレージ効率を向上させながら、一貫性の保証とエッジでの低遅延読み取りを維持することに成功した。
-
Arm社がSME2(Arm Scalable Matrix Extension 2)のAndroid実装を開始。AndroidデバイスでもAIアプリケーションの高速化を実現。
この度、Armv9-Aアーキテクチャに、行列演算を多用するワークロードの高速化に向けて設計された高性能な拡張命令セット「SME2(Scalable Matrix Extension 2)」が実装となった。今回導入されるSME2はモバイルアプリ開発に活用でき、高度なAI処理をCPUから直接実行する際のパーフォーマンス改善や効率改善が可能になるという。また、使用にあたってのアプリツール変更も不要だ。
-
Gemini 2.5 Deep Think、並行思考を応用してクリエイティブな問題解決を実現
Google AI Ultraサブスクリプションの一環として提供されるGemini 2.5 Deep Thinkは、並列思考技術と推論時間を拡張することでクリエイティブな問題解決に特化したモデルである。
-
もう一つのRust書き換え:OpenAIのCodex CLIをネイティブ化、Node���TypeScriptをRustで再構築
OpenAIは最近、Codex CLIをRustで再構築することを発表した。Codex CLIスタックはもともとReact、TypeScript、Nodeを特徴として持っている。この再構築は、開発者エクスペリエンスの向上に加えて、セキュリティとパフォーマンスの向上を実現することを目的としている。
-
Amazon、AIエージェント開発向けオープンソースSDK「Strands Agents」を公開
Amazon社は、AIエージェント開発をモデル駆動型アプローチで簡素化するオープンソースSDK「Strands Agents」を公開した。このフレームワークは、最小限のコードでプロンプトとツールリストを定義することでエージェントを構築できる。
-
初開催のMCP開発者サミットがAI統合の未来を描く
2025年5月、Model Context Protocol(MCP)の開発者や貢献者たちがサンフランシスコに集まり、初の開発者サミットを開催、LLMアプリケーションと外部データソースやツールをシームレスに統合するために急速に採用されている、このオープン標準の未来を描いた。