InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
Docker Model RunnerでLLMモデルのローカル実行を手軽に
今回公開となったDocker Model Runnerでは、AIモデルのローカル環境実行や、ローカル環境にあるAIモデル使用したアプリケーションコードの反復処理が可能になっている。また、作業中にコンテナー内でワークフロー実行を中断する必要もない。現在、Apple Siliconを搭載したMac向けのDocker Desktop 4.40がプレビュー配信中だ。
-
OpenAIがCodexソフトウェアエンジニアリングエージェントのプレビューを発表
OpenAIはCodexを発表した。これは、コードの作成、デバッグ、テスト、プルリクエストの生成など、一般的な開発タスクを自動化するために設計されたクラウドベースのソフトウェアエンジニアリングエージェントの研究プレビューだ。Codexは、ChatGPTのPro、Team、Enterpriseユーザー向けに統合されており、各タスクはユーザーのコードベースが事前にロードされ、開発環境に合わせて設定された安全なサンドボックス環境で実行されている。
-
Cloudflare AutoRAG、Retrieval-Augmented Generationを効率化
LLMベースシステムでCloudflareはRetrieval-Augmented Generationを利用するためのマネージドサービスを開始した。現在ベータ版の、Cloudflare AutoRAGは開発者がリッチなコンテキストデータをLLMに統合するパイプラインをより簡単に構築できるようにすることを目指している。
-
Amazon QとClaude Codeが開発者CLIをAIで制御可能に
AWSは最近、高度なエージェント機能を備えたAmazon Q Developer用の拡張CLI(コマンドラインインターフェイス)エージェントを発表した。Amazon BedrockとClaude 3.7 Sonnetの推論機能を利用したこのアップグレードにより、開発者はコンテキストを切り替えることなく、ターミナル内で直接AIと作業可能になる。一方、Anthropic社は研究プレビューとしてClaude Codeを発表した。これはターミナルベースのコーディングアシスタントで、開発者はコマンドラインから直接Claudeを操作できる。
-
CiscoがJARVISを発表:プラットフォームエンジニアリングチームのためのAIアシスタント
Ciscoのイノベーション部門Outshiftがプラットフォームエンジニアリング・ワークフローを効率化するために設計されたJARVIS 、AI搭載アシスタントを発表した。JARVISは会話型インターフェースを提供、複雑なタスクを簡素化し、実行時間と認知負荷を減少させる。
-
Googleがイルカのコミュニケーション研究支援にDolphinGemmaを投入
GoogleはDolphinGemma、研究者がイルカの発声を分析・解釈することを支援するために開発された新しいAIモデルを発表した。このプロジェクトはWild Dolphin Project(WDP)とジョージア工科大学の研究者との継続的な共同研究の一環であり、大西洋マダライルカの自然なコミュニケーションにおけるパターンの特定にフォーカスしている。
-
Google Cloud、Cloud Storageに階層型ネームスペースを導入し、AI/MLワークフローを強化
2025年3月17日、Google CloudはCloud Storageに階層型ネームスペース(HNS)機能を導入し、データの整理、パフォーマンス、信頼性を向上させることで、AIおよび機械学習(ML)ワークロードの最適化を目指した。
-
DeepSeek社、数学定理証明向けLLM「Prover-V2」をオープンソースで公開
DeepSeek社は、Lean 4における数学定理証明に特化した新しいオープンソースの大規模言語モデルDeepSeek-Prover-V2を公開した。このモデルは、同社の基盤モデルであるDeepSeek-V3を活用した再帰的定理証明パイプラインを基盤として構築されている。Lean 4は、Microsoft Researchが開発した最新バージョンのLean定理証明ツールであり、機械による検証が可能な形式的証明を数学者やコンピュータ科学者が記述できる対話型証明支援システムである。
-
Anthropicの「AI顕微鏡」が大規模言語モデルの内部構造を探る
Anthropicが最近発表した2つの論文は、大規模言語モデルの内部で起こるプロセスを明らかにしようとする試みで、解釈可能な概念を特定し、それを言語化する計算「回路」に結びつける方法と、ハルシネーション、プランニング、その他の主要な特徴を含むClaude Haiku 3.5の重要な挙動を特徴付ける方法を探求している。
-
FastAPI-MCP: FastAPIとAIエージェントの統合をシンプルに
新しいオープンソースライブラリFastAPI-MCPは、Model Context Protocol (MCP)を通じて開発者が、従来のFastAPIアプリケーションと最新のAIエージェントを接続することを容易にしている。ゼロコンフィギュレーションセットアップのために設計されたFastAPI-MCPは、開発者が自動的にAPIエンドポイントをMCP互換のツールとして公開できるようにし、最小限の変更でWebサービスをAIシステムからアクセス可能にする。
-
OpenAI社がAIエージェントのウェブ検索機能やディープリサーチ機能のベンチマーク評価を実現する「BrowseComp」を発表
SimpleQAをはじめとする従来型のベンチマークは単一事実情報の収集能力評価に特化しており、ブラウジング機能搭載型GPT-4oなどの高速ブラウジング対応モデルの台頭で「飽和状態」に達している。一方、BrowseCompは数十、数百のウェブサイトを行き来しながら、情報を収集精査するエージェントの能力を計測する。 BrowseCompの問題には、端的かつ明確な回答が可能であり、参照型ソリューションとの照合で評価が容易に行える。
-
Azure MCP Serverがパブリックプレビューに登場:AIエージェント機能を拡張
マイクロソフトはオープンソースAzure MCP Serverのパブリックプレビュー、Azureリソースへのアクセスを提供することによりAIエージェント機能を強化する新しいツール、を発表した。Azure MCP ServerはAIエージェントがファイルストレージ、データベース、ログなどのAzureサービスとやり取りしたり、CLIコマンドを実行したりできるようにする。
-
AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進
AWSは、生成AIワークロード設計と運用のベストプラクティス提供にフォーカスした、新しいWell-Architected Generative AI Lensの提供を発表した。このLensは、生成AIを使って堅牢かつコスト効率の高いソリューションを提供する責任を持つビジネスリーダー、データサイエンティスト、アーキテクト、エンジニアを対象としている。このドキュメントはクラウドに依存しないベストプラクティス、実装ガイダンス、その他のリソースへのリンクを提供している。
-
オブザーバビリティがLLMベースのシステムのユーザーエクスペリエンスを向上させる方法:KubeCon EUでのHoneycombのCEOの洞察
KubeCon Europeの基調講演で、HoneycombのCEO兼共同設立者であるChristine Yen氏は、ソフトウェアシステムにおけるLLMの統合によってもたらされた急速なシフトに対処するために、オブザーバビリティどのように役立つかについての洞察を説明した。LLMの統合は、ソフトウェア開発方法だけでなく、リリース方法論にも大きな変革をもたらした。彼女は、本番環境の観測結果に基づいて開発のフィードバックループを適応させる方法を説明した。
-
Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。