InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
Google DeepMind社、Gemini Robotics-ER 1.5でエンボディド推論を実現
Google DeepMind社が、ロボットアプリケーション向けの新たなエンボディド推論モデル「Gemini Robotics-ER 1.5」を発表した。現在、Google AI StudioやGemini APIを通じたプレビュー版の利用が可能だ。
-
Google Stax、AIモデル評価を開発者向けによりアクセシブルに
Google StaxはAIモデルの主観的評価を、客観的かつデータ駆動型で再現可能なプロセスに置換えるためにデザインされたフレームワークだ。Googleは汎用ベンチマークに頼るのではなく、AI開発者は彼らの特定ユースケースに合わせて評価プロセスをテーラリングできるようになると言っている。
-
EmbabelがJavaアプリケーション向けの高度なAIエージェント開発を実現
Spring Frameworkの創設者Rod Johnson氏が発表したEmbabel Agent Frameworkは、Spring Framework上に構築されたAI駆動型アプリケーションを開発するための新しいJVMベースのプラットフォームだ。これにより、開発者が従来のJavaアプリケーションに大規模言語モデル(LLM)を統合する方法を変革し、実験的なアプローチから本番環境対応の型安全なソリューションへと移行できる。
-
Claude Code、ストリーム可能なHTTPによるリモートMCPサーバーのサポートを実装
Anthropic社は最近、Claude CodeにリモートMCPサーバーへの接続をサポートする機能を導入した。これにより、開発者は手動でローカルサーバーを設定することなく、外部ツールやリソースを統合可能になった。
-
Anthropicがアプリ構築機能をClaude Artifactsにアップグレード
Anthropic社は、Claudeに新たなアプリ構築機能を追加し、ユーザーがテキストプロンプトから直接AIアプリケーションを作成、ホスト、シェアできるようにした。この機能はArtifactsとして知られ、データアナライザーやフラッシュカードジェネレーター、学習支援のような実用的なツールを、ユーザーがアイデアをシンプルに記述するだけで構築できるようにする。プログラミングスキルがない人でも高度なアプリケーションを作成できるよう、Claudeが裏でコーディングする。
-
Gemini 2.5 Deep Think、並行思考を応用してクリエイティブな問題解決を実現
Google AI Ultraサブスクリプションの一環として提供されるGemini 2.5 Deep Thinkは、並列思考技術と推論時間を拡張することでクリエイティブな問題解決に特化したモデルである。
-
Amazon、AIエージェント開発向けオ���プンソースSDK「Strands Agents」を公開
Amazon社は、AIエージェント開発をモデル駆動型アプローチで簡素化するオープンソースSDK「Strands Agents」を公開した。このフレームワークは、最小限のコードでプロンプトとツールリストを定義することでエージェントを構築できる。
-
初開催のMCP開発者サミットがAI統合の未来を描く
2025年5月、Model Context Protocol(MCP)の開発者や貢献者たちがサンフランシスコに集まり、初の開発者サミットを開催、LLMアプリケーションと外部データソースやツールをシームレスに統合するために急速に採用されている、このオープン標準の未来を描いた。
-
Hugging Face、オープンソースのロボットReachy 2でロボティクスの民主化を目指す
Hugging Face社は、ヒューマノイドロボットReachy 2を開発したフランスのスタートアップ企業Pollen Robotics社を買収。この買収は、ロボットの設計をオープンソース化し、開発者がそのコードを修正・改良できるようにすることで、ロボティクスをより身近にすることを目的としている。
-
AnthropicがAIの経済的影響に対処するための「Economic Futures Program」を発表
AIの経済的影響に対処するためのイニシアチブである「Economic Futures Program」の開始を発表した。同社によると、AIが世界の労働市場や生産性に与える影響が増大する中、このプログラムは貴重な洞察を提供し、AIの経済的変化を管理するための戦略の開発に寄与することを目指している。このプログラムは、Anthropic社の既存の「Economic Index」��拡充するものであり、実証的な研究やデータに基づく政策の開発、経済測定ツールの拡充に焦点を当てることで、AIが経済において果たす役割の進化をより深く理解することを目指している。
-
グーグル、Android Studio NarwhalでGeminiのエージェントモードを限定公開プレビュー
グーグルは、Gemini in Android StudioのエージェントモードをAndroid Studioの最新カナリア版「Android Studio Narwhalのプレビュー版」で限定公開したと発表した。今回公開となったエージェントモードは、複数ファイルにまたがる複雑な開発作業に特化しているという。
-
Mistral AIがMagistralをリリース、同社初の推論特化型言語モデル
Mistral AIはMagistral、透明性のある多段階推論のために構築された新しいモデルファミリーをリリースした。オープンバージョンとエンタープライズバージョンが利用可能で、構造化されたロジック、多言語出力、追跡可能な意思決定をサポートする。
-
Google LabsがOpalを発表、AIミニアプリ作成用ビジュアルプラットフォーム
Google LabsはOpal、ユーザーが自然言語記述とビジュアルワークフローエディタを通じてAI駆動ミニアプリケーションを作成できる実験的なノーコードツールを発表した。現在パブリックベータ版でアメリカ合衆国でのみ利用可能、Opalはプログラミングスキル不要でAIアプリケーション構築プロセスをシンプル化することを目的としている。
-
Google、オープンソースのクロスプロバイダーLLM評価ツールLMEvalを公開
LMEvalは、AI研究者や開発者が異なる大規模言語モデル(LLM)の性能を比較するのを支援することを目的としている。正確性、マルチモーダル対応、使いやすさを重視して設計されており、安全性やセキュリティの観点から主要なモデルの評価にすでに使用されている。
-
GoogleがGemini CLIをローンチ:開発者用オープンソースターミナルAIエージェント
GoogleはGemini CLI、Gemini 2.5 Proモデルの全機能を開発者ターミナルに直接提供する新しいオープンソースのAIコマンドラインインターフェースをリリースした。柔軟性、透明性、開発者優先のワークフローを重視して設計されており、Gemini CLIは軽量でローカルにアクセス可能なインターフェースを通じて高性能な自然言語AIアシスタンスを提供する。