InfoQ ホームページ Google_DeepMind に関するすべてのコンテンツ
-
Dreamer 4: オフラインデータからの想像力トレーニングで目標達成を学ぶ
Google DeepMindの研究者たちは、環境との直接的な相互作用ではなく、ビデオ映像のみを用いて知能エージェントに複雑で長期的なタスクを解決する方法を教える新しいアプローチを最近発表した。彼らの新しいエージェントDreamer 4は、実際にゲームをプレイすることなく、ビデオで訓練された後にMinecraftでダイヤモンドを採掘する能力を示した。
-
Google DeepMind社、Gemini Robotics-ER 1.5でエンボディド推論を実現
Google DeepMind社が、ロボットアプリケーション向けの新たなエンボディド推論モデル「Gemini Robotics-ER 1.5」を発表した。現在、Google AI StudioやGemini APIを通じたプレビュー版の利用が可能だ。
-
Google DeepMind社、ロボット基盤モデルGemini Robotics On-Deviceを発表
Google DeepMind社が、Gemini Robotics On-Deviceを発表した。Gemini Robotics On-Deviceは、ロボットのローカル実行に特化したVLA(vision-language-action)基盤モデルである。なかでも低レイテンシー推論に秀でており、わずか50回のデモンストレーションで特定タスクへのカスタマイズチューニングが可能である。
-
Google DeepMindがAlphaGenomeを発表:高解像度ゲノム解釈のための統合AIモデル
Google DeepMindは、AlphaGenome、遺伝子変異がゲノム全体の遺伝子調節にどのように影響するかを予測する新しいAIモデルのリリースを発表した。これは、単一の汎用アーキテクチャで塩基対レベルの解像度を持つ長距離の配列コンテキストを統合することにより、計算ゲノミクス分野で大きな進歩を示している。
-
Googleがイルカのコミュニケーション研究支援にDolphinGemmaを投入
GoogleはDolphinGemma、研究者がイルカの発声を分析・解釈することを支援するために開発された新しいAIモデルを発表した。このプロジェクトはWild Dolphin Project(WDP)とジョージア工科大学の研究者との継続的な共同研究の一環であり、大西洋マダライルカの自然なコミュニケーションにおけるパターンの特定にフォーカスしている。
-
Google DeepMindがAIコーディングエージェントAlphaEvolveを発表
Google DeepMindがAlphaEvolveコーディングエージェントに関する論文を発表した。AlphaEvolveはハードウェア設計、データセンター運用、AIトレーニングを含む幅広い分野でアルゴリズムの発見と最適化を行うためにLLMを使用する。
-
Google DeepMind社がAGI(汎��型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。
-
Google DeepMindが Gemini Roboticsを発表
Google DeepMindは、視覚、言語、行動を統合することでロボット工学を強化するために設計された先進的なAIモデル、Gemini Roboticsを発表した。Gemini 2.0フレームワークに基づくこのイノベーションは、特に現実世界のセッティングにおいて、ロボットをよりスマートで能力の高いものにすることを目指している。
-
Google DeepMindが長期的疾病管理向けにAMIEを強化
Google DeepMindは長期的な疾病管理をサポートするためにArticulate Medical Intelligence Explorer(AMIE)の機能を診断以外にも拡張した。このシステムは現在、臨床医が複数回の患者の受診にわたって病気の進行を監視し、治療を調整し、臨床ガイドラインの遵守を支援するように設計されている。
-
Google、実験的なAI推論モデルをリリース
GoogleはAI Studioプラットフォームで利用可能なAI推論モデル Gemini 2.0 Flash Thinking Experimentalを発表した。この実験的なモデルは、複雑な問題を推論することでプログラミング、数学、物理学などのマルチモーダルタスクを処理するために設計されており、その思考過程を説明することができる。これはGemini 2.0 Flashモデルを基に構築されており、OpenAIのo1を含む類似モデルと整合している。
-
Googleが視覚言語モデルファミリーPaliGemma 2をリリース
Google DeepMindは視覚言語モデル(VLM)ファミリー PaliGemma 2をリリースした。PaliGemma 2は3つの異なるサイズと3つの入力画像解像度が利用可能で、複数の視覚言語ベンチマークで最先端の性能を達成している。
-
Google I/O 2024を振り返る:Gemini 1.5、Project Astra、AI搭載検索エンジン
Googleは先日、年次開発者会議「Google I/O 2024」を開催し、Googleのアプリやサービスに関する数多くの発表をした。予想通り、AIはこのイベントの焦点であり、ほとんど全てのGoogle製品に組み込まれている。以下は、このイベントでの主な発表の要約である。
-
MetaとIBMがオープンソースイノベーションを推進するAIアライアンスを結成
MetaとIBMが主導する新しいコンソーシアムが、オープンソースAIを支援するために設立された。AIアライアンスは、ソフトウェア、ハードウェア、非営利団体、公共団体、学術機関など、さまざまな分野の組織から構成され、オープンな開発を促進するためのツールやプログラムを共同で開発することを目的としている。
-
DeepMindが新しいジェネラリストAIエージェントのGatoを発表
エージェントとして知られているGatoは、DeepMindsの汎用的なAI(ジェネラリストAI)である。人間が実行できるさまざまなタスクを実行できるが、1つのタスクの専門家としてのニッチな領域を切り開くことない。Gatoは、ビデオゲームのプレイ、画像のキャプション、実世界のロボットアームの制御など、600を超えるさまざまなタスクを実行できる。Gatoはマルチモーダル、マルチタスク、マルチエンボディメントのジェネラリストポリシーである。
-
DeepMindが核融合研究装置のAIコントローラをトレーニング
Google子会社のDeepMindとEPFL(スイス連邦工科大学ローザンヌ校) Swiss Plasma Centerの研究者らが、核融合研究で使用するトカマク(tokamak)デバイスの制御アルゴリズムを生成する深層強化学習(RL)AIを開発した。このシステムは、シミュレータとのインタラクションを通じて制御ポリシを学習することで、実際のデバイスの制御への適用において、新たなプラズマ配位(plasma configuration)の実現を可能にしている。