InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Google、オープンソースのクロスプロバイダーLLM評価ツールLMEvalを公開
LMEvalは、AI研究者や開発者が異なる大規模言語モデル(LLM)の性能を比較するのを支援することを目的としている。正確性、マルチモーダル対応、使いやすさを重視して設計されており、安全性やセキュリティの観点から主要なモデルの評価にすでに使用されている。
-
Google DeepMindがAlphaGenomeを発表:高解像度ゲノム解釈のための統合AIモデル
Google DeepMindは、AlphaGenome、遺伝子変異がゲノム全体の遺伝子調節にどのように影響するかを予測する新しいAIモデルのリリースを発表した。これは、単一の汎用アーキテクチャで塩基対レベルの解像度を持つ長距離の配列コンテキストを統合することにより、計算ゲノミクス分野で大きな進歩を示している。
-
GoogleがGemini CLIをローンチ:開発者用オープンソースターミナルAIエージェント
GoogleはGemini CLI、Gemini 2.5 Proモデルの全機能を開発者ターミナルに直接提供する新しいオープンソースのAIコマンドラインインターフェースをリリースした。柔軟性、透明性、開発者優先のワークフローを重視して設計されており、Gemini CLIは軽量でローカルにアクセス可能なインターフェースを通じて高性能な自然言語AIアシスタンスを提供する。
-
Gemma 3がモバイルAI推論を拡張するための斬新な手法を導入
昨年5月に初期プレビュー版が公開されたGemma 3nが正式に利用可能となった。モバイル優先のオンデバイスAIアプリケーションを対象としており、効率を向上させ、性能を改善するための新しい技術、Per-Layer EmbeddingsやTransformer Nestingといった手法が含まれる。
-
Uberがマイクロサービスと大規模計算ワークロードのための大規模なKubernetes移行を完了
Uberは、複数のデータセンターとクラウド環境にわたって、Apache MesosからKubernetesへの大規模な移行を無事完了した。ライドシェアの大手であるUberのエンジニアリングチームは、技術ブログ投稿シリーズでその包括的な移行過程を詳細に説明し、数千のマイクロサービスと大規模計算ワークロードの移行における課題、解決策、学んだ教訓を明らかにした。
-
Meta社、AIエージェントを組み合わせた防御のためのLlamaFirewallをオープンソース化
LlamaFirewallは、プロンプトインジェクション、目標の不一致、そして安全でないコード生成からAIエージェントを保護することを目的としたセキュリティフレームワークである。AgentDojoベンチマークで評価された際には、攻撃成功率を90%以上削減する効果を達成した。さらに、開発者は新しいセキュリティガードレールを追加することでLlamaFirewallの動作を更新できる。
-
MicrosoftがAzure DevOps MCPサーバーのパブリックプレビューを開始
MicrosoftがAzure DevOps Model Context Provider(MCP)サーバーのパブリックプレビューをリリースした。
-
GoogleがML KitにGemini Nanoを導入、新しいオンデバイスGenAI APIを提供
ML Kitに最近追加された新しいGenAI APIは、開発者がGemini Nanoを使ってAndroidアプリでオンデバイス推論を可能にし、要約、校正、書き換え、画像説明などの機能をサポートする。
-
HashiCorp、AI統合に向けてTerraform MCP Serverをリリース
HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ-モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など-を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。
-
Mistral AI社、ソフトウェアエンジニア向けのオープンソースLLM「Devstral」をリリース
先日、Mistral AI社が、新しいオープンソースのLLM「Devstral」のリリースを発表した。Devstralは、同社とAll Hands AI社の共同開発モデルである。ソフトウェアエンジニアリングにおけるワークフローの自動化を主な用途としており、なかでも、推論に複数のファイルやコンポーネントの横断が必要となる複雑な開発環境でのワークフロー改善に特化している。また、コーディングエージェントフレームワークを活用しており、リポジトリ全体における現実世界のプログラミング課題に取り組むことが可能だ。こうした汎用性により、コード補完機能や関数生成機能などの個別タスクに最適化された他のモデルとの差別化が図られている。
-
OpenAI社、信頼性重視の新モデル『o3-pro』を発表――ユーザーフィードバックは賛否で二極化
OpenAI社が、複雑なタスクでの信頼性や応答の分析力に注力した同社最先端モデルの新バージョンo3-proをリリースした。現時点では、ChatGPTのPro・Teamユーザーに公開されているほか、API経由でも利用が可能である。本モデルが従来の「o1-pro」モデルに置き換わる形でリリース中だ。
-
PerplexityがLabsを発表、プロジェクトベースAIワークフローを支援
PerplexityはLabs、従来の質問応答を超えるもっと複雑なタスクをサポートするために設計されたProサブスクライバー向けの新機能をリリースした。このアップデートは検索ベースのインタラクションから、構造化された生成AI駆動のマルチステップワークフローへのシフトを示している。
-
AWSがECS・EKS・サーバーレス向けのオープンソースMCPサーバーを発表
AWS社は、Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS)、およびAWS Serverless向けのオープンソースModel Context Protocol (MCP)サーバーセットをGitHub上で公開した。これらのサーバーは、Amazon Q DeveloperのようなAI開発アシスタントの能力を強化し、これらのAWSサービスに特化したリアルタイムのコンテキスト情報を提供するものだ。
-
GPUアクセラレーションによるLLM推論をPure Javaに導入
マンチェスター大学のBeehive LabがGPULlama3.javaを公開した。これは、Llama3のJavaネイティブ実装として初めて自動GPUアクセラレーションを実現したプロジェクトである。このプロジェクトはTornadoVMを活用し、開発者がCUDAやネイティブコードを記述する必要なく、GPUアクセラレーションによる大規模言語モデル推論を可能にする。これにより、Java開発者が企業環境でAIアプリケーションに取り組む方法を変革する可能性がある。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。