InfoQ ホームページ AIと機械学習、データエンジニアリングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Google、オープンソースのクロスプロバイダーLLM評価ツールLMEvalを公開

LMEvalは、AI研究者や開発者が異なる大規模言語モデル（LLM）の性能を比較するのを支援することを目的としている。正確性、マルチモーダル対応、使いやすさを重視して設計されており、安全性やセキュリティの観点から主要なモデルの評価にすでに使用されている。

Sergio De Simone 翻訳者 Naoko Koshimura
投稿日 2025年9月12日午前2時30分
AIと機械学習、データエンジニアリング

Google DeepMindがAlphaGenomeを発表：高解像度ゲノム解釈のための統合AIモデル

Google DeepMindは、AlphaGenome、遺伝子変異がゲノム全体の遺伝子調節にどのように影響するかを予測する新しいAIモデルのリリースを発表した。これは、単一の汎用アーキテクチャで塩基対レベルの解像度を持つ長距離の配列コンテキストを統合することにより、計算ゲノミクス分野で大きな進歩を示している。

Robert Krzaczyński 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月11日午前5時30分
AIと機械学習、データエンジニアリング

GoogleがGemini CLIをローンチ：開発者用オープンソースターミナルAIエージェント

GoogleはGemini CLI、Gemini 2.5 Proモデルの全機能を開発者ターミナルに直接提供する新しいオープンソースのAIコマンドラインインターフェースをリリースした。柔軟性、透明性、開発者優先のワークフローを重視して設計されており、Gemini CLIは軽量でローカルにアクセス可能なインターフェースを通じて高性能な自然言語AIアシスタンスを提供する。

Robert Krzaczyński 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月11日午前4時30分
モバイル

Gemma 3がモバイルAI推論を拡張するための斬新な手法を導入

昨年5月に初期プレビュー版が公開されたGemma 3nが正式に利用可能となった。モバイル優先のオンデバイスAIアプリケーションを対象としており、効率を向上させ、性能を改善するための新しい技術、Per-Layer EmbeddingsやTransformer Nestingといった手法が含まれる。

Sergio De Simone 翻訳者 null
投稿日 2025年9月11日午前3時30分
DevOps

Uberがマイクロサービスと大規模計算ワークロードのための大規模なKubernetes移行を完了

Uberは、複数のデータセンターとクラウド環境にわたって、Apache MesosからKubernetesへの大規模な移行を無事完了した。ライドシェアの大手であるUberのエンジニアリングチームは、技術ブログ投稿シリーズでその包括的な移行過程を詳細に説明し、数千のマイクロサービスと大規模計算ワークロードの移行における課題、解決策、学んだ教訓を明らかにした。

Claudio Masolo 翻訳者 Naoko Koshimura
投稿日 2025年9月9日午前4時30分
AIと機械学習、データエンジニアリング

Meta社、AIエージェントを組み合わせた防御のためのLlamaFirewallをオープンソース化

LlamaFirewallは、プロンプトインジェクション、目標の不一致、そして安全でないコード生成からAIエージェントを保護することを目的としたセキュリティフレームワークである。AgentDojoベンチマークで評価された際には、攻撃成功率を90%以上削減する効果を達成した。さらに、開発者は新しいセキュリティガードレールを追加することでLlamaFirewallの動作を更新できる。

Sergio De Simone 翻訳者 Naoko Koshimura
投稿日 2025年9月8日午前6時30分
DevOps

MicrosoftがAzure DevOps MCPサーバーのパブリックプレビューを開始

MicrosoftがAzure DevOps Model Context Provider（MCP）サーバーのパブリックプレビューをリリースした。

Mark Silvester 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月3日午前10時30分
モバイル

GoogleがML KitにGemini Nanoを導入、新しいオンデバイスGenAI APIを提供

ML Kitに最近追加された新しいGenAI APIは、開発者がGemini Nanoを使ってAndroidアプリでオンデバイス推論を可能にし、要約、校正、書き換え、画像説明などの機能をサポートする。

Sergio De Simone 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月2日午前7時30分
AIと機械学習、データエンジニアリング

HashiCorp、AI統合に向けてTerraform MCP Serverをリリース

HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ－モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など－を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。

Matt Foster 翻訳者 Hiroaki.Sugimura
投稿日 2025年8月25日午前12時55分
AIと機械学習、データエンジニアリング

Mistral AI社、ソフトウェアエンジニア向けのオープンソースLLM「Devstral」をリリース

先日、Mistral AI社が、新しいオープンソースのLLM「Devstral」のリリースを発表した。Devstralは、同社とAll Hands AI社の共同開発モデルである。ソフトウェアエンジニアリングにおけるワークフローの自動化を主な用途としており、なかでも、推論に複数のファイルやコンポーネントの横断が必要となる複雑な開発環境でのワークフロー改善に特化している。また、コーディングエージェントフレームワークを活用しており、リポジトリ全体における現実世界のプログラミング課題に取り組むことが可能だ。こうした汎用性により、コード補完機能や関数生成機能などの個別タスクに最適化された他のモデルとの差別化が図られている。

Daniel Dominguez 翻訳者 Kazuki.Shimatani
投稿日 2025年8月25日午前12時46分
AIと機械学習、データエンジニアリング

OpenAI社、信頼性重視の新モデル『o3-pro』を発表――ユーザーフィードバックは賛否で二極化

OpenAI社が、複雑なタスクでの信頼性や応答の分析力に注力した同社最先端モデルの新バージョンo3-proをリリースした。現時点では、ChatGPTのPro・Teamユーザーに公開されているほか、API経由でも利用が可能である。本モデルが従来の「o1-pro」モデルに置き換わる形でリリース中だ。

Robert Krzaczyński 翻訳者 Kazuki.Shimatani
投稿日 2025年8月8日午前9時30分
AIと機械学習、データエンジニアリング

PerplexityがLabsを発表、プロジェクトベースAIワークフローを支援

PerplexityはLabs、従来の質問応答を超えるもっと複雑なタスクをサポートするために設計されたProサブスクライバー向けの新機能をリリースした。このアップデートは検索ベースのインタラクションから、構造化された生成AI駆動のマルチステップワークフローへのシフトを示している。

Robert Krzaczyński 翻訳者 Hiroaki.Sugimura
投稿日 2025年8月8日午前1時30分
Cloud

AWSがECS・EKS・サーバーレス向けのオープンソースMCPサーバーを発表

AWS社は、Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS)、およびAWS Serverless向けのオープンソースModel Context Protocol (MCP)サーバーセットをGitHub上で公開した。これらのサーバーは、Amazon Q DeveloperのようなAI開発アシスタントの能力を強化し、これらのAWSサービスに特化したリアルタイムのコンテキスト情報を提供するものだ。

Steef-Jan Wiggers 翻訳者 Naoko Koshimura
投稿日 2025年8月1日午前2時30分
Java

GPUアクセラレーションによるLLM推論をPure Javaに導入

マンチェスター大学のBeehive LabがGPULlama3.javaを公開した。これは、Llama3のJavaネイティブ実装として初めて自動GPUアクセラレーションを実現したプロジェクトである。このプロジェクトはTornadoVMを活用し、開発者がCUDAやネイティブコードを記述する必要なく、GPUアクセラレーションによる大規模言語モデル推論を可能にする。これにより、Java開発者が企業環境でAIアプリケーションに取り組む方法を変革する可能性がある。

A N M Bazlur Rahman 翻訳者 Takashi Kawase
投稿日 2025年7月30日午前7時30分
AIと機械学習、データエンジニアリング

OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ

OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。

Vinod Goje 翻訳者 Naoko Koshimura
投稿日 2025年7月17日午前4時30分