InfoQ ホームページ MachineLearning に関するすべてのコンテンツ
-
Arm社がSME2(Arm Scalable Matrix Extension 2)のAndroid実装を開始。AndroidデバイスでもAIアプリケーションの高速化を実現。
この度、Armv9-Aアーキテクチャに、行列演算を多用するワークロードの高速化に向けて設計された高性能な拡張命令セット「SME2(Scalable Matrix Extension 2)」が実装となった。今回導入されるSME2はモバイルアプリ開発に活用でき、高度なAI処理をCPUから直接実行する際のパーフォーマンス改善や効率改善が可能になるという。また、使用にあたってのアプリツール変更も不要だ。
-
Amazon、AIエージェント開発向けオープンソースSDK「Strands Agents」を公開
Amazon社は、AIエージェント開発をモデル駆動型アプローチで簡素化するオープンソースSDK「Strands Agents」を公開した。このフレームワークは、最小限のコードでプロンプトとツールリストを定義することでエージェントを構築できる。
-
Google DeepMindがAlphaGenomeを発表:高解像度ゲノム解釈のための統合AIモデル
Google DeepMindは、AlphaGenome、遺伝子変異がゲノム全体の遺伝子調節にどのように影響するかを予測する新しいAIモデルのリリースを発表した。これは、単一の汎用アーキテクチャで塩基対レベルの解像度を持つ長距離の配列コンテキストを統合することにより、計算ゲノミクス分野で大きな進歩を示している。
-
Gemma 3がモバイルAI推論を拡張するための斬新な手法を導入
昨年5月に初期プレビュー版が公開されたGemma 3nが正式に利用可能となった。モバイル優先のオンデバイスAIアプリケーションを対象としており、効率を向上させ、性能を改善するための新しい技術、Per-Layer EmbeddingsやTransformer Nestingといった手法が含まれる。
-
Uberがマイクロサービスと大規模計算ワークロードのための大規模なKubernetes移行を完了
Uberは、複数のデータセンターとクラウド環境にわたって、Apache MesosからKubernetesへの大規模な移行を無事完了した。ライドシェアの大手であるUberのエンジニアリングチームは、技術ブログ投稿シリーズでその包括的な移行過程を詳細に説明し、数千のマイクロサービスと大規模計算ワークロードの移行における課題、解決策、学んだ教訓を明らかにした。
-
GoogleがML KitにGemini Nanoを導入、新しいオンデバイスGenAI APIを提供
ML Kitに最近追加された新しいGenAI APIは、開発者がGemini Nanoを使ってAndroidアプリでオンデバイス推論を可能にし、要約、校正、書き換え、画像説明などの機能をサポートする。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。
-
UberのKubernetes上でのRayへの道のり
Uberは、Rayベースの機械学習ワークロードをKubernetes上で実行するための最近の移行について詳細を発表した。これはインフラストラクチャの進化を示しており、スケーラビリティ、効率性、開発者体験の向上を目指している。Uber Engineeringからの二部構成のシリーズが最近公開され、この移行中に直面した動機、課題、解決策について掘り下げている。
-
Google Cloud、Cloud Storageに階層型ネームスペースを導入し、AI/MLワークフローを強化
2025年3月17日、Google CloudはCloud Storageに階層型ネームスペース(HNS)機能を導入し、データの整理、パフォーマンス、信頼性を向上させることで、AIおよび機械学習(ML)ワークロードの最適化を目指した。
-
DeepSeek社、数学定理証明向けLLM「Prover-V2」をオープンソースで公開
DeepSeek社は、Lean 4における数学定理証明に特化した新しいオープンソースの大規模言語モデルDeepSeek-Prover-V2を公開した。このモデルは、同社の基盤モデルであるDeepSeek-V3を活用した再帰的定理証明パイプラインを基盤として構築されている。Lean 4は、Microsoft Researchが開発した最新バージョンのLean定理証明ツールであり、機械による検証が可能な形式的証明を数学者やコンピュータ科学者���記述できる対話型証明支援システムである。
-
Anthropicの「AI顕微鏡」が大規模言語モデルの内部構造を探る
Anthropicが最近発表した2つの論文は、大規模言語モデルの内部で起こるプロセスを明らかにしようとする試みで、解釈可能な概念を特定し、それを言語化する計算「回路」に結びつける方法と、ハルシネーション、プランニング、その他の主要な特徴を含むClaude Haiku 3.5の重要な挙動を特徴付ける方法を探求している。
-
Radical AI、次世代原子論的シミュレーションのためのPyTorchネイティブエンジン「TorchSim」をリリース
Radical AI社は、PyTorchネイティブで構築され、MLIP(機械学習による原子間ポテンシャル)時代のために設計された次世代原子論的シミュレーションエンジンTorchSimのリリースを発表した。材料科学における大きな技術的転換と位置づけられるTorchSimは、ASE(原子シミュレーション環境)やDFT(密度汎関数理論)といった従来のフレームワークと比較して、分子シミュレーションを桁違いに高速化することを約束する。
-
SREと生成AIを利用したeBayのダウンタイム削減方法:KubeCon EUでのアーキテクトによる洞察
KubeCon EUの基調講演で、eBay社のプリンシパルMTSアーキテクトであるVijay Samuel氏は、機械学習やLLMのビルディングブロックを組み込み、自社SREチームのインシデント対応強化を行った際の実体験を披露した。同氏は今回の体験を通し、LLMは万能ではないものの、複数機能を組み合わせることで複雑なシナリオに取り組むエンジニアに役立つことが分かったと語っている。
-
Cloudflare Security Week 2025 総括:量子暗号からAI Labyrinthまで
先日開催されたCloudflare Security Week 2025 において、クラウドプロバイダーはサイバーセキュリティサービスの様々な改善とセキュリティ脅威の傾向と課題を分析した複数のレポートを発表した。さらに不正なクローラーに対抗するハニーポットの新バージョン AI Labyrinthと、安全なAI技術の採用を支援することを目的としたツール群 Cloudflare for AIも発表した。
-
instructlab.aiは、合成データを使用して大規模言語モデル(LLMs)の微調整の複雑さを軽減する
InstructLab.aiは、この論文で説明されているチャットボットのための大規模アラインメント(LAB)コンセプトをオープンソースで実装したものである。論文の要旨によると、LABは大規模言語モデル(LLM)の命令チューニングフェーズにおけるスケーラビリティの課題を克服することを目的としている。このアプローチは、LLMのための合成データベースのアライメントチューニングメソッドを活用する。このアプローチでは、作成された分類法によって、学習データの合成シードを提供できる。