InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開
NVIDIAが言語、エージェント型AI、ロボティクス、自動運転、バイオメディカル研究を対象としたオープンモデル、データセット、開発ツール群を公開した。今回のアップデートでは既存のNVIDIAモデルファミリーが拡張され、関連する学習データとリファレンス実装がGitHub、Hugging Face、NVIDIAの開発者向けプラットフォームを通じて提供される。
-
オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に
Agent Sandboxは、安定したアイデンティティと永続ストレージを備えた単一のステートフルPodを管理するための宣言的APIを提供する、オープンソースのKubernetesコントローラーである。信頼できないLLM生成コードを実行するための隔離環境の構築に特に適しており、他のステートフルワークロードの実行にも向いている。
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
Microsoft Foundry Agent Service、長期メモリのプレビュー版で状態管理をシンプル化
Microsoftは年次カンファレンスIgniteにてFoundry Agent Serviceのメモリ機能、Agent serviceにネイティブ統合されたフルマネージド長期メモリストア、のパブリックプレビュー版を発表した。
-
Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張
Memoriは、AIエージェントに長期的で構造化されたクエリ可能なメモリを提供するために設計された、フル機能を備えたオープンソースのメモリシステムへと成熟した。これにより、従来のプロプライエタリなベクトルストアではなく、標準的なデータベースを使用できる。Memoriは、アドホックなプロンプトや一時的なセッション状態に依存する代わりに、インタラクションからエンティティ、事実、関係、コンテキストを継続的に抽出し、それらをSQLやMongoDBのバックエンドに保存する。それにより、エージェントは手動でのオーケストレーションを行うことなく、セッションをまたいで情報を記憶し再利用が可能だ。
-
Android GenAIプロンプトAPI、Gemini Nanoで自然言語リクエストを実現
ML Kit GenAI Prompt APIIがアルファ版で利用可能となり、Android開発者はデバイス上で動作するGemini Nanoに自然言語およびマルチモーダルリクエストを送信できるようになった。このAPIは、初期のGenAIリリースで導入されたテキスト要約や画像説明の機能を拡張するものである。
-
Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM(大規模言語モデル)として評価された。
Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri(Parallel Exploration Tool For Risky Interactions)による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。
-
AnthropicがClaude Codeを拡張、Webおよびモバイルプラットフォームに
AnthropicはAI駆動開発環境Claude Codeの利用可能範囲を拡張し、Webおよびモバイルプラットフォームに対応させた。これまでClaude.aiやAPI統合を通したデスクトップアクセスに限定されていたが、今回の展開により開発者はブラウザやモバイルデバイス上で直接コーディング作業を実行および管理できるようになった。
-
Hugging FaceがmmBERTを発表、対応言語1,800以上の多言語エンコーダー
Hugging FaceはmmBERT、1,833の言語にわたる3兆以上のトークンでトレーニングされた新しい多言語エンコーダーをリリースした。モデルはModernBERTアーキテクチャを基盤としており、多言語理解タスクの長年のベースラインとなっていたXLM-Rを大幅に上回る初のモデルである。
-
AnthropicがClaudeパフォーマンス問題の背後にある3つのインフラストラクチャバグを公開
Anthropicは最近、Claudeモデルの出力品質が数週間にわたり断続的に低下していた原因について、3つの異なるインフラストラクチャのバグが関与していたことを明らかにするポストモーテムを公開した。同社はこれらの問題を解決し、同様の障害を防ぐために内部プロセスを変更していると述べているが、コミュニティは3つのハードウェアプラットフォームでサービス運用することの課題をハイライトしている。
-
AnthropicがSkills導入、カスタムClaudeタスク向け
AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。
-
OWASPがAgentic AIにおけるツール誤用を重大な脅威として警告
今年初め、OWASPはAgentic AI - Threats and Mitigationsと呼ばれるAgentic AIセキュリティに関するガイダンスをリリースした。この文書はこの新興技術を安全にデプロイする際のユニークな課題をハイライトし、防御のための緩和策やアーキテクチャパターンを提案している。