InfoQ ホームページ 大規模言語モデル に関するすべてのコンテンツ
-
Googleがイルカのコミュニケーション研究支援にDolphinGemmaを投入
GoogleはDolphinGemma、研究者がイルカの発声を分析・解釈することを支援するために開発された新しいAIモデルを発表した。このプロジェクトはWild Dolphin Project(WDP)とジョージア工科大学の研究者との継続的な共同研究の一環であり、大西洋マダライルカの自然なコミュニケーションにおけるパターンの特定にフォーカスしている。
-
Anthropicの「AI顕微鏡」が大規模言語モデルの内部構造を探る
Anthropicが最近発表した2つの論文は、大規模言語モデルの内部で起こるプロセスを明らかにしようとする試みで、解釈可能な概念を特定し、それを言語化する計算「回路」に結びつける方法と、ハルシネーション、プランニング、その他の主要な特徴を含むClaude Haiku 3.5の重要な挙動を特徴付ける方法を探求している。
-
FastAPI-MCP: FastAPIとAIエージェントの統合をシンプルに
新しいオープンソースライブラリFastAPI-MCPは、Model Context Protocol (MCP)を通じて開発者が、従来のFastAPIアプリケーションと最新のAIエージェントを接続することを容易にしている。ゼロコンフィギュレーションセットアップのために設計されたFastAPI-MCPは、開発者が自動的にAPIエンドポイントをMCP互換のツールとして公開できるようにし、最小限の変更でWebサービスをAIシステムからアクセス可能にする。
-
OpenAI社がAIエージェントのウェブ検索機能やディープリサーチ機能のベンチマーク評価を実現する「BrowseComp」を発表
SimpleQAをはじめとする従来型のベンチマークは単一事実情報の収集能力評価に特化しており、ブラウジング機能搭載型GPT-4oなどの高速ブラウジング対応モデルの台頭で「飽和状態」に達している。一方、BrowseCompは数十、数百のウェブサイトを行き来しながら、情報を収集精査するエージェントの能力を計測する。 BrowseCompの問題には、端的かつ明確な回答が可能であり、参照型ソリューションとの照合で評価が容易に行える。
-
AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進
AWSは、生成AIワークロード設計と運用のベストプラクティス提供にフォーカスした、新しいWell-Architected Generative AI Lensの提供を発表した。このLensは、生成AIを使って堅牢かつコスト効率の高いソリューションを提供する責任を持つビジネスリーダー、データサイエンティスト、アーキテクト、エンジニアを対象としている。このドキュメントはクラウドに依存しないベストプラクティス、実装ガイダンス、その他のリソースへのリンクを提供している。
-
オブザーバビリティがLLMベースのシステムのユーザーエクスペリエンスを向上させる方法:KubeCon EUでのHoneycombのCEOの洞察
KubeCon Europeの基調講演で、HoneycombのCEO兼共同設立者であるChristine Yen氏は、ソフトウェアシステムにおけるLLMの統合によってもたらされた急速なシフトに対処するために、オブザーバビリティどのように役立つかについての洞察を説明した。LLMの統合は、ソフトウェア開発方法だけでなく、リリース方法論にも大きな変革をもたらした。彼女は、本番環境の観測結果に基づいて開発のフィードバックループを適応させる方法を説明した。
-
Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。
-
マイクロソフトがAnthropicと提携し、MCP統合のためのC# SDKを発表
マイクロソフトはAnthropicと提携し、大規模言語モデル(LLM)を外部ツールやデータソースと接続するために設計されたオープンプロトコルであるModel Context Protocol(MCP)の公式C# SDKを開発した。SDKはオープンソースで、modelcontextprotocol GitHub組織の下で利用できる。
-
Meta AIがLlama 4をリリース:初期の印象とコミュニティからのフィードバック
Meta社は、新しいLlama 4ファミリーの最初のモデルであるScoutとMaverickを正式にリリースした。これは、同社のオープンウェイト大規模言語モデルエコシステムにおける大きな前進となる。ネイティブのマルチモーダルアーキテクチャとMixture of Experts(MoE)フレームワークで設計されたこれらのモデルは、画像理解からロングコンテキストの推論まで、より幅広いアプリケーションをサポートすることを目的としている。
-
AI大陸行動計画:欧州委員会がAI開発におけるスケーリング戦略概要を発表
欧州委員会は、EUにおけるAIの開発とデプロイ推進に向けた新戦略「AI大陸行動計画」を発表した。同計画は、AIインフラストラクチャーへの協調投資、高品質データへのアクセス拡大、EUの戦略的セクターにおけるAI導入推進、AI規則順守への支援に関する戦略概要である。
-
SREと生成AIを利用したeBayのダウンタイム削減方法:KubeCon EUでのアーキテクトによる洞察
KubeCon EUの基調講演で、eBay社のプリンシパルMTSアーキテクトであるVijay Samuel氏は、機械学習やLLMのビルディングブロックを組み込み、自社SREチームのインシデント対応強化を行った際の実体験を披露した。同氏は今回の体験を通し、LLMは万能ではないものの、複数機能を組み合わせることで複雑なシナリオに取り組むエンジニアに役立つことが分かったと語っている。
-
Mistral AIがマルチモーダル文書のLLMベースOCR用APIを発表
Mistral AI社のla Plateforme SaaSで利用可能になったMistral OCRは、テキストと画像、表、数式、高度なレイアウトが混在する複雑な文書をデジタル化するためのOCRソリューションを提供することを目的としている。そのため、科学研究、歴史的文書や工芸品、ユーザーマニュアルなどのデジタル化に特に適していると同社は述べている。
-
OpenAIが文字起こしと音声合成用の新音声モデルを発表
OpenAIはAPIにおいて、文字起こしの精度向上とAI生成音声の制御性向上にフォーカスした新しい音声認識と音声合成モデルを導入した。これらのアップデートは自動音声アプリケーションを強化し、さまざまな環境やユースケースにさらに適応できるようにすることを目的としている。
-
OpenAIがカスタムエージェント開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
instructlab.aiは、合成データを使用して大規模言語モデル(LLMs)の微調整の複雑さを軽減する
InstructLab.aiは、この論文で説明されているチャットボットのための大規模アラインメント(LAB)コンセプトをオープンソースで実装したものである。論文の要旨によると、LABは大規模言語モデル(LLM)の命令チューニングフェーズにおけるスケーラビリティの課題を克服することを目的としている。このアプローチは、LLMのための合成データベースのアライメントチューニングメソッドを活用する。このアプローチでは、作成された分類法によって、学習データの合成シードを提供できる。