InfoQ ホームページ大規模言語モデルに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Qwen開発チーム、QwQ-32B-Previewを発表：AIによる推論と分析が進化

LLM（大規模言語モデル）であるQwenの開発チームは、AIの推論と分析能力を向上させるために設計された実験的研究モデル、QwQ-32B-Previewを発表した。32,768トークンのコンテキストと最先端の変換アーキテクチャを特徴とするこのモデルは、GPQAやMATH-500のような数学、プログラミング、科学ベンチマークに優れている。Hugging Faceで利用可能で、その機能を探求し、開発に貢献をしてくれる研究者たちを募っている。

Robert Krzaczyński 翻訳者 Takamasa Sugawara
投稿日 2025年1月9日午前8時30分
AIと機械学習、データエンジニアリング

Amazonが Amazon Nova、基盤モデルのシリーズを発表

Amazonは生成AIタスク向けに設計された基盤モデルのファミリーAmazon Novaを発表した。AWS re:Inventの中に行われたこの発表は、ドキュメントやビデオの分析、チャートの理解、ビデオコンテンツの生成、AIエージェントの開発といったタスクにおけるモデルの能力をハイライトしている。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2025年1月6日午前8時30分
AIと機械学習、データエンジニアリング

QCon San Francisco 2024のAIとMLトラック - 生成AIと実用的アプリケーションを深掘り

InfoQによる国際的なソフトウェア開発会議であるQCon San Francisco 2024では、AIとMLの急速な進歩に特化した2つのトラックが設けられており、これらの技術が現代のソフトウェア開発の中心となっていることを反映している。

Artenisa Chatziou 翻訳者 Takashi Kawase
投稿日 2024年12月27日午前7時30分
AIと機械学習、データエンジニアリング

マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表

マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月24日午前5時31分
AIと機械学習、データエンジニアリング

Meta Spirit LM、音声とテキストを統合した新しいマルチモーダルGenAIモデルを発表

最近の論文で発表されたSpirit LMは、話し言葉と書き言葉を混在させたパイプラインを作成し、音声とテキストを同じマルチモーダルモデルに統合することを可能にする。Meta社によれば、テキストと音声トークンのインターリーブに基づく新しいアプローチにより、音声とテキストに別々のパイプラインを使用する従来のソリューションの本質的な制限を回避することが可能になるという。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2024年12月24日午前12時30分
AIと機械学習、データエンジニアリング

Amazon SageMaker JumpStartがBria AIのテキスト画像変換モデルでポートフォリオを拡大

Amazon Web Servicesは、Bria AIの最新のテキストから画像への基礎モデルをAmazon SageMaker JumpStartに統合し、エンタープライズグレードの生成AI機能を大幅に拡張した。今回の追加には、Bria 2.3、Bria 2.2 HD、Bria 2.3 Fastの3つのバリエーションが含まれ、それぞれがビジュアルコンテンツ生成における特定の企業ニーズに対応するように設計されている。

Vinod Goje 翻訳者 Takashi Kawase
投稿日 2024年12月20日午前9時30分
AIと機械学習、データエンジニアリング

xAIがGrokモデルの新APIサービスを発表

Elon Musk氏のxAIは、開発者がアプリケーションにxAIの大規模言語モデル（LLM）を統合できるようになる、APIサービスのパブリックベータ版をローンチした。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月20日午前3時30分
AIと機械学習、データエンジニアリング

DecartとEtchedがゲーム世界を変える新しいAIモデル、Oasisをリリース

Decart.aiとEtched.aiは最近Oasis、Minecraftにインスパイアされた完全インタラクティブ、リアルタイムオープンワールド体験を生成するAI駆動モデルを発表した。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月20日午前2時30分
AIと機械学習、データエンジニアリング

AWSがAIエージェント管理のためのMulti-Agent Orchestratorフレームワークを公開

AWSはMulti-Agent Orchestrator、複数のAIエージェントを管理し、複雑な会話シナリオを処理するために設計されたフレームワークを発表した。このシステムはクエリを最適なエージェントにルーティングし、インタラクション間でコンテキストを維持し、AWS Lambda、ローカルセットアップ、その他クラウドプラットフォームなどさまざまなデプロイ環境とシームレスに統合する。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月19日午前7時30分
AIと機械学習、データエンジニアリング

AISuiteは統一クロスLLM APIを提供する新オープンソースPythonライブラリ

最近Andrew Ng氏によって発表された、現在利用可能なもっとも一般的な大規模言語モデル（LLM）に対してOpenAI��イクなAPIを提供することを目的としたaisuiteは、開発者がコードを変更することなく簡単にLLMを試して結果を比較したり、あるLLMから別のLLMに切り替えることを可能にする。

Sergio De Simone 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月19日午前5時31分
AIと機械学習、データエンジニアリング

Meta社のMobileLLMでオンデバイスユースケースに向けたLLM設計が促進

Meta社の研究者のMobileLLMに対する目標は野心的だ。小型モデルの品質は搭載しているパラメータが何十億あるかに直結したものではなく、むしろ注意深いアーキテクチャ設計の賜物であることを示そうとしている。その実証として、層の深いアーキテクチャと層の浅いアーキテクチャを埋め込み共有やグループ化クエリアテンションメカニズムを組み合わせた125M、350M、600M、10Bパラメータの4つのモデルを構築し、従来の最先端モデルよりも精度を向上させた。

Sergio De Simone 翻訳者 Takashi Kawase
投稿日 2024年12月16日午前6時30分
AIと機械学習、データエンジニアリング

Rhymes AIがAriaを発表：開発リソースを備えたオープンソースのマルチモーダルモデル

Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE（Mixture-of-Experts）モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。

Robert Krzaczyński 翻訳者 Naoko Koshimura
投稿日 2024年12月10日午前10時30分
AIと機械学習、データエンジニアリング

マイクロソフトと清華大学が大規模言語モデル向けのDIFF Transformerを発表

マイクロソフトAI と清華大学の研究者が、Differential Transformer (DIFF Transformer) という大規模言語モデルの性能向上を目的とした新しいアーキテクチャを発表した。同モデルでは、モデルによるコンテキスト処理の微調整や無関係な情報によるハルシネーションを最小限化することで、アテンション・メカニズムが向上している。

Daniel Dominguez 翻訳者 Takashi Kawase
投稿日 2024年12月9日午前4時31分
AIと機械学習、データエンジニアリング

Hugging Face、AIモデル比較強化に向けOpen LLM Leaderboardをアップグレード

Hugging FaceはOpen LLM Leaderboard v2、大規模言語モデル向けの彼らのポピュラーなベンチマーキングプラットフォームのアップグレード版を最近リリースした。

Vinod Goje 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月4日午前3時30分
デベロップメント

Google社、Android StudioにAI機能Geminiを導入

Google社は、AI機能を通じた開発者の生産性向上に向けて、Android StudioでGeminiの一連のアップデートをリリースした。今回のリリースは、AIアシストを用いたコーディング、リファクタリング、ドキュメント生成、コードの分析やテスト、修正提案など、開発ライフサイクルのあらゆる段階にAIを導入することを目的としている。

Diogo Carleto 翻訳者 Hiroshi.Kuroki
投稿日 2024年12月4日午前1時30分