InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Rhymes AIがAriaを発表:開発リソースを備えたオープンソースのマルチモーダルモデル
Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE(Mixture-of-Experts)モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。
-
マイクロソフト、GraphQL用Fabric APIの一般提供を発表
マイクロソフトはGraphQL用Fabric APIを発表し、データアクセスレイヤーをパブリックプレビューから一般提供(GA)に移行した。このリリースでは、Azure SQLとFabric SQLデータベースのサポート、保存された資格情報認証、詳細な監視ツール、CI/CDワークフローとの統合など、いくつかの機能強化が導入されている。
-
Uber社がPrestoとExpress QueriesでSQLベースのデータ分析を加速した方法とは
Uber社は、オープンソースの分散型SQLクエリエンジンであるPrestoを使用して、Apache Hive、Apache Pinot、MySQL、Apache Kafkaなどの複数のデータソースで分析をしている。
-
Amazon QがVisual Studio CodeとJetBrains IDEsにインラインチャットサポートを追加
AWSは最近、Amazon Q Developerがインラインチャットをサポートし、開発者がエディタ内でコードの問題について議論し解決できるようになったと発表した。コードを直接更新できる機能とIDE内チャットのベネフィットを組み合わせたこの機能は、Claude 3.5によって提供されVisual Studio CodeとJetBrains IDEで利用できる。
-
メモリ効率を改善したValkey 8.0が一般提供開始
Linux Foundationは、Redisの後継として開発されたオープンソースのインメモリ・ストレージ・ソリューションであるValkey 8.0の一般提供を発表した。スロットごとにディクショナリを導入し、キーをディクショナリエントリに直接埋め込むことで、開発者は最大20%の容量増加を達成し、ノードごとに追加のキーを保存可能になる。
-
PyTorch 2.5リリースにて、Intel GPUをサポート
PyTorch Foundationは最近、Intel GPUのサポートを含むPyTorchバージョン2.5をリリースした。このリリースには、FlexAttention API、TorchInductor CPUバックエンドの最適化、コンパイル時間を短縮するリージョナルコンパイル機能など、いくつかのパフォーマンス強化も含まれている。全体として、このリリースには PyTorch 2.4 以降の 4095 のコミットが含まれている。
-
マイクロソフトと清華大学が大規模言語モデル向けのDIFF Transformerを発表
マイクロソフトAI と清華大学の研究者が、Differential Transformer (DIFF Transformer) という大規模言語モデルの性能向上を目的とした新しいアーキテクチャを発表した。同モデルでは、モデルによるコンテキスト処理の微調整や無関係な情報によるハルシネーションを最小限化することで、アテンション・メカニズムが向上している。
-
Hugging Face、AIモデル比較強化に向けOpen LLM Leaderboardをアップグレード
Hugging FaceはOpen LLM Leaderboard v2、大規模言語モデル向けの彼らのポピュラーなベンチマーキングプラットフォームのアップグレード版を最近リリースした。
-
AIコーディングアシスタントの活用による開発者の生産性向上を研究結果が示唆
Microsoft社、マサチューセッツ工科大学(MIT)、プリンストン大学、ペンシルベニア大学ウォートンスクールの研究者らは先日、GitHub Copilotの利用で開発者の生産性が向上するという研究結果を発表した。研究チームは、4,000人以上の開発者を対象とした3つの別々のランダム化比較試験(RCT)を実施し、Copilotを使用した開発者の生産性は26%向上した。
-
Google社、Android StudioにAI機能Geminiを導入
Google社は、AI機能を通じた開発者の生産性向上に向けて、Android StudioでGeminiの一連のアップデートをリリースした。今回のリリースは、AIアシストを用いたコーディング、リファクタリング、ドキュメント生成、コードの分��やテスト、修正提案など、開発ライフサイクルのあらゆる段階にAIを導入することを目的としている。
-
Meta社がNotebookLlamaをリリース:オープンソースのPDFからPodcastへのツールキット
Meta社は、PDF文書をポッドキャストに変換するために設計されたオープンソースのツールキットである、NotebookLlamaをリリースした。これにより、開発者は構造化されたアクセス可能な PDF からオーディオへのワークフローを利用できるようになる。GoogleのNotebookLMのオープンソースの代替として、NotebookLlamaは、大規模言語モデル(LLM)やオーディオ処理の経験がなくても、PDF文書を音声コンテンツに変換する4段階のプロセスを通してユーザーをガイドする。このツールキットは、ユーザーがLLMやTTSモデルを試して、会話や音声に対応したコンテンツを作成するための実用的な方法を提供する。
-
RAG(Retrieval-Augmented Generation)を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約
Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation(RAG)を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。
-
Google社、大規模言語モデル(LLM)自己修正アルゴリズムSCoReを発表
先日、Google DeepMind社の研究者が、強化学習を用いた自己修正(Self-Correction via Reinforcement Learning, 以下 SCoRe)に関する論文を発表した。このSCoReとは、数学やコーディングの問題を解く際の大規模言語モデルによる自己修正能力の向上を図る技術である。SCoReで微調整されたモデルは、ベースラインモデルと比較で、いくつかのベンチマークの性能が向上した。
-
Stability AIが最上位のテキスト生成画像モデルをAmazon Bedrockと統合したことを発表
Stability AIは、Amazon Bedrockに3つの新しいテキスト画像生成モデル:Stable Image Ultra、Stable Diffusion 3 Large、Stable Image Coreを搭載した。これらのモデルは、マルチサブジェクト・プロンプト、画像品質、タイポグラフィのパフォーマンスを向上させることに重点を置いている。これらのモデルは、マーケティング、広告、メディア、エンターテインメント、小売業などの様々な用途において高品質のビジュアルを生成するように設計されている。
-
LLMを精製し、そのパフォーマンスを超える:spaCyの創設者がInfoQ DevSummit Munichで語る
InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。