InfoQ ホームページ AIと機械学習、データエンジニアリングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

PyTorch 2.5リリースにて、Intel GPUをサポート

PyTorch Foundationは最近、Intel GPUのサポートを含むPyTorchバージョン2.5をリリースした。このリリースには、FlexAttention API、TorchInductor CPUバックエンドの最適化、コンパイル時間を短縮するリージョナルコンパイル機能など、いくつかのパフォーマンス強化も含まれている。全体として、このリリースには PyTorch 2.4 以降の 4095 のコミットが含まれている。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年12月9日午前5時30分
AIと機械学習、データエンジニアリング

マイクロソフトと清華大学が大規模言語モデル向けのDIFF Transformerを発表

マイクロソフトAI と清華大学の研究者が、Differential Transformer (DIFF Transformer) という大規模言語モデルの性能向上を目的とした新しいアーキテクチャを発表した。同モデルでは、モデルによるコンテキスト処理の微調整や無関係な情報によるハルシネーションを最小限化することで、アテンション・メカニズムが向上している。

Daniel Dominguez 翻訳者 Takashi Kawase
投稿日 2024年12月9日午前4時31分
AIと機械学習、データエンジニアリング

Hugging Face、AIモデル比較強化に向けOpen LLM Leaderboardをアップグレード

Hugging FaceはOpen LLM Leaderboard v2、大規模言語モデル向けの彼らのポピュラーなベンチマーキングプラットフォームのアップグレード版を最近リリースした。

Vinod Goje 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月4日午前3時30分
AIと機械学習、データエンジニアリング

AIコーディングアシスタントの活用による開発者の生産性向上を研究結果が示唆

Microsoft社、マサチューセッツ工科大学（MIT）、プリンストン大学、ペンシルベニア大学ウォートンスクールの研究者らは先日、GitHub Copilotの利用で開発者の生産性が向上するという研究結果を発表した。研究チームは、4,000人以上の開発者を対象とした3つの別々のランダム化比較試験（RCT）を実施し、Copilotを使用した開発者の生産性は26％向上した。

Anthony Alford 翻訳者 Hiroshi.Kuroki
投稿日 2024年12月4日午前2時30分
デベロップメント

Google社、Android StudioにAI機能Geminiを導入

Google社は、AI機能を通じた開発者の生産性向上に向けて、Android StudioでGeminiの一連のアップデートをリリースした。今回のリリースは、AIアシストを用いたコーディング、リファクタリング、ドキュメント生成、コードの分析やテスト、修正提案など、開発ライフサイクルのあらゆる段階にAIを導入することを目的としている。

Diogo Carleto 翻訳者 Hiroshi.Kuroki
投稿日 2024年12月4日午前1時30分
AIと機械学習、データエンジニアリング

Meta社がNotebookLlamaをリリース：オープンソースのPDFからPodcastへのツールキット

Meta社は、PDF文書をポッドキャストに変換するために設計されたオープンソースのツールキットである、NotebookLlamaをリリースした。これにより、開発者は構造化されたアクセス可能な PDF からオーディオへのワークフローを利用できるようになる。GoogleのNotebookLMのオープンソースの代替として、NotebookLlamaは、大規模言語モデル（LLM）やオーディオ処理の経験がなくても、PDF文書を音声コンテンツに変換する4段階のプロセスを通してユーザーをガイドする。このツールキットは、ユーザーがLLMやTTSモデルを試して、会話や音声に対応したコンテンツを作成するための実用的な方法を提供する。

Robert Krzaczyński 翻訳者 Naoko Koshimura
投稿日 2024年12月2日午前7時30分
設計/アーキテクチャ

RAG（Retrieval-Augmented Generation）を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約

Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation（RAG）を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。

Eran Stiller 翻訳者 Naoko Koshimura
投稿日 2024年11月28日午前5時30分
AIと機械学習、データエンジニアリング

Google社、大規模言語モデル(LLM)自己修正アルゴリズムSCoReを発表

先日、Google DeepMind社の研究者が、強化学習を用いた自己修正（Self-Correction via Reinforcement Learning, 以下 SCoRe）に関する論文を発表した。このSCoReとは、数学やコーディングの問題を解く際の大規模言語モデルによる自己修正能力の向上を図る技術である。SCoReで微調整されたモデルは、ベースラインモデルと比較で、いくつかのベンチマークの性能が向上した。

Anthony Alford 翻訳者 Takashi Kawase
投稿日 2024年11月28日午前4時31分
AIと機械学習、データエンジニアリング

Stability AIが最上位のテキスト生成画像モデルをAmazon Bedrockと統合したことを発表

Stability AIは、Amazon Bedrockに3つの新しいテキスト画像生成モデル：Stable Image Ultra、Stable Diffusion 3 Large、Stable Image Coreを搭載した。これらのモデルは、マルチサブジェクト・プロンプト、画像品質、タイポグラフィのパフォーマンスを向上させることに重点を置いている。これらのモデルは、マーケティング、広告、メディア、エンターテインメント、小売業などの様々な用途において高品質のビジュアルを生成するように設計されている。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年11月26日午前3時30分
AIと機械学習、データエンジニアリング

LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。

Olimpiu Pop 翻訳者 Naoko Koshimura
投稿日 2024年11月26日午前1時30分
AIと機械学習、データエンジニアリング

Meta社 AIが思考の選好最適化を導入、AIモデルが反応する前に考えることを可能に

Meta FAIR、カリフォルニア大学バークレー校、ニューヨーク大学の研究者たちが、思考の選好最適化（TPO）を発表した。最終的な解答のみに注目する従来のモデルとは異なり、このアプローチでは、LLMがより正確で首尾一貫した解答を生成するために、内部的な思考プロセスを生成し、洗練させることができる。

Daniel Dominguez 翻訳者 Naoko Koshimura
投稿日 2024年11月25日午前10時30分
AIと機械学習、データエンジニアリング

OpenAIがChatGPT検索機能をリリース

OpenAIは最近、ChatGPTがユーザーの質問に答える際にウェブを検索可能にするChatGPT Search機能をリリースした。ChatGPTは、トレーニング時に利用可能な知識に制限されるのではなく、ウェブから最新の情報を取り入れ、その情報源へのリンクを含めることが可能になった。

Anthony Alford 翻訳者 Hiroshi.Kuroki
投稿日 2024年11月25日午前9時31分
AIと機械学習、データエンジニアリング

GitHubとGoogle Cloudが連携し、Gemini 1.5 ProをGitHub Copilotに導入

GitHubはGoogle Cloudと提携し、Gemini 1.5 ProモデルをGitHub Copilotに導入し、開発者に最大200万トークンを扱えるAIツールを提供する。Gemini 1.5 Proは、コード生成、分析、最適化などのタスク向けに設計されており、Visual Studio Codeのようなプラットフォームで間もなく利用可能になり、大規模なコードベースを扱う開発者に柔軟性を提供する。

Robert Krzaczyński 翻訳者 Takashi Kawase
投稿日 2024年11月21日午前8時31分
AIと機械学習、データエンジニアリング

PyTorch カンファレンス 2024：PyTorch 2.4/2.5(開発中)、そしてLlama 3.1

2024年9月18日と19日、Linux Foundationはサンフランシスコのフォート・メイソン周辺でPyTorch Conference 2024を開催した。このカンファレンスでは、PyTorch 2.4とLlama 3.1の最新の機能と、PyTorch 2.5での今後の変更点が紹介された。PyTorch Foundationのエグゼクティブディレクターであり、Linux FoundationのAI担当GMでもあるMatt White氏は、初日のカンファレンスの冒頭で、責任ある生成AIの発展におけるオープンソース・イニシアチブの重要性を強調した。

Andrew Hoblitzell 翻訳者 Takashi Kawase
投稿日 2024年11月19日午前10時30分
設計/アーキテクチャ

PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加

PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル（LLM）を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成（RAG）、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。

Rafal Gancarz 翻訳者 kazuki
投稿日 2024年11月14日午前8時30分