InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Hugging FaceがGPU全体の効率的LLMトレーニングに関するガイドを公開
Hugging FaceがUltra-Scale Playbook: Training LLMs on GPU Clusters、GPU クラスター全体で大規模言語モデル(LLM)をトレーニングする際の方法論と技術について詳細に探究するオープンソースのガイドを公開した。このプレイブックはスループット、GPU利用率、トレーニング効率の最適化に焦点を当て、最大512GPUを使用して実施された4000以上のスケーリング実験に基づいている。大規模モデルトレーニングに取り組む研究者やエンジニアに実践的なガイダンスを提供することを目的としており、再現可能なベンチマーク、実装の詳細、パフォーマンス最適化を提供している。
-
AWS、アベイラビリティゾーンのアフィニティルーティングとValkey GLIDEでキーバリュー型データストアのレイテンシーとコストを削減
AWSは先日、オープンソースクライアントライブラリ、Valkey General Language Independent Driver for Enterprise(GLIDE)のバージョン1.2にアベイラビリティゾーン(AZ) 認識機能を導入した。今回のキーバリュー型オープンソースデータストアへのアベイラビリティゾーンのアフィニティルーティングの実装でクライアントと同じアベイラビリティゾーンのレプリカにリクエストが送信されるようになった。このため、開発者によるレイテンシーとコストの削減が可能になった。
-
Google DeepMindが長期的疾病管理向けにAMIEを強化
Google DeepMindは長期的な疾病管理をサポートするためにArticulate Medical Intelligence Explorer(AMIE)の機能を診断以外にも拡張した。このシステムは現在、臨床医が複数回の患者の受診にわたって病気の進行を監視し、治療を調整し、臨床ガイドラインの遵守を支援するように設計されている。
-
OpenAIがソフトウェア開発ベンチマークを発表
OpenAIは、実世界のフリーランスのソフトウェア開発タスクで先進的なAI言語モデルの能力を評価するためのSWE-Lancerベンチマークを発表した。このベンチマークはUpworkから提供された1,400以上のタスクのデータセットを使用しており、その総額は100万ドルである。これらのタスクには独立したコーディング活動と管理的意思決定の両方が含まれ、複雑さと報酬の範囲が実世界のフリーランスのシナリオをシミュレートするように設計されている。
-
分散型マルチモーダルデータベースAerospike 8がリアルタイムACIDトランザクションのサポートを提供
Aerospikeは分散マルチモーダルデータベースのバージョン8.0を発表し、分散ACIDトランザクションをサポートした。これにより、銀行、eコマース、在庫管理、ヘルスケア、注文処理などの大規模オンライントランザクション処理(OLTP)アプリケーションが可能になるという。
-
DeepSeek、OpenAIのo1モデルに匹敵する性能を持つDeepSeek-R1 LLMをオープンソース化
DeepSeekは推論能力を向上させるために強化学習(RL)でファインチューニングされたLLM、DeepSeek-R1をオープンソース化した。DeepSeek-R1はMATH-500やSWE-benchを含むいくつかのベンチマークで、OpenAIのo1モデルと同等の結果を達成している。
-
GitHub Copilot拡張機能はIDEと外部サービスを統合
現在一般提供されているGitHub Copilot 拡張機能により、開発者はIDEを離れることなく自然言語を使用してドキュメント照会し、コード生成し、データ取得し、外部サービス上でアクションを実行できる。Docker、MongoDB、Sentryなど多くの企業が公開している拡張機能を利用できるほか、開発者は内部ライブラリやAPIと連携するための独自の拡張機能を作成することもできる。
-
データコントラクトでデータチームのチームコラボレーションを促進するには
データコントラクトは、データプロバイダーとデータコンシューマー間のインターフェース定義であり、データモデル、品質保証、所有権などを指定する。Jochen Christ氏によると、データコントラクトはデータメッシュでの分散データのデータ所有権の決定に不可欠であり、このおかげでデータ特定性、データ相互運用性、データガバナンスが確保されている。データコントラクトでチーム間のコミュニケーションが促進され、データプロダクトの信頼性と品質が向上している。
-
マイクロソフトがCoRAGを発表:反復的推論によるAI検索の強化
Microsoft AIは中国人民大学と共同でRetrieval-Augmented Generation(RAG)モデルを強化するために設計された新しいAIフレームワーク、Chain-of-Retrieval Augmented Generation(CoRAG)を発表した。単一の検索ステップに依存する従来のRAGシステムとは異なり、CoRAGは反復検索と推論を可能にし、AIモデルが回答を生成する前に動的に検索結果をリファインすることを可能にする。
-
Hugging Face、新たなプロバイダー統合でサーバーレス推論オプションを拡大
Hugging Faceは、Fal、Replicate、SambaNova、Together AIの4つのサーバーレス推論プロバイダーの統合を直接モデルページにローンチした。これらのプロバイダーはJavaScriptおよびPython用Hugging FaceクライアントSDKにも統合されており、ユーザーは最小限のセットアップで様々なモデルの推論を実行できるようになっている。
-
ラテンアメリカがAIの文化的関連性を向上させるためにLatam-GPTを発表
ラテンアメリカは同地域の歴史、文化、言語的多様性をよりよく表現するために設計された言語モデル「Latam-GPT」の開発を通して、人工知能の開発を進めている。Paris AI Action Summitで発表されたこのプロジェクトは、チリの科学・技術・知識・イノベーション省(CTCI)と国立人工知能センター(Cenia)が主導し、ラテンアメリカ各地の専門家や機関の支援を受けている。
-
OpenAIがo3のリリースをキャンセル、GPT 4.5、5のロードマップを発表
今週初め、OpenAIは自社のAIロードマップを再構築し、以前計画していたo3の単独リリースを取りやめ、GPT-5を中心に取り組みを統合すると発表した。
-
PerplexityがDeep Researchを発表:高度な分析のためのAI駆動ツール
PerplexityはDeep Research、金融、マーケティング、テクノロジーなど様々な分野で詳細な分析を行うために設計されたAI駆動ツールを発表した。このシステムは、複数の検索を実行し、広範な情報源を分析し、数分以内に構造化されたレポートに結果をまとめることでリサーチプロセスを自動化する。
-
MongoDBに代わるオープンソースのFerretDB、バージョン2.0をリリース
FerretDBはバージョン2.0の最初のリリース候補を発表した。最近リリースされたDocumentDBを搭載したFerretDBは、MongoDBに代わるオープンソースとして、大幅なパフォーマンスの向上、機能互換性の強化、ベクトル検索機能、レプリケーションのサポートを提供する。
-
OpenAIがOperator、Webベースタスク用AIエージェントをリリース
OpenAIはOperatorのリサーチプレビュー版、ユーザーに代わってWebブラウザを使ってタスクを実行できるAIエージェントをリリースした。OperatorはWebArenaと WebVoyager のベンチマークで最先端の性能を達成している。