InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Microsoftが.NET開発向けに新しいAIチャットWebアプリテンプレートを発表
先週、新しいAIチャットWebアプリテンプレートをMicrosoftが発表した。このテンプレートはAIをより身近なものにするというMicrosoftの継続的な取り組みの一環であり、Visual Studio、Visual Studio Code、.NET CLIでスキャフォールディングとガイダンスを提供する。
-
Google DeepMindが Gemini Roboticsを発表
Google DeepMindは、視覚、言語、行動を統合することでロボット工学を強化するために設計された先進的なAIモデル、Gemini Roboticsを発表した。Gemini 2.0フレームワークに基づくこのイノベーションは、特に現実世界のセッティングにおいて、ロボットをよりスマートで能力の高いものにすることを目指している。
-
エンジニアリングチームがAI、プラットフォームエンジニアリング、DevExにどう取り組んでいるか:InfoQ Dev Summit Boston 2025
InfoQとQConの開発チームによるこのイベントは、理論的な議論のみ行うカンファレンスとは異なり、Netflix、The New York Times、Shopify、CarGurus、Vanguardなどから得られる実践的な洞察に基づいた現実世界での実装にフォーカスしている。講演者は参加者がすぐに適用できる戦略を共有し、チームがコストのかかる試行錯誤を避けられるよう支援する。
-
IBM社、Granite 3.2で新たな視覚言語モデル、思考連鎖推論、時系列モデル強化を実装
IBM社は、マルチモーダルと推論機能を搭載したGranite 3.2の最新モデルを発表した。。Granite 3.2の特徴は試験的に導入された思考連鎖推論機能であり、従来モデルを大きく上回る性能を発揮している。新たな大規模視覚言語モデル(VLM)は、いくつかのベンチマークスコアでより大型のモデルを凌駕しているほか、小型モデルより効率的なデプロイを実現している。
-
Mistral AIがアラビア語と南インドの言語に対応した地域言語モデルのSabaを発表
Mistral AIは、アラビア語といくつかのインド言語、特にタミル語のような南インド言語のAIパフォーマンスを向上させるために設計された240億パラメータ言語モデルである、Mistral Sabaを発表した。必要とされる地域的コンテキスト理解を欠く恐れのある汎用モデルとは異なり、Mistral Sabaは中東や南アジアで収集しキュレートされたデータセットで訓練されており、言語文化的により正確な応答を提供している。
-
Googleが機密フェデレーション分析でデータプライバシーを強化
Googleはプライバシーを保護しながらデータ処理の透明性を高めるために設計された技術、Confidential Federated Analytics(CFA)を発表した。フェデレーション分析を基盤に、CFAは機密コンピューティングを活用して生データがサーバーやエンジニアに公開されることなく、ユーザーデータに対して事前に定義された検査可能な計算のみが実行されるようにする。
-
Hugging FaceがGPU全体の効率的LLMトレーニングに関するガイドを公開
Hugging FaceがUltra-Scale Playbook: Training LLMs on GPU Clusters、GPU クラスター全体で大規模言語モデル(LLM)をトレーニングする際の方法論と技術について詳細に探究するオープンソースのガイドを公開した。このプレイブックはスループット、GPU利用率、トレーニング効率の最適化に焦点を当て、最大512GPUを使用して実施された4000以上のスケーリング実験に基づいている。大規模モデルトレーニングに取り組む研究者やエンジニアに実践的なガイダンスを提供することを目的としており、再現可能なベンチマーク、実装の詳細、パフォーマンス最適化を提供している。
-
AWS、アベイラビリティゾーンのアフィニティルーティングとValkey GLIDEでキーバリュー型データストアのレイテンシーとコストを削減
AWSは先日、オープンソースクライアントライブラリ、Valkey General Language Independent Driver for Enterprise(GLIDE)のバージョン1.2にアベイラビリティゾーン(AZ) 認識機能を導入した。今回のキーバリュー型オープンソースデータストアへのアベイラビリティゾーンのアフィニティルーティングの実装でクライアントと同じアベイラビリティゾーンのレプリカにリクエストが送信されるようになった。このため、開発者によるレイテンシーとコストの削減が可能になった。
-
Google DeepMindが長期的疾病管理向けにAMIEを強化
Google DeepMindは長期的な疾病管理をサポートするためにArticulate Medical Intelligence Explorer(AMIE)の機能を診断以外にも拡張した。このシステムは現在、臨床医が複数回の患者の受診にわたって病気の進行を監視し、治療を調整し、臨床ガイドラインの遵守を支援するように設計されている。
-
OpenAIがソフトウェア開発ベンチマークを発表
OpenAIは、実世界のフリーランスのソフトウェア開発タスクで先進的なAI言語モデルの能力を評価するためのSWE-Lancerベンチマークを発表した。このベンチマークはUpworkから提供された1,400以上のタスクのデータセットを使用しており、その総額は100万ドルである。これらのタスクには独立したコーディング活動と管理的意思決定の両方が含まれ、複雑さと報酬の範囲が実世界のフリーランスのシナリオをシミュレートするように設計されている。
-
分散型マルチモーダルデータベースAerospike 8がリアルタイムACIDトランザクションのサポートを提供
Aerospikeは分散マルチモーダルデータベースのバージョン8.0を発表し、分散ACIDトランザクションをサポートした。これにより、銀行、eコマース、在庫管理、ヘルスケア、注文処理などの大規模オンライントランザクション処理(OLTP)アプリケーションが可能になるという。
-
DeepSeek、OpenAIのo1モデルに匹敵する性能を持つDeepSeek-R1 LLMをオープンソース化
DeepSeekは推論能力を向上させるために強化学習(RL)でファインチューニングされたLLM、DeepSeek-R1をオープンソース化した。DeepSeek-R1はMATH-500やSWE-benchを含むいくつかのベンチマークで、OpenAIのo1モデルと同等の結果を達成している。
-
GitHub Copilot拡張���能はIDEと外部サービスを統合
現在一般提供されているGitHub Copilot 拡張機能により、開発者はIDEを離れることなく自然言語を使用してドキュメント照会し、コード生成し、データ取得し、外部サービス上でアクションを実行できる。Docker、MongoDB、Sentryなど多くの企業が公開している拡張機能を利用できるほか、開発者は内部ライブラリやAPIと連携するための独自の拡張機能を作成することもできる。
-
データコントラクトでデータチームのチームコラボレーションを促進するには
データコントラクトは、データプロバイダーとデータコンシューマー間のインターフェース定義であり、データモデル、品質保証、所有権などを指定する。Jochen Christ氏によると、データコントラクトはデータメッシュでの分散データのデータ所有権の決定に不可欠であり、このおかげでデータ特定性、データ相互運用性、データガバナンスが確保されている。データコントラクトでチーム間のコミュニケーションが促進され、データプロダクトの信頼性と品質が向上している。
-
マイクロソフトがCoRAGを発表:反復的推論によるAI検索の強化
Microsoft AIは中国人民大学と共同でRetrieval-Augmented Generation(RAG)モデルを強化するために設計された新しいAIフレームワーク、Chain-of-Retrieval Augmented Generation(CoRAG)を発表した。単一の検索ステップに依存する従来のRAGシステムとは異なり、CoRAGは反復検索と推論を可能にし、AIモデルが回答を生成する前に動的に検索結果をリファインすることを可能にする。