InfoQ ホームページ プログラミング に関するすべてのコンテンツ
-
マイクロソフトがCoRAGを発表:反復的推論によるAI検索の強化
Microsoft AIは中国人民大学と共同でRetrieval-Augmented Generation(RAG)モデルを強化するために設計された新しいAIフレームワーク、Chain-of-Retrieval Augmented Generation(CoRAG)を発表した。単一の検索ステップに依存する従来のRAGシステムとは異なり、CoRAGは反復検索と推論を可能にし、AIモデルが回答を生成する前に動的に検索結果をリファインすることを可能にする。
-
Cloudflareがドキュメントをオープンソース化し、スケーラビリティ向上のためAstroを採用
Cloudflareは最近、HugoからAstroエコシステムに移行することで、開発者向けドキュメントをアップグレードしたことを詳細に説明する記事を公開した。すべてのCloudflareドキュメントはGitHubでオープンソース化されており、コミュニティによるコントリビューションの機会もある。
-
Hugging Face、新たなプロバイダー統合でサーバーレス推論オプションを拡大
Hugging Faceは、Fal、Replicate、SambaNova、Together AIの4つのサーバーレス推論プロバイダーの統合を直接モデルページにローンチした。これらのプロバイダーはJavaScriptおよびPython用Hugging FaceクライアントSDKにも統合されており、ユーザーは最小限のセットアップで様々なモデルの推論を実行できるようになっている。
-
ラテンアメリカがAIの文化的関連性を向上させるためにLatam-GPTを発表
ラテンアメリカは同地域の歴史、文化、言語的多様性をよりよく表現するために設計された言語モデル「Latam-GPT」の開発を通して、人工知能の開発を進めている。Paris AI Action Summitで発表されたこのプロジェクトは、チリの科学・技術・知識・イノベーション省(CTCI)と国立人工知能センター(Cenia)が主導し、ラテンアメリカ各地の専門家や機関の支援を受けている。
-
OpenAIがo3のリリースをキャンセル、GPT 4.5、5のロードマップを発表
今週初め、OpenAIは自社のAIロードマップを再構築し、以前計画していたo3の単独リリースを取りやめ、GPT-5を中心に取り組みを統合すると発表した。
-
PerplexityがDeep Researchを発表:高度な分析のためのAI駆動ツール
PerplexityはDeep Research、金融、マーケティング、テクノロジーなど様々な分野で詳細な分析を行うために設計されたAI駆動ツールを発表した。このシステムは、複数の検索を実行し、広範な情報源を分析し、数分以内に構造化されたレポートに結果をまとめることでリサーチプロセスを自動化する。
-
MongoDBに代わるオープンソースのFerretDB、バージョン2.0をリリース
FerretDBはバージョン2.0の最初のリリース候補を発表した。最近リリースされたDocumentDBを搭載したFerretDBは、MongoDBに代わるオープンソースとして、大幅なパフォーマンスの向上、機能互換性の強化、ベクトル検索機能、レプリケーションのサポートを提供する。
-
OpenAIがOperator、Webベースタスク用AIエージェントをリリース
OpenAIはOperatorのリサーチプレビュー版、ユーザーに代わってWebブラウザを使ってタスクを実行できるAIエージェントをリリースした。OperatorはWebArenaと WebVoyager のベンチマークで最先端の性能を達成している。
-
DevProxy 0.24、さらにOpenAPIオプションを追加
マイクロソフトはAPIシミュレーションコマンドラインツール DevProxyのバージョン0.24をリリースした。新バージョンでは、異なるOpenAPI仕様との互換性が改善され、日常的なタスクのためにいくつかの改良が加えられている。
-
BlockがオープンソースAIフレームワーク「コードネームGoose」を発表
BlockのオープンソースプログラムオフィスはコードネームGoose、タスクを自動化し、既存のツールとシームレスに統合するように設計されたオープンソースの非商用AIエージェントフレームワークを発表した。Gooseは、拡張機能によってカスタマイズ可能な柔軟なオンマシンAIアシスタントをユーザーに提供し、開発者やその他の専門家が生産性を向上させることを可能にする。
-
Vercelでは新しいMicroVMインフラストラクチャの導入でビルド時間を短縮
クラウドプラットフォームサービス会社のVercelは、顧客のビルドのインフラストラクチャを支える新しい低レベルコンピュートプラットフォームであるHiveについての詳細な分析を公開した。Vercelは、2023年11月から信頼されていない一時的なコンピューティングタスクのためにHiveを使用している。
-
Dragonfly v2.2.0リリース:Rustクライアント、P2Pアップグレード、イメージアクセラレーション強化
1月、Cloud Native Computing Foundation(CNCF)は、オープンソースのピアツーピア(P2P)ファイル配布およびイメージアクセラレーションシステムにいくつかの重要な機能強化を導入した、Dragonflyバージョン2.2.0のリリースを発表した。
-
OpenAIが Microsoft Azure OpenAI Service上に新しいo3-miniモデルを提供
OpenAIは、o3-miniモデルをローンチし、現在Microsoft Azure OpenAI Serviceからアクセス可能となっている。同社によると、このモデルはAI技術の進歩を象徴しており、昨年9月にリリースされたo1-miniと比較してコスト効率が改善され、推論能力が向上している。
-
JetBrainsのAIコーディングエージェントJunieがJetBrains IDEとの緊密な統合を提供
JetBrainsは新しいAIコーディングエージェントJunieをクローズドプレビューで発表した。同社によるとJunieは割り当てられたコーディングタスクを実行し、IDE内で利用可能なプロジェクトコンテキストに関する知識を活用できる。
-
OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度
OpenAIは最新の推論LLM OpenAI o3-miniをリリースした。o3-miniはSTEM分野向けに最適化されており、科学、数学、コーディングのベンチマークで完全版o1モデルを上回る性能を発揮し、o1-miniより低レイテンシーになっている。