InfoQ ホームページ OpenAI に関するすべてのコンテンツ
-
OpenAIが文字起こしと音声合成用の新音声モデルを発表
OpenAIはAPIにおいて、文字起こしの精度向上とAI生成音声の制御性向上にフォーカスした新しい音声認識と音声合成モデルを導入した。これらのアップデートは自動音声アプリケーションを強化し、さまざまな環境やユースケースにさらに適応できるようにすることを目的としている。
-
OpenAIがカスタムエージェント開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
OpenAIがソフトウェア開発ベンチマークを発表
OpenAIは、実世界のフリーランスのソフトウェア開発タスクで先進的なAI言語モデルの能力を評価するためのSWE-Lancerベンチマークを発表した。このベンチマークはUpworkから提供された1,400以上のタスクのデータセットを使用しており、その総額は100万ドルである。これらのタスクには独立したコーディング活動と管理的意思決定の両方が含まれ、複雑さと報酬の範囲が実世界のフリーランスのシナリオをシミュレートするように設計されている。
-
Hugging Face、新たなプロバイダー統合でサーバーレス推論オプションを拡大
Hugging Faceは、Fal、Replicate、SambaNova、Together AIの4つのサーバーレス推論プロバイダーの統合を直接モデルページにローンチした。これらのプロバイダーはJavaScriptおよびPython用Hugging FaceクライアントSDKにも統合されており、ユーザーは最小限のセットアップで様々なモデルの推論を実行できるようになっている。
-
OpenAIがo3のリリースをキャンセル、GPT 4.5、5のロードマップを発表
今週初め、OpenAIは自社のAIロードマップを再構築し、以前計画していたo3の単独リリースを取りやめ、GPT-5を中心に取り組みを統合すると発表した。
-
PerplexityがDeep Researchを発表:高度な分析のためのAI駆動ツール
PerplexityはDeep Research、金融、マーケティング、テクノロジーなど様々な分野で詳細な分析を行うために設計されたAI駆動ツールを発表した。このシステムは、複数の検索を実行し、広範な情報源を分析し、数分以内に構造化されたレポートに結果をまとめることでリサーチプロセスを自動化する。
-
OpenAIがOperator、Webベースタスク用AIエージェントをリリース
OpenAIはOperatorのリサーチプレビュー版、ユーザーに代わってWebブラウザを使ってタスクを実行できるAIエージェントをリリースした。OperatorはWebArenaと WebVoyager のベンチマークで最先端の性能を達成している。
-
OpenAIが Microsoft Azure OpenAI Service上に新しいo3-miniモデルを提供
OpenAIは、o3-miniモデルをローンチし、現在Microsoft Azure OpenAI Serviceからアクセス可能となっている。同社によると、このモデルはAI技術の進歩を象徴しており、昨年9月にリリースされたo1-miniと比較してコスト効率が改善され、推論能力が向上している。
-
OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度
OpenAIは最新の推論LLM OpenAI o3-miniをリリースした。o3-miniはSTEM分野向けに最適化されており、科学、数学、コーディングのベンチマークで完全版o1モデルを上回る性能を発揮し、o1-miniより低レイテンシーになっている。
-
OpenAIがDeep Researchを発表:AI支援調査の前進
OpenAIはDeep Research、Web全体にわたる詳細な多段階調査を行うように設計されたChatGPT内の新しいエージェントを発表した。当初はProユーザーに提供され、PlusユーザーとTeamユーザーへのアクセス拡大を計画している。Deep Researchはオンライン情報の取得、分析、統合を行うことで時間のかかる調査を自動化する。
-
OpenAIが米国政府機関向けにChatGPT Govを発表
OpenAIはChatGPT Gov、米国政府機関向けに特別に設計されたAI駆動チャットボットのバージョンを発表した。このカスタマイズされたデプロイメントより、連邦、州、地方機関はOpenAIの最新AIモデルにアクセスしながらセキュリティ、プライバシー、コンプライアンスを管理できるようになる。各機関はMicrosoft AzureのコマーシャルクラウドまたはガバメントクラウドでChatGPT Govをセルフホストできるため、厳格な連邦サイバーセキュリティ要件との整合性が確保される。
-
Google、実験的なAI推論モデルをリリース
GoogleはAI Studioプラットフォームで利用可能なAI推論モデル Gemini 2.0 Flash Thinking Experimentalを発表した。この実験的なモデルは、複雑な問題を推論することでプログラミング、数学、物理学などのマルチモーダルタスクを処理するために設計されており、その思考過程を説明することができる。これはGemini 2.0 Flashモデルを基に構築されており、OpenAIのo1を含む類似モデルと整合している。
-
"DeepThought-8B":LLaMA-3.1 8Bを活用してコンパクトな推論モデルを作成
DeepThought-8Bは、LLaMA-3.1 8B上に構築された小型の「推論」モデルであり、OpenAI o1と同様に、意思決定プロセスを段階的に実行できるが、はるかに小型のパッケージである。
-
マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表
マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。
-
xAIがGrokモデルの新APIサービスを発表
Elon Musk氏のxAIは、開発者がアプリケーションにxAIの大規模言語モデル(LLM)を統合できるようになる、APIサービスのパブリックベータ版をローンチした。