InfoQ ホームページ ChatGPT に関するすべてのコンテンツ
-
OpenAIがカスタムエージェント開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
Google DeepMindが Gemini Roboticsを発表
Google DeepMindは、視覚、言語、行動を統合することでロボット工学を強化するために設計された先進的なAIモデル、Gemini Roboticsを発表した。Gemini 2.0フレームワークに基づくこのイノベーションは、特に現実世界のセッティングにおいて、ロボットをよりスマートで能力の高いものにすることを目指している。
-
OpenAIがソフトウェア開発ベンチマークを発表
OpenAIは、実世界のフリーランスのソフトウェア開発タスクで先進的なAI言語モデルの能力を評価するためのSWE-Lancerベンチマークを発表した。このベンチマークはUpworkから提供された1,400以上のタスクのデータセットを使用しており、その総額は100万ドルである。これらのタスクには独立したコーディング活動と管理的意思決定の両方が含まれ、複雑さと報酬の範囲が実世界のフリーランスのシナリオをシミュレートするように設計されている。
-
ラテンアメリカがAIの文化的関連性を向上させるためにLatam-GPTを発表
ラテンアメリカは同地域の歴史、文化、言語的多様性をよりよく表現するために設計された言語モデル「Latam-GPT」の開発を通して、人工知能の開発を進めている。Paris AI Action Summitで発表されたこのプロジェクトは、チリの科学・技術・知識・イノベーション省(CTCI)と国立人工知能センター(Cenia)が主導し、ラテンアメリカ各地の専門家や機関の支援を受けている。
-
OpenAIがOperator、Webベースタスク用AIエージェントをリリース
OpenAIはOperatorのリサーチプレビュー版、ユーザーに代わってWebブラウザを使ってタスクを実行できるAIエージェントをリリースした。OperatorはWebArenaと WebVoyager のベンチマークで最先端の性能を達成している。
-
OpenAIが推論モデルo3-miniをリリース、o1より高速かつ高精度
OpenAIは最新の推論LLM OpenAI o3-miniをリリースした。o3-miniはSTEM分野向けに最適化されており、科学、数学、コーディングのベンチマークで完全版o1モデルを上回る性能を発揮し、o1-miniより低レイテンシーになっている。
-
OpenAIがDeep Researchを発表:AI支援調査の前進
OpenAIはDeep Research、Web全体にわたる詳細な多段階調査を行うように設計されたChatGPT内の新しいエージェントを発表した。当初はProユーザーに提供され、PlusユーザーとTeamユーザーへのアクセス拡大を計画している。Deep Researchはオンライン情報の取得、分析、統合を行うことで時間のかかる調査を自動化する。
-
OpenAIが米国政府機関向けにChatGPT Govを発表
OpenAIはChatGPT Gov、米国政府機関向けに特別に設計されたAI駆動チャットボットのバージョンを発表した。このカスタマイズされたデプロイメントより、連邦、州、地方機関はOpenAIの最新AIモデルにアクセスしながらセキュリティ、プライバシー、コンプライアンスを管理できるようになる。各機関はMicrosoft AzureのコマーシャルクラウドまたはガバメントクラウドでChatGPT Govをセルフホストできるため、厳格な連邦サイバーセキュリティ要件との整合性が確保される。
-
DeepSeekが新たなオープンソースAIモデル、Janus Proをリリース
DeepSeekはマルチモーダルモデルJanusのアップデート版、Janus-Proをリリースした。新モデルはトレーニング戦略、データスケーリング、モデルサイズを改善し、マルチモーダル理解とテキストから画像への生成能力を向上させている。
-
OpenAIがChatGPT検索機能をリリース
OpenAIは最近、ChatGPTがユーザーの質問に答える際にウェブを検索可能にするChatGPT Search機能をリリースした。ChatGPTは、トレーニング時に利用可能な知識に制限されるのではなく、ウェブから最新の情報を取り入れ、その情報源へのリンクを含めることが可能になった。
-
OpenAIがマルチエージェント・オーケストレーションの実験的オープンソース・フレームワーク「Swarm」をリリース
最近実験的なツールとしてリリースされたSwarmは、開発者がルーチンとハンドオフを使用してタスクを実行するために、複数のエージェントを互いに協調させる方法を調査できるようにすることを目的としている。
-
OpenAI、低遅延音声対話向けのRealtime APIのパブリックベータ版を発表
OpenAIが、Realtime APIのパブリックベータ版を発表した。今回のリリースでは、開発者にアプリ内での低遅延かつマルチモーダルな音声対話が提供される。さらに、音声入力/出力がChat Completions APIで利用可能になり、音声駆動型アプリケーションの選択肢が広がった。初期のフィードバックでは、ChatGPTのアドバンスドボイスモードと同様に、音声オプション数や応答の切断といった制限に関心が集まっている。
-
Anthropic、AIデータハンドリング強化のためのコンテキスト検索を発表
Anthropicは、AIシステムと広範な知識ベースとの相互作用における重要な進歩であるコンテキスト検索を発表した。この技術は、埋め込みや索引付けの前にテキストチャンクをコンテキスト情報を付加することで、検索拡張生成(RAG)システムにおけるコンテキスト損失の課題に対処する。
-
XプラットフォームでGrok-2ベータ版がリリースされた
Grok-2言語モデルがXプラットフォーム上でベータ版としてリリースされ、Grok-2 miniと共に発表された。LMSYSリーダーボード上で「sus-column-r」という名称でテストされたこのモデルは、Claude 3.5 Sonnetと GPT-4-ターボと比較して高いEloスコアを達成した。Grok-2 miniは、処理速度とパフォーマンスのバランスを重視して設計された軽量版で、ベータリリースの一部である。
-
OpenAI、脱獄耐性を向上させたGPT-4o miniモデルをリリース
OpenAIは、同社のフラッグシップモデルであるGPT-4oの小型版であるGPT-4o miniをリリースした。GPT-4o miniはいくつかのLLMベンチマークでGPT-3.5 Turboを上回り、OpenAIの最初のモデルで、脱獄とシステムプロンプト抽出に対するモデルの耐性を向上させる命令階層メソッドで学習される。