InfoQ ホームページ OpenAI に関するすべてのコンテンツ
-
LangChainがOpen SWEを発表、オープンソースの非同期コーディングエージェント
LangChainはOpen SWE、クラウド上で動作し、複雑なソフトウェア開発タスクを処理できる完全オープンソースの非同期コーディングエージェントをリリースした。同社はOpen SWEがリアルタイムの「コパイロット」アシスタントから開発者の既存ワークフローに直接統合される、より自律的で長期間稼働するエージェントへのシフトを象徴していると述べている。
-
AnthropicがSkills導入、カスタムClaudeタスク向け
AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。
-
Anthropicがアプリ構築機能をClaude Artifactsにアップグレード
Anthropic社は、Claudeに新たなアプリ構築機能を追加し、ユーザーがテキストプロンプトから直接AIアプリケーションを作成、ホスト、シェアできるようにした。この機能はArtifactsとして知られ、データアナライザーやフラッシュカードジェネレーター、学習支援のような実用的なツールを、ユーザーがアイデアをシンプルに記述するだけで構築できるようにする。プログラミングスキルがない人でも高度なアプリケーションを作成できるよう、Claudeが裏でコーディングする。
-
OpenAIのGPT-5がMicrosoft Azure AI Foundryで一般提供開始
MicrosoftとOpenAIは最近、OpenAIのGPT-5モデルスイートが、企業向けAI運用統合プラットフォームであるAzure AI Foundryプラットフォームで一般提供(GA)されたことを発表した。新モデルスイートは特定ワークロードに対応するために設計されており、実世界のアプリケーション向けに最適化されている。
-
OpenAIがgpt-oss-120bとgpt-oss-20bをリリース、ローカルデプロイメント向けのオープンウェイト言語モデル
OpenAIはgpt-oss-120bとgpt-oss-20b、高性能な推論、ツールの使用、効率的デプロイを目的とした2つのオープンウェイト言語モデルをリリースした。これらはGPT-2以来の同社初の完全オープンウェイト言語モデルであり、寛容なApache 2.0ライセンスの下で利用可能である。
-
OpenAI社、信頼性重視の新モデル『o3-pro』を発表――ユーザーフィードバックは賛否で二極化
OpenAI社が、複雑なタスクでの信頼性や応答の分析力に注力した同社最先端モデルの新バージョンo3-proをリリースした。現時点では、ChatGPTのPro・Teamユーザーに公開されているほか、API経由でも利用が可能である。本モデルが従来の「o1-pro」モデルに置き換わる形でリリース中だ。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。
-
OpenAIがCodexソフトウェアエンジニアリングエージェントのプレビューを発表
OpenAIはCodexを発表した。これは、コードの作成、デバッグ、テスト、プルリクエストの生成など、一般的な開発タスクを自動化するために設計されたクラウドベースのソフトウェアエンジニアリングエージェントの研究プレビューだ。Codexは、ChatGPTのPro、Team、Enterpriseユーザー向けに統合されており、各タスクはユーザーのコードベースが事前にロードされ、開発環境に合わせて設定された安全なサンドボックス環境で実行されている。
-
OpenAI社がAIエージェントのウェブ検索機能やディープリサーチ機能のベンチマーク評価を実現する「BrowseComp」を発表
SimpleQAをはじめとする従来型のベンチマークは単一事実情報の収集能力評価に特化しており、ブラウジング機能搭載型GPT-4oなどの高速ブラウジング対応モデルの台頭で「飽和状態」に達している。一方、BrowseCompは数十、数百のウェブサイトを行き来しながら、情報を収集精査するエージェントの能力を計測する。 BrowseCompの問題には、端的かつ明確な回答が可能であり、参照型ソリューションとの照合で評価が容易に行える。
-
Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。
-
OpenAI社、GPT-4oの画像生成機能改善を発表
OpenAI社が、ネイティブ画像生成機能を搭載したGPT-4oの新バージョンをリリースした。。今回のモデルでは、アップロード画像の修正やプロンプト指示による画像生成が可能になったほか、一貫性を保った複数バージョンの画像生成機能や画像内テキスト生成機能が改善されている。
-
OpenAIが文字起こしと音声合成用の新音声モデルを発表
OpenAIはAPIにおいて、文字起こしの精度向上とAI生成音声の制御性向上にフォーカスした新しい音声認識と音声合成モデルを導入した。これらのアップデートは自動音声アプリケーションを強化し、さまざまな環境やユースケースにさらに適応できるようにすることを目的としている。
-
OpenAIがカスタムエージェン���開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
OpenAIがソフトウェア開発ベンチマークを発表
OpenAIは、実世界のフリーランスのソフトウェア開発タスクで先進的なAI言語モデルの能力を評価するためのSWE-Lancerベンチマークを発表した。このベンチマークはUpworkから提供された1,400以上のタスクのデータセットを使用しており、その総額は100万ドルである。これらのタスクには独立したコーディング活動と管理的意思決定の両方が含まれ、複雑さと報酬の範囲が実世界のフリーランスのシナリオをシミュレートするように設計されている。
-
Hugging Face、新たなプロバイダー統合でサーバーレス推論オプションを拡大
Hugging Faceは、Fal、Replicate、SambaNova、Together AIの4つのサーバーレス推論プロバイダーの統合を直接モデルページにローンチした。これらのプロバイダーはJavaScriptおよびPython用Hugging FaceクライアントSDKにも統合されており、ユーザーは最小限のセットアップで様々なモデルの推論を実行できるようになっている。