InfoQ ホームページ OpenAI に関するすべてのコンテンツ
-
OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引
OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減らす。
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
OpenAI、QCon AI NYCで企業向けのファインチューニングを発表
QCon AI NYC 2025において、OpenAIのWill Hang氏は、ツールを使用するエージェントの性能を向上させることを目的とした強化学習型ファインチューニングアプローチであるAgent RFTの概要を発表した。
-
OpenAI、GPT-5.1モデルを発表。より高速で会話的に
OpenAIは最近、GPT-5モデルのアップグレード版を公開した。GPT-5.1 Instantはデフォルトのチャットモデルであり、指示の理解力が向上している。GPT-5.1 Thinkingは推論モデルであり、より迅速で理解しやすい応答を提供する。GPT-5.1-Codex-Maxはコーディングモデルであり、長時間のタスクを効率的に実行するために圧縮技術を活用するよう訓練されている。
-
LangChainがOpen SWEを発表、オープンソースの非同期コーディングエージェント
LangChainはOpen SWE、クラウド上で動作し、複雑なソフトウェア開発タスクを処理できる完全オープンソースの非同期コーディングエージェントをリリースした。同社はOpen SWEがリアルタイムの「コパイロット」アシスタントから開発者の既存ワークフローに直接統合される、より自律的で長期間稼働するエージェントへのシフトを象徴していると述べている。
-
AnthropicがSkills導入、カスタムClaudeタスク向け
AnthropicはClaudeをモジュール化された再利用可能タスクコンポーネントで拡張できるようにする新機能、Skillsを発表した。各Skillは長文の要約、APIからのデータ取得、ドメイン固有の計算の実行などの会話中に、Claudeが呼び出すことができる自己完結型機能である。
-
Anthropicがアプリ構築機能をClaude Artifactsにアップグレード
Anthropic社は、Claudeに新たなアプリ構築機能を追加し、ユーザーがテキストプロンプトから直接AIアプリケーションを作成、ホスト、シェアできるようにした。この機能はArtifactsとして知られ、データアナライザーやフラッシュカードジェネレーター、学習支援のような実用的なツールを、ユーザーがアイデアをシンプルに記述するだけで構築できるようにする。プログラミングスキルがない人でも高度なアプリケーションを作成できるよう、Claudeが裏でコーディングする。
-
OpenAIのGPT-5がMicrosoft Azure AI Foundryで一般提供開始
MicrosoftとOpenAIは最近、OpenAIのGPT-5モデルスイートが、企業向けAI運用統合プラットフォームであるAzure AI Foundryプラットフォームで一般提供(GA)されたことを発表した。新モデルスイートは特定ワークロードに対応するために設計されており、実世界のアプリケーション向けに最適化されている。
-
OpenAIがgpt-oss-120bとgpt-oss-20bをリリース、ローカルデプロイメント向けのオープンウェイト言語モデル
OpenAIはgpt-oss-120bとgpt-oss-20b、高性能な推論、ツールの使用、効率的デプロイを目的とした2つのオープンウェイト言語モデルをリリースした。これらはGPT-2以来の同社初の完全オープンウェイト言語モデルであり、寛容なApache 2.0ライセンスの下で利用可能である。
-
OpenAI社、信頼性重視の新モデル『o3-pro』を発表――ユーザーフィードバックは賛否で二極化
OpenAI社が、複雑なタスクでの信頼性や応答の分析力に注力した同社最先端モデルの新バージョンo3-proをリリースした。現時点では、ChatGPTのPro・Teamユーザーに公開されているほか、API経由でも利用が可能である。本モデルが従来の「o1-pro」モデルに置き換わる形でリリース中だ。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。
-
OpenAIがCodexソフトウェアエンジニアリングエージェントのプレビューを発表
OpenAIはCodexを発表した。これは、コードの作成、デバッグ、テスト、プルリクエストの生成など、一般的な開発タスクを自動化するために設計されたクラウドベースのソフトウェアエンジニアリングエージェントの研究プレビューだ。Codexは、ChatGPTのPro、Team、Enterpriseユーザー向けに統合されており、各タスクはユーザーのコードベースが事前にロードされ、開発環境に合わせて設定された安全なサンドボックス環境で実行されている。
-
OpenAI社がAIエージェントのウェブ検索機能やディープリサーチ機能のベンチマーク評価を実現する「BrowseComp」を発表
SimpleQAをはじめとする従来型のベンチマークは単一事実情報の収集能力評価に特化しており、ブラウジング機能搭載型GPT-4oなどの高速ブラウジング対応モデルの台頭で「飽和状態」に達している。一方、BrowseCompは数十、数百のウェブサイトを行き来しながら、情報を収集精査するエージェントの能力を計測する。 BrowseCompの問題には、端的かつ明確な回答が可能であり、参照型ソリューションとの照合で評価が容易に行える。
-
Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。
-
OpenAI社、GPT-4oの画像生成機能改善を発表
OpenAI社が、ネイティブ画像生成機能を搭載したGPT-4oの新バージョンをリリースした。。今回のモデルでは、アップロード画像の修正やプロンプト指示による画像生成が可能になったほか、一貫性を保った複数バージョンの画像生成機能や画像内テキスト生成機能が改善されている。