BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引

OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引

原文リンク(2026-02-21)

OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減らす。

OpenAIのテクニカルスタッフRyan Lopopolo氏は述べている:

Harnessは大規模AIワークロードを一貫性と信頼性をもって実行する方法を提供するために構築されています、これによりチームはインフラストラクチャのオーケストレーションではなく研究やプロダクト開発に集中できます。

5か月間の社内実験においてOpenAI社のエンジニアは、手書きソースコードを一切使用せずに、約100万行のコードを含むベータ製品を構築し、リリースした。少人数のエンジニアチームがプルリクエストや継続的インテグレーションのワークフローを通じてエージェントをガイドした。作業にはアプリケーションロジック、ドキュメント、CI設定、オブザーバビリティのセットアップ、ツール群が含まれている。エンジニアはプロンプトとフィードバックを提供し、Codexエージェントはバグの再現、修正案の提示、結果の検証などのタスクを自律的に反復した。

Codexエージェント駆動アプリケーションテストおよびフィードバック(出典 OpenAIブログ記事

Harness engineeringは人間のエンジニアの焦点をコード実装から、環境設計、意図の明確化、構造化されたフィードバックの提供へと移行させる。Codexは開発ツールと直接連携し、プルリクエストの作成、変更の評価、タスク基準が満たされるまで反復する。エージェントは、ログ、メトリクス、スパンを含むテレメトリーを用いてアプリケーション性能を監視し、分離された開発環境全体でバグを再現する。

Codexエージェントのためのオブザーバビリティとテレメトリーワークフロー(出典 OpenAIブログ記事

社内ドキュメントはマップ、実行計画、設計仕様を含む構造化されたdocsディレクトリに整理されている。これらのドキュメントはエージェントにとって唯一の信頼できる情報源として機能する。相互にリンクされた設計およびアーキテクチャドキュメントはリンターやCI検証によって機械的に強制され、一貫性を確保するとともに人的監視の必要性を低減する。

OpenAI社は機械的ルールと構造テストを通じてドメイン間のアーキテクチャ境界と依存レイヤーを担保している。依存関係はTypes→Config→Repo→Service→Runtime→UIという制御された順序で流れ、エージェントはこれらのレイヤー内のみ操作するよう制限されている。構造テストは準拠状況を検証し、モジュール分離違反を防止する。

著者かつThoughtworksテクノロジストMartin Fowler氏がLinkedIn投稿で述べた:

Harness EngineeringはAIを活用したソフトウェア開発の重要要素のための価値あるフレームワークです。Harnessにはコンテキストエンジニアリング、アーキテクチャ制約、ガーベジコレクションが含まれます。

OpenAIはHarnessがスキャフォールディング、フィードバックループ、ドキュメント、アーキテクチャ制約を機械可読なアーティファクトとしてエンコードしており、それらを用いてCodexエージェントがコード生成、テスト、オブザーバビリティを含む開発ワークフロー全体でタスクを実行するとレポートしている。

作者について

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT