BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Claude Codeオートモードの内側:人間承認ゲートを備えたAnthropicの自律コーディングシステム

Claude Codeオートモードの内側:人間承認ゲートを備えたAnthropicの自律コーディングシステム

原文リンク(2026-05-05)

AnthropicはClaude Codeにオートモードを導入し、人的介入を削減しつつマルチステップ・ソフトウェア開発タスクを実行可能にした。開発者が目標を定義すると、システムがコード生成・実行・ツール利用・反復的なリファインメントを担い、センシティブな操作については選択したチェックポイントで人間による承認が求められる。

従来、Claude Codeはコマンドの実行やファイルの変更といったほとんどのアクションについてユーザーが承認する必要がある、パーミッションベースのモデルに依存していた。これは安全性と制御の面では優れていたが、長いセッションでは繰り返しの確認による摩擦が生じ、開発作業に集中するより承認プロンプト管理に多く時間を費やす承認疲労を招いていた。

Intemptのプロダクト責任者Sid Chaudhary氏が述べた

今ではClaudeを動かしたままその場を離れられるようになりました。コーヒーブレイクでも実際に散歩でも。もはや付き添う必要はありません。

オートモードは入力の処理方法とアクションの実行方法の両方を制御する階層化セーフティおよび実行アーキテクチャを導入している。入力レイヤーではファイル読み込み、シェル実行結果、Webレスポンスなどのツール出力が、システムコンテキストに組み込まれる前に検査される。コンテンツが悪意のあるものと判断された場合や、指示を変更しようとしていると判断された場合は、当該コンテンツを信頼できないものとして扱うために警告が挿入され、ユーザーの意図を上書きしないよう制御される。

Claude Codeオートモードの高レベルアーキテクチャ(出典: Anthropicブログ記事

実行レイヤーでは、提案された各アクションが実行前に評価され、安全な操作はそのまま通過させつつ、判断が難しいケースは追加チェックへとルーティングする自動化承認メカニズムとして機能する。これにより影響範囲が大きい操作や潜在的に安全でない操作に対するセーフガードを維持しつつ、ユーザーによる反復的な介入を削減する。

テストエンジニアのAnkit Kalluraya氏がオートモードにおけるインターフェース挙動について説明した

オートモードで権限チェックがトリガーされるとスピナーが赤に変わり、Claudeが承認待ちのため一時停止していることを示す明確な視覚的シグナルをくれます。

このシステムは効率性とカバレッジのバランスを取るために二段階分類アプローチを採用している。高速な初期フィルターがほとんどのツール呼び出しを処理し、安全なアクションを最小限のオーバーヘッドで実行する。不確実または潜在的にリスクのある操作のみ詳細分析にエスカレーションされる。これによりエッジケースに対する再現率を高めつつ、レイテンシーと計算コストを抑制し、安全性と意図整合性の一貫した執行を維持する。

効率性、レイテンシー、セキュリティカバレッジのバランスを取る二段階分類パイプライン(出典: Anthropicブログ記事

PlaytikaのディレクターMykola Kondratiuk氏は述べた

オートモードがオンの場合、AIは単なる実行者ではなく承認者にもなる。ほとんどのガバナンス文書は依然として人間をその役割に明記したままで更新されていない。

Zethra OSのリードエンジニアMayank Agrawal氏が投稿の中で述べた。

ここで、レジリエンスがセキュリティ問題に変わります。

オートモードはサブエージェントのワークフローにも安全性チェックを拡張する。権限移譲時には、実行開始前にアウトバウンドチェックが、割り当てられたタスクとユーザーの意図が合致しているかを検証する。完了時にはリターンチェックがサブエージェントの実行履歴全体を評価し、実行中のプロンプトインジェクションや操作の試みを検出する。リスクが検出された場合、結果がオーケストレーターエージェントに返される前に警告が付加される。

Anthropicは拡張された評価セットと反復的リファインメントを通じて安全性とコストのトレードオフを引き続き改善すると述べており、ガードレールなしの場合よりも自律運用を安全にするのに十分な高リスクなアクションを十分に検知することを目指しつつ、利用者には残存リスクを認識することと、問題を報告することを促している。

作者について

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT