OpenAIがAIの安全性に"Preparedness Framework"を採用

原文リンク(2024-01-09)

OpenAIはこの頃、AIのリスクを軽減するためのPreparedness Frameworkのベータ版を発表した。このFrameworkには、4つのリスクカテゴリーとそれぞれのリスクレベルの定義が記載されており、OpenAIの安全ガバナンス手順も定義されている。

Preparedness FrameworkはOpenAIの全体的な安全性への取り組みの一部であり、特に最先端モデルによるフロンティアリスクについて懸念している。モデルを評価する中核的な技術的作業は、専門の準備チームが担当し、説得力、サイバーセキュリティ、CBRN（化学、生物、放射性物質、核）、モデルの自律性という4つのカテゴリーでモデルのリスクレベルを評価する。このFrameworkでは、モデルの開発や配備を進めても安全かどうかを判断するためのリスク閾値を定義している。このFrameworkはまた、潜在的なリスクの証拠を評価し、リスク軽減策を推奨する責任を負う安全諮問グループ（SAG）を含む、準備のための運用構造とプロセスも定義している。OpenAIによると、

我々は、新たなリスクをよりよく検知するために、厳格な能力評価と予測の設計と実行に投資しています。特に、リスクに関する議論を、仮説的なシナリオから具体的な測定やデータドリブンの予測へと移行させたいと考えています。また、現在起きていることにとどまらず、その先に何が待ち受けているかを予測することも望んでいます。安全対策が今後の技術革新と歩調を合わせるためには、私たちは単純に少ない労力で済ませることはできず、反復的な展開を通じて学び続ける必要があります。

Frameworkの文書では、4つの追跡カテゴリーにおける4つのリスクレベル（低、中、高、重要）の詳細な定義が示されている。例えば、サイバーセキュリティのリスクレベルが中レベルのモデルは、「既知のエクスプロイトを攻撃に発展させるなど、主要なサイバー操作タスクにおけるオペレーターの生産性を向上させる」ことができる。OpenAIは、モデルのリスクレベルを自動的に評価するための一連の評価を作成することを計画している。これらの詳細は公表されていないが、Frameworkには「ハッキングチャレンジの参加者が...ChatGPTを使用することでより高いスコアを得る」といった例示が含まれている。

Frameworkで定義されているガバナンス手順には、モデルの緩和前と緩和後のリスクレベルに基づく安全ベースラインが含まれている。例えば、モデルを制限された環境にのみデプロイする。ミティゲーション（攻撃軽減）後のリスクが「高」または「クリティカル」であるモデルは展開されず、ミティゲーション後のスコアが「クリティカル」であるモデルはそれ以上開発されない。また、ガバナンスの手順では、OpenAIのリーダーはデフォルトで安全性に関する意思決定者であるが、理事会は決定を覆す権利があるとしている。

このFrameworkに関するHacker Newsのディスカッションでは、あるユーザーがこうコメントしている。

AIの本当の危険性は、モデルが人間によって使用され、人間の説明責任を伴わずに、他の人間について決定を下すことだと感じています。これによって、新たな種類の組織的な虐待が人知れず行われるようになり、効果的に対応するためのリソースが不足しているため、恵まれないグループのほとんどが被害者となるでしょう。彼らの安全性モデルのどこにも、このリスクが取り上げられているのを私は見てきませんでした。

他のAI企業も、AIリスクの評価と軽減のための手順を公表している。この枠組みには、疾病管理センターのバイオセーフティレベル（BSL）プロトコルに倣ったAI安全レベル（ASL）の枠組みが含まれている。この枠組みでは、AnthropicのClaudeを含むほとんどのLLMは、"ASL-2であるように見える"。Google Deepmindはこの頃、AGIモデルを分類するためのFrameworkを発表したが、これには6つの自律性レベルとそれに関連するリスクのリストが含まれている。

作者について

Anthony Alford

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Anthony Alford

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco

OpenAIがAIの安全性に"Preparedness Framework"を採用

作者について

Anthony Alford

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。