BigScience Research Workshop、AI言語モデルのT0をリリース

原文(投稿日：2021/11/09)へのリンク

BigScience Research Workshopは、ゼロショット・マルチタスク(zero-shot multitask)学習の研究を目的として特別にトレーニングされた自然言語処理(NLP)AIモデルのシリーズを、T0としてリリースした。T0はBIG-benchベンチマークの大半において6倍規模のモデルを上回り、他のNLPベンチマークの一部では16倍の規模を持つGPT-3のパフォーマンスをも凌駕する。

Workshopチームは、arXivで公開された論文の中でモデルとそのトレーニングデータセットについて説明している。完全に"未知(unseen)"のタスクを使って大規模NLPモデルのゼロショットパフォーマンスを調査するため、研究者たちは、教師あり学習NLPデータの大規模なセットを、テンプレート化されたプロンプト形式に変換する作業を実施した。研究の目的は、この形式のトレーニングデータで未知のタスクを汎化するT0の能力を改善可能か、判断を下すことにあった。用意された11のデータセットを用いた評価において、T0は、その中の8つのデータセットでGPT-3のパフォーマンスを上回る結果を出した。さらに、BIG-benchベンチマークの14タスク中の13においては、他の基準モデルを凌ぐ成績を上げた。

大規模な言語モデルは、多くの場合において未知のタスク -- 処理トレーニングを行っていないタスクを、比較的良好に処理することができる。例えばGPT-3では、明示的に実施したのは文章内のマスクされた単語を入力するトレーニングのみだが、実際のモデルは翻訳や質問への応答、さらには3桁の計算までも行うことができる。これを説明する仮説のひとつとして、モデルがトレーニングデータ内にある"暗黙の混合タスク"に遭遇するため、というものがあるのだが、トレーニングデータが主としてWebから収集されたものであるため、そのようなタスクが暗黙的に含まれるのではないか、とBigScienceのチームは指摘している。

BigScience Research Workshopは、"50か国250以上の機関からの600人の研究者"による、1年間にわたるコラボレーションで、大規模なマルチリンガルデータセットとディープラーニングNLPモデルの開発および調査を目標とする。同チームがT0を構築したのは、"教師あり、かつ極めて大規模なマルチタスク方式による、巨大な言語モデルの意図的かつ明示的なトレーニングの焦点を当てる"ためだ。このトレーニングデータの重要なポイントは、自然言語のプロンプトを使って言語タスクを指定することにある。この形式のトレーニングデータを使うことによって、少ないモデルパラメータで未知のタスクをよりよく汎化できるのではないか、と研究者たちは仮説を立てているのだ。

データセットを作成するため、同チームは、さまざまなNLPタスク用の既存の教師あり学習データを収集し、一連のテンプレートを使ってそれらをプロンプト形式に変換した。例えば自然言語推論タスクのテンプレートは、"Xであると仮定した場合、Yだと推測できるか？"というようなものだ。XとYには、例えば"銀行家は教授と運動選手に連絡した"、"銀行家は教授に連絡した"というようなフレーズが入る。このようなインプットに対して、モデルには、真(true)または偽(false)のいずれかへの分類がアウトプットとして求められる。最終的に研究者たちは62のデータセットを収集し、それを12のタスクに整理した。

T0モデルはGoogleのText-To-Text Transfer Transformer(T5)トレーニング済モデルをベースとして、プロンプト形式のマルチタスクデータセットの混合によってファインチューニングされている。モデルのゼロショット汎化能力の評価には、4つのタスクのデータセットがすべて使用された。その結果、110億のパラメータを持つこのモデルは、1,750億パラメータのGPT-3のパフォーマンスを、11のデータセット中8つにおいて上回ったのだった。

T0研究チームのメンバ数人がHacker Newに参加して、この開発について議論している。その中のひとりが、GoogleとEleutherAIがいずれも先頃、汎化能力向上のために"インストラクションチューニング"言語モデルを調査したことに触れていた。モデルのサイズは推論において"面倒"なものか、という質問に対しては、別の研究者が次のようにリプライしている。

サイズが問題になるか、という点に関して言うならば、Google Cloud TPU v3-8デバイス1個でも、あるいは4×32GB×100GPUを備えたサーバでも推論の実行は可能ですし、Hugging Faceにも推論APIはあります ...

T0モデルファイルはHuggingFaceのサイトで公開されている。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

Mezzalira氏のQCon London講演：「マイクロフロントエンド～設計から企業メリットと社内実装まで～」

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

QCon London

QCon AI Boston

QCon San Francisco