BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース CommAI: FacebookによるAIのトレーニングとテストのためのシステム

CommAI: FacebookによるAIのトレーニングとテストのためのシステム

ブックマーク

原文(投稿日:2016/10/21)へのリンク

Facebookは、AIシステムのトレーニング・評価プラットフォーム、CommAI-envをリリースした。これは「A roadmap towards Machine Intelligence」にインスパイアされたもので、人間やマシンとのインタラクションによるさらなる専門的トレーニングの土台となる汎用学習能力を、知的エージェントに教えることを狙いにしている。

CommAIは、Environmentを通してTasksをLearnerに割り当て、正解ごとにLearnerに報酬を与えることで機能する。こうしたインタラクションによって、報酬から正解と不正解を認識するよう、システムは訓練される。Tasksには、もっとも単純な、黙っている/黙っていないのバリエーションから、Learnerの長期記憶を必要とするような徐々に複雑なタスクまで、さまざまなものが用意されており、すべて同じトレーニングセッションで適用される。

これはOpenAI GymMazeBaseといった同様のシステムとの差異化要因のひとつではあるが、これだけではない。このシステムは一般的なトレーニングデータテストデータの分割をなくすことで、単純な以前見たことのある問題を素早く解きながら、新しい未知の問題を学習するLearnerの能力を汎化することを狙っている。

Learnerアルゴリズムのインターフェイスは、2つの関数を定義している。
next(self, input_bit)は、アルゴリズムの入力としての役割を果たし、環境から1ビットの入力を受け取り、Learnerによる次ビットを返す。
reward(self, reward)は、環境から受け取った報酬をLearnerに与える。
報酬に向かって反復的に動くことで、過去のデータから学習し、新しいパズルに適応するように、アルゴリズムを訓練する。

トレーニングプラットフォームは開発者向けにバインディングを提供しており、zeromqメッセージキュー経由で、任意のプログラミング言語を使ったLearnerによって学習を定義する。まだプロジェクトはベータテストフェーズで、ディスカッションとサポートのためのFacebookグループが用意されている。プラットフォームはPythonで実装されており、ソースコードはGithubがホストされている。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

BT