BT

CommAI: FacebookによるAIのトレーニングとテストのためのシステム

| 作者: Alex Giamas フォローする 10 人のフォロワー , 翻訳者 笹井 崇司 フォローする 0 人のフォロワー 投稿日 2016年11月1日. 推定読書時間: 2 分 |

原文(投稿日:2016/10/21)へのリンク

Facebookは、AIシステムのトレーニング・評価プラットフォーム、CommAI-envをリリースした。これは「A roadmap towards Machine Intelligence」にインスパイアされたもので、人間やマシンとのインタラクションによるさらなる専門的トレーニングの土台となる汎用学習能力を、知的エージェントに教えることを狙いにしている。

CommAIは、Environmentを通してTasksをLearnerに割り当て、正解ごとにLearnerに報酬を与えることで機能する。こうしたインタラクションによって、報酬から正解と不正解を認識するよう、システムは訓練される。Tasksには、もっとも単純な、黙っている/黙っていないのバリエーションから、Learnerの長期記憶を必要とするような徐々に複雑なタスクまで、さまざまなものが用意されており、すべて同じトレーニングセッションで適用される。

これはOpenAI GymMazeBaseといった同様のシステムとの差異化要因のひとつではあるが、これだけではない。このシステムは一般的なトレーニングデータテストデータの分割をなくすことで、単純な以前見たことのある問題を素早く解きながら、新しい未知の問題を学習するLearnerの能力を汎化することを狙っている。

Learnerアルゴリズムのインターフェイスは、2つの関数を定義している。
next(self, input_bit)は、アルゴリズムの入力としての役割を果たし、環境から1ビットの入力を受け取り、Learnerによる次ビットを返す。
reward(self, reward)は、環境から受け取った報酬をLearnerに与える。
報酬に向かって反復的に動くことで、過去のデータから学習し、新しいパズルに適応するように、アルゴリズムを訓練する。

トレーニングプラットフォームは開発者向けにバインディングを提供しており、zeromqメッセージキュー経由で、任意のプログラミング言語を使ったLearnerによって学習を定義する。まだプロジェクトはベータテストフェーズで、ディスカッションとサポートのためのFacebookグループが用意されている。プラットフォームはPythonで実装されており、ソースコードはGithubがホストされている。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT