Facebookは、AIシステムのトレーニング・評価プラットフォーム、CommAI-envをリリースした。これは「A roadmap towards Machine Intelligence」にインスパイアされたもので、人間やマシンとのインタラクションによるさらなる専門的トレーニングの土台となる汎用学習能力を、知的エージェントに教えることを狙いにしている。
CommAIは、Environmentを通してTasksをLearnerに割り当て、正解ごとにLearnerに報酬を与えることで機能する。こうしたインタラクションによって、報酬から正解と不正解を認識するよう、システムは訓練される。Tasksには、もっとも単純な、黙っている/黙っていないのバリエーションから、Learnerの長期記憶を必要とするような徐々に複雑なタスクまで、さまざまなものが用意されており、すべて同じトレーニングセッションで適用される。
これはOpenAI GymやMazeBaseといった同様のシステムとの差異化要因のひとつではあるが、これだけではない。このシステムは一般的なトレーニングデータとテストデータの分割をなくすことで、単純な以前見たことのある問題を素早く解きながら、新しい未知の問題を学習するLearnerの能力を汎化することを狙っている。
Learnerアルゴリズムのインターフェイスは、2つの関数を定義している。
next(self, input_bit)は、アルゴリズムの入力としての役割を果たし、環境から1ビットの入力を受け取り、Learnerによる次ビットを返す。
reward(self, reward)は、環境から受け取った報酬をLearnerに与える。
報酬に向かって反復的に動くことで、過去のデータから学習し、新しいパズルに適応するように、アルゴリズムを訓練する。
トレーニングプラットフォームは開発者向けにバインディングを提供しており、zeromqメッセージキュー経由で、任意のプログラミング言語を使ったLearnerによって学習を定義する。まだプロジェクトはベータテストフェーズで、ディスカッションとサポートのためのFacebookグループが用意されている。プラットフォームはPythonで実装されており、ソースコードはGithubがホストされている。
Rate this Article
- Editor Review
- Chief Editor Action