BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

CommAI,Facebook的AI训练和测试系统

| 作者 Alex Giamas 关注 9 他的粉丝 ,译者 足下 关注 1 他的粉丝 发布于 2016年10月27日. 估计阅读时间: 2 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

Facebook最近发布了CommAI-env,一个用于训练和评价AI系统的平台。这个平台是受一个机器智能的路线图启发,旨在教授智能代理一般的学习能力,作为进一步、更专业的、通过人类或机器级的互动培训的基础。

CommAI的工作原理是通过工作平台分配任务给学习者,如果学习者能给出正确的答案,就会再给予奖励。这种类型的互动能训练系统去通过奖励,识别正确或不正确的答案。任务千变万化,从最简单的沉默-不沉默,到越来越复杂的、需要学习者长期记忆的任务,所有都在同一次训练环节里完成。

OpenAI GymMazeBase等相似的系统相比,这是一个但不是唯一的区别因素。通过消除在训练测试集之间的流行的界限,系统旨在概括学习者学习新的、未知的问题的能力,以及快速解决简单的、过去见过的问题的能力。

学习者算法的接口定义了两个函数。

next(self, input_bit)作为算法的输入,接收工作平台的一段输入,并且由学习者返回下一段内容。

reward(self, reward)将为学习者提供从工作平台中获得的奖励。

追逐奖励的迭代工作将在学习过去数据和适应新难题的过程中训练算法。

培训平台为开发者提供绑定,可以使用任何编程语言定义学习者通过ZeroMQ消息队列进行学习。该项目仍然处在Beta测试阶段,它有一个Facebook群对其进行讨论和提供支持。该平台代码是用Python写的,代码在GitHub上托管。

查看英文原文CommAI, a Training and Testing AI System by Facebook

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT