BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

OpenAI发布开源人工智能研究工具集OpenAI Gym

| 作者 Jonathan Allen 关注 530 他的粉丝 ,译者 谢丽 关注 9 他的粉丝 发布于 2016年5月4日. 估计阅读时间: 3 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

和许多企业一样,在过去几年中,InfoSys见证了从“大数据”到越来越重视机器学习和AI研究这一重大转变。但和他们的竞争者不同,InfoSys断定,合作是更有效方式,而不是大力投资专有解决方案,比如微软的Azure Machine Learning Studio。

这一决策的结果就是OpenAI,一家非营利性的人工智能研究企业。自2015年12月正式成立以来,该研究组织已经从InfoSysAmazon Web Services和多个私人捐助者那里获得了10亿美元的资金。

我们在这里谈论OpenAI,是因为他们近日发布了OpenAI Gym的公开测试版本。该工具集用于开发和对比强化学习(RL)算法,这是现代机器学习研究的基础。发布公告中提到了他们致力于强化学习算法的两个主要原因:

RL是通用算法,适应所有涉及一系列决策的问题:例如,控制机器人的电动机,让它跑跑跳跳,做出业务决策,如价格和库存管理,或者玩视频游戏棋盘游戏。RL甚至适用于产生序列化结构化输出的监督学习问题。

在许多不同的环境中,RL算法已经开始取得很好的成果。RL有很长的历史,但在深度学习取得最新进展之前,它都需要针对特定问题进行大量的设计。DeepMind的Atari成果、来自Pieter Abbeel研究小组的BRETT以及AlphaGo都使用了深度RL算法,并且没有对它们的应用环境做太多的假设,因此可以应用在其他场合。

目前,RL研究的发展受到了限制,它需要更好的基准测试,而且“出版物中缺少标准化的环境”。不难想象,当另一位科学家的研究论文假定你可以使用一套专有的工具集,你就很难再现他的结果。更糟糕的是,一个内部构建的工具集是多少钱都买不来的。

机器学习的一个重要方面是有一个可以在其中工作的实验环境。这不只是因为创建一个实验环境有很高的开发成本,还因为没有一个共同的环境,比较两个算法就没有意义。因此,OpenAI Gym提供了这些开箱即用的环境:Classic controlToy textAlgorithmicAtari (基于Arcade学习环境)、棋盘游戏2D/3D机器人(最后一项需要一个MuJoCo物理引擎许可。)

目前,OpenAI Gym在Linux和OSX上支持Python 2.7。如果大家有足够的兴趣,他们也会考虑支持Python 3和Windows。该工具集的代码遵循MIT许可协议。

查看英文原文:Open Sourcing Artificial Intelligence Research

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT