BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

从大脑视觉皮层获得灵感,初创公司Vicarious利用AI破解了CAPTCHA的安全性

| 作者 Roland Meertens 关注 7 他的粉丝 ,译者 姚佳灵 关注 0 他的粉丝 发布于 2017年11月20日. 估计阅读时间: 3 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

湾区初创公司Vicarious利用称为“RCN”的新型网络布局改进了一项机器学习技术,从而有能力解决CAPTCHA的挑战

Vicarious的目标是开发一种在任何环境下都能够检测出特定字母的算法。对机器来说,在不同的环境下检测出字母是件困难的事。出于这个原因,发明了CAPTCHA以区分人类和机器。在2013年,Vicarious成为首批利用深度神经网络破解CAPTCHA系统的公司之一。

如今,他们改进了算法,所需的数据变得更少以推广到所有的CAPTCHA。通常,神经网络需要数千到数百万的样本以推广到未曾见过的新数据。但是,他们的新系统归纳能力更好,训练所需的数据只是原来的300分之一。

为此,他们发明了RCN。与一般的神经网络在训练之前不具有任何知识相反,RCN带着与轮廓和表面相关的知识开始学习。 这种预备知识有利于模型的建立和推广,而一般的神经网络必须学习已存在着的轮廓和表面,还必须学习物体和背景之间的不同。多亏了预备知识,现在可以在几个独立的物体上训练一个RCN,并利用其来代表具有多个物体的场景。

RCN背后的想法源于认知科学和神经科学。人类在出生时,神经皮层就已经有能力区分前景和背景。对于我们来说,比起从一片空白开始学习所有的东西,在我们所处的世界中学习各种表达更容易些。

RCN是轮廓和表面组合的模型。表面是使用条件随机场的模型。轮廓是利用特征的组合层次来建模。这样一来,RCN能够识别具有不同外观的物体,无需在每一种形状和外观组合上进行训练。RCN的另外一个优点是它们不会过度拟合训练集中的无关细节。这意味着RCN对于其他类似的场景有很强的推广能力。

解决CAPTCHA问题是机器学习技术推广的一个非常重要的领域。Vicarious观察到在CAPTCHA中轻微的干扰就使得传统的神经网络方法完全无效。这个可以在下图中观察到,如果在训练了两个网络之后,修改了CAPTCHA的表达,那么深度学习的方法会失败。而他们的新方法在仅仅用了260个样本训练之后,表现却更好。

为了生成训练和测试数据,研究人员生成了自己的CAPTCHA。对于这些CAPTCHA,他们复制了几个著名的CAPTCHA生成系统的字体。相关的数据集可以通过他们的博文底部的链接下载获得。

Vicarious是一家美国人工智能公司。他们希望可以在训练样本中进行归纳,就像人类能做到的一样。他们的终极目标是把这个智能应用于机器人。关于RCN的本文已发布于《Science》其网站上

查看英文原文: Start-up Vicarious Defeats CAPTCHA Security with AI Inspired by Brain’s Visual Cortex


感谢冬雨对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT