BT

您是否属于早期采用者或者创新人士?InfoQ正在努力为您设计更多新功能。了解更多

Teachable Machine:训练机器在浏览器中使用摄像头

| 作者 Roland Meertens 关注 2 他的粉丝 ,译者 盖磊 关注 1 他的粉丝 发布于 2017年10月12日. 估计阅读时间: 2 分钟 | ArchSummit社交架构图谱:Facebook、Snapchat、Tumblr等背后的核心技术

Teachable Machine是一个浏览器应用,用户可以使用它训练自己的网络摄像头识别物体或语句。

应用的演示中,用户使用网络摄像头识别三种不同类别的物体或语句。根据摄像头的输入,网站显示了不同的图片、播放预先录制的声音或播放语音。该应用不需要用户做任何编程,也不需要对超参数或网络架构做任何编程。对用户而言,来自于机器的唯一反馈是机器对每个预测类的置信度。根据被识别出的类型,机器会从三个不同图片中选择一个展示。图片分别是一只猫、一条狗和一个可爱的兔子。在Youtube上给出了一个如何使用Teachable Machine的很好教程

所有的训练都是使用deeplearn.js软件库在浏览器中完成的。该软件库是一个使用硬件加速的JavaScript库,由Google Brain PAIR团队构建并开放提供。软件库是2017年八月在Google博客上发布的,在deeplearn.js网站上还提供了多个使用该库的应用。

用户只需要对自己想要识别的一些对象拍照。训练的加速是通过下载称为“squeezenet”的预先训练好的神经网络实现的。根据研究论文,相对于做对比的神经网络,squeezenet减少了50倍的训练参数。这意味着,squeezenet可以作为小于0.5MB的文件下载。虽然该神经网络具有更少的参数,但其输出不逊于大型的神经网络,完全适用于这个简单的浏览器应用。该应用使用了预先训练好的神经网络的输出,去学习网络摄像头中展示的物体。

Teachable Machine的源代码已提供在GitHub上。deeplearn.js的上手操作指令及该库的源代码也提供于GitHub上

查看英文原文: Teachable Machine: Teach a Machine Using Your Camera in Your Browser

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT