BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Google发布MobileNets,一种预训练的高效Tensorflow计算机视觉模型

| 作者 Roland Meertens 关注 6 他的粉丝 ,译者 Rays 关注 3 他的粉丝 发布于 2017年6月26日. 估计阅读时间: 2 分钟 | GMTC大前端的下一站,PWA、Web框架、Node等最新最热的大前端话题邀你一起共同探讨。

Google在Tensorflow的Github代码库中,发布了多个用在移动电话上的高效预训练计算机视觉模型。

这几个模型间的差别在于模型的参数、单图像处理的计算能力以及预测的准确性,开发人员可从中做出选取。从计算量上看,最小的模型具有14个百万次MAC(乘加运算,Multiply-Accumulates ),最大的模型则具有569个百万次MAC。要预测一个图像的类别,一个模型所需的计算量越大,所需使用移动设备的电量也越多。开发人员可以根据特定的应用,在准确性和所耗费电池电量间进行权衡。模型的性能及资源占用情况发布在Google博客上,如下图所示。

在智能电话上处理图像的性能,要优于将图像上传到在线处理服务(例如,Cloud API)。这也意味着数据完全不必离开智能手机,确保了了用户的隐私。这些模型是开源的,开发人员可直接下载,或是微调模型以适合自身的特定需求。

尽管这些发布的模型使用了更少的计算量,但是大多数模型所做出预测的准确性还是可与其它神经网络的表现相媲美的。在今年早先预发表的一篇研究论文中,阐述了MobileNets更为高效的原因。

论文在LSVRC数据集上验证了模型的准确性。LSVRC数据集是一个大规模的图像识别数据集。MobileNet对每个图像给出五个标签预测结果,并使用“Top-1 Accuracy”和“Top-5 Accuracy”指标衡量了预测结果的准确性。“Top-1 Accuracy”表示预测结果中可能性最大的一个标签的确是图像真实标签的比例,“Top-5 Accuracy”表示预测结果中可能性最大的五个标签中包含了图像真实标签的比例。

有意着手去运用这些模型的开发人员,可以访问Tensorflow Mobile的主页。Tensorflow-Slim图像分类库的更多信息,提供于Github上

查看英文原文: Google Released MobileNets: Efficient Pre-Trained Tensorflow Computer Vision Models

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT