BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

TensorFlow学会黄瓜选择和分类

| 作者 Dylan Raithel 关注 8 他的粉丝 ,译者 谢丽 关注 11 他的粉丝 发布于 2016年9月12日. 估计阅读时间: 3 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

Makoto Koike对TensorFlow如何学会了他这个黄瓜种植户的黄瓜选择和分类原则进行了详细描述。这个话题在Hacker News上被斥为谷歌的市场营销,而在其他地方则被当成是深度学习、神经网络和机器学习日益流行的案例。TensorFlow的学习结果大大超出了预期。选择和分类通常是一个非常耗时的过程,在收获的高峰季节,临时员工都无法在短期内学会,这经常导致Koike一家根据若干属性花费大量的时间对黄瓜进行仔细的整理和分类。

Koike使用了由其家庭成员耗时三个月分类完成的7000张黄瓜图片作为训练数据集。在对该神经网络进行测试时,他通过Raspberry Pi控制图像数据的获取,供经过训练的神经网络处理。在实验组(其中的图像数据不包含在训练集中)上,该网络的成功率达到了70%到90%。CUCUMBER-9库提供了训练数据集。据报道,TensorFlow python api的代码实现是由TensorFlow Deep MNIST for Experts提供的示例代码修改而来。这篇文章没有具体说明Koike训练模型时使用的计算概要文件,也没有实际演示经过训练的网络。对于该模型的效率和准确率,Koike表示:

在我对测试图片进行验证时,识别准确率超过了95%。但如果把这个系统应用在真实的场景中,准确率降低到大约70%。我怀疑神经网络模型因为训练图片数量不足产生了“过拟合”问题(这是神经网络中的一个现象,经过训练的模型只适合小规模的训练集)。

分类问题符合良好深度学习对象的一般模式;图像属于“我看到它就知道它”的类别,或者是直觉和经验驱动的分类,那通常很难使用语言简单地描述出来,需要丰富的经验才能做好。Koike详细阐述了这个话题,他指出:

分类工作不是一项容易学习的任务。你不只要考虑大小和粗细,还要考虑颜色、纹理、小划痕,是直是弯,是否多刺。这需要花费几个月的时间来学习,你不能只在最忙的时候雇用兼职人员。我自己都是最近才学会如何把黄瓜整理好。

对于当前的原型,扩展性和计算时间是Koike面临的一项挑战,即使将图片转换成低分辨率(80x80)的图片,该训练模型仍然需要两到三天的时间处理那个包含7000张图片的训练数据集。虽然Koike表示感兴趣,但他还没有在Google Cloud ML上执行训练。那是谷歌推出的一个用于分布式TensorFlow训练的大规模集群。他还指出,他尚未对不同参数、配置和算法的组合进行测试。

查看英文原文:TensorFlow Learns Cucumber Selection and Classification

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT