BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

使用深度学习和街景提升Google地图服务

| 作者 Srini Penchikala 关注 36 他的粉丝 ,译者 Rays 关注 3 他的粉丝 发布于 2017年6月23日. 估计阅读时间: 3 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

最近,Google的Ground Truth团队发布了一个新的深度学习模型,用于从带有地理定位信息的图像文件中自动抽取信息,以改进Google地图服务。该神经网络模型在对挑战性的FSNS(法国街道名称识别数据集,French Street Name Signs)数据集处理上,给出了更高的准确性指标。来自Google Brain团队的Julian Ibarz和来自Ground Truth团队的Sujoy Banerjee在Google Research博客网站撰文,介绍了解决现实世界图像中文本抽取问题中所用的TensorFlow模型。

目前有十亿用户使用Google地图软件指路、获取实时交通情况和商户信息,要为这些用户提供更好的体验,信息应必须能反映了变化中的世界。当前,街景车(Street View Car)已经采集了800多亿张图像。要从这么大规模的图像数据集中为Google地图发现新的或者是发生更改的信息,人工分析是不可能实现的。因此,从具有地理定位信息的图像中自动地抽取结构化信息成为团队的工作目标之一。

现在,这一新的深度神经网络模型对开发人员公开可用。它在从FSNS数据集街景图像中读取街道名称的任务上,达到了比其它深度神经网络更高的识别率(84.2%)。可扩展该模型实现从街景图像中抽取其它类型的信息,例如从含有店面的图像中抽取出商户的名称。

在城市、道路和商户等自然环境中做文本识别,这是一个具有挑战性的计算机视觉和机器学习问题。失真、遮挡、方向模糊、复杂背景或视角上的差别,这些因素使得从自然场景中抽取文本更具挑战性。先前在2008年,Google团队就使用了一个基于神经网络的模型,用于街景图像中行人面部及车辆牌照的模糊化,实现对用户隐私的保护。以该研究为基础,他们已能使用机器学习自动地改进Google地图,实现了相关最新信息的更新。

深度学习模型还实现了如下任务的自动化:新街景图形库的标记、与命名规范一致的文本规范化处理,以及剔除与数据分析无关的文本。团队无需知道街道的名称或是该地址的具体位置,就可以直接从图像创建新的地址。例如,如果街景车汽车行驶在一条新建的道路上,该模型可以分析所街景车捕获的图像,从中抽取街道的名称和门牌号码,并在Google地图的适当处自动地创建并定位新地址。

要在大规模的街景图像数据集上应用这些模型,Ground Truth团队采用了机器学习芯片TPU(张量处理单元,Tensor Processing Unit),以降低指令流水线推断(Inference)的计算代价。

查看英文原文: Enhancing Google Maps with Deep Learning and Street View

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT