BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

谷歌推出云自然语言API

| 作者 Margot Krouwer 关注 5 他的粉丝 ,译者 谢丽 关注 11 他的粉丝 发布于 2016年9月5日. 估计阅读时间: 3 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

将自然语言处理(NLP)的先进成果,从前沿研究的小世界里拿出来,送到普通的数据科学家和软件工程师手中,这已经成为一场运动。7月20日,谷歌也加入进来,发布了测试版的云自然语言API。谷歌的NLP API让用户可以利用如下三个核心的NLP特性:

  • 情感分析——分析语言的基调,比如积极或消极;
  • 实体识别——识别语言中不同的实体,比如人或组织;
  • 语法分析——识别语言中的各种词性,比如句子X包含3个名词。

这些工具使用了谷歌的深度机器学习算法,这也是其API与其他自建的数据科学工具的不同之处。

NLP软件是一种构建用来理解人类语言或文本的程序。像谷歌和IBM这样的科技巨头发布了大量便于开发人员使用的API,让这类软件进入了主流应用。在谷歌的一篇博文中,开发工程师Sara Robinson使用该API的实体识别特性识别《哈利·波特》中的人物和地点(因为她不会念咒语)。接下来,她比较了自己开发并维护所有软件和使用NLP API的差别:

我可以编写自己的算法,找出这个句子里的人物和地点,但是那会很困难。而且,考虑到相同的实体会使用不同的词语描述,如果我希望针对涉及到的每个实体收集更多的数据,或者在成千上万的句子里分析实体,则会更加困难。

按照Robinson的说法,从头构建NLP软件特别困难,因为即使是在开始真正的工具开发工作之前,数据收集、预处理和训练就有太多的事项需要注意。像谷歌提供的这种NLP API,让用户可以利用NLP算法的强大功能,而又不必应对复杂的高等数学计算、工程和数据建模所带来的巨大开销。

Watson的Conversation API也是最近出现的NLP API。借助该API,你可以使用NLP解释不同的用户指令,并将这些指令传达给不同的智能家居软件,比如控制灯光的应用。Watson API有交互式的Swagger文档,你可以在里面测试类似“开灯”和“天气怎么样”这样的请求。谷歌的NLP API面向更为广泛的NLP使用场景,而Watson的API主要是为人通过文本或语言同机器通信提供便利。它基于日益流行的IoT(物联网)技术构建。在IoT环境里,NLP是同智能汽车、家居、甚至卫生纸筒通信的理想介质。

Facebook采取了一种更为直接的路线,即向更大的技术社区公布内部使用的NLP代码。今年7月,他们把词汇表征学习和句子分类库fastText的所有源代码都发布在了GitHub上。虽然开发人员不会完全忠于一个干净的API,但能够从Facebook的代码创建分支,让开发人员可以在更高的层面上参与到现有的NLP数据科学社区。在社区环境里,这个库很容易衍生出更多的NLP API和库。无论形式如何,可以确定的是,NLP离普通大众越来越近。

查看英文原文Google Launches Cloud Natural Language API

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT