BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

微软发布人脸识别、计算机视觉和内容审核API

| 作者 Roland Meertens 关注 6 他的粉丝 ,译者 刘嘉洋 关注 0 他的粉丝 发布于 2017年5月16日. 估计阅读时间: 3 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

微软认知服务(Microsoft Cognitive Services)于四月底向其用户发布了人脸识别API(Face API)、计算机视觉API(Computer Vision API)和内容审阅API(Content Moderator API)。

认知服务集合了多款API和服务,帮助开发人员在自己的应用程序中添加图像识别、语音、翻译和其他功能。这些API还可以帮助开发人员在他们的应用程序中添加人工智能和机器学习功能,而无需亲自动手开发这些功能。

人脸识别API可以帮助检测并识别人脸。微软可以鉴别两张图像是否属于同一个人(这对于需要使用人脸识别技术来鉴别司机身份的公司来说非常实用,比如Uber)。人脸识别API还可以根据视觉相似性将人分组。这一功能的用例之一就是将老年人和年轻人分在不同的类别中。如果一个人之前被标记过,人脸识别API也将在新的图像中再次识别他们。除此之外,人脸识别API还能检测人脸部的表情。

计算机视觉API可以根据内容对不同的图片打上标签。比如说,下图能得到“水”、“运动”、“游泳”和“游泳池”这样的标签。该API还能检测到这张图像不包含种族歧视和成人级内容。

计算机视觉API包括两个特定领域模型,帮助你识别地标和名人

计算机视觉服务也可以用一句话描述一张图像。举例来说,会有这样的描述:“一个人坐在一张长凳上”。微软还加入了手写检测功能,可以帮助检测、分段并读取手写的文字。他们展示了几个计算机视觉API将便利贴和备忘录内容转换为计算机可读文本的用例。

内容审阅API可以帮助用户筛选应用程序中输入的文字和图像。它可以识别可能令人不悦的或不需要的图像,并查找图像中具有攻击性的文字。现在已实现检测超过100种语言的手写文字中令人不悦的内容。内容审阅API还能帮助搜索个人可识别信息(PII)。视频审核API可以帮助检测视频中的成人级内容,但该功能目前仅供预览。

2015年4月这些API就作为alpha版本发布。在通用版本发布阶段的过程中还加入了许多功能。这些API是分布于视觉、语言、语音、搜索和知识领域的25种认知服务API的一部分。用户可以免费使用这些API的一些数据内容。通过访问在线演示页面,你可以上传自己的图像试用API提供的功能,获取相应的数据。每月需要识别超过30000张图像的用户需要支付约每1000张图像0.55欧元/0.65美元到1.27欧元/1.50美元的费用。

查看英文原文Microsoft Releases APIs for Face Recognition, Computer Vision, and Content Moderation


感谢薛命灯对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT