BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

2018 AI先行者大会在杭州召开,精选专场演讲回顾

| 作者 蔡芳芳 关注 6 他的粉丝 发布于 2018年9月21日. 估计阅读时间: 6 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

2018年9月16日,由AICUG人工智能技术社区、Datafun社区、博学联合主办的2018 AI先行者大会于杭州召开,来自阿里巴巴、科大讯飞、微软、腾讯、平安壹钱包、宜信、地平线、格灵深瞳等企业的数十名技术专家向参会者分享了国内不同行业公司的AI实践经验。本文精选其中部分演讲进行总结回顾。

阿里文娱:视频AI在优酷搜索推荐的应用与挑战

阿里商业机器智能算法团队及优酷算法技术团队负责人永叔在演讲中分享了视频AI领域当前面临的挑战和优酷将搜索推荐算法应用于视频领域的尝试。当前视频搜索和推荐面临的挑战主要来自两方面:

  1. 多模态视频检索召回。早期优酷做视频搜索的时候主要使用视频的标题、描述和介绍来做视频的检索,但用户的诉求远不止于此。在优酷最近的一次用户调研问卷中,超过1/4的用户反馈在搜索视频时不知道该输入什么关键词,有时候用户只能提供非常有限且模糊的关键词信息,当前只有文本和语言信息的检索已经无法满足用户需求。因此视频搜索推荐面临的问题已经变成了如何基于文本、图像、视频、声音等多种异构信息的数据源提供高质量的信息检索;
  2. 监管部门对内容安全的审核需求。所有内容网站其实都面临同样的挑战,监管部门的审核标准通常是模糊且不确定的,需要大量人工参与,如Youtube的人工审核团队已经超过1万人。对于优酷来说,在内容安全面临的问题还包括超大规模数据带来的巨大开销、中文谐音双关歧义、跨媒介多模态识别等。永叔介绍了一些可能的解决思路,包括将小样本学习和领域知识相结合,采用内容质量分级方法对不同内容设置不同的审核标准(包括制定分级标准和构建分级样本库)。

视频AI技术在优酷业务线上的应用主要包括图像视频分类、物体检测(人脸检测、风险对象检测)、视频版权保护(视频和音频指纹技术)、视频语义等。大量的分类任务导致人工标注成本急剧上涨,单位人工标注成本近5年内已经涨了3倍。优酷尝试通过预训练模型并在不同任务间共用参数权重来提高多任务分类的训练效率,借助Active Learning提高标注效率、降低人力标注的成本,同时辅以Fewshot Learning和迁移学习的方法,用于解决仅有少量截图的视频识别问题。

科大讯飞:语音大数据下的智能人机交互

科大讯飞智能服务BU创新业务总监刘国光总结了当前智能语音交互技术的发展现状和未来面临的挑战。智能人机交互正在引领新的产业变革,语音作为入口已经得到业界的广泛认同。当前智能语音客服能够做到5个人工带1台机器,而未来3-5年的目标是1个人带5台机器。智能服务存在的技术难点主要包括声学(噪音、异常输入、方言、领域优化、多语言混合)、语义及知识(多轮对话、统一智能知识库、自由及复杂表述、知识挖掘、人机协同)。刘国光认为,当前深度学习仍然在持续给语音识别带来红利;在深层语义理解上,当前对效果贡献最大的仍然是基于大量数据的有监督学习,人工优化工作占比超过60%,效率比较低,科大讯飞尝试通过引入弱监督、无监督学习来提升知识库建库的效率,减少客户投入,原来冷启动场景的成本需要10个人月,现在已经下降到7个人月,未来3年以内希望能降低到1个人月。刘国光还分享了近三年AI话题的变迁,2016年都在谈AI相关的技术,2017年则是应用场景,2018年业界关注的是到底新的算法、新的模型能带来哪些可衡量的用户价值。

微软亚洲研究院:MSRA近期在物体检测领域的进展

实例识别是计算机视觉中存在已久的基础研究问题。 最近,随着深度网络和大规模数据集的引入,该领域取得了重大进展。 微软亚洲研究院Lead Researcher代季峰分享了最近MSRA在物体检测领域的最新进展,包括R-FCN物体检测、用于几何平移建模的可变形ConvNets、用于视频识别的深度特征流,这些研究成果已经在微软内部广泛应用,并帮助MSRA在多项国际比赛(包括COCO检测和分割挑战赛等)中取得了很好的成绩。代季峰表示,通用物体检测仍然是计算机视觉领域一个开放的未能有效解决的基础研究问题,当前存在的挑战还包括:识别外观容易发生变化的物体、在移动设备上做到低延迟识别、对全景场景的理解;将新的研究成果应用到产品中需要先经过仔细的调查和原型设计。

腾讯:智能客服的问题分解和解决思路

腾讯数据平台部算法高级研究员陈松坚以腾讯小知为例,从AI实践角度出发,总结了智能客服这类AI应用是如何从客户需求逐步落地成实际可用的应用。首先从智能客服的使用场景和客户的痛点出发,将智能客服拆解成三个大问题,分别是知识怎么来、怎么问答和怎么持续学习;然后着重针对怎么问答这个问题进行细分,分为意图明确问题,意图不明确问题和知识点外问题。针对意图明确问题,陈松坚详细介绍了问句匹配模型的解决方案及其进化方向,分别是基于字面匹配的通用模型,基于语义匹配的深度模型,和针对语料不足的场景如何使用迁移策略。而对于意图不明确问题,则需要利用知识图谱来对行业问答库进行建模,然后结合多轮对话模型实现带有上下文记忆的对话逻辑。对于知识点外问题的处理,陈松坚介绍了如何利用NLP技术快速实现简单有效的判别器来区分闲聊和专业意图,从而完成一个基本的客服问答框架。

由于演讲的内容庞杂,本文无法全部总结,演讲的视频和PPT后续会陆续发布到AICUG的官方微信公众号上,感兴趣的同学可以关注。AICUG人工智能技术社区成立于2018年3月份,每月在不同城市举办技术沙龙,并有走进名企AI技术开放日活动,本届AI先行者大会是社区主办的第一次大会,10月起将在硅谷同步开展线下沙龙。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT