BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

百度输入法语音输入技术的应用和实现
录制于:

| 作者 施聪 魏利开 关注 0 他的粉丝 发布于 2016年12月10日 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。
41:12

概要
语音输入作为改变人们常规输入习惯的输入方式由来已久,只是受限于环境、技术等因素,输入体验一直无法达到预期。随着网络技术,深度学习技术在近几年的不断提高,以及人工智能时代的到来,语音输入作为常规输入方式慢慢登上舞台。本次分享基于语音输入到识别结果返回的工作流程,介绍具体的实现和优化细节,包括不同环境的采样选择,麦克风的预热,不同机型的离线识别模式选择,语音识别的场景化实现,以及如何通过语音输出表情、天气、联系人等卡片功能,希望给开发者带来一些新的产品和技术思路。

个人简介

施聪:百度手机输入法Android团队经理,技术负责人,负责输入法总体技术框架设计、相关技术方案评估、新技术引入等工作。 魏利开:百度语音开放平台资深研发工程师,自2011年以来一直从事语音相关工作,目前负责百度开放平台的离在线语音、一体化唤醒和自定义语义等客户端技术。

百度技术沙龙是由百度主办,InfoQ负责策划、组织、实施的线下技术交流活动,每月一期,每期由1个话题,2场演讲以及Open Space开放讨论环节组成。旨在为中高端技术人员提供一个自由的技术交流和分享的平台。每期沙龙会邀请1名百度讲师分享百度在特定技术领域的成果及实践经验,同时还会邀请1名优秀的互联网公司或企业技术负责人对同一话题进行分享。活动主要面向开发者、技术负责人、项目经理、架构师等IT技术人员。我们的口号是:畅想,交流,争鸣,聚会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT