凤凰科技讯 北京时间12月19日消息,据《福布斯》杂志网络版报道,百度近日在美国康奈尔大学图书馆的arXiv.org网站上发表论文称,已开发出了一种新的语音识别系统Deep Speech,准确率超过了苹果、谷歌的产品。
百度首席科学家吴恩达以及由Awni Hannun领导的10人研究团队在arXiv.org网站上称,他们已经开发出了一种新的,更为准确的语音识别系统Deep Speech,该系统使用了端对端的深度学习技术。语音识别是一项越来越重要的技术,已经被用于苹果语音助手Siri、语音输入功能Dictation以及谷歌语音搜索中。
吴恩达称,按照衡量语音识别系统出错率的标准基准,Deep Speech的准确性已经超越了苹果、谷歌的语音识别系统。特别是在汽车或人群等噪音环境下,Deep Speech的表现更为出色。
吴恩达称,测试显示,在噪音环境下,Deep Speech语音识别出错率比谷歌语音识别引擎(Google Speech API)、语音识别公司wit.ai、微软必应语音搜索、苹果Dictation的语音系统低10%以上。
百度团队收集了9600人的7000个小时的语音,但多数是在安静环境下。为了提升噪音环境下的语音识别能力,百度向语音样本中添加了大约15种类型的噪音,比如酒店、汽车和地铁内的环境噪音,从而将语音样本中的数据扩充到10万个小时。然后,百度让系统在噪音环境下学习识别语音。(编译/箫雨)
联系客服