随着语音识别技术的迅速发展,它在通信与电子,信息处理等领域呈现出巨大的潜力。基于语音识别技术的智能语音控制产品纷纷涌现。在照明领域包括GE和欧普等厂家也都纷纷推出了自己的语音控制台灯产品,软件采用非特定语音识别技术(ASR),实现了语音控制台灯的开关以及亮灭的同时,使用者还可以通过不同的指令实现更多控制。
一时间,语音控制台灯大量涌现,于此同时原来一些应用在玩具上的近场语音控制的芯片和方案厂家,按耐不住寂寞,也纷纷加入了语音控制台灯方案提供商的队伍。鱼目混珠的语音控制台灯方案让初入语音控制台灯领域的厂商们无从选择,投入大量人力物力开发出来的语音控制台灯产品,因为用户体验极差,导致纷纷退货,大笔市场运营费用带来的是对品牌的伤害。
以下,笔者将从几个方面对语音控制台灯的技术指标做出解释,希望对新进的语音控制台灯厂商提供到一些帮助。
一:语音控制台灯远场距离,在这一点上,绝大多数厂商是知道的,如果语音控制台灯的距离只能做到1米以内,这样的语音控制台灯是很难被用户接受的。
二:语音控制台灯唤醒率,这一点相信绝大多数厂家也是容易理解的。一个语音控制台灯如果用户叫了没有反应,这样的用户接受度肯定也是不高的。
三:语音控制台灯误唤醒率,这一点估计是绝大多数厂家容易忽视的。如果一个语音控制台灯在半夜里,你没有控制它,它自己就亮了,这样的场景是挺吓人的。
如何能够同时满足到拾音距离远,唤醒率高,而误唤醒率低呢?需要在软件和硬件上都下足功夫。首先,在软件方面,欧普,GE,ECHO,
GOOGLE选用的都是16KHZ的语音模型,就是将1秒钟的语音信号,分割成16000份,然后对每一小份音频能量赋值,再将每200个小份汇总提取特征值,最后形成音频曲线。这个工作的重要性怎么强调都是不过分的,这是语音识别效果的保障。
目前市场上出现了一些将近场声控玩具的8KHZ语音模型用于远场的方案提供商,他们将唤醒率提高了,而完全不顾及误唤醒率。在样品演示阶段,欺瞒厂商。等到大批量生产后,市场退货不断,这个时候语音控制台灯厂商们才开始叫苦不迭。
下面再来说一说语音控制台灯硬件的要求,我们都知道作为硬件的配置越高,最终的效果就越好。但是对于语音控制台灯需要好到什么程度,其实语音控制台灯厂商们大多不知道如何去评估。一般来说,要做好远场语音控制台灯,需要处理好以下几个问题。
一,滤除噪声。由于我们生活在一个相对的噪音环境里,
在远场控制中,用户和语音控制台灯有一定距离,很多时候噪声源距离麦克风的位置比人更近,在某种程度中也为录制声音带来了一定的困难。很多噪声是人耳听不到,但是麦克风能够听到的。
第二,混响处理。我们在空旷的空间中,声音发出之后声波遇到空间中的各种物质进行物理反射,不同反射声波最终汇聚到麦克风中,导致混响效果,所以声音需要处理的相对纯净。
第三,修复衰减。声音通过外界物质传输到语音控制台灯麦克风,会有一定的衰减,并且在不同频段会有不同程度的非线性衰减。我们去恢复这个声音,需经过一个比较复杂的处理,通过SSP技术处理,恢复到纯净声音的效果,最终传输到语音控制引擎,达到远程人机自然语音交互无障碍的目的。经过语音控制台灯麦克风收集到的语音,做了的信号处理之后,还需要跟语音控制引擎进行足够的匹配,让语音控制的模型与经过信号处理的信号一致,这样才会取得好的控制效果。
而一个完美的语音算法的是由以上多个语音算法模型组成的,而在硬件系统中可以同时支持多少算法模型,就对硬件系统有着不同的要求。一般来说,在稍微复杂一点的环境中,比如厨房电器中,我们需要使用主频在1GHZ以上的主控芯片。在更高端的产品上,需要使用双核或多核的主控芯片,主频要在1.6GHZ以上。而在语音控制台灯的产品上,一般需要100MHZ的主控芯片。
希望越来越多的语音控制台灯厂商们能够成功避开陷阱,真正的做出客户体验良好的产品,也让自己的付出得到实实在在的经济回报。
郑重声明:以上文章仅代表作者个人观点,与本网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作出任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本文仅供参考,盲目相信,风险自担。发布本文之目的在于传播更多信息,并不意味着本网赞同或者否定本文部分以及全部观点或内容。如对本文内容有疑义,请及时与我们联系。
联系客服