打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
还在手机上打字吗?对着它说话吧!
2015年08月25日
Robert Hof

就在几年前,你看到走在路上对着自己说话的人,会认为他一定是疯了。可是现在呢,你每天都带着蓝牙耳机在那儿摇来晃去,甚至想都没想过这件事(即便你还是会烦到地铁上的一些乘客)。

不过,这只是和其他人说话的方面——2015年,你还在用自己的手机打电话吗?现如今,你可以只需动动嘴皮子,说“OK,谷歌”或是“嘿,Siri”,就可以让手机进行搜索、餐厅订位、发送短讯,或你习惯于在搜索框或应用中打字进行输入的几乎任何事情。

你可能已经知道确实可以尝试这么做,不过你可能不知道:它们之中的大部分已经不再那么糟糕。如果你最近并没有尝试过谷歌语音搜索、苹果Siri、微软Cortana、甚至是亚马逊Echo智能对讲机的话,你可能会惊喜地发现,它们的性能要比六个月前好太多了:不仅能更好地理解语句——甚至在吵闹的环境下,更能在很多情况下交付更精确的结果。

所有这一切都要感谢机器学习领域——特别是人工智能的一个分支“深层学习”(deep learning)——的重大进步;过去几年中,深层学习技术已经被应用于语音识别。“近期人工智能领域的突破已经破解了语音密码,精确度能够达到人类的90%。”Expect Labs首席执行官蒂姆·塔特尔(Tim Tuttle)如是表示。这家公司从去年开始提供基于云端的MindMeld服务,为任何需要构建语音界面的设备或应用提供帮助。

对我们智能手机用户来说,这再好不过,不过对于公司而言,其中的风险却很高。“无论是谁创造了智能助手,其就将成为人们搜索、购物以及做其他所有事情的首选对象。”曾在麻省理工大学和贝尔实验室担任人工智能研究员的塔特尔如是表示。而且,有相当数量的公司并不希望谷歌或苹果或亚马逊或Facebook(该公司最近收购了语音识别技术公司Wit.ai)成为这样的中间人。比如,塔吉特(Target)并不想放弃对其产品相关的所有数据的控制权,所以该公司应该会想要在应用或网站上做自己的语音界面。

上周,塔特尔在智能数据大会(Smart Data conference)上做了演讲。在我看来,这一演讲中最有趣的一点是,语音识别将有可能扩散到其他形形色色的设备——这一趋势已经切切实实地开始了。Expect Labs是将成为这股趋势的领头羊还是辅助性玩家,尚有待定论,不过塔特尔表示,有一点是无可辩驳的:越来越多的人开始使用语音指令。

谷歌和中国的百度均表示,其10%的搜索行为来自于语音搜索,而18个月前,这一数字几乎为零。塔特尔认为,未来五年内,这一占比将增长至一半以上。

快速识别的准确性是更多人开始使用语音识别的原因之一。特别是在移动设备上,语音搜索和其他指令的速度要比在搜索框内输入(以及重新输入)文字,乃至是点击应用中的按钮,都要快得多。

语音识别的进步还没有完。塔特尔认为,未来18个月中,人类语音识别将会变得更好,这要感谢谷歌、苹果和微软在各自的移动软件上所取得的进步,而Expect Labs等公司可以利用这些技术。

不过,将这些技术上的进步带到除智能手机以外的其他设备上需要大量的工作。塔特尔表示,每一家以客户为先的企业都必须构建与其产品和服务特定相关的知识图表,使用各种技术来从他们的网站和其他数据来源中抓取概念,并在这些概念中追踪各种关系。

接着,他们可以使用自然语言理解模型来输入消费者可能希望了解的典型问题和答案,然后用成千上万个质询要求来训练这一系统。所有这一切都必须移植到移动设备上,获取麦克风权限,并在少于百分之一秒的延迟下将语音转化成文本。

这些技术进步,以及语音指令使用的兴起,都没有逃过各类型企业和政府机构的注意。例如,Expect Labs正和大约1600名开发人员及多家公司合作,其中包括大型有线电视运营商、汽车公司以及美国政府机构。“每一家企业都需要为应用和设备打造极棒的语音体验,”他说,“我们认为,语音存在于每一款应用之中,而不仅仅是家里的电视机中。”

事实上,塔特尔认为,在年底之前,我们将看到更多类似于亚马逊Echo的语音助手设备出现。他认为,这些设备将专注于特定市场,如音乐、OTP流媒体视频机顶盒,以及零售。他之所如此确定,是因为Expect Labs正在和其中一些企业进行合作。

坦白说,这其中依然存在着重大的社会障碍,特别是对着你的手机说话。我妻子和女儿已经渐渐习惯这种行为,不过在我对着自己手机讲话,让它进行搜索时,她俩依然还是会露出那种被逗乐的表情。我避免在公众场合这样做,除非我能找到一个不那么引人注意的地方,因为我还是会被别人取笑。事实上,我认为这是语音在担当起重任的过程中所将受到的一大限制,至少在我们现在在公众场合这样做时会被别人听到的方面来说是如此。

不过,我们现在甚至都还没有接近这些限制。很快,你就会问自己,为什么会在手机上去输入除了表情符之外的其他东西——或者说,你会问自己,都已经2015年了,为什么家里的微波炉或闹钟收音机还听不懂你的话。

 

译 Lily  校  徐笑音

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
生态是如何为智能音箱画龙点睛的?
新鲜公司|Fano Labs另辟蹊径:专注小语种智能语音识别,打下东南亚市场
动态 | 阿里推出首个智能音箱:现场PK亚马逊苹果
PK Echo!阿里发布新款智能音箱,据说马云都惊呆了
语音交互和人工智能,谁更快?
为什么苹果亚马逊都在抢占智能音箱?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服