打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
科大讯飞王士进:第三代人机交互时代来临

DoNews4月27日消息(记者 翟继茹)在GMIC北京2017大会上,科大讯飞研究院副院长王士进发表了《以人工智能技术为基础构建商业新生态》的主题演讲。王士进认为要做到人工智能+需要对各个行业进行透彻的理解,并拥有大量的优质数据。

王士进介绍第一代人机交互是以键盘和鼠标为主,随着移动互联网到来,触控成为第二代人机交互方式。在物联网时代,以智能语音为主,视觉、触摸为辅的智能交互将很快走入我们的生活。

王士进表示在基于新一代人机交互基础上来构建商业新生态方面,科大讯飞已经在包括家居、医疗、安防、教育等场景下都做了布局。

人工智能+是近两年非常火热的话题,王士进认为它包含了两层意思,第一层是以语音、视觉为主的AI技术在万物互联的场景下面使人机交互效果更加优异。第二个层面的意义是机器学习正在成为行业专家,这使得各领域都掀起了人工智能与行业结合的热潮。(完)

以下为演讲实录:

大家好,因为刚才主持人介绍了,我不用介绍我们公司了,来自科大讯飞,谈谈商业新生态构建,正好刚才我们有一个环节也讨论了人工智能技术在很多商业里面怎么应用,怎么去体现。

所以我今天PPT会分成两个部分,第一个部分用非常短的时间把所谓的人工智能技术简单过一遍。讲到人工智能大家比较清楚,我们在1956年在美国会议上有几位年轻的,当然是非常有名的几个专家提出人工智能技术,所谓人工智能有很多不同的定义,但是在这些定义里面的话有一些大家的共识,这些共识包括我们认为机器可以像人一样感知、认知,去决策和执行,大家听到很多嘉宾讲的这些关于智能的一些相关工作,其实都涉及到这样一些东西。所以我们可以把在自然宇宙中,人类智能和我们在数字宇宙中人工智能技术对应起来。

关于人工智能分类的话,科大讯飞最早提出分类方式,第一是运算技能,能存会算,第二包括感知和运动智能,希望机器像人一样可以感知外面的世界。还有一个是认知智能,是我们认为人工智能比较高的境界,是让我们机器可以理解会思考。

关于运算智能,前面的人也讲了很多,实际上大家可以看到关于在存储和运算上面,其实机器已经把我们人类抛在后面了,无论α狗还是IBM那位先生提到很多计算,机器所实现的效果比人类好很多了。感知的话,大家提到很多,包括我们人类的听觉,包括人类的视觉,机器在很多方面进步非常快,特别是我们从2010年开始起深度学习提出来之后,机器感知的技能越来越快,甚至很多领域已经达到和超过人类。

在第二段的话就是运动智能,也是一样的,机器怎么能够通过运动的判断达到人的效果,比较有名在去年还是前年有机器人跟德国著名的乒乓球进行比赛,虽然人类最后转败为胜,但是大家可以看到机器做了很多优化的工作。

关于认知智能我们说这是人类智能最高的体现,这里面包含很多东西,对语言理解,对逻辑的推理,大家认为是机器最大的挑战,同时这里面也是蕴含了更多的商业机会。前面把人工智能技术过了一遍,下面谈谈技术和产业的融合,在谈融合之前,我们简单看人工智能的三次浪潮,时间有限,我不对每次浪潮做具体的解释了,大家可以看到从现在开始,2000年开始,10年以后的话我们认为核心技术,跟这种产业形成的深度融合,很多嘉宾提到了大家都认为现在是人工智能爆发非常好的时机。

讯飞在2014年的时候基于很多研究成果提出超脑,提出几个主要的功能,我们希望讯飞超脑能听会说,能理解,讯飞做云起家,云识别上,包括产业里面做了很多工作,最近我们在去年参加了由谷歌组织的比赛,因为大家知道在最近在ROT的时代,很多领域基于更困难的场景里面怎么使用多麦克风促进云识别的效果,这一直是产业里面最重要的问题,这也是以麦克风阵列识别技术。相比于国内和国际很多企业,我们做了很多优化,所以大家看效果也还不错。

第二个是让机器会说,会说我们主要讲机器合成,从06年开始参加国际语音合成的比赛,到16年已经是11届了,讯飞第一能够连续蝉联11届的冠军,第二是唯一一家能够把自然度做上4分的单位,我们业内评测5分满分,4分我们认为接近播音主持战或者正常人的水平。特别随着深度学习的发展,讯飞在去年年底的时候发布了一项新的合成技术,使得我们这个合成技术只需要半个小时左右的录音,任何一个说话人我们就可以达到合成,让你从听感上很难区分出机器还是人这样一个效果。

关于让机器能理解的话,讯飞提出超脑以后也做了很多工作,比如参加知识图谱的构建比赛,讯飞取得第一名的效果。我们去年还参加由美国举行的一个比赛,我们认为它是逻辑推理非常重要的比赛,大家认为这是替代图林测试非常有可能的。虽然说讯飞在里面比赛成绩比较好,大家看到机器还有很多提升空间,比如人类在系统上可以做90分以上,当时比赛可以做到60分,现在可以做到70多分。

最近在机器阅读理解这个领域上面的话,国际上和国内有非常多科研单位做类似的工作,讯飞也在竞争激烈中能够持续保持这个技术的领先。刚才在实验室也提到,我们说衡量机器设备有没有智能有一个办法,其中一个参加考试,考试这块原来在美国实验室做了一个美国生物考试,日本有一个东京大学的机器人,中国在15年的时候也提出由科技部发起,由科大讯飞主导首个中国人工智能的,我们是希望积极人可以像人一样进行语言的理解,联想的推理,知识的表示和自主学习,同时说的话让机器人参加我们的高考,也能够考上大学,还希望是一本。

众所周知,最近一两年非常重要的话题,人工智能+,科大讯飞或者我,我认为包含两层意思,第一层我们认为人工智能的技术,特别是语音、视觉等使我们在万物互联的场景下面,使得我们机器和人进行更好、更自然的交互,这是一个。

第二个深入到各个领域,机器可以学习到这些领域里面专家的知识,从而变成可预测、可决策这样一些模型,从而达到接近领域专家的水平。同时大家看到各行各业都在掀起了人工智能和这些行业结合的工作。

下面我分别把这两大块做一些介绍。我们在早期的时候,第一代人和机器交互是以键盘和鼠标为主,我们最早的时候小型机的时代,一直到个人PC的时代,主要通过键盘和鼠标和机器交互,随着我们说触摸屏,互联网时代到来的话,更多的时候,大家用跟手机,跟平板做交流的时候的话,更多做多点触控这种方式和机器做交流,随着IOT时代到来的话,智能时代以语音为主,包括视觉,包括触摸这些为辅这样一种智能交互时代,我们认为是第三代,而且会越来越快进入到我们的生活。

在这里讯飞15年的时候提出AI、UI人工智能时代的这种人机交互解决方案,并且我们持续在为之优化。主要解决这种人机交互里面的五个痛点问题,第一个原厂和降噪,很多语音识别距离话筒比较近或者噪声很小的时候识别很好,但是出现距离远或者噪声大比较难,智能家居有各种噪声和回响怎么做好,这个很关键。第二个有些人有方言,或者方言味会比普通味还要重,这种场景下怎么做好,这是第二个痛点。第三个就是我们原来很多机器人人和机交互的话,术语说单攻,你说话的时候他要等,人和人交互不是这样的,是一个非常自然的交互形式,所以我们也做了很多关于人机进行双攻交互的。

第四个我们知道语音识别是一个基于概率统计体系的,概率统计体系里面一定会有错误产生,错误对理解会造成困难,结合很多领域的知识把语音识别做识别结果的一些校正或者顺滑,使得人机交互更流畅。还有多轮交互,变成以机器为中心变成以人为中心,就是机器面向人要解决的具体任务,以任务为中心看机器怎么通过多次交流,使得达到人要完成的事情。

这个技术的话讯飞语音云已经开放很长时间了,16年2月份左右上线的话,大家看到我们在一年左右时间因为这些技术和平台以及解决方案的上线,使得用户包括交互次数有些非常大的变化。

第二部分是讲我们人工智能技术和各个行业结合,给各个行业带来的变化,比如说刚才提到我们使用人工智能技术和我们这种交流的场景,比如大家可以看到在很多会议场景里面,原来会议场景有一个最重要的东西就是记者怎么整理成稿是一个很困难的事情,现在会非常容易,而且特别是我们在面向具体,我们是演讲,面向会议的话,它可以识别出我们说话人的身份,使得在整理成稿的时候更加容易辨认说话人。

第二个,我们会发现在很多场景里面,交流的时候需要进行语音的同传,原来会有非常大的麻烦,不同的领域或者不同场景要请不同的同传,因为同传如果对这个具体的领域不太熟悉的话翻译出来的效果也不太好,所以基于机器翻译的效果的话,基于交流的时候可以迅速去捕捉到大概的意思,去方便交流。

第二个的话基于移动互联网手机的应用,包括跟移动合作,提出灵犀这个品牌,定义人机交互智能助理,通过跟软件的交互,都可以完成。第二个是讯飞语音输入法,原来很多时候输入有拼音,有手写等很多输入方式,但是很多场景里面现在用语音输入发现很多人愿意使用,并且它的输入速度相比以前用拼音或者用手写有一个非常大的提升。

第三个我们说在智能家居里面使用的话,会使得交互非常容易。这一点讯飞在2015年左右发布智能家居的各种解决方案,包括音箱,还有和家电的合作,这是16年也是非常热的话题,包括谷歌、苹果、亚马逊都发布了自己智能家居解决方案,这块也是非常有意思的话题。

车载里面人机交互也是非常有意思的话题,手不能离开驾驶的时候使用语音交互是非常重要的方式,大家知道从另外一点上说,在车载环境里面的话,语音识别是非常困难的,因为噪声会比通常噪声会难很多,讯飞在2015年和2016年连续参加由宝马、奔驰、通用等公司语音技术评测,并且在评测里面都取得第一名的成绩,将来我们陆续无论在国际车场还是国内车场陆续包含这样的车机会陆陆续续上线。

关于人工智能和各个行业结合的话,大家可以看到,首先懂得这个行业,并且能够获得这个行业大的数据,同时我们利用人工智能的核心算法,以及云平台能力,使得能够给这些行业进行赋能。比如+教育,教育人最常见的难点和痛点是怎么根据学生去给他因材施教,因为我们知道在一个课堂里面,老师是没有办法对每个学生去个性化的学习和辅导,这块机器去对每个学生进行画像,根据智能算法对他进行推荐和学习,从而使得教育会有更深刻的变革。

人工智能和智慧城市的结合,包括刚才提到智能安防,包括社管云的服务,我们在一个城市的合作里面的话,通过大数据+人工智能计划的话,无论办事效率还是办事人员有一个非常大的变化。

刚才我看也提到智能医疗,我们也做了很多工作,包括我们说医生在病例生成的时候用语音录入病例,第二基于先进的图象识别技术做各种疾病的判别,特别癌症一些病的判别,同时还在做辅助诊疗的技术,基于病人的一些长期病例或者历史去做各种辅助,同时我们应该会参加今年的职业医生水平的考试,医考的机器人应该是在七八月份上线,对病人怎么诊断,怎么医疗的话,可能要做跟多工作。

讯飞在很多行业里面也做了很多应用,因为时间有限,我大概举这样一些例子是抛砖引玉,我们自己给自己定的是希望在中国用人工智能改变生活,改变世界。谢谢大家。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
科大讯飞天津沙龙完美举行 聚焦人工智能和人机交互
可穿戴设备该如何争夺物联网的入口?
语音交互和人工智能,谁更快?
演讲丨胡郁:人工智能的发展未来与创业
科大讯飞要从人车交互切入汽车智能化,还说无屏化交互是未来
这家默默做技术的创业公司,想要重新定义国产智能硬件的语音交互
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服