打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【BAT合伙人硬见】百度少帅顾嘉唯:人机交互和自我学习是智能硬件核心


导读
观点:智能的本质是什么?其一是人工智能,其二是人机交互。智能的前提是什么?是有学习能力,根据用户的使用经验能够自我演进和自我学习。


6月19日,在BAT跨界合伙人和创业邦联合举办的《硬·见 - 邂逅未来》活动上,百度深度学习研究院人机交互组的研究带头人顾嘉唯分享了百度在物联网上的布局思路,以及深度学习和智能硬件之间的关系和百度对于人工智能的思考,以下是他的发言:
今天的主题是智能硬件,我们做深度学习的跟智能硬件有什么关系,百度这家做互联网的企业跟智能硬件有什么关系,今天会讲一下我们的思考。今天主要讲“智能”这一块,跟大家聊聊怎么理解智能的本质。


1
智能的本质是人工智能和人机交互


智能是什么?第一个是人工智能,第二个是人机交互。智能的本质是什么?这么多智能硬件,智能手环、智能牙刷、智能水杯等等,仔细想一下,除了连上网、在手机上呈现了数据信息之外与普通电子设备有什么区别?区别智能的能力是这个产品或者系统有否具有学习能力,根据用户的使用经验能够自我演进和自我学习,那么学习能力就变成了智能硬件的核心。

第二块是人机交互,为什么这样说?回顾一下人机交互历史,以前人通过鼠标、键盘跟信息打交道,再之前用电器旋扭按键,再后来在玻璃触摸屏上做交互。智能硬件普及之后,用户就不能只停留在这三个交互维度上,需要跟硬件在多通道上发生交互。很多人问终极形态的人机交互是什么,我说终极形态是没有交互,因为没有人愿意跟机器打交道,在人工智能飞速正循环的今天,我们有机会让你身边的所有设备不断学习你的使用习惯,潜移默化地理解预测你的需求,后台全场景感知计算无处不在,前端全自动智能服务联动推送,最终实现环抱式的智能化场景。

举几个例子,这个场景(见PPT)可能大家遇见过,你下班开车去赴跟女朋友的约会,电影票你之前在糯米团购上买好了。女朋友先到了电影院,她打电话叫你把券发给她,她先去核销。你要怎么做,首先进到百度糯米找到券,然后发到微信,确认你女朋友看到这个东西,然后再跳到百度地图,找到那个位置。在开车的过程中这个行为非常危险。用户完成这样的任务,要不断的在APP之间跳转。今天用户已经习惯了在垂直APP之间跳转的行为实际上不智能。能不能把女朋友所在的位置连通,她到电影院可以跟我连到,是不是可以把我微信上的信息直接推送给她,地图的信息直接推送,能不能推送到用户所需要推送的服务是我们要考虑的。

前提是什么?首先,足够多的数据量要对行为预判进行感知。这里说一个观点,APP已经死了,智能是永生的,智能并不遥远。今天来看人们已经不只是用手机联网,逐渐发现手表、穿戴设备和家里的各个智能硬件都在联网。当数据量不断提升的时候,用户的每一个行为、每一个单体数据会连接,促成事情的可能性会越来越大。

举个例子,以前做很多事情做不起来一定程度是因为用户数据是没有的,如果今天打车没有LBS地标数据是做不起来的。现在UBER通过智能派单算法让运转效率提升挺高。每天用户的每个行为,你可能想要打的车是什么,司机想接的单是什么,根据请求和接单数量动态定价,通过大数据运转以后会做精准预测匹配。

百度外卖,我们通过优化算法完成对骑士智能调度、智能派单、路径规划,餐饮行业在互联网进来之后高效运作改变了用户生活方式,另一方面,你每天吃什么、几点吃、在哪儿找吃的。不只是打通你的用餐习惯,因为你在百度上有很多数据,在百度地图上你可以去找,包括出行数据、餐饮数据统统可以拿到。对于用户饮食的客单预测和出行的预测打通之后能做什么,我们正在努力将这些数据价值发挥到最大。

这是美国的一家在线教育网站Coursera(见PPT),他把线上、线下的课程打通了,要做的事情是知识获取和信息获取,跟踪学习轨迹,分析数据,课程推荐知道你要看什么,知道你可能对什么样的知识感兴趣。我们要考虑的问题是,当所有的数据统统打通之后能做什么。

刚才举的这些例子都属于服务性创新,不管是数据量的有限性还是运转效率的低效性,我们做了数据的连接。百度有机会做成中国最大的商圈餐饮服务商,虽然不拥有任何一家餐馆厨师和服务员;UBER是全球最大的出租车公司,但是没有拥有任何一辆车和司机。为什么百度能做这些事情?像刚才的智能派单到运营调度、学习行为的分析,统统是基于大数据的分析。

说到这儿再举一个例子,昨天在UBER一键呼叫大咖专车上给创业人把脉,其中有一家是给生鲜类配送管理的公司,主要是做to C的场景,给每个家庭配送生鲜。很多家都在做这个生鲜,因为这是很好的O2O方向。当互联网进来,把生鲜电商的物流做的更高效,你每天回到家,下班的时候定这个生鲜,回到家的时候这个生鲜就可以到家门口了。那么冰箱还需不需要,智能冰箱该往哪个方向发展,冷藏还需要吗?我们的模式创新到服务创新颠覆之后,某些智能家居,连上网呈现手机数据的智能家居还有没有意义?


2
人工智能把人类从劳力和体力活动中解放出来



刚才说到百度外卖,以前互联网是线上、线下信息层的交换提高运转效率,现在互联网+把线下物和物交换的效率提升了。物和物还是需要递送,今天还是人在完成,我们高效运转,告诉你这个单在哪个路上,要去哪个路上接这个单,这样的人的行为是不是像计算机一样,给的是0和1的指令。人在这里面扮演什么?当互联网+进来,加上物流行业,物流人员有没有被机器取代?因为做的很多事情已经像机器的指令一样。百年前,工业革命把人类从体力和劳力活动中解放出来,今天人工智能有机会把人从脑力和智力活动中解放出来。达芬奇曾经说过,骑车这个行为是非常高能的行为,因为需要通过大脑认知路况,判断路径,调动小脑完成肌腱的控制。这个在今天看来有没有可能被机器取代?我们尝试了这样的路径,有没有可能造一台自行车,这个自行车有自己骑行的能力。我们做了这样一个原型车,能够自己骑行的,完成转向,行径平衡的,感知路况的单车。(见PPT)。

大家看到了我们做这个奇特的“自行”车,背后开发过程还是很有意思的,还有我们正在研发无人车自动驾驶项目。人到今天为止,可能开第二台车、第三台车、第四台车,人和车的交互停留在方向盘和刹车上面,方向盘未来能不能被取代,现在这款车(见PPT)的方向盘已经被Google的无人驾驶工程师给干掉了。那同样在做无人车的百度怎么思考的?我们希望尽快把自动驾驶技术做成熟,从辅助驾驶到全自动驾驶。这里面,无人车也好,无人自行车也好,无人驾驶技术是集人工智能大成的,包括了感知层、理解层、决策层,还需要系统有自主学习能力。

今天现有地图只有路网的拓扑信息,我们正在使用SLAM即时定位与地图构建技术来实现对高精度三维地图数据的采集,推动无人驾驶技术的发展,这里不只是定位,还有对三维场景的语义理解,比如你到了一个岔道口,拿到前景的道路深度视觉感知,包括车道线、道路标志牌,对前方车辆实时位置检测,周围障碍物的监测,分析行人行为和并道超车的情况。另一方面,考虑这里面一个人车协同的设定,同之前提到的万物智能的本质一样,如何做到智能地学习驾驶习惯,不止是做到自动泊车跟车,应急紧急制动等,让半自动驾驶能做到和你副驾驶座上的老婆一样,在你过某个红绿灯时候就能推测出你要去的路线,我们希望创造出一匹城市中的骏马,马可以自由驰骋,同时当人要驾驭的时候,还有缰绳可以一手掌握。

跟大家分享我们原来的思考,我们跟Google的区别,马车是重要的交通工具,不管是中国的马车还是西方的马车,马本身有认知和决策,到悬崖不会自己跳下去。我们做的自动驾驶汽车的目标是创造奔跑在城市中的骏马,这是我们做自动驾驶的思路。另外一大类人类历史上的交通工具,船,是历史上很长时间使用的运输工具。大家知道船的转向是怎么样吗?船要左转,打的方向舵是右舵。为什么举这个例子?因为我们要做无人车人机交互的时候考虑到一个细节,当人的方向怎么控制的时候,比如说船这个东西带来的影响是什么,托马斯爱迪生发明第一台车的时候就是学船的方式,往左转的时候打右舵,这就是第一款人类用的车上的舵。当时这样的操作方式的发明变成了当时的一个标准,所有达官贵族都坐这样的车在路上。

这里面的问题在哪儿?即使是人类历史上这么重要的发明,还是在做相似模仿类创新,就是已经成熟的类仿型的创新。我们现在是不断做成熟型突破性创新,当无人车的出现,这个车会进入大众视野中就是革命性、突破性创新,我们要把无人车放回到原点去,当无人车技术成熟的时候怎么成熟型突破性创新,现在很多公司都做无人车,他们的思路是怎么在现有基础上创新,我们是在原点上考虑怎么改进和重新定义汽车。

人类历史上有很多应用创新和发明可以套用到这个创新Matrix中去的。手机,最早的是诺基亚的一款手机,它做的类似windows 32的九宫格的方式,直到Nokia最后的旗舰机型的桌面还是用这个九宫格。乔布斯06年把iPhone推出来,就把这个方式改变了,突破性创新。每一个大公司都会遇到什么问题,就是对于创新突破性的限制,还有一个问题是像微软、诺基亚这样的大公司,在行业完成一个标准制定之后会活得很滋润,但是会陷进去没法跳出来,我把它叫“抑制创新的重力场”,这是除了前面那个限制创新的“舵”之外,第二个局限创新的因素。早期微软在PC行业是绝对的霸主,在iPhone和iPad出现以前,很多家生态圈硬件公司给微软做了很多个人电脑移动终端,但是它用的还是在桌面电脑那套人机交互方式,没有合理地引导人在移动场景地真正的需求和数字处理行为,留给iPad和iPhone很大的机会。


3
物联网要做到通过多维感知和人工智能来理解真正用户场景需求


回到今天智能的方向,今天在百度上搜索物联网、智能硬件,会发现有非常多的内容,不只是创业者在关注,大众都已经非常关注这些方向,势不可当的趋势。这里面的核心是什么?我把物联网分成两块,一块是智能硬件,一块是自动化家居。

回到刚才的观点,很多智能硬件公司做的是左边的事情,智能硬件,这家NEST大家都不陌生,Google花37亿美金买的智能硬件公司,相比北美每家都有的常见温控设备,Nest产品设计优雅有品质,交互有特点,通过旋动物理圆壳来控制中心蓝色的圆形界面,几次使用之后,它知道用户使用温度控制的习惯,会逐渐调整配置时间和温度控制的关系等等,在办公室可以用手机远程预先调好温度。然后这张图右边的白色盒子大家知道是什么吗,有了这个智能蛋盒放在冰箱里面,在超市里买菜时可以知道家里还有多少鸡蛋。问题是,这些设备通常是手机App加一个智能硬件而已,大都是独立的智能单元体。

但用户要的是什么?是智能自动化场景。举例,早上起床闹铃把我叫醒,我当天的日历上的有我一早开会的时间地点,根据现在路况和距离推算出我还有多久要出门,提醒我有多少时间洗漱吃早饭。我的咖啡机、面包机在我闹钟响的时候就运作起来了。当我洗漱、早餐完毕之后,会议室目的地坐标就会在无人车导航里,下楼坐上车以后,直接把我运到相应的位置。用户是需要这样的智能自动化场景,但真实情况下,这种场景中的变量很多,很有可能出门之前你老爸说生病了,要带他去医院,这种场景出现了怎么办,简单的智能硬件能不能解决,简单的联网硬件无法处理和预判用户的多维场景,更没有全场景的自动化服务的可能了。

那我们来谈谈到底什么是智能化的场景,市面上一直有一类在做智能化家居的公司,大家看视频里这是kickstarter建立初期非常火的十大项目之一,看看视频是怎么操作的?从一个房间到另外一个房间,你离开的房间,灯就关上了,进到另一个房间,灯就开了,包括还可以打开音响之类的。这个场景,看似很智能、很自动化的产品,叫做Ninja Sphere。 但我说它有些可笑,为什么?因为只有单身汉家里才有可能用得上这样的场景,用这个智能设备取代开关,但问题是这样的,现实情况并没有这么简单,并不是一个简单的IFTTT条件计算逻辑。

我们来分析一下刚才的场景,比如说房间判断是不是空的,空着的,灯打开,就可以。但如果卧室里面,老婆在睡觉,怎么办?有的人说这个简单,在床上放一个传感器或者装一个Sleep Cycle,或者再狠一点可以给老婆鼻子上夹一个酣睡传感器。但如果房间一个狗在睡觉,怎么办?可以在狗上面装传感器,也能解决问题。但这些都不是事,如果老婆在沙发上面看电视,喊老公进来,先开灯找一下遥控器,把频道调到湖南卫视,再把灯关上,这时候那些所谓的智能家居产品就要疯了,还不如把老婆大脑连上电路。不过这样的实际场景才是最常见的用户场景。这里实际情况是简单的IFTTT的逻辑,在自动化家居的真实情景下是不完全适用的。

那究竟什么是智能的本质?今天上午我也提到,其实用户需要的就是自动化场景下的服务,我们会被无处不在智能设备包围,设备有感知能力,全方位的感知,收集了你很多数据,经过数据积累之后可以分析出核心事件背后的数据逻辑,对用户潜在需求进行理解。第一步是从各式传感器收集感知,第二步通过算法来理解和演进这些经验数据。一个好的智能,是具有学习能力的,是具有经验积累和学习能力的。

第三个是决策,在获得这个判断之后,怎么去判别场景和用户状态进行推送?刚才那个卧室开灯的家居场景,我们来重新思考一下,换一个思路来做,不要去妄图用智能设备取代开关,想想你的卧室里面,通常有很多个可以点亮的东西,有床边的床灯,有电视机,有壁灯。我判断两个逻辑,判断里面有没有活物,有猫有狗哪怕有外星人都没有问题,如果没有,用户进去,灯就打开,如果有的话,逻辑就把这个决策权推回给用户,通过你的手表,提示要不要开,开多亮开多久,完成这个控制权限的人机协同。上面两层,感知和理解层是不是可以做到很好的判断逻辑推送给用户。今天的互联网和物联网技术要做的事情是要进行这个层次的理解。

人工智能今天像火箭一样喷发,在过去三年到未来五年时间是这样,大数据是火箭的燃料,数据的有效性和图谱性,燃料的品质决定了喷发的速度,人工智能就好比火箭引擎,既有燃料又有引擎就可以引爆这个火箭,所以大数据和智能算法非常重要。百度在这里面思考什么?百度有一个叫百度大脑的东西。百度在今天通过很多纬度的方式获得用户的数据信息,就像我刚才说的原来获得不到的用户数据我现在都可以获得。

在互联网行业很早时候就获得了用户数据,除了网上的这些索引信息数据,通过用户手机端使用的语音、图像,可以获得多维的用户层面的信息,还可以获得物理层面的信息,我们通过这样一个平台完成云端的处理能力,这也是核心算法布局的地方,完成最后的推荐。比如说早期的广告推荐和预估,包括后来做的机器人、无人驾驶、百度无人自行车,都是完成对智能推送和控制的这一块。

简单说一下深度学习这么重要的算法核心的理念,人工智能很早就被提出来了,但是深度学习近三年迅速影响人工智能的发展,我们通过大规模并行计算和深度神经网络的算法模型完成类人脑的计算设计。以前你告诉小孩杯子里面透明的液体的是水,通过经验来教育认知,但是计算机不行,计算机必须要同一角度和光线下的图片才能识别。今天把这个多层卷织网络算法把每一个目标物体的物理属性单元体拆分,在节点上递归演算,无论是图样识别、语音识别还是用户行为的判别,都可以通过我们的算法进行识别和预测。听着很高深的技术,今天用户已经在手机上可以用到了,百度地图语音识别度这么高,它从识别、解析、合成都用到了。另外手机百度上的图像搜索、拍照搜索功能,你可以打开试一下,你可以拍一个照片,拍一件衣服会出现相似款,拍一个人脸会出现夫妻脸,拍一个苹果会出现相关的卡路里或者做菜的推荐。它已经用到感知系统了,用户用的过程同时也不断收集数据来反哺我们的后台算法。

回到智能硬件这个大方向,我们百度在过去这段时间也尝试了一些智能硬件,就是把我刚才说的百度大脑应用到智能硬件上去。我们在百度大脑这边尝试用户的衣食住行各个方面都做了原型的搭建和尝试。比如说我们做的智能自行车DuBike,很多人问我们为什么做这样的自行车,其实百度非常强的数据能力在地图上,在地图上除了导航和目的地的信息服务之外,我们有没有可能连接新的服务的可能性,让用户需要信息会主动来找你。

大家看一下我们当时的设想,举个例子,自行车骑出去,通过踏频和心率的检测推算出卡路里的消耗,进而在骑车路上坐标位置的附近告诉你有一个最近的星巴克的一杯拿铁咖啡可以推送,尝试让服务信息来找你。我们核心还是百度地图,通过地图做很多接口,让所有低速交通工具统统可以用这样的体验。由于我们做了这样的平台需要做一个硬件展现这样的能力,当时和清华美院合作了这样一款原型车(见PPT)。

这是去年完成的,我们看看用户需要什么数据,有心率、踏频、踏压,车后灯有报警,有车靠近会闪。防盗和定位等基本骑行体验,首先车要骑着舒服,还要防盗,同时骑行时候的动力回收发电花鼓为整车充电,还要有脱离手机都能运行的导航功能。用户骑行的数据,我们把全感应的数据收集上来进行数据分析。硬件非常不容易,不止是研发和供应链问题,后面分发、营销和售后等很长的环节都有很多线下实体的问题,做交通工具要有合规的,我们自己完不成这些任务,我们就找到行业最大的品牌制造商去完成这样的任务。大家可以期待一下,最后的产品可能跟这个还不太一样。

这个产品中当然有手机APP,同时有一些东西可以在上面把玩。我们去年推出这样一个网站,用户给了我们很有意思的反馈,除了想要合作和想做线下订单之外,很多人说我们很好,希望通过这样的产品提倡绿色出行,但是北京这样的霾都怎么办?像口罩、围巾这些骑行用户都会戴着,西方很多用户都戴头盔,我们能让这样的产品带起用户戴头盔的习惯吗?我们就做了这样一个风幕空气净化头盔,空气通过导流进入盔内通过AOS净化后把干净空气循环在鼻子和嘴巴前面,把脏空气挡在外面,还可以显示你在路径中吸入的PM值的量。互联网的迭代速度,让用户参与式开发,通过用户反馈及时做预判,然后通过原形去验证。

除了自行车之外,我们是怎么思考万物智能的本质,一个是人工智能,一个是人机交互。人工智能是助理,做的事情是把人和信息的交互变成像人一样去交互。屏幕会无处不在,在家里有电视,在办公室有电脑,在路上有手机,你在任何地方都可以与视觉信息交互,但是需要核心设备终端作为大脑中枢,这就是BaiduEye。我们在终极形态上做了几个不同场景的落地探索,我们想做一个半人半机器的Cyborg,让人做适合的事情,让机器做理解和预判,大家可以看一下这个视频(播放视频)。

对百度来说它是一个新的实体搜索入口,以前数据获取都是线上的,手机端的使用行为很难让用户第一视角的数据信息有持续获取的使用场景。比如这个在博物馆使用,消费者可以进行游览和导览,它可以预判你的行走停留关注等行为,识别之后对你推荐信息。今天你去旅游的地方有没有导游的体验差异很大,你可以通过这个设备来完成类似导游的用户体验。比如说今天在大商场逛花店为女朋友买花,一个屌丝不知道买什么花,如果用这个设备,打通线上数据知道女朋友的星座,可以把花语和女朋友的星座去结合。

大家知道,今天你在宜家买东西,只有在用户买单刷卡时候的消费记录知道你买了什么,不知道用户购物行为之前看过什么、浏览过什么,看过多久,线上的阿里、百度知道,但是线下不知道。我们通过BaiduEye有机会获得这样的数据,其次通过分析和打通线上所有的浏览信息,推送服务影响用户决策购物的行为。除了消费者使用起来第一视角的数据价值之外,另外一个场景是什么?可以给服务员佩戴,通过人脸识别,后台服务通过BaiduEye可以给服务员可以完成对用户标签的识别,因为零售行业和电商的线上数据是有的,给客户打标签之后可以为客户提供更好的服务,提高客单转化率。

这是我们去年5月份到9月份做的第一版产品原型(见PPT),做成了这样的穿戴式设备。看到信息就知道这里的信息推送。在过去一年当中曝光率很高,只要是说起百度的人工智能产品,百度的创新产品都会谈及BaiduEye,另一方面,我们在真实场景也做了打磨和小批量的验证,比如国家博物馆、银泰、万达商场等。过去一年我们做了很多原形的迭代,刚刚看到的视频去年第一款原型还是比较大的体量,后来通过不断在软硬件架构上的调整和优化,做了一些很小很集成的硬件原型尝试。

做一个总结,物联网和智能的核心有几个重要特性:第一,全场景的感应和全自动的服务推送,这里智能本质特性上核心企业怎么做,看到像以前索尼IBM那些做的企业好比松树,百年老店,现在小米做的是竹林,百度想要做的是土壤,在背后提供智能技术的核心平台和算法,在所有品牌的终端产品上获得用户场景的感应,让每一棵松树和竹子提供养料。第二,物联网是比手机移动互联网更碎片化的切入到用户场景,这带来更全面的入口可能性。

最后是输入、输出的人机交互特性,我们做智能硬件的时候,都会考虑一个单品从感知、思考到决策的一整套逻辑,很多创业公司做的硬件要么只做前面,要么只做后面。我们做的事情是告诉大家有了土壤之后能做什么。这里面有三个层次,今天我和大家梳理了一下智能的本质,希望大家对于物联网的理解不是大家以前以为的智能硬件,不是一个简单的连上网在手机上呈现数据的硬件就能称为智能的,这里智能核心有三个层面,首先是万物互联,其次是大数据人工智能,第三是自然人机交互。你没有屏幕,跟用户打交道就不只是在触屏上圈划、点选了,很可能明天一早起来就不是打开Yahoo Weather、墨迹天气App了解今天深圳天气怎么样,而是从床上下来打开窗户的时候问窗户的玻璃外面冷不冷。那或许,不过多久手机就在博物馆里被人缅怀了吧。


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
“百米组合”成立 发烧的小米能否就此AI上百度?
东方证券策略会之圆桌论坛—触碰未来全纪要
巨头之间的对垒 智能语音系统争夺战
智能家居
人工智能浪潮汹涌!但企业需时刻警惕其中虚火– 高工机器人新闻
移动互联网评论NO.1:移动互联网的大时代才刚开始
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服