打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
2022特斯拉人工智能日完整版(二):机器人技术介绍
这是9月30日,2022年特斯拉人工智能日活动完整版的第二部分,由机器人团队的负责人Milan Kovac和七位团队成员共同介绍擎小柱机器人所采用的技术。
视频总长约29分钟,本文字数约7千5百。
源视频:Tesla / 翻译及字幕:瓦砾村夫
2022特斯拉人工智能日完整版跳转链接
1/ 马斯克开场白,并展示机器人
2/ 机器人技术介绍(本篇)
3/ 自动驾驶技术介绍(翻译进行中)
4/ Dojo介绍翻译进行
5/ 现场问答
23分钟精剪版

一 整体介绍

Lizzy:好的,谢谢你,埃隆。

好的,你们今天已经看到了几个机器人,让我们快速的回顾一下时间线。去年我们公布了特斯拉机器人的概念,但一个概念远远不够,我们知道,我们需要一个真正的开发和集成平台,尽快在实践中进行学习。

那个出场为你们进行了表演的机器人,我们用6个月就制作完成了,并在此后的几个月内进行了软件集成和硬件升级。但与此同时,我们也在设计下一代的机器人,这边的这个机器人。这个家伙,植根于车辆设计工艺的基础之上,我们正在利用我们已经拥有的所有这些经验。

显然,从去年开始,有很多事情发生了变化,但你会发现,有几点仍然没变。我们仍然非常细致地关注真实人类的形态。我们认为这很重要,这里有几个原因,不过不重要。我们花了很多时间来思考人类的身体是多么的神奇,我们有令人难以置信的运动范围,通常有着非常惊人的力量。

一个有趣的测试是,如果你把指尖放在你面前的椅子上,你会注意到,你的肩部和肘部拥有巨大的运动范围,不需要移动你的指尖,你就可以往各个方向移动这些关节。

但对于机器人而言,它的主要功能是做真正有用的事情,它也许不一定马上就需要所有这些自由度。因此,我们把它缩减到最低限度,28个基础自由度,除此之外,当然还有手部。

人类在某些事情上的效率很高,而其他事情就没那么高。比如说,我们可以吃少量的食物,就能维持几个小时的生命,这很棒。但我们只是坐着的时候,无意冒犯,我们是很低效的,我们只是在消耗能量。

在机器人平台上,我们的计划是,我们打算尽量减少空闲时的耗电,把它降到尽可能低的水平。这样一来,我们只要切换开关,机器人就会进入能做有用工作的状态。

让我们来仔细聊聊这最新一代的机器人,好吧。在屏幕上,你看到橙色的部分是驱动器,我们稍后会具体介绍,蓝色是我们的电气系统。

既然我们进行了基于人类的研究,也拥有了我们第一个开发平台,我们就可以从这个设计出发,开展研究,开始执行。再次强调,我们采用了车辆设计的基础,从概念到设计和分析,到建造和验证。在这个过程中,我们对成本和效率等因素进行优化,因为最终,这些都是这个产品走向规模化的关键指标。

我们如何做到这一点?

我们减少我们的零件数量,尽量降低每一个元素的功耗。

我们减少四肢的传感和布线,你可以想象,你的手脚末端如果很重,移动起来就会很困难,而且很耗电。

我们把电源和计算都集中到平台的物理中心。在躯干的内部,我们安装了电池组,它有2.3度电,这对于一整天的使用来说是完美的配置。这个电池组的独特之处在于,所有电池电子元件都集成在电池组一块PCB上,这意味着,从传感到熔断,充电管理和电源分配,所有功能都在一个地方。

我们正利用我们的汽车和能源产品,把所有这些关键功能集成到该电池中。这是精简制造工艺,真正有效而简单的冷却方法,电池管理,以及安全性。当然,我们可以利用特斯拉现有的基础设施和供应链来开展生产。

接下来是大脑,它不在头部,但很接近。同样在躯干里,我们安装了中央计算机。如各位所知,特斯拉已经在我们生产的每辆汽车上配备了FSD计算机。我们想利用autopilot的硬件和软件来开发人形机器人平台,但因为它的需求和外形因素不同,我们首先要作出一些改变。

它要能做人脑所做的一切事情:处理视觉数据,根据多传感器输入做出极快速的决定,还有通信。为了支持通信,它配备了无线连接以及音频支持。然后,它还具有硬件级别的安全功能,这对于保护机器人和机器人周围的人都很重要。

现在我们完成了核心部分,我们需要在这个家伙身上安装四肢。我们很乐意向大家展示我们的执行器和我们功能齐全的双手,但在此之前,我想邀请Malcolm,他会介绍一下我们机器人的结构基础。

二 结构基础

Malcolm:谢谢Lizzy。

特斯拉有能力实现高度复杂的系统,它们比碰撞要复杂得多。这里你可以看到,Model 3的碰撞仿真,叠加真实的物理碰撞,它的准确程度令人难以置信。

这个仿真模型究竟有多复杂性?它包括每一个螺栓,每一个焊点,而且有3500万个自由度,非常惊人。可以说,如果没有这样的模型,我们就没法生产出世界上最安全的汽车。

那么,我们是否能利用我们在汽车端的能力和方法,来影响机器人呢?嗯,我们可以制作一个模型。

既然我们有碰撞软件,我们可以使用同样的软件,我们可以让它摔倒,目的是为了确保:当然最好是别摔,但如果摔倒,也只是表面损伤。例如,我们不想让它的手臂齿轮箱断裂,那相当于机器人肩膀脱臼,修起来既困难又昂贵。我们希望它振作起来,继续完成它的任务。

如果我们也能采用同样的模型,用之前现成模型的输入来驱动驱动器,进行实时仿真。这是机器人为完成我们的任务需要做出的动作,这些任务包括拿起箱子,转身,下蹲,上楼。不管什么任务,我们都可以用这个模型进行仿真。

这里展示的,是简单的行走,我们可以生成所有零部件的应力,以帮助我们优化这些部件。

这些并不是跳舞机器人,它们实际上是机器人的模式化行为,前五种模式。通常,人们在生产机器人时,他们会确保首个模式的频率是大几赫兹,最高10赫兹。这样做,是为了让对于行走的控制更容易,如果你不能保证脚的准确移动,就很难走路了。

生产一个机器人还可以,我们想要生产几千个,也许几百万个。用碳纤维和钛进行生产,太奢侈了,我们想用塑料,并不太硬的材料来生产机器人。我们不能有这么高的要求,我叫它们傻要求,我们必须用低要求的材料就让它运行,这能行吗?

如果你想一想,很抱歉,但我们自己也只是一些胶状物体和骨头的组合。我们的频率不高,如果我单腿站立,我的震动频率不会超过10赫兹。我们人类是以低频工作的,所以机器人实际上也可以,只是控制会变得更难。

我们从这里获取信息,模式化数据和刚度,并将其输入控制系统,让它能够行走。

稍微转换下话题,看看膝盖,我们可以从生物学得到一些启发,我们可以看看,膝关节的结构优势是什么。事实证明,它实际上与四连杆结构非常相似,具有相当高的非线性。

这并不奇怪,因为当你弯腿的时候,膝盖上的扭矩,在弯曲时要比在伸直时大得多,你会期望这是一个非线性函数。事实上,生物学的确是非线性的,这就相当契合了。

这就是四连杆,它显然不是物理上的四连杆,但特征是相似的。

弯曲膝盖,还种说法不是很科学,让我们更科学一点吧。我们通过这张图,展示了所有的任务。这里展示的是,捡东西,走路,下蹲,对于不同任务计算的应力。这里,纵轴是膝盖的扭矩,和横轴膝盖弯曲程度的对应关系。

这显示了,为完成所有这些任务,膝关节的需求是什么样的,然后用一条曲线连接各个波峰,这就是,让机器人完成这些任务所需的膝关节扭矩。

我们看一下四连杆,也就是这条绿色曲线。这是说,四连杆的非线性,在这里力学特征被线性化了。这实际上说明,这个结构降低了力量的要求,能让驱动器只拥有最小的力量。这是最有效的,因为我们想慢慢地消耗能量。

蓝色曲线是什么?蓝色曲线表示的是,如果我们没有四连杆,如果大腿下是机械臂,用驱动器连接,一个简单的二连杆,这是采用二连杆你能得到的最好参数。它表明,这将需要驱动器产生大得多的力,就会很低效。

那么,实际运行是什么样子呢?正如你所看到的,连接装置紧密的包裹在膝盖中。等它一会儿变透明,你会在那里看到四连杆。它是基于驱动器运行的,这决定了驱动器的力和位移。

接下来请Constantinos给大家介绍,生产,设计和优化这些驱动器的细节。谢谢!

三 驱动器(actuator)

Constantinos:谢谢Malcolm。

我想谈谈,我们机器人的设计流程和驱动器组合。

谈到动力系统的设计,在汽车和机器人之间有许多相似之处,这里最重要的因素,是耗能,质量和成本。我们将汽车上的大部分设计经验带到了机器人上。

在这个例子里,你看到一辆有两个驱动单元的汽车,这两个驱动单元用来将汽车从0加速到60英里时速。而机器人有28个驱动器。

在驱动器层面,任务并不清晰,我们有更高层次的任务,如走路,爬楼梯或搬运重物,这些都需要转化为关节的参数规格。因此,我们使用我们的模型,为关节生成扭矩,速度和轨迹,这些数据然后输入给我们的优化模型,并运行优化流程。

这是机器人能够完成的其中一个任务,转弯并行走。有了扭矩,速度和轨迹之后,我们画出驱动器的效率图,我们可以沿着这个轨迹,生成任务的功耗和累积能耗与时间的关系。这样我们就能定义特定驱动器的系统成本,并把一个简单的点放入云中。然后,在我们的集群中求解,我们为成千上万的驱动器重复同样的计算。

红线表示帕累托前沿,这是我们要寻找的最佳区域,X表示我们为这个特定关节所选的最佳驱动器设计。现在,我们需要对每个关节都做同样的事情。我们有28个关节需要进行优化,对于每个关节的规格参数,我们再次解析我们的云。这次的红色X表示每个关节的定制驱动器设计。

这里的问题是,我们有太多独特的驱动器设计。即使我们利用了对称性,仍然有太多设计。为了促成大规模生产,我们需要减少独特驱动器设计的数量。因此,我们进行一个称之为共同性研究的任务,再次解析我们的云,这次,是为了寻找那些能同时满足一个以上关节的性能要求的驱动器。

最终的组合是六个驱动器,它们以彩图的形式显示在中间的图上。在这张幻灯片上,也可以看到这些驱动器:三个旋转驱动器和三个线性驱动器。

所有的驱动器都有很大的输出力量或单位质量扭矩,特别是,旋转驱动器集成了一个机械离合器。在高速侧,是角接触球轴承;在低速侧,是一个交叉滚柱轴承,而齿轮组是一个应变波齿轮。

这里有三个集成的传感器,以及定制的永磁机。线性驱动器... 不好意思,线性驱动器有行星滚柱,和一个倒置的行星螺杆作为齿轮组,这保证了效率,紧凑性和耐用度。

为了证明我们线性驱动器的能力,我们设计了一个实验,以测试它的极限。请你们欣赏这段视频。

我们的驱动器能够举起,一架重达半吨,九英尺长的音乐会大钢琴。这是一个需求,不是可以选择性实现的功能。因为当我们的肌肉被直接驱动时,它们也能做到这一点。当被直接驱动时,我们的肱四头肌可以同样做到这一点。

只不过,膝关节是一个上齿轮联动系统,在脚跟末端处把力转化为速度,从而给人体带来了灵活性。这是人类身体最神奇的地方之一。

我的发言到此结束。我想欢迎我的同事Mike,他将谈谈关于手的设计。非常感谢大家!

四 手的设计

Mike:谢谢Constantinos。

我们刚才看到了人类和仿人驱动器的强大,然而,人类也非常灵巧。人手有能力以每秒300度的速度转动,它有数以万计的触觉传感,它有能力抓取和操纵我们日常生活中的几乎所有物体。

我们的机器人手的设计,受到了生物学的启发。我们有五个手指,一个可对立的拇指。我们的手指由金属肌腱驱动,既灵活又坚固。我们具有完成大范围用力抓取的能力,同时,也为精准的抓取很薄很小的物体进行了优化。

那么,为什么选择仿人的机器手呢?

主要原因是,我们的工厂和我们周围的世界被设计成符合人体工程学。这意味着,它确保了我们工厂里的物体是可以被抓取的。它也确保了,新的物体,我们可能前所未见的物体,可以被人手,也可以被我们的机器手所抓取。

反过来说,也很有意思,因为反过来说,这些物体是为我们的手而设计的,而不是让我们的手做出改变,以迎合一个新的物体。

关于我们手的一些基本数据是,它有6个驱动器和11个自由度。它有一个手内控制器,可以驱动手指并接收传感器反馈。传感器反馈,对于了解我们正在抓取的物体和本体感受非常重要,这是让我们能识别我们手的空间位置的能力。

我们手的一个重要方面是,它具有适应性。这种适应性主要是指复杂的机制,使手能够适应于被抓取的物体。另一个重要的部分是,我们有一个不能反向驱动的手指驱动装置。这种抓取机制使我们能够握住并运送物体,而不需要打开手部马达。

你们刚刚听到了我们是如何设计特斯拉机器人的硬件的,现在请Milan和我们的自动驾驶团队,把这个机器人带入现实世界。

五 autopilot的应用

Milan:谢谢Mike。

好的,我们在视频中所展示的所有这些很酷的内容,都是在短短几个月内完成的。感谢过去几年里我们在autopilot上取得的出色进展,大部分的组件都可以很容易地移植到机器人的环境中。

你可以想一想,这只是把轮子上的机器人,变成长了腿的机器人而已。其中某些组件是非常相似的,而另一些则需要我们付出更多的工作。例如,我们的视觉神经网络,直接从autopilot移植到了机器人的环境中。

这就是稍后autopilot团队将要进一步介绍的占用网络。在这个视频里,同一个网络现在运行在机器人上,唯一改变的是我们必须为此重新收集的训练数据。

我们还在努力寻找方法,利用神经辐射场方面的工作来改进这些占用网络,来获得机器人周围环境良好的体积深度渲染。例如,这里是一些机器人需要与之互动的机器。

另一个有趣的问题是,在室内环境中,大多数情况都没有GPS信号,你怎么让它导航到目的地呢?比如,找到离它最近的充电站。

我们一直在训练更多神经网络,在机器人摄像帧流中识别高频特征和关键点,并随着机器人在环境中导航,进行跨帧跨时间的跟踪。利用这些点,能更好地估计机器人的姿势,以及它在工作环境中的行走轨迹。

我们还在仿真方面做了不少工作。这就是autopilot仿真器,我们整合了机器人的运动代码。

这是一段视频,演示了在autopilot模拟器中运行运动控制的代码,展示了机器人行走的演变过程。

可以看到,我们四月份开始的时候,行走速度相当缓慢。而过去几个月,随着解锁更多关节和更多高级技术,如手臂平衡,它开始加速。

当我们从汽车转到机器人环境时,运动是一个非常不同的组成部分,因此,我认为需要作些更深入的介绍。请我的同事们上台介绍。

六 机器人的行走

Felix:谢谢Milan,大家好,我是Felix,我是这个项目的机器人工程师。我现在要介绍的是行走。

行走似乎很容易,对吧?人们每天都在行走,你甚至不需要考虑这个问题。但从工程的角度来看,行走从某些方面来说是有挑战性的。

例如,物理上的自我感知,这意味着,对于自身有一个良好的表示:四肢的长度是多少,四肢的质量是多少,脚的大小是多少,所有这些都很重要。

通过实现能效步态,你可以想象,有不同的行走方式,而它们都同样高效。最重要的是,保持平衡,不能摔倒,当然,还要协调所有肢体的运动。人类能自然而然地做到这一切,但作为工程师或机器人专家,我们必须考虑这些问题。

接下来我要介绍,如何在运动规划和控制技术栈中解决这些问题。

我们从运动规划开始,以及我们对于结合点的表示开始。对于机器人的表示,包含机器人的运动学,动力学和接触属性。对于机器人使用该模型和理想的路径,我们的运动规划器为整个系统生成了参考轨迹。这意味着,在我们模型的假设条件下可行的轨迹。

规划器目前分三个步骤工作,从规划脚步开始,以生成系统的完整运动结束。让我们更深入地了解一下工作原理。

在这段视频中,我们可以看到,在规划范围内,按照期望的路径规划脚步。我们从这里开始,然后添加轨迹以连接所有的脚步。就像人类那样,用脚趾和脚跟着地,这样我们就有了更大的步幅和更少的膝关节弯曲,以保证系统的高效率。

最后一个阶段是寻找质心的轨迹,以获得整个系统可以保持动态平衡的运动轨迹。

理想虽好,也必须要照进现实。让我们看看,如何做到这一点。

七 运动控制

Arnold:谢谢你,Felix,大家好,我叫Arnold,我将谈谈控制问题。

让我们把Felix刚才谈到的运动规划,放到现实世界一个真正的机器人上。让我们看看会发生什么。它走几步,就摔倒了,这有点让人失望。

我们还缺几个能让它真正行走的关键要素。

如Felix所说,运动规划器使用它自身的理想版本,和周围环境的现实版本,这并不完全正确。它也通过轨迹和扭力来表达它的意图,即它想要施加于世界,用以行走的力和扭矩。

现实远比任何类似模型复杂得多,而且,机器人并不是一个简化模型,它包含振动,各种模式,妥协行为,传感器噪音等等。那么,把机器人放在现实世界中时,它对于现实世界有什么影响?

呃,意外的力导致了未经建模的动态变化,出乎规划器的意料之外,而且这将导致不稳定,特别是对于一个动态稳定的系统,比如双足运动,更是如此。

对此,我们能做些什么呢?

好吧,我们对现实进行测量。我们用传感器和我们对于世界的理解,来进行状态估计。

在这里,可以看到骨盆的位置和姿态,这基本是由人类前庭系统控制的。当机器人在办公室环境中行走时,我们对质心的轨迹进行跟踪。我们有了用于完成闭环所需的所有信息,我们使用更好的机器人模型,我们使用通过状态估计获得的对于现实的理解,并把我们想要的,和现实对于我们的影响进行比较,以对机器人的行为加以修正。

在这个例子里,机器人当然不喜欢被人戳一下,但它在保持直立方面的表现也令人钦佩。

最后一点,一个会行走的机器人是不够的,要变得有用,还需要使用它的手和胳膊,让我们来谈谈操纵问题。

八 操纵物体

Eric:大家好,我叫Eric,特斯拉机器人团队,机器人工程师。

我想谈谈,我们是如何让机器人在现实世界中操纵物体的。我们希望操纵物体能尽可能的自然,并能快速的完成任务。

我们的做法是,我们把这个过程分成了两个步骤。首先,生成一个自然运动的参照库,我们可以把它们称之为“示范”。然后,我们在线调整这些运动参考,以适应当前真实世界的状况。

比如说,我们有一个人类拿起一个物体的示范动作。我们可以得到这个示范的运动捕捉,在这里,它被可视化为一系列关键帧,代表手部,肘部和躯干的位置。我们可以使用反向运动学将其映射到机器人上。

我们如果收集了很多这样的示范动作,就有了一个可用的库。

但是,单一的示范并不能适用于现实世界中的各种变化。例如,这个示范只适用于一个位于特定位置的盒子。因此,我们还通过一个轨迹优化程序,运行这些参考轨迹,按现实世界调整运动,解决手放哪里,机器人如何保持平衡的问题。

比如,如果盒子在这个位置,那么,我们的优化程序就会创建这个不同的轨迹。

接下来,Milan会讲讲擎小柱,特斯拉机器人的下一步计划,谢谢。

八 擎小柱的下一步计划

Milan:谢谢Eric。

好的,希望到目前为止,你们对我们过去几个月的工作有了很好的了解。我们开始实现一个可用的机器人,但还远远没有达到有用的程度。我们前面还有一条漫长而又令人激动的道路。

我认为,在未来几周内,我们需要完成的首要任务,是让擎小柱至少追平甚至超越小黄蜂,你们之前看到的那个机器人原型。

我们还将在我们的一家工厂内,开始专注于真正的使用场景,并致力于真正解决问题,彻底夯实将这个产品部署到现实世界的所有要素:我之前提到过,室内导航,优雅的全面管理或服务,规模化这个产品所需的所有组件。

我不知道你们的想法,但在看到我们今晚所展示的内容之后,我很肯定,我们可以在未来几个月或几年内完成这个目标,把这个产品变成现实,并改变整个经济。

我想感谢整个擎小柱团队在过去几个月的努力工作,我认为他们的工作非常出色,这一切都是在短短的六到八个月内完成的。非常感谢你们!

(以上)

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
特斯拉人形机器人真机发布!能跳舞能干活,完整技术路线公布
六轴机器人建模方法、正逆解、轨迹规划实例与Matalb Robotic Toolbox 的实现
华泰 | 机械:人形机器人再探讨——百尺竿头更进一步
奇妙的机器人世界15(一)
新时代你必须要了解的:工业机器人基础知识 !
KUKA机器人做到世界顶尖,他的组装是不是非常精密?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服