这一节最精彩的地方是通过链式法则将梯度向量,方向导数和偏微分总结在一起。梯度向量,方向导数是一些比较容易混淆的概念,Denis的讲解,清晰易懂,几个例子也是非常有趣。关于梯度看这个足够了。直接使用的结论如果不明白请查找最后的传送门。
回顾一下链式法则:
w的变化是由x,y,z的变化引起的。x,y,z又分别以自己的速度变化,通过的偏导数的影响直接影响原函数。偏导数告诉我们w对每个变量变化有多敏感。
用一种新的写法:
这个向量包含了所有的偏导数。每个点都会有一个向量。可以称为函数w在某一点(x,y,z)处的 梯度 (gradient)。r对t的微分就是 速度向量(velocity vector)。
定理: 令w为常数,梯度向量垂直于原函数等值面。如图,画出函数的等高线,梯度向量是指向函数值更大的方向,并且垂直于等高线(投影于2维情况)。
看一种最简单的情况:
寻找这个函数的等值面,令w=c
发现,等值面就是平面。由于平面的法向量是
这个平面的法向量就是梯度向量。
其实,对任何函数,都可以有这种线性的近似来代替函数本身。这意味着用切平面取代等值面。
再来看一个例子:
当w=c时,在等值面上有梯度向量<2x,2y>,如图所示,垂直于等值面:
要理解向着等值曲线内部移动会发生什么?假设在等值曲线上有一个动点,这会令函数值保持为一个常数。通过链式法则,我们能够知道函数变化有多快。链式法则就是理解梯度向量和等值面之间的关键点。
令 r=r(t) 是一条在等值面 w=c 上的曲线
首先观察速度向量,这个动点的速度向量和曲线相切,和等值面相切。
速度向量v和平面w=c相切,根据链式法则,我们知道w是如何变化的:
由于一直在等值面上运动,所以速度是0,所以
可以推出,梯度向量和速度向量垂直:
更进一步的说,这对任何w=c上的动点,都成立。
如果用二维来说,会有等高线,运动方向是切向量方向,梯度垂直于切向量。
找到 x^2+y^2-z^2=4 在点(2,1,1)的切平面。这个函数叫做双曲面(hyperpoloid),长得像这个样子:
这是 w=x^2+y^2-z^2 在w=4时的等值面。梯度向量是:
这是曲面或者是切平面的法向量。 在给定点处,曲面和切平面有相同的法向量。得到切平面的方程:
带入点(2,1,1),得到C=8。切平面和梯度向量如图所示:
换一个角度,使用微分来考虑:
方向导数是梯度的一个应用。
方向导数是沿着某方向上的导数,例如x轴,y轴。方向导数衡量了函数沿着某方向的变化情况。
在某点(x,y)开始,有一个向量u,沿着u的方向直线移动。同时有一个二元函数w(x,y),沿着u的方向,变化有多快?
将直线的轨迹参数化:
这个问题实际上就是求:
定义:函数w沿着u方向的方向导数,不局限于坐标轴方向:
学习偏导数的时候我们知道,偏导数是与x轴y轴平行的线做垂面所得到的截线的斜率。相似的,方向导数是沿着方向向量的垂面截取图像,得到的截线的斜率。
链式法则里,就讲解过如何去求解了。现在,可视化这个问题。沿着3D图直线方向做垂面,可以得到这个垂面的截线,截线上的某点的斜率就是方向导数:
方向导数的计算
根据链式法则:
比如说在i方向上的方向导数:
i方向上的方向导数就是x方向的偏导数。
梯度向量和方向导数的关系
已经知道
当角度为0的时候,方向导数变化最大。所以梯度向量是在给定点处函数增加最快的向量。
当角度为180的时候,方向导数是负的梯度。
当角度为90的时候,运动方向与梯度向量垂直,相当于在等值面上运动,没有大小变化。此时与等值面相切。
联系客服