外观
Lesson 41 多元函数的可微性
约 2200 字大约 7 分钟
2025-3-26
方向导数
∂v∂f(x0)=dtdt=0f(x0+vt)=t→0limtf(x0+vt)−f(x0)
反映了 f 在 x0 处沿 v 方向的变化率. 上节课我们证明了,
∂(λv)∂f=λ∂v∂f
λ 出现在分母上,但是最后的效果是整体乘上一个 λ,这说明我们这种类似分数的记法并不十分贴切,在定义式中 v 更多地出现在分子中.
偏导数:
∂xk∂f(x0)=∂e^k∂f(x0)
是在坐标正方向的方向导数. 事实上,我们可以将它视为“冻结” else xi,视 f 为 xk 的一元函数再对 xk 求导. 在这种意义下,多元函数求导 ⟶ 一元函数的求导.
有些人乐意给偏导数一个几何意义:函数 f 的图像在某个 xk 轴对应的二维截面上的那条曲线的切线斜率,就是 ∂kf(x0). 但是这样看来这种几何解释并不是十分直观,也并不好应用.
提示
我这个“释”字写对了吗?—— 艾神
上次我们有一个例子,指出即使一个函数有各方向的方向导数 (我们称这种性质为可导),也不一定能证明其连续. (可导 = 连续) 我们给出一种解释:
- 可导 ⟷ x 沿直线方式靠近 x0 时 f 有变化率;
- f 在 x0 处连续 ⟷ x 沿任意方式靠近 x0 时都有变化率.
可以发现,高维情况下直线的趋近方式并不能刻画任意的趋近方式,但是对于一维这两种方式并无区别.
/Example/
f(x1,⋯,xn)=(x1⋯xn)Ax1⋮xn=i∑j∑aijxixj
不妨假设 A 对称.
上面的函数实际上是一个二次型,有
f(x1,⋯,xn)=i=1∑naiixi2+2i<j∑aijxixj
我们现在来计算其偏导数. 这时候我们要把它视为 xi 的一元函数:
f=aiixi2+2k<i∑akixkxi+2i<l∑ailxixl+else⟹∂xi∂f=2j=1∑naijxj
以上是对上节课的复习.
可微 / 微分
在多元函数中求导并非一个好的概念,其局限性在于它并不对应连续,每次只能关注一个方向上的局部行为.
回忆一元情形,我们发现还有一个另外的概念“可微” ⟺ 可导 ⟹ 连续,对于多元函数,可微是更加基本的概念.
回忆一元函数中可微的定义:
/Definition/
对于一元函数 f,f 在 x0 处可微 ⟺ ∃ 线性映射 L:R→R,满足 f(x0+h)=f(x0)+L(h)+α(h),∀h∈Br(0) (∃r∈R+),且 h→0limhα(h)=0.
对于多元函数,几乎完全一致:
/Definition/
对于多元函数 f,f 在 x0 处可微 ⟺ ∃ 线性映射 L:Rn→R,满足 f(x0+h)=f(x0)+L(h)+α(h),∀h∈Br(0) (∃r∈R+),且 h→0lim∣h∣α(h)=0.
并称满足上述条件的唯一的线性映射 L 为 f 在 x0 处的微分,记为 dfx0:Rn→R (现在西方国家的一些教材里面更多地写作 Df:Rn→R).
/Lemma/
满足条件的线性映射 L 是唯一的.
/Proof/
若有两个线性映射 L1 和 L2 均满足条件,则 L1(h)+α1(h)=L2(h)+α2(h),于是
h→0lim∣h∣L1(h)−L2(h)=h→0lim∣h∣α2(h)−α1(h)=0
设 L1(h)−L2(h)=i=1∑naihi,则取一个探测方向 e^k,路径为 p(t)=e^kt,这时候映射是复合映射:
R∣{0}⟶pRn∣{0}⟶q(h)=∣h∣∑iaihiR
由 h→0limq(h)=0,t→0limp(t)=0,满足复合极限定理的修正 I,因此每一个 ak 都是零,两个线性映射是同一个映射.
微分是 f 在 x0 附近的线性近似.
/Example/
线性映射的微分是自身.
设 f:Rn→R 为线性映射 f(x)=i=1∑ncixi,保加法和数乘. 从而 f(x0+h)=f(x0)+f(h)+0,就是自身.
1940 年代才开始使用映射的语言来描述微分,更早以前的表述是“函数”,如果混用这两种语言,我们在某方向的微分为 dXi(h)=hi,∀h∈Rn.
我们一开始引入可微的概念是为了连续性,现在我们来看微分的一些效果:
/Theorem/
设 f 在 x0 处可微,则有:
- f 在 x0 处连续;
- f 在 x0 处有各个方向导数;
- ∇vf(x0)=n=1∑n∂xi∂f(x0)vi.
/Proof/
由可微的定义知,f(x0+h)=f(x0)+L(h)+α(h),h→0lim∣h∣α(h)=0.
验证 x→x0limf(x)=f(x0) ⟺ 换元 h=x−x0 之后有 x→x0limf(x0+h)=f(x0).
后者成立的理由:
h→0limf(x0+h)=h→0lim(f(x0)+L(h)+α(h))=f(x0)+h→0lim∑aihi+h→0lim∣h∣α(h)⋅∣h∣=f(x0)+0+0⋅0=f(x0)
算方向导数:
∇vf(x0)=t→0limtf(x0+vt)−f(x0)=t→0limtL(vt)+α(vt)=L(v)+t→0lim∣vt∣α(vt)⋅t∣vt∣
为计算第二项,考虑复合极限:
R∣{0}⟶pRn∣{0}⟶q(h)=∣h∣α(h)R
满足修正 I,所以上面的第二项是一个为零的极限乘以一个有界的量,得到最终极限值为零. 因此方向导数是:
∇vf(x0)=L(v)=dfx0(h)
取 v=e^k,得到偏导数:
∇e^kf(x0)=dfx0(e^k)
任意方向上的方向导数是
∇vf(x0)=dfx0(i∑vie^i)=i∑vidfx0(e^i)
最后的一个式子利用了微分的线性性,这个式子的形式类似于一个内积,所以我们引入 gradient:
/Definition/ (gradient)
f 在 x0 处的梯度向量定义为
gradf=(∂x1∂f(x0),⋯,∂xn∂f(x0))
也记为 ∇f(x0).
定义 gradient 之后,若 f 在 x0 处可微,则其方向导数为
∇vf(x0)=⟨gradf,v⟩=⟨∇f,v⟩
也就是说,方向导数是梯度与方向的内积.
有人误以为上面的式子永远成立,但是实际上有成立条件:
/Example/
f(x,y)=⎩⎨⎧x∣y∣x2+y2,x=00,x=0
之前计算过方向导数:
∇(cosθ,sinθ)f(x,y)=⎩⎨⎧0,cosθ=0cosθ∣sinθ∣,cosθ=0
这里的梯度和方向内积不能计算出方向导数.
上面式子的成立条件是可微.
由以上的定理,我们可以表述微分:
dfx0(h)=∇hf(x0)=i=1∑n∂xi∂f(xi)hi=(∂x1∂f(x0)⋯∂xn∂f(x0))h1⋮hn
其中的那个行向量是 dfx0:Rn→R 的表示矩阵.
/Remark/
有人可能会有疑问:表示矩阵不是就是梯度吗?
事实上这是因为我们不太要求严谨性,如果我们坚持所有的向量都是列向量,那么原来的梯度应该写成列向量. 但是在微积分里面我们不至于分不清我们说的是什么,没必要这样强调.
作为线性映射的等式,我们可以写成
dfx0=∑∂xi∂f(x0)dxi
在 f 的可微点皆成立.
省略 x0,有更抽象的写法:
df=i=1∑n∂xi∂fdxi=i=1∑n∂xi∂fdpi
后一个式子是将微分全部用映射语言写出.
由定理,我们知道表示矩阵至多有一种. 为判断是否可微,充要条件是:
h→0lim∣h∣f(x0+h)−f(x0)−i=1∑n∂xi∂f(x0)hi=0