外观
Lesson 47 隐函数
约 3516 字大约 12 分钟
2025-4-18
反函数定理
总结一下上节课证明反函数定理时用到的几个步骤的作用.
设 x=f(x)=0,Jf(0)=Id.
f(x)=x+α(x),Jα(0)=0 ⟹ (微分中值定理) ∣α(x)−α(y)∣≤21∣x−y∣ (至少压缩为原来的一半) ⟹ f 在 B2R(0) 中为单射.
对于 T(x)=w−α(x),用压缩映像 (∣w∣<R/2) ⟹ 任何 ∣w∣<R/2,w 在 BR(0) 中有原像点 ⟹ 取 V=BR/2(0),U=f−1[V]∩B2R(0),得到 f:U→V 为双射.
要证明 f−1:V→U 是 C1 的. 为此有三个步骤:
a. 证明 f−1:V→U 是连续的 (为证明 3.b);
b. 证明 f−1:V→U 是可微的. 证明 ⟷ 计算极限式,用复合极限定理 ⟹ 不妨 Jf(x)=Id,验证 f−1 在 f(x) 处微分为 Id
⟹v→0lim∣v∣f−1(f(x)+v)−x−v=0
不好直接计算,于是换元 h=f−1(f(x)+v)−x (v=f(x+h)−f(x)) ⟹ 由 Jf(x)=Id 可设 f(x+h)=f(x)+h+α(h),h→0limα(h)/∣h∣=0
⟹h→0lim∣h+α(h)∣−α(h)=0
Need:当 v→0 时,h→ ? 用到 3.a 证明过的 f−1 连续 ⟹ h→0.
c. 证明 f−1:V→U 是 C1 的 ⟸ 算 f−1 的偏导数 ⟸ Jf−1 ⟸ 用 chain rule,需要已知 f∈C1,f−1 可微,f∘f−1=Id,f−1∘f=Id. 其中 f−1 可微由 3.b 证明
⟹ Jf−1(y)=Jf−1(f(x))∘f−1(y)=[Jf(x)]−1∘f−1(y),Jf−1 的矩阵元均是 Jf 的有理式,而 f∈C1 故 Jf 的矩阵元均是连续函数,于是 Jf−1 矩阵元均连续,再复合连续函数 f−1(y) (已经在 3.a 中证明过连续性),仍然连续
⟹ Jf−1 的矩阵元均连续,证明了 f−1∈C1.
以上是我们对上节课证明过程的回忆与总结.
下面看几个例子:
/Example/
n=1,f:R→R 是 C1 的,这时反函数定理为 (上学期学过)
/Theorem/
若 Jf(x0) 可逆 (⟺ f′(x0)=0 ⟺ Jf(x0)=[f′(x0)]∣x∣),则 f 在 x0 附近有 C1 的逆.
这学期我们知道了一些新的内容:n=2,f:R2→R2,f(x,y)=(u(x,y),v(x.y)). 反函数定理:
/Theorem/
若 Jf(x0,y0) 可逆,也就是:
det(∂x∂u∂x∂v∂y∂u∂y∂v)(x0,y0)=0
则在 (x0,y0) 附近 f 有 C1 的逆 f−1.
结论也可以表述为 (在物理中常用):在 x0,y0 附近,x,y 可以表示为 u,v 的 C1 函数 x=x(u,v);y=y(u,v). 物理学中经常还要求 x(u,v),y(u,v) 的偏导数:
/Method/ (1)
Jf−1(u,v)(∂ux∂uy∂vx∂vy)=[Jf(x,y)]−1=(∂xu∂xv∂yu∂yv)=uxvy−uyvx1(vy−vx−uyux)
/Method/ (2)
更加老套的微积分书中会说,直接对恒等式两边求导. 不过这种语言更加难以理解,所以略去.
隐函数定理
隐函数一般有两个来源:
物理中,我们常说“每加入一个方程进入系统,就会少一个自由度”,这句话的精确含义是什么?
数学 / 几何中,几何空间大都来自于方程的解集:
Sn−1={(x1,⋯,xn)∣x12+⋯+xn2−1=0}={f(x1,⋯,xn)=0}
一般地,
S=⎩⎨⎧(x1,⋯,xn)g1(x1,⋯,xn)=0⋯gk(x1,⋯,xn)=0⎭⎬⎫
问:S 的维数是多少?(猜测是 dimS=n−k),S 在每个点附近的形状怎么样?
最简单的情形是 n=2,k=1,S={F(x,y)=0}. 问:S 在 (x0,y0) 附近的形状?
⟷ (x0,y0) 附近,S 有哪些点?
⟷ 找更多的解 x=x0+Δx,y=y0+Δy (微分学最重要的是近似),0=F(x0+Δx,y0+Δy) (微分学近似).
Taylor 展开到一阶:
F(x0,y0)+ΔxFx(x0,y0)+ΔyFy(x0,y0)⟹ΔxFx(x0,y0)+ΔyFy(x0,y0)=0
若 Fy(x0,y0)=0,Δy≈−Fx(x0,y0)/Fy(x0,y0)⋅Δx,因此对于每一个 Δx,都能唯一地给出一个近似解. 于是我们就能获得 (x0,y0) 附近的一族近似解,形如一条直线 (因为 Δx/Δy 是固定的).
我们相信,这一族近似解可以被我们变为一族精确解,这种“相信 / 猜想”就是隐函数定理.
/Theorem/
设 f∈C1(R2) (主要是为了能够做 Taylor 展开),(x0,y0)∈S={(x,y)∣F(x,y)=0}.
若 Fy(x0,y0)=0,则 ∃x0 附近的在 R 中的开区间 U 以及 C1 映射 g:U→R 使得 {(x,g(x))∣∀x∈U}⊆S (即 F(x,g(x))=0,∀x∈U).
称 g:U→R 为由方程 F(x,y)=0 所确定的、y 关于 x 的隐函数. 进一步,有
g′(x)=−Fy(x,g(x))Fx(x,g(x)),∀x∈U
若 Fx(x0,y0)=0,则类似上面,可定义 x=h(y). 这时有
h′(y)=−Fx(h(x),y)Fy(h(x),y),∀y∈V
/Proof/ (要用到反函数定理)
构造 f:R2→R2 为 f(x,y)=(x,F(x,y)),则 f(x0,y0)=(x0,0),Jacobian 的行列式为
detJf(x0,y0)=det(1∂x∂F(x0,y0)0∂y∂F(x0,y0))=Fy(x0,y0)=0
可用反函数定理,∃(x0,y0) 的邻域 N,∃(x,0) 的邻域 W,使得 f:N→W 为双射,且 f−1:W→N 是 C1 的,由此可在 N 中求出 F(x,y)=0 的全部解.
(x,y)∈N 且 F(x,y)=0
⟺ (x,y)∈N 且 f(x,y)=(x,0)
⟺ (利用双射条件) (x,0)∈W 且 (x,y)=f−1(x,0)
⟺ (x,0)∈W 且 y=(f−1(x,0) 的第二坐标分量)
⟺ (x,0)∈W 且 y=p2(f−1(x,0))=p2∘f−1(x,0).
令 g(x)=p2∘f−1(x,0),由 f−1∈C1,p2∈C1 知道 g∈C1,得证.
同时由上面的证明过程,我们还可以知道 N 中 F(x,y)=0 的全部解 (x,y) 形如 (x,0)∈W 且 y=g(x).
最后,取 x0 在 R 中开区间邻域 U 使得 U×{0}⊆W,则 ∀x∈U,(x,g(x))∈S.
求隐函数的偏导是简单的,困难的部分就是上面证明的 ∃C1 的隐函数.
若已经存在 C1 的隐函数,则有恒等式:F(x,g(x))=0,∀x∈U. 求导:
0=dxdF(x,g(x))=chain ruleFx(x,g(x))+Fy(x,g(x))g′(x)
所以得到上面写过的 g′(x) 表达式.
/Remark/
实际上,我们的证明过程中给出的比我们最开始想要得到的结果更强.
定理中只说了 (x,g(x)) 是 F=0 的解,但是证明中我们发现 N 中 F=0 全部的解均形如 (x,g(x)).
F(x,y)=0 时,有两种情形:
- Fy(x0,y0)=0 ⟹ y 是 x 的隐函数;
- Fx(x0,y0)=0 ⟹ x 是 y 的隐函数.
这两种情形说明 S 在 (x0,y0) 附近是“规则”的,在第一种情况下,S 在 (x0,y0) 附近 ≅ U (开区间):P:U→S∩N,Q:S∩N→U,它们互逆,给出了一个 C1 的 微分同胚.
(
怎么开始说这个了.jpg
)总结一下:若两个偏导数有一个不为零,则 S 在 (x0,y0) 附近的解集形如一个 R1.
/Remark/
若两个偏导数全部为零,那么这个解集会很坏吗?
那很坏了.
S 在 (x0,y0) 附近形状不规则.
/Example/
F(x,y)=xy,在 (0,0) 附近会出现分叉;
更有甚者,F(x,y)=xy(x+y),会出现三分叉,而且这些奇异的点无法具体分类,因为可能性太多.
/Definition/
称 (x0,y0) 是 S={F(x,y)=0} 的光滑点,若 (Fx,Fy)=(0,0);否则称奇异点 (singular point).
一般我们在微积分中遇到的都是光滑点,遇到奇异点会特殊说明,并且需要非常小心地处理.
出于推广的精神,我们写出一般的隐函数定理:
/Theorem/ (一般的隐函数定理)
设 F∈C1(Rn),a=(a1,⋯,an)∈S={F(x1,⋯,xn)=0},且 Fxn(a)=0.
/Draft/
0=F(a1+Δx1,⋯,an+Δxn)≈Fx1(a)Δx1+⋯+Fxn(a)Δxn
若 Fxn(a)=0,则可以把 Δxn 用其他的量表示,因此 (Δx1,⋯,Δxn−1)⇝ 确定了一个近似解.
则存在 (a1,⋯,an−1) 在 Rn−1 中的开邻域 U 以及 C1 隐函数 g:U→R 使得:
F(x1,⋯,xn−1,g(x1,⋯,xn−1))=0,∀(x1,⋯,xn−1)∈U
更一般地,考虑有 k 个方程的情形:
/Theorem/ (终极进化版)
设 F1,⋯,Fk∈C1(Rn),记 S 为:
S:={(x1,⋯,xn)∣F1(x1,⋯,xn)=⋯=Fk(x1,⋯,xn)=0}
(上面的下标表示第几个函数,而不是偏导数的意思)
设 a=(a1,⋯,an)∈S.
/Draft/
⎩⎨⎧0≈∂x1∂F1Δx1+⋯+∂xn∂F1Δxn⋯0≈∂x1∂FkΔx1+⋯+∂xn∂FkΔxn
n 个未知元、k 个线性方程,因此有 k 个主元 (need k×k 系数矩阵可逆)、n−k 个自由元.
若有:
det∂xn−k+1∂F1(a)⋮∂xn−k+1∂Fk(a)⋯⋱⋯∂xn∂F1(a)⋮∂xn∂Fk(a)=0
则 xn−k+1,⋯,xn 可表示为 x1,⋯,xn−k 的 C1 隐函数,具体而言,∃(a1,⋯,an−k) 在 Rn−k 中的开邻域 U 以及 k 个 C1 映射 gn−k+1,⋯,gn:U→R 使得 ∀(x1,⋯,xn−k)∈U,则:
(x1,⋯,xn−k,gn−k+1(x1,⋯,xn−k),⋯,gn(x1,⋯,xn−k))∈S
/Definition/
称 a∈S 是 S 的光滑点,若至少一个 version 的隐函数定理条件成立,也就是说:
∂(x1,⋯,xn)∂(F1,⋯,Fk)a=∂x1∂F1(a)⋮∂x1∂Fk(a)⋯⋱⋯∂xn∂F1(a)⋮∂xn∂Fk(a)k×n
满秩 (rk=k).
若不满秩,则为奇异点.
隐函数定理的应用
切空间
回忆我们中学时学到的“切向量”、“切平面”定义,考虑一个质点被限制在在某个区域上运动所产生的速度矢量:
/Definition/ (切向量和切空间)
设 M⊆Rn,p0∈M,所谓 M 在 p0 处的一个切向量 v,是指 ∃C1 path p:(−ε,ε)→M (M 上的运动路径) 使得 p(0)=p0,p′(0)=v.
进一步,可以定义 M 在 p0 处的切空间为 Tp0M={M 在 p0 处所有切向量}.
我们想要写出这个切空间的具体表达式,也就是:已知 M={F1=⋯=Fk=0} 以及 M 的光滑点 a,确定 TaM.
/Theorem/
TaM=(span{∇F1(a),⋯,∇Fk(a)})⊥ (法向量所张成空间的正交补).
/Proof/
(1) 证明 LHS⊆RHS.
设 v 是 M 在 a 处的切向量,由定义知存在一个 C1 的路径 p(t)=(p1(t),⋯,pn(t)) 使得 p(0)=a,p′(0)=v.
由 p(t)∈M 知,Fi(p1(t),⋯,pn(t))=0,∀t∈(−ε,ε).
求导:
0=dtdFi(p1(t),⋯,pn(t))t=0=∇Fi(a)⋅p′(0)=∇Fi(a)⋅v
因此 v⊥∇Fi(a),因此 v⊥span{∇Fi(a)},也就是 LHS⊆RHS.
(2) 证明 RHS⊆LHS (这个稍微难一点,要用到隐函数定理)
设 w∈RHS,则 w⊥∇Fi(a) (∀1≤i≤k).
来证明 w∈TaM ⟺ 构造 M 上的一种运动,为 p:(−ε,ε)→M,使得 p′(0)=w.
由于 a 是 M 的光滑点,所以 [∂xj∂Fi(a)]i,j 满秩,也就是 ∃k×k 子式可逆,不妨取:
[∂xj∂Fi(a)]1≤i≤k,n−k+1≤j≤n
可逆.
回忆以隐函数为分量的点 ∈M,容易构造 M 上的 path.
这时 xn−k+1,⋯,xn 可表示为 x1,⋯,xn−k 的隐函数 gn−k+1,⋯,gn,即 ∀(x1,⋯,xn−k)∈U,有
(x1,⋯,xn−k,gn−k+1(x1,⋯,xn−k),⋯,gn(x1,⋯,xn−k))∈M
构造这样的 path:p:(−ε,ε)→M 为 (我们希望 p′(0)=w,但是先不管后 k 个分量)
p=(a1+tw1,⋯,gn−k+1(a1+tw1,⋯),⋯)∈M
且 p(0)=a,因此 p′(0)∈TaM=LHS,记 p′(0)=(w1.⋯,wn−k,vn−k+1,⋯,vn),我们要证明 p′(0)=w.
因为 p′(0)∈TaM⊆RHS,因此 p′(0)⊥∇Fi(a),由 w⊥(span)⊥ 知:w⊥∇Fi(a).
⟹ p′(0)−w⊥ any ∇Fi(a),其中:
p′(0)−w=(0,⋯,0,vn−k+1−wn−k+1,⋯.vn−wn)
所以:
∂1F1(a)∂1F2(a)⋮⋮∂1Fk−1(a)∂1Fk(a)⋯⋯⋱⋱⋯⋯∂nF1(a)∂nF2(a)⋮⋮∂nFk−1(a)∂nFk(a)0⋮0vn−k+1−wn−k+1⋮vn−wn=0⋮0
可证 v∗=w∗ (非零部分相等),于是 w=v=p′(0)∈TaM,得证.