外观
Lesson 40 最值定理 & 导数
约 3296 字大约 11 分钟
2025-3-21
紧致性
/Definition/
称拓扑空间 (X,T) 是紧致的 (compact),如果 X 的任何开覆盖皆有有限子覆盖.
即,∀X 的覆盖 U={Uα,α∈I},Uα∈T,都可以从 U 中选择有限个成员覆盖 X.
上节课的一个例子是 Rn 的通常拓扑空间不是紧致的,因为这样的开覆盖 U={Bn(0)∣n∈Z+} 没有有限子覆盖.
这件事情导致我们在处理 Rn 上的最值存在性问题时遇到一些麻烦.
接下来我们考虑 X⊆Rn 的紧致性:如何定义 X 的紧致性?显然我们只能选择 X 因为 Rn 而来的诱导拓扑,这是比较普遍的方案. 即,X 的开集 =(Rn 的开集 U)∩X.
/Definition/
称 X 是 Rn 的紧致子集,如果 X 在 Rn 通常拓扑的诱导拓扑下是紧致的.
具体而言,X 的任何开覆盖 V={Vα=Uα∩X:Uα 是 Rn 的开集}.
V 是 X 的开覆盖 ⟺ α⋃Vα=X ⟺ α⋃(Uα∩X)=X ⟺ α⋃Uα⊇X.
因此我们可以说,X 紧致等价于存在 α⋃Uα⊇X.
/Claim/
设 X⊆Rn,则 X 紧致 ⟺ 若 U={Uα}⊆TRn,∃⋃Uα⊇X.
证明其实在定义中讲到,这就是同义转换罢了.
但是即使我们做了这样的同义转换,我们还是要问:如何判断 X 紧致?
/Theorem/ (Borel)
设 X⊆Rn,则 X 紧致 ⟺ X 是有界的闭集 (∃BR(0)⊆X).
/Proof/
我们可以认为这是上学期证明过的 Borel 定理之推广,当然也可以看下面的证明.
“⟹”的证明:设 X 紧致,U={Bm(0):m∈Z+} 是一个 Rn 的开覆盖,理应可以在其中找到一个有限子覆盖:
Bmt(0)=Bm1(0)∪⋯∪Bmt(0)⊇X,(m1<⋯<mt)
这表明 X 有界.
接下来证明 X 是闭集,也就是证明 XC 是开集,等价于验证 XC 的每个点 y 是 XC 的内点. 为此,约定“带边球” BR(x)={y:d(y,x)≤R},显然带边球是 Rn 的闭集.
考虑
V={Vm=(B1/m(y))C}
可知 Vm 是 Rn 的开集,“一个包含一个”,大指标的 Vm 包含在小指标的 Vm 中.
m⋃Vm=m⋃(B1/m(y))C=(m=1⋂∞B1/m(y))C={y}C⊇X
因为 X 紧致,所以 ∃ 一个有限子覆盖包含 X,因此最大的指标 mt 对应的带边球包含 X,所以 XC⊇B1/mt(y)⊃B1/m(y),所有 y 均是 XC 内点,得证.
“⟸”的证明:这一个证明和上面制备开覆盖的证明过程相比,是非平凡的.
特例:I= 矩体 =[a1,b1]×[a2,b2]×⋯×[an,bn]. 来证明 I 紧致,为此,设 U={Uα}⊆TRn,反证:设 U 无 I 的有限子覆盖.
和上学期类似,用“区间套分割”的方法.
将 I 每个坐标轴方向的 [ai,bi] 均分成两份,得到 2n 个小矩体,由 I 无 U 的有限子覆盖,得到这 2n 个小矩体中一定也有一个 I1 也没有 U 的有限子覆盖,……
依次,得到矩体下降链 I⊇I1⊇I2⊇⋯Im⊇⋯,每一个均具有相同性质 (无 U 的有限子覆盖). 这相当于一种高维的区间套 (因为每个坐标上都是一个一维的区间套),得到 ⋂Im={z} 为单点集.
这样,z∈I⊂α⋃Uα,知道 z∈ 某个 Uα,由 Uα∈TRn 知 ∃Br(z)⊆Uα,所以对于充分大的 m 会有 Im⊆Uα,矛盾!
对于一般的有界闭集 X,设 V={Vα} 是 X 在 Rn 中的开覆盖. 因为 X 有界,所以取矩体 I 使得 I⊇X.
由 X 闭 ⟹ XC 开,令 U=V∪{开集 XC},则:
(α⋃Vα)∪XC⊇X∪XC=Rn⊇I
表明 U 是 I 在 Rn 中的开覆盖,有 U 的有限子覆盖,即可以从 U=V∪XC 中选取有限个成员 cover I,特别地,这有限个成员同时 cover X.
由 X∩XC=∅,得到上述选出 V 的有限个成员 cover X,这就验证了 X 紧致.
完全证毕.
X 的开覆盖 | X 在 Rn 中的开覆盖 |
---|---|
V={Vα},Vα 是 X 的开集,α⋃Vα=X. | U={Uα},Uα 是 Rn 的开集,α⋃Uα⊇X. |
所以有命题:
/Claim/
X 紧致 ⟺ X 的任何开覆盖都有有限子覆盖 ⟺ X 在 Rn 中任何开覆盖皆有有限子覆盖.
下面进一步探究:
/Theorem/
设 X 是 Rn 的紧致子集,则 X 上的任何连续函数 f 都有最值,特别地,f 有界.
X 的紧致性 ⟺ X 的任何开覆盖都有有限子覆盖,这就是说 X 在开覆盖的意义下具有某种“有限性”.
f:X→Y 连续 ⟺ f 没有被“撕开”,这样,若 X 紧致,则 f:X→Y 连续,f[X] 紧致.
因此我们先来看下面的定理和证明:
/Theorem/
若 X 紧致,f:X→Y 连续,则 f[X] 紧致.
/Proof/
来证明 f[X] 紧致,只需验证 f[X] 在 Y 中任何开覆盖 V={Vα} 有有限子覆盖.
由 f 连续知,Uα=f−1[Vα] 是 X 的开集,显然 α⋃Uα=X. 原因:
X=f−1[f[X]]⊆f−1[⋃Vα]=⋃f−1[Vα]
由 X 紧致,{Uα} 是 X 的开覆盖,得到存在一个有限子覆盖包含 X,于是
f[X]=f[Uα1∪⋯∪Uαt]=f[Uα1]∪⋯∪f[Uαt]⊆Vα1∪⋯∪Vαt
(其中用到 Uα=f−1[Vα],所以 f[Uα]⊆Vα.)
这表明 f[X] 可以被有限个 Vαt 覆盖,证明完毕.
/Proof/ (最值定理)
已知 X 紧致,f:X→R 连续 ⟹ f[X] 紧致 ⟹Borel f[X] 是 R 的有界闭集.
这就得到 f[X] 有界 (证明了有界性 / 最值定理)
由 f[X] 非空且有界,知道 supf[X] 存在 (记为 M),有命题:
/Claim/
supf[X]=M∈f[X] (表明 M 是 f[X] 的最大元素).
/Proof/
反证:设 M∈/f[X] ⟹ M∈f[X]C,由 f[X] 是闭集得到 f[X]C 是开集,从而 M 是 f[X]C 的内点,∃Br(M)⊆f[X]C,这样,(M−r,M] 中没有 f 的像点,且我们同时知道 f 的所有像点都小于 M,得到
f[X]⊆(−∞,M−r]⟹supf[X]≤M−r
与 supf[X]=M 矛盾.
因此最值定理得证.
最值定理的应用
最著名的例子是线性代数中的:
/Theorem/
实对称方阵皆可正交对角化 (实对称方阵由实的特征值)
/Proof/
可以用微积分给出证明. 设 A=(aij)1≤i,j≤n,aij=aji∈R.
考虑:
Q(x1,⋯,xn)=(x1⋯xn)Ax1⋮xn=i∑j∑aijxixj
这是连续的. 我们来求 Q 在 Sn−1={(x1,⋯,xn)∣∑xi2=1} 的最值.
最值的存在性?
Sn−1 紧致 ⟺Borel Sn−1 有界,闭集. 由最值定理,Q 在 Sn−1 上有最大值.
设 Q 在 Sn−1 上有最大值点 a.
Lagrange 乘子法
可以证明,Aa=λa.
提示
因为他还没有讲偏导数,所以这里扯到 Lagrange 乘子法实属无聊,也只能提到“可以证明”了.
问题:我们经常讨论 f:Rn→R 是否有最小值?
这里没办法使用最值定理,因为 Rn 并非紧致. 因此我们需要“剥夺”远处的点竞争最值点的权利.
/Claim/
设 f:Rn→R 连续,且 ∣x∣→∞limf(x)=+∞,则 f 在 Rn 上有最小值.
先引入一个定义:
/Definition/
∣x∣→+∞limf(x)=+∞,当且仅当 ∀k,∃M,∀∣x∣>M 有 f(x)>k.
/Proof/ (命题证明)
取 k=f(0),则由定义知道 ∃M 使得 ∀∣x∣>M 有 f(x)>k. 令 D=BM(0) 是有界闭球,用最值定理得到 f:D→R 存在最小值 f(x0) (x0∈D).
这样 ∀∣x∣>M,f(x)>f(0)≥f(x0),还有 ∀y∈D,f(y)≥f(x0),表明 f(x0)=minf.
微分 & 求导
用之前“道路”的概念,研究 g(t)=f(p(t)).
Rn 中最简单的 path 是直线段,p(t)=x0+vt,p:R→Rn. 我们允许 ∣v∣=1.
/Definition/ (多元函数的导数)
设 f:D→R,D⊆Rn. 设 x0 是 D 的内点,令 g(0)=f(x0),g(t)=f(p(t))=f(x0+vt).
则
dtdt=0g(t)=dtdt=0f(x0+vt)=t→0limtf(x0+vt)−f(x0)
称为 f 在 x0 处沿方向 v 的方向导数,记为:
∂v∂f(x0)=∂v∂f(x0)=∂v∂fx0=∇vf(x0)=Dvf(x0)=∂vf(x0)
(D 来源于导数的英文单词 derivative) 其中前三种在排版时有可能不太好看,现在大家更多使用后面几种了;当然在大量的中文教材中还是喜欢用前三种.
线性代数中,对于 Rn 空间 (线性空间) 有一组约定俗成的基底 e^1,⋯,e^n,对于基底方向的导数:
/Definition/
称 ∇e^kf(x0) 为 f 在 x0 处的第 k 个偏导数.
等价写法:
∂xk∂f(x0)=∂f(x0)=∂kf(x0)=⋯
最后一种最常用 (Levi - Civita 算符作用时一直用的是最后一种)
以分量写出,x0=(x1,⋯,xn),则
∇e^kf(x1,⋯,xn)=t→0limtf((x1,⋯,xk,⋯,xn)+t(0,⋯,1,⋯,0))−f(x1,⋯,xn)
解读为:冻结其他分量,视为关于 xk 的一元函数,再求导.
/Remark/
方向导数 / 偏导数的计算方式,实际上和一元函数情形没有区别:
∇vf(x0)=dtdt=0f(x0+vt) or ∂kf(xk)
/Claim/
∇0f(x0)=0;
∇λvf(x0)=λ∇vf(x0);
Leibniz 法则:
∇v(fg)(x0)=(∇vf(x0))g(x0)+f(x0)(∇vg(x0))
∂k(fg)=(∂kf)g+f(∂kg).
/Proof/
显然 1. 是 2. 的特例,4. 是 3. 的特例. 我们只证明 2. 和 3.
2.证明:
∇λvf(x0)=dtdt=0f(x0+λvt)=dtdt=0g(λt)=Chain Ruleg′(λt)∣t=0⋅λ=λg′(0)=λdsds=0f(x0+vs)
得证.
3.证明:
∇v(fg)(x0)=dtdt=0f(x0+vt)g(x0+vt)=Leibniz(dtdt=0f(x0+vt))g(x0)+etc.=(∇vf(x0))g(x0)+f(x0)(∇vg(x0))
得证.
我们之前在一元函数中有一个命题,说:可导一定连续. 但是多元函数中这个命题并不一定成立,一个反例:
/Example/
f(x,y)=⎩⎨⎧x∣y∣x2+y2,x=00,x=0
来证明:
- f 在 (0,0) 处有各个方向导数;
- f 在 (0,0) 处不连续.
对于 1.,v=r(cosθ,sinθ),由 ∇λvf=λ∇vf,只需要计算 r=1 情况. 那么有:
∇(cosθ,sinθ)f(0)=dtdt=0f(tcosθ,tsinθ)=⎩⎨⎧dtdt=00=0,cosθ=0dtdt=0tcosθ∣tsinθ∣⋅∣t∣=cosθ∣sinθ∣,cosθ=0
对于 2.,反证:假设 f(x,y) 在 (0,0) 处连续,则 ∀ε>0,∃δ>0 使得 ∀∣(x,y)∣<δ 有 ∣f(x,y)−f(0,0)∣<ε.
特别地,对于 (x,y)=2δ(cosθ,sinθ),会得到不等式:2δ∣tanθ∣<ε,∀θ. 但是 ∣tanθ∣ 无界,所以矛盾.