高等微积分笔记 Lesson 15

高等微积分 Lesson 15

微分

Leibiniz 为导数设计了一个符号f(x)=dfdxf'(x)=\frac{\text{d}f}{\text{d}x},他希望将导数解释为微分之商,当然我们在之后的学习中会发现这种方式有不妥之处.

回忆ffx0x_0处可导的条件,是

limh0f(x0+h)f(x0)hAR,limh0f(x0+h)f(x0)h=AAR,limh0f(x0+h)f(x0)hAh=0AR,f(x0+h)=f(x0)+Ah+α(h),limh0α(h)h=0\begin{aligned} &\exist\underset{h\to0}{\lim}\frac{f(x_0+h)-f(x_0)}{h}\\\\ &\Longleftrightarrow\exist A\in\R\,,\quad\underset{h\to0}{\lim}\frac{f(x_0+h)-f(x_0)}{h}=A\\\\ &\Longleftrightarrow\exist A\in\R\,,\quad \underset{h\to0}{\lim}\frac{f(x_0+h)-f(x_0)-h\cdot A}{h}=0\\\\ &\Longleftrightarrow\exist A\in\R\,,\quad f(x_0+h)=f(x_0)+Ah+\alpha(h)\,,\quad \underset{h\to0}{\lim}\frac{\alpha(h)}{h}=0 \end{aligned}

虽然上面这几种表述方式都是等价的,但是我们认为最后一种表述方法更加直观. 在这种表达方式中,α(h)\alpha(h)是一个“误差项”,因为它相对于其他的项是显著小的,我们有理由称之为“误差”;同时上面还存在一个线性项AhAh,这就是我们在求导数时希望找到的.

由上面的讨论,我们能够定义微分:

/Definition/

ffx0x_0的某个邻域有定义,称ffx0x_0处可微,如果存在线性函数L:RRL:\R\to\RL(h)=AhL(h)=Ahh\forall h)使得f(x0+h)=f(x0)+Lh+α(h)f(x_0+h)=f(x_0)+Lh+\alpha(h),且有

limh0α(h)h=0\underset{h\to0}{\lim}\frac{\alpha(h)}{h}=0

并称满足以上条件的唯一的LLffx0x_0处的微分,记作

dfx0:RR\text{d}f_{x_0}:\R\to\R

/Claim/

ffx0x_0处可微 \Longleftrightarrow ffx0x_0处可导;

进一步,若ffx0x_0处可微,则有dfx0(h)=f(x0)h\text{d}f_{x_0}(h)=f'(x_0)hhR\forall h\in\R.

对于一元函数,上面的命题显然成立,这一点我们在上面已经说明了,可以发现,一元函数的“可微”、“可导”等价,而且都是“连续”的充分条件.

但是对于多元函数,“可微”能得到“可导”,反过来却不一定成立;同时这时“可微”才能得到“连续”. 所以说,“可微”是更加基本/更好的一个概念.

为什么“可微”更好?

这些概念都是在研究f(x0+h)f(x_0+h)ffx0x_0附近的行为),一旦ffx0x_0附近可微,就能直接知道f(x0+h)f(x0)+L(h)f(x_0+h)\approx f(x_0)+L(h),可以将ff近似为线性(一次函数),完全变成线性代数的内容.

就算我们不满意一阶近似,我们还可以使用 Taylor 公式进行展开,产生二次型、三次型……这些仍然是线性代数的内容(tenser).

目前我们已经定义了逐点的可微性,接下来考虑整个定义域上的可微性:

/Definition/

ffDD上可微,如果ffDD上的每点可微.
(对于一元函数,在DD上可微 \LongleftrightarrowDD上可导;对于多元函数,可微强于可导.)

进一步,若ffDD上处处可微,{dfx0:RR}x0D\{\text{d}f_{x_0}:\R\to\R\}_{x_0\in D}是一族线性映射,称之为ff的微分,简记为df\text{d}f.

“微分”概念更加偏向代数化,其几何图像不明显;我们考虑空间中的每一个点,都对应自己的一族微分,这构成所谓的“切空间”(你又开始讲微分几何了),实际上微分就是从切丛到切丛的线性映射.

已经对df\text{d}f给出了定义,我们接下来考虑一些例子.

/Example/ (dx\text{d}x的定义)

考虑恒同映射idR:RR\text{id}_\R:\R\to\R(更早的时期,人们还不会使用映射的语言,就把这个映射写成函数xx

其微分为d(idR)x0:RR\text{d}(\text{id}_\R)_{x_0}:\R\to\R,或者写成dx:RR\text{d}x:\R\to\R,而这两个映射都是将hh映射为hhhR\forall h\in\R).

这样我们能够来改写一些微分. 对可微的ff

dfx0(h)=f(x0)h=f(x0)(dx)x0(h)dfx0=f(x0)dxx0\begin{aligned} \text{d}f_{x_0}(h)=&f'(x_0)h=f'(x_0)(\text{d}x)_{x_0}(h)\\\\ \Longrightarrow\text{d}f_{x_0}&=f'(x_0)\text{d}x_{x_0} \end{aligned}

这是一个作为线性映射的等式. 这样就实现了 Leibiniz 最初的想法,即将导数写成两个微分之商. 如果没有那么小心,我们现在就能写出

f(x0)=dfx0dxx0f'(x_0)=\frac{\text{d}f_{x_0}}{\text{d}x_{x_0}}

但是要发出质疑:这样在概念上并不恰当. 一般而言,取两个线性映射,它们成比例的概率是很小的;这里因为两者均是在一元的情况下讨论,所以可以谈及比例系数,否则根本无法定义“商”.

总结一下:我们定义了ffx0x_0处的微分(也即ffx0x_0附近的线性近似),还证明了dfx0:RR\text{d}f_{x_0}:\R\to\R的矩阵表示就是(f(x0))x(f'(x_0))_{|x|}(在f:RmRnf:\R^m\to\R^n时这将是一个m×nm\times n的矩阵,但是现在它只是一个1×11\times1的矩阵).

现在我们来证明之前跳过的链式法则. 对于复合映射,有

RfRgRRdfx0Rdgf(x0)R          d(gf)x0       \begin{aligned} &\R\overset{f}{\longrightarrow}\R\overset{g}{\longrightarrow}\R\\ &\R\overset{\text{d}f_{x_0}}\longrightarrow\R\overset{\text{d}g_{f(x_0)}}\longrightarrow\R\\ &\xrightarrow{\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{d}(g\circ f)_{x_0}\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }\text{ }} \end{aligned}

这样,在线性映射的意义上,我们确定了复合映射的微分.

/Theorem/ (复合的微分等于微分的复合,or to say,线性近似保持复合)

ffx0x_0处可微,ggf(x0)f(x_0)处可微,则gfg\circ fx0x_0处可微,且

d(gf)x0=dgf(x0)dfx0\text{d}(g\circ f)_{x_0}=\text{d}g_{f(x_0)}\circ\text{d}f_{x_0}

用微分写出这个定理,就能发现至少从直观的角度,比之前的链式法则写法要好证明很多,因为甚至可以把两个线性映射都写出来证明.

/Proof/

dfx0(h)=Ah\text{d}f_{x_0}(h)=Ah(其中A=f(x0)A=f'(x_0)),dgf(x0)(v)=Bv\text{d}g_{f(x_0)}(v)=Bv(其中B=g(f(x0))B=g'(f(x_0))),由可微的定义,

f(x0+h)=f(x0)+Ah+α(h),limh0α(h)h=0g(f(x0)+v)=g(f(x0))+Bv+β(v),limv0β(v)v=0\begin{aligned} &f(x_0+h)=f(x_0)+Ah+\alpha(h)\,,\quad\underset{h\to0}{\lim}\frac{\alpha(h)}{h}=0\\\\ &g(f(x_0)+v)=g(f(x_0))+Bv+\beta(v)\,,\quad\underset{v\to0}{\lim}\frac{\beta(v)}{v}=0 \end{aligned}

从而,

gf(x0+h)=g(f(x0)+Ah+α(h))=g(f(x0))+B(Ah+α(h))+β(Ah+α(h))=g(f(x0))+BAh+[Bα(h)+β(Ah+α(h))]\begin{aligned} g\circ f(x_0+h)&=g(f(x_0)+Ah+\alpha(h))\\\\ &=g(f(x_0))+B(Ah+\alpha(h))+\beta(Ah+\alpha(h))\\\\ &=g(f(x_0))+BAh+[B\alpha(h)+\beta(Ah+\alpha(h))] \end{aligned}

接下来只要证明这样的命题,整个定理就得证:

/Claim/

limh0Bα(h)+β(Ah+α(h))h=0\underset{h\to0}{\lim}\frac{B\alpha(h)+\beta(Ah+\alpha(h))}{h}=0

/Proof/

首先,极限中的第一项由定义就知道为00. 接下来只需要证明

limh0β(Ah+α(h))h=0\underset{h\to0}{\lim}\frac{\beta(Ah+\alpha(h))}{h}=0

定义p(h)=Ah+α(h)p(h)=Ah+\alpha(h),定义q(v)q(v)如下:

q(v)={β(v)v,v0limv0β(v)v,v=0q(v)=\left\{\begin{array}{lr} \frac{\beta(v)}{v}\,,\quad v\neq 0\\\\ \underset{v\to0}{\lim}\frac{\beta(v)}{v}\,,\quad v=0 \end{array}\right.

qq00处连续,这符合复合极限定理的修正2,由复合极限定理,

limh0q(p(h))=0\underset{h\to0}{\lim}q(p(h))=0

再使用极限的四则运算,得到

limh0q(p(h))p(h)h=limh0q(p(h))limh0Ah+α(h)h=limh00(A+0)=0\begin{aligned} \underset{h\to0}{\lim}q(p(h))\frac{p(h)}{h}&=\underset{h\to0}{\lim}q(p(h))\cdot\underset{h\to0}{\lim}\frac{Ah+\alpha(h)}{h}\\\\ &=\underset{h\to0}{\lim}0\cdot(A+0)\\\\ &=0 \end{aligned}

同时注意到,

q(p(h))p(h)h={β(p(h))p(h)p(h)h=β(Ah+α(h))h,p(h)00p(h)h=0=β(Ah+α(h))h,p(h)=0q(p(h))\frac{p(h)}{h}=\left\{\begin{array}{lr} \frac{\beta(p(h))}{p(h)}\frac{p(h)}{h}=\frac{\beta(Ah+\alpha(h))}{h}\,,\quad p(h)\neq0\\\\ 0\cdot\frac{p(h)}{h}=0=\frac{\beta(Ah+\alpha(h))}{h}\,,\quad p(h)=0 \end{array}\right.

这个式子永远都是我们本来需要的那个函数,这就得到了 Claim 的证明.

证毕.

这就说明gfg\circ fx0x_0处可微,且微分为d(gf)x0(h)=BAh\text{d}(g\circ f)_{x_0}(h)=BAh. 也就是说,

d(gf)x0=dgf(x0)dfx0\text{d}(g\circ f)_{x_0}=\text{d}g_{f(x_0)}\circ\text{d}f_{x_0}

证毕.

这种证明方式的好处是,我们证明多元函数的相应定理只需要把hhvv换成粗体就行,本质是完全一致的.

老师说他在写讲义的LaTeX\LaTeX的时候就是这么干的.

这个定理直接得到 Chain Rule:

((gf)(x0))x=(g(f(x0)))x(f(x0))x((g\circ f)'(x_0))_{|x|}=(g'(f(x_0)))_{|x|}(f'(x_0))_{|x|}

上面的定理将 Chain Rule 从求导数的角度直接提升到了线性映射的高度,之后可以自然地衔接到 Jacobi 行列式等内容.

反函数求导

回忆反函数定理,若f:DRf:D\to\R是连续单射,则f1:f[D]Df^{-1}:f[D]\to D也连续.

问:若ff可导,是否f1f^{-1}也可导?

我们仍然用线性近似的思维来考虑,发现f1f^{-1}也是可导的.

/Theorem/ (逆映射的微分等于微分之逆)

f:DRf:D\to\R是连续单射,ffx0x_0处可导,则f1f^{-1}f(x0)f(x_0)处可导,且

(df1)f(x0)=(dfx0)1(\text{d}f^{-1})_{f(x_0)}=(\text{d}f_{x_0})^{-1}

其中 RHS 表示线性映射的逆映射. 当然有要求,dfx0\text{d}f_{x_0}不能是00.

注意:多元映射,上述结果远非平凡,称之为“反函数定理”,我们到时可能要证明三个小时.

/Proof/ (只适用于11维)

来证明f1f^{-1}f(x0)f(x_0)处可导,只需证明极限存在:

(f1)(f(x0))=limyf(x0)f1(y)f1(f(x0))yf(x0)(f^{-1})(f(x_0))=\underset{y\to f(x_0)}{\lim}\frac{f^{-1}(y)-f^{-1}(f(x_0))}{y-f(x_0)}

做换元:f1(y)=xf^{-1}(y)=x,由于已经证明了f1(x)f^{-1}(x)连续,所以当yf(x0)y\to f(x_0)时,有f1(y)f1(f(x0))=x0f^{-1}(y)\to f^{-1}(f(x_0))=x_0,这里复合极限定理的修正1成立.

所以上式等于:

limxx0xx0f(x)f(x0)=1limxx0f(x)f(x0)xx0=1f(x0)\underset{x\to x_0}{\lim}\frac{x-x_0}{f(x)-f(x_0)}=\frac{1}{\underset{x\to x_0}{\lim}\frac{f(x)-f(x_0)}{x-x_0}}=\frac{1}{f'(x_0)}

这里用到f(x0)0f'(x_0)\neq0.

这里有一个推论:

(f1)(f(x))=1f(x),(f1)(y)=1f(f1(y))(f^{-1})'(f(x))=\frac{1}{f'(x)}\,,\quad(f^{-1})'(y)=\frac{1}{f'(f^{-1}(y))}


高等微积分笔记 Lesson 15
https://physnya.top/2024/11/06/integral15/
作者
菲兹克斯喵
发布于
2024年11月6日
许可协议