高等微积分笔记 Lesson 22

高等微积分 Lesson 22

接着上节课讲过的题目开始.

/Example/

ff''连续,M=max[0,1]fM=\underset{[0,1]}{\max}|f''|,设f(0)=f(1)=0f(0)=f(1)=0,证明f(x)18M|f(x)|\leq\frac{1}{8}Mx[0,1]\forall x\in[0,1].

/Proof/

证法 1:

考虑ff的最值点x0x_0,不妨设x0(0,1)x_0\in(0,1),可知x0x_0是极值点 \Longrightarrow f(x0)=0f'(x_0)=0.

在这种情况下,Taylor 公式变得极其简单,得到

f(0)=f(x0)+12f(ξ)x02f(1)=f(x0)+12f(η)(1x0)2f(x0)=12f(ξ)x02=12f(η)(1x0)2min(M2x02,M2(1x0)2)M8\begin{aligned} f(0)&=f(x_0)+\frac{1}{2}f''(\xi)x_0^2\\ f(1)&=f(x_0)+\frac{1}{2}f''(\eta)(1-x_0)^2\\ \Longrightarrow|f(x_0)|&=\frac{1}{2}f''(\xi)x_0^2=\frac{1}{2}f''(\eta)(1-x_0)^2\\ &\leq\min(\frac{M}{2}x_0^2,\frac{M}{2}(1-x_0)^2)\\ &\leq\frac{M}{8} \end{aligned}

得证.

总结起来上面的方法给我们一个启示:要证明f(x)Af(x)\leq AxD\forall x\in D,等价于求maxDf(x)A\underset{D}{\max}f(x)\leq A,所以这时能够取出最大值点x0x_0,在x0x_0附近的 Taylor 展开会有f(x0)=0f'(x_0)=0,能够简化式子.

证法 2:这是去年考试时同学们的做法,更为直接.

来考虑一般的x[0,1]x\in[0,1],利用f(0)=f(1)=0f(0)=f(1)=0,得到

f(0)=f(x)+f(x)(0x)+12f(ξ)x2=0f(1)=f(x)+f(x)(1x)+12f(η)(1x)2=0\begin{aligned} f(0)&=f(x)+f'(x)(0-x)+\frac{1}{2}f''(\xi)x^2=0\\ f(1)&=f(x)+f'(x)(1-x)+\frac{1}{2}f''(\eta)(1-x)^2=0 \end{aligned}

消去f(x)f'(x),获得

0=f(x)+12f(ξ)x2(1x)+12f(η)x(1x)2f(x)=12f(ξ)x2(1x)+12f(η)(1x)2x12Mx2(1x)+12M(1x)2x=12Mx(1x)12M(x+(1x)2)2=18M\begin{aligned} 0&=f(x)+\frac{1}{2}f''(\xi)x^2(1-x)+\frac{1}{2}f''(\eta)x(1-x)^2\\ \Longrightarrow|f(x)|&=|\frac{1}{2}f''(\xi)x^2(1-x)+\frac{1}{2}f''(\eta)(1-x)^2x|\\ &\leq\frac{1}{2}Mx^2(1-x)+\frac{1}{2}M(1-x)^2x\\ &=\frac{1}{2}Mx(1-x)\leq\frac{1}{2}M(\frac{x+(1-x)}{2})^2=\frac{1}{8}M \end{aligned}

得证.

证毕.

继续来讲微分学的更多应用.

判断单调性

/Claim/

ffII上可导,则

  • ff'恒正,则ffII上严格单调递增.
  • ffII上不减 \Longrightarrow ff'II上处处非负.

/Example/ (幂平均不等式)

a1,,an>0a_1,\cdots,a_n>0,定义

G(x)=(a1x++anxn)1/xG(x)=(\frac{a_1^x+\cdots+a_n^x}{n})^{1/x}

/Theorem/

G(x)G(x)关于xx是递增的(未必严格).

/Proof/

f(x)=lnG(x)=1xln(a1x++anxn)f(x)=\ln G(x)=\frac{1}{x}\ln(\frac{a_1^x+\cdots+a_n^x}{n})

则定理等价于f(x)0f'(x)\geq0x\forall x.

f(x)=xna1x++anxa1xlna1++anxlnanxnlna1x++anxnx20a1xlna1++anxlnana1x++anxxln(a1x++anxn)\begin{aligned} f'(x)&=\frac{x\cdot\frac{n}{a_1^x+\cdots+a_n^x}\cdot\frac{a_1^x\ln a_1+\cdots+a_n^x\ln a_n^x}{n}-\ln\frac{a_1^x+\cdots+a_n^x}{n}}{x^2}\geq0\\\\ \Longrightarrow\quad&\frac{a_1^x\ln a_1+\cdots+a_n^x\ln a_n}{a_1^x+\cdots+a_n^x}x\geq\ln(\frac{a_1^x+\cdots+a_n^x}{n}) \end{aligned}

发现无法继续往下证明. 我们需要有关凸性的 Jensen 不等式,之后会讲.

最值问题

问:给定DD,求maxDf\underset{D}{\max}f.(min\min是对称的)

这时候的解法需要下面的步骤:

  1. 存在性(未必容易)

    • D=[a,b]D=[a,b],那么由最值定理就能证明存在max\max.
    • D=RD=\R,若limxf=\underset{x\to\infty}{\lim}f=-\infty,连续函数ffR\R上面有max\max.
  2. 设已经建立了maxDf\underset{D}{\max}f的存在性,可来确定ff的最大值点x0x_0.

    • x0Dx_0\in\partial D,枚举.

      对于高维问题,用 Lagrange 乘子法.

    • x0Dx_0\notin\partial D,即x0x_0DD内部,则由 Fermat 的结论,x0Crit(f)={xf(x)=0}x_0\in\text{Crit}(f)=\{x|f'(x)=0\}(临界点集).

总结:如果已经建立了最值的存在性,则

maxDf=max{f(x0)x0DCrit(f)}\underset{D}{\max}f=\max\{f(x_0)|x_0\in\partial D\cup\text{Crit}(f)\}

下面来看一个来自于 Optics 的例子.

/Example/ (Fermat’s Principle)

光程最短.

以 Snell’s law 为例,假设光的出射点A(0,a)A(0,a),终止点B(d,b)B(d,-b),在(x,0)(x,0)位置发生折射(分界面y=0y=0). 则总时长为

T(x)=x2+a2v1+(dx)2+b2v2T(x)=\frac{\sqrt{x^2+a^2}}{v_1}+\frac{\sqrt{(d-x)^2+b^2}}{v_2}

minxRT(x)\underset{x\in\R}{\min}T(x).

/Solution/

首先判断存在性,容易得到

limx+T(x)=limx+(x2+a2v1+(dx)2+b2v2)=+limxT(x)=limx(x2+a2v1+(dx)2+b2v2)=+\begin{aligned} \underset{x\to+\infty}{\lim}T(x)&=\underset{x\to+\infty}{\lim}(\frac{\sqrt{x^2+a^2}}{v_1}+\frac{\sqrt{(d-x)^2+b^2}}{v_2})=+\infty\\ \underset{x\to-\infty}{\lim}T(x)&=\underset{x\to-\infty}{\lim}(\frac{\sqrt{x^2+a^2}}{v_1}+\frac{\sqrt{(d-x)^2+b^2}}{v_2})=+\infty\\ \end{aligned}

由上面的结论,知道minxRf\underset{x\in\R}{\min}f存在.

现在求解x0=minxRfx_0=\underset{x\in\R}{\min}f,得到T(x0)=0T'(x_0)=0,即x0x_0满足T(x)T(x)的临界点方程:

0=T(x)=xv1x2+a2dxv2(dx)2+b20=T'(x)=\frac{x}{v_1\sqrt{x^2+a^2}}-\frac{d-x}{v_2\sqrt{(d-x)^2+b^2}}

这个方程不好处理,我们甚至难以知道它是否有解和有几个解. 于是转而考虑T(x)T''(x),以及已经知道的limx+T(x)=1v1+1v2>0\underset{x\to+\infty}{\lim}T'(x)=\frac{1}{v_1}+\frac{1}{v_2}>0limxT(x)=1v11v2<0\underset{x\to-\infty}{\lim}T'(x)=-\frac{1}{v_1}-\frac{1}{v_2}<0.

由介值定理,知道TT'有零点,也就是TT有临界点. 但是我们不知道有几个零点,任意奇数个看起来都是有可能的.

T(x)=x2+a2xxx2+a2x2+a21v1(dx)2+b2+(dx)dx(dx)2+b2(dx)2+b21v2=a2v1(x2+a2)3/2+b2v2((dx)2+b2)3/2>0\begin{aligned} T''(x)&=\frac{\sqrt{x^2+a^2}-x\cdot\frac{x}{\sqrt{x^2+a^2}}}{x^2+a^2}\cdot\frac{1}{v_1}\\&\quad-\frac{-\sqrt{(d-x)^2+b^2}+(d-x)\cdot\frac{d-x}{\sqrt{(d-x)^2+b^2}}}{(d-x)^2+b^2}\cdot\frac{1}{v_2}\\\\ &=\frac{a^2}{v_1(x^2+a^2)^{3/2}}+\frac{b^2}{v_2((d-x)^2+b^2)^{3/2}}>0 \end{aligned}

所以T(x)T'(x)R\R上严格单调递增,TT有唯一的临界点.

总结:T(x)T(x)有且仅有一个最小值点x0x_0,且x0x_0TT的唯一临界点,x0x_0满足下面的方程

x/x2+a2v1=(dx)/(dx)2+b2v2\frac{x/\sqrt{x^2+a^2}}{v_1}=\frac{(d-x)/\sqrt{(d-x)^2+b^2}}{v_2}

从几何上来看,这就是 Snell’s law,sinα/v1=sinβ/v2\sin\alpha/v_1=\sin\beta/v_2.

In Physics,可以通过最小作用量原理推出动力学方程(Euler - Lagrange Equation),甚至 Hamilton 方程.

Fermat 对于可导的ff{\{极值点}Crit(f)\}\subseteq\text{Crit}(f),问:判别x0Crit(f)x_0\in\text{Crit}(f)是否是ff的极值点?

等价于比较f(x0)f(x_0)与附近的f(x)f(x)大小,也就是f(x0)f(x_0)f(x0+h)f(x_0+h)比较大小,这就要用到 Taylor 展开.

f(x0+h)=f(x0)+f(x0)h+12f(x0)h2+o(h2)=f(x0)+12f(x0)h2+o(h2)\begin{aligned} f(x_0+h)&=f(x_0)+f'(x_0)h+\frac{1}{2}f''(x_0)h^2+o(h^2)\\ &=f(x_0)+\frac{1}{2}f''(x_0)h^2+o(h^2) \end{aligned}

/Claim/

x0x_0ff的临界点且ffx0x_0处有二阶导,则

  • f(x0)>0f''(x_0)>0,则x0x_0ff的极小值点.
  • f(x0)<0f''(x_0)<0,则x0x_0ff的极大值点.
  • f(x0)=0f''(x_0)=0,需要更高阶的 Taylor 展开.

更加一般的命题是:

/Claim/

f(1)(x0)==f(n1)(x0)=0f^{(1)}(x_0)=\cdots=f^{(n-1)}(x_0)=0f(n)(x0)0f^{(n)}(x_0)\neq0(其中n2n\geq2).

  • nn是偶数且f(n)(x0)>0f^{(n)}(x_0)>0,则x0x_0ff的极小值点.
  • nn是偶数且f(n)(x0)<0f^{(n)}(x_0)<0,则x0x_0ff的极大值点.
  • nn是奇数,则x0x_0不是极值点.

/Proof/ (证明更一般的命题)

由 Taylor 公式,得到

f(x0+h)=f(x0)+f(n)(x0)n!hn+α(h)=f(x0)+hn(f(n)(x0)n!+α(h)hn)\begin{aligned} f(x_0+h)&=f(x_0)+\frac{f^{(n)}(x_0)}{n!}h^n+\alpha(h)\\ &=f(x_0)+h^n(\frac{f^{(n)}(x_0)}{n!}+\frac{\alpha(h)}{h^n}) \end{aligned}

对于δ>0\exist\delta>0h<δ\forall|h|<\delta,有α(h)hn<f(n)(x0)n!|\frac{\alpha(h)}{h^n}|<|\frac{f^{(n)}(x_0)}{n!}|,从而对于这些h<δ|h|<\deltaf(n)(x0)f^{(n)}(x_0)f(n)(x0)n!+α(h)hn\frac{f^{(n)}(x_0)}{n!}+\frac{\alpha(h)}{h^n}同号.

分上面几类讨论得到结果.

证毕.

函数的凹凸性

回忆初中学到过的二次函数,我们知道所谓的“开口向上”和“开口向下”,这两者显著不同,但是我们并未定义什么是“开口”.

实际上,凹凸性可以通过做一条割线来判断——观察弦 PQ 是否高于 P、Q 间的图像.

/Definition/

称函数ff在区间II上是下凸函数,如果对于{(x,f(x))xI}\{(x,f(x))|x\in I\}上任何两点 P、Q,总有 PQ 弦(割线)在 P、Q 间ff图像的上方(亦即图像在弦下方).

类似地,可以定义上凸函数.

/Claim/ (等价表述)

ffII上是下凸函数. (1)(1)

\Longleftrightarrow f(α1x1+α2x2)α1f(x1)+α2f(x2)f(\alpha_1x_1+\alpha_2x_2)\leq\alpha_1f(x_1)+\alpha_2f(x_2)α1+α2=1\alpha_1+\alpha_2=1(2)(2)

\Longleftrightarrow 0λ10\leq\lambda\leq1f((1λ)x1+λx2)(1λ)f(x1)+λf(x2)f((1-\lambda)x_1+\lambda x_2)\leq(1-\lambda)f(x_1)+\lambda f(x_2). (3)(3)

\LongleftrightarrowII中任何三点x1<x2<x3x_1<x_2<x_3,总有k12k13k23k_{12}\leq k_{13}\leq k_{23},其中kijk_{ij}xix_ixjx_j之间的割线斜率. (4)(4)

/Proof/

首先容易知道(2)(2)(3)(3)等价,证明略去.

来证明(1)(1)(2)(2)(3)(3)等价. 记P(x1,f(x1))P(x_1,f(x_1))Q(x2,f(x2))Q(x_2,f(x_2))(不妨x1x2x_1\leq x_2). PQ 弦上的点形如(x,f(x2)f(x1)x2x1(xx1)+f(x1))(x,\frac{f(x_2)-f(x_1)}{x_2-x_1}(x-x_1)+f(x_1))ff图像上的点形如(x,f(x))(x,f(x)),“在图像上方”这个表述等价于一个不等式:

f(x)f(x2)f(x1)x2x1(xx1)+f(x1)f(x)\leq\frac{f(x_2)-f(x_1)}{x_2-x_1}(x-x_1)+f(x_1)

x=x1+λ(x2x1)=(1λ)x1+λx2x=x_1+\lambda(x_2-x_1)=(1-\lambda)x_1+\lambda x_2,得到(3)(3),也就和(2)(2)等价.

现在来证明(1)(1)(4)(4)等价. 将之前用到的x1x_1xxx2x_2改述成x1x_1x2x_2x3x_3,则

f(x2)f(x3)f(x1)x3x1(x2x1)+f(x1)f(x_2)\leq\frac{f(x_3)-f(x_1)}{x_3-x_1}(x_2-x_1)+f(x_1)

得到k12k13k_{12}\leq k_{13}.(所以说实际上这一个式子就能够判断凸性了)而k13k23k_{13}\leq k_{23}也可以通过恒等变形得到.

证毕.

下凸的斜率表示是相当有用的.

/Claim/

开区间上的下凸函数皆连续.(注:如果不是开区间,以上命题并不对,想想在端点处有一个不连续点的ff

/Proof/

来证明ffI=(a,b)I=(a,b)中的每一点x0x_0处连续. 为此,证明ε>0\forall\varepsilon>0,找一个δ>0\delta>0使得xx0<δ\forall|x-x_0|<\deltaf(x)f(x0)<ε|f(x)-f(x_0)|<\varepsilon.

因为II是开区间,x0x_0一定是一个内点,也就是能找到一个xIx_-\in I和一个x+Ix_+\in I使得x<x0<x+x_-<x_0<x_+,由斜率不等式(这里引入新的点x(x,x0)x\in(x_-,x_0)),

f(x)f(x0)xx0f(x)f(x0)xx0f(x+)f(x0)x+x0\frac{f(x_-)-f(x_0)}{x_--x_0}\leq\frac{f(x)-f(x_0)}{x-x_0}\leq\frac{f(x_+)-f(x_0)}{x_+-x_0}

我这样写是不是太啰嗦了?不,没关系,我平时就这么啰嗦.
——艾神

对于x(x0,x+)x\in(x_0,x_+),也有

f(x)f(x0)xx0f(x)f(x0)xx0f(x+)f(x0)x+x0\frac{f(x_-)-f(x_0)}{x_--x_0}\leq\frac{f(x)-f(x_0)}{x-x_0}\leq\frac{f(x_+)-f(x_0)}{x_+-x_0}

没区别. 所以中间的那个斜率一定有界,

f(x)f(x0)xx0max(A,B)=K|\frac{f(x)-f(x_0)}{x-x_0}|\leq\max(|A|,|B|)=K

所以f(x)f(x0)Kxx0|f(x)-f(x_0)|\leq K|x-x_0|ff的变化比不过xx的变化的KK倍,这被称为 Lipschitz 条件(这是一个比光滑性更强的条件),连续性得证.

证毕.


高等微积分笔记 Lesson 22
https://physnya.top/2024/12/06/integral22/
作者
菲兹克斯喵
发布于
2024年12月6日
许可协议