高等微积分 Lesson 23
这一节课补上上周缺掉的两节,内容较多.
凹凸性
f在I上是下凸的 ⟺ 图像在弦 PQ 下方 ⟺ 对任何x,y∈I,任何权重α,β∈[0,1],α+β=1,有f(αx+βy)≤αf(x)+βf(y).
记忆方法:f作用在定比分点≤f的定比分点.
同时还可以用斜率不等式进行表述.
上凸反之,全部不等式反向,建议每次自己画一个图方便理解.
为什么函数的凹凸性会和微分学有关系?我们马上就会问,对于一个可导的f,如何刻画其凹凸性.
/Theorem/
设f在I中处处可导,则如下命题彼此等价:
f在I上下凸.
f的图像总在切线的上方,即
∀x∈I,f(x)≥f(x0)+f′(x0)(x−x0)
f′在I上单调递增(未必是严格的,只要不减就满足条件).
/Proof/
证明“1→2”:设f下凸(已知条件),讨论.
若x>x0,找到两个这样的x1,x2,不妨设x0<x1<x2,用斜率不等式即可.
x1−x0f(x1)−f(x0)f′(x0)=x1→x0+lim≤x2−x0f(x2)−f(x0)x1−x0f(x1)−f(x0)≤x2−x0f(x2)−f(x0)
化简得到
f(x)≥f(x0)+f′(x0)(x−x0)
反之亦然. 得证.
证明“2→3”:由 2 的结论,改写成
x−x0f(x)−f(x0)≥f′(x0)
也就是,弦的斜率大于左端点处切线斜率. 这样解读之后,推导命题 3 就几乎是显然的.
证明“3→1”:用两次微分中值定理,得到
k12=f′(ξ1),ξ1∈(x1,x2)k23=f′(ξ2),ξ2∈(x2,x3)
所以命题得证.
证毕.
假设f有二阶导,则f在I上是下凸的 ⟺ f′′在I上处处非负. 这就是最常用的上下凸判断方法.
这个证明是显然的.
一个记忆方法:考察这样的一个二次函数g(x)=ax2+bx+c,f′′=2a,这就能看出开口朝向什么位置,确定上下凸和二阶导符号的关系.
凹凸性的用处何在?答案是它能产生一系列不等式. 因为f下凸 ⟺ ∀x,y∈I,∀α,β>0,α+β=1,有f(αx+βy)≤αf(x)+βf(y).
这是两个点的加权平均,容易推广到n个点的情形,这样就会得到 Jensen 不等式.
/Theorem/ (Jensen 不等式)
设f在I上是下凸的,则对于I中的任何n个点x1,⋯,xn上,以及任意总和为一的非负实数(权)α1,⋯,αn有
f(α1x1+⋯+αnxn)≤α1f(x1)+⋯+αnf(xn)
特别地,对于α1=⋯=αn=1/n的情况,可以得到
f(nx1+⋯+xn)≤nf(x1)+⋯+f(xn)
/Proof/
并不困难,只要对n归纳:
对于n−1已经成立,对n有
f(α1x1+⋯+αn−1xn−1+αnxn)=f(α1x1+⋯+(αn−1+αn)αn−1+αnαn−1xn−1+αnxn)≤α1f(x1)+⋯+(αn−1+αn)f(αn−1+αnαn−1xn−1+αnxn)≤i=1∑nαif(xi)
证毕.
推论:设f′′在I上非负,f在I上是下凸函数,则有 Jensen 不等式成立.
/Example/
f(x)=lnx:R+→R,f′=1/x,f′′=−1/x2<0.
lnx在R+上是上凸的.
我每次自己写的时候都要偷偷摸摸画一个图,因为容易把方向搞反.
——艾神
从而得到,∀xi,⋯,xn>0,∀和为1的非负数α1,⋯,αn,有
f(i∑αixi)≥i∑αif(xi)⟹i∑αixi≥x1α1⋯xnαn
这被称为 Yang 不等式.
/Theorem/ (Yang 不等式)
若xi>0,αi≥0且∑iαi=1,则有
i∑αixi≥x1α1⋯xnαn
在n=2情况下,得到
xαyβ≤αx+βy
如果取所有权相等,那么就会得到我们常用的均值不等式:
nx1⋯xn≤nx1+⋯+xn
/Theorem/ (Holder 不等式)
条件与上面相同,全部是正数,得到
i=1∑nxiαyiβ≤(i=1∑nxi)α(i=1∑nyi)β
如果推广到积分形式,f、g是连续的正值函数,则
∫abfα(x)gβ(x)dx≤(∫abf(x)dx)α(∫abg(x)dx)β
/Proof/
证明完全是用 Yang 不等式. 记A=∫f(x)dx,B=∫g(x)dx,要证明的式子等价于
∫abAαfα(x)Bβgβ(x)dx≤1
用 Yang 不等式就知道,
∫ab(Af(x))α(Bg(x))βdx≤∫ab(αAf(x)+βBg(x))dx=Aα∫abf(x)dx+Bβ∫abg(x)dx=α+β=1
证毕.
在 Holder 不等式中取两个权重为1/2,则称为 Cauchy - Schwarz 不等式(内积!)
在周五的课程中,我们没有证明幂平均不等式,这里用一些时间简单证明.
/Proof/ (幂平均不等式)
记f(x)=lnG(x)=x1ln(∑λiaix). 来证明
f′(x)=x2∑λiaix∑λiaixlnx−ln(∑λiaix)≥0
这等价于证明
∑λiaixlnaix≥(∑λiaix)ln(∑λiaix)
注意到重复出现的一些部分,可以令h(y)=ylny,得到
∑λih(aix)≥h(∑λiaix)
这是h的 Jensen 不等式. 实际上,h下凸,因为
h′(y)h′′(y)=lny+1=y1>0
所以上面的 Jensen 不等式恰好成立,得证.
证毕.
我们也可以来找更多例子.
/Example/
f(x)=sinx,f′(x)=cosx,f′′(x)=−sinx. 这里的正负性只能在区间上面判断,在[0,π]上f′′(x)非正,f(x)上凸;在[π,2π]上f′′(x)非负,f(x)下凸,⋯
一般来说,我们把上下凸性改变的点称为“拐点”.
/Definition/
称x0是f的拐点,若f在x0两侧的上 / 下凸性相反.
虽然上面这个概念并不是很重要,但是它强迫我们意识到这一点:上下凸性和区间有关,分析上下凸性不能脱离区间讨论.
继续回到对三角函数的研究:
/Claim/ (sinx的 Jensen 不等式)
设x1,⋯,xn∈[0,π],则
sinnx1+⋯+xn≥nsinx1+⋯+sinxn
这个命题在没有 Jensen 不等式之前极为难证,想想它的一个推论:在ΔABC中,有
sinA+sinB+sinC≤233
/Claim/
- 设f是连续的下凸函数,则f在[a,b]上的最大值应当在区间端点取到. 也就是,下凸函数的max在端点取到.
- 反之,上凸函数的min在端点取到.
如果改写成和我们的微积分课程联系更加紧密的形式,就是:
设[a,b]上f′′≥0,则f在[a,b]上的最大值在端点取到. 反之亦然.
写两个版本的目的是用不同方法来证明,实际上第二种版本可以用 Taylor 展开来证明.
/Proof/ (版本 1)
对于下凸函数证明.
由最值定理得到最大值一定存在,但是如果出现在端点就没有证明的意义了,所以我们假设这个点x0在区间内部. 取x0−h、x0+h两个点,用 Jensen 不等式:
f(x0)=f(2(x−h)+(x+h))≤2f(x−h)+f(x+h)≤M
其中M=maxf. 这里必须取等,因为f(x0)=M已经由假设成立,即两个点x−h、x+h处的值都等于M,整个函数是常值函数,取h=min(d(x0,a),d(x0,b)),两个点中就有一个是端点.
(下课的时候)你把那个关了,我最不喜欢听自己的声音,每次看自己的录像都会静音.
——艾神
下课的时候,有同学提出更好的证明,就是用a、x0、b三个点,使用斜率不等式(上节课讲的),也能推出常值函数.
在这个方法的启发之下,我们发现甚至可以抛弃f连续的条件,完全不需要最值定理,用f下凸的定比分点定义,∀x∈[a,b],可用λ∈[0,1]表示x=(1−λ)a+λb. 则
f(x)=f((1−λ)a+λb)≤(1−λ)f(a)+λf(b)≤max{f(a),f(b)}
得证.
/Proof/ (版本 2)
利用 Taylor 公式,若x0∈(a,b)是极值点,则f′(x0)=0,有
f(b)=f(x0)+2f′′(ξ)(b−x0)2≥f(x0)
所以还是必须取等.
证毕.
/Example/
设f′′(x)≤M,∀x∈[a,b],已知f(a)=f(b)=0,则f(x)≥?
哎呀,我忘记自己要证明的结论是什么了. Anyway,我先空在这里.
——艾神
/Proof/
令g(x)=f(x)+2M(x−a)(b−x),发现这个构造使得g′′(x)≤0,g(a)=g(b)=0.
可以知道,g上凸,最小值在端点处取到,而端点值为零,所以整个函数g(x)≥0,∀x∈[a,b].
所以
f(x)≥2M(x−a)(x−b)
证毕.
对偶地,也可以把条件改成f′′(x)≥−M,构造
h(x)=f(x)−2M(x−a)(b−x)
这时h(x)下凸,可证明总是小于零的.
至此,我们完成了微分学,下面开始积分学.
积分学
不定积分
没有人会特别认真地计算一个不定积分,除非他想算一个定积分.
——艾神
不定积分就是求导的逆运算,设I是给定区间,导子D的作用是将I上的可导函数映射到I上的函数,我们自然而然地想问D有没有逆运算. 但是,D远非满射.
/Definition/
称F:I→R是f:I→R在区间上的一个原函数,如果D(F)=f,也即F′(x)=f(x),∀x∈I.
问:f有无原函数?有哪些?
我们在习题课中曾经讲过 Darboux 中值定理:设F在I上处处可导,则F′满足介值定理,即使它并不一定连续.
虽然我们在习题课中已经证明过该结论,但是这里还是证明一下.
/Proof/ (Darboux 中值定理)
设v介于F′(a)、F′(b)之间,不妨设F′(a)<v<F′(b).
令G(x)=F(x)−vx,则G′(a)<0<G′(b),要证明∃G′(x)=0,我们先假设∀G′(x)=0,则由 Rolle 定理的逆否命题,得到G是单射,而连续单射严格单调,分类讨论:
- G严格递增,则G′处处≥0,与G′(a)<0矛盾;
- G严格递减,则G′处处≤0,与G′(b)>0矛盾.
所以∃G′(x)=0,定理得证.
证毕.
由这个定理,我们就已经知道导子D不是满射,因为我们肯定可以在区间I上构造一个取不到自己介值的函数,它一定不是某个函数的导函数.
如果要问什么样的函数有原函数,这是很难回答的,但是我们能讲出一个 partial answer,就是连续的函数一定有原函数,因为一个变上限的积分∫axf(x)dx,其导数就会是这个函数.
/Claim/
在区间I上f的原函数彼此相差常数.
/Proof/
设F′=G′=f,则h=F−G满足h′=0. 用微分中值定理,对于∀x<y∈I有
h(y)−h(x)=∃ξh′(ξ)(y−x)=0
所以h是一个常值C,任何原函数记为F=G+C.
这样,导子D的逆变换实际上是D−1(f)={f的原函数}={F(x)+C∣C∈R}. 这个记为
∫f(x)dx+C
称为f(x)的不定积分.
实际上,积分就是一种查表的过程,查询求导结果的表格. 所以积分也有对应几条性质:
∫(αf(x)+βg(x))dx∫(f′g+fg′)dx∫F′(α(x))α′(x)dx=α∫f(x)dx+β∫g(x)dx=f(x)g(x)=F(α(x))+C
这分别是线性性、分部积分公式和换元公式.
/Claim/
分部积分.
∫f′(x)g(x)dx=f(x)g(x)−∫f(x)g′(x)dx
不定积分换元公式.
∫F′(α(x))α′(x)dx=F(α(x))+C
(在 Zorich 的书中,讲到这里就算讲完了换元公式,但是部分中文书讲了第一换元、第二换元,这可能会让我们更难理解,所以之后再讲.)
/Example/
(xα)′=αxα−1.
∫xβdx=⎩⎪⎨⎪⎧β+1xβ+1+C,β=−1ln∣x∣+C,β=−1
一定要注意区间.
(ex)′=ex,(ax)′=axlna.
∫axdx=lnaax+C
(sinx)′=cosx,(cosx)′=−sinx.
……
Riemann 积分
我们在第一节课讲过 Archimedes 求一个曲线下的面积,要剖分区间I=[a,b],小区间Ii=[xi−1,xi],其长度记为∣Ii∣=xi−xi−1=Δxi.
则area(Di)≈f(ξi)∣Ii∣=f(ξi)Δxi. 则总面积是所谓的 Riemann 和,
area(D)≈i=1∑nf(ξi)Δxi
Archimedes 相信,当剖分越来越细时,上述 Riemann 和趋于真正的面积.
为了叙述前述的极限过程,记剖分{x0=a<x1<⋯<xn=b}为P(partition),描述P的精细程度λ(P)=max{∣Ii∣},越小越精细.
/Definition/
称当剖分越来越细时,Riemann 和趋于极限I(integral),如果∀ε>0,∃δ>0,使得只要λ(P)<δ,对任何选点方案{ξ}有
∣i=0∑nf(ξi)Δxi−I∣<ε
若如此,则称积分∫abf(x)dx存在,并称上述极限I为f在[a,b]上的积分(值),同时称f在[a,b]上可积.
有时我们会忽略哑元dx,而直接写I=∫abf.
以上这个定义是复杂的,因为它同时涉及选点方案和剖分,难以判断某一个f是否可积,更难以计算积分值.
/Example/
常值函数可积.
(约定[a,b]上可积函数的全体记作R([a,b]).)
/Proof/
Riemann 和是c(b−a),f(x)=c,这是与选点方案无关的.
/Claim/
可积函数一定有界,无界函数不可积分.
/Proof/
反证,设f∈R([a,b]),且f无界,则取定一个λ(P)<δ,对任何选点有
∣i∑f(ξi)Δxi−I∣<ε
取定选点{ξi},因为无界,所以∃f(C)远离已经选好的n个f(ξ1),⋯,f(ξn),用C替换掉一个选点即可,要求
∣f(C)−f(ξi)∣≥max{Δx12ε,⋯,Δxn2ε}
从而,
2ε>∣∑f(ηi)Δxi−∑f(ξi)Δxi∣=∣f(C)−f(ξj)∣Δxj>max{Δx12ε,⋯,Δxn2ε}Δxj≥Δxj2εΔxj=2ε
矛盾.
证毕.
我们遗憾地发现就算证明上述结论,我们还是难以回答连续函数是否可积这一问题,主要因为我们定义中的选点方案产生了大量的任意性. 所以我们应该引入一个新的积分定义.
设f在[a,b]上有界,对[a,b]的每个剖分P={a=x0<⋯<xn=b},考虑P下最大和最小的 Riemann 和:
/Definition/
定义f在剖分P下的 Darboux 上和为
U(P,f)=i∑(Iisupf)⋅∣Ii∣
和 Darboux 下和
L(P,f)=i∑(Iiinff)⋅∣Ii∣
注意,上和和下和未必是 Riemann 和,因为不一定全部取到上界或者下界.
显然,L(P,f)≤U(P,f).
引理:∀两剖分P1、P2总有L(P1,f)≤U(P2,f).
称P是P1的加细,若{P1的分割点}⊆{P分割点},等价地说,P来自于P1加更多分点得到的剖分.
引理:若P是P1的加细,则U(P,f)≤U(P1,f),L(P,f)≥L(P1,f).
/Proof/
加一个新的分点,被分成两半,Ii=J1∪J2,所以
U(P1,f)−U(P1∪y,f)=∣Ii∣Iisupf−∣J1∣J1supf−∣J2∣J2supf≥Iisupf(∣Ii∣−∣J1∣−∣J2∣)=0
所以加新的点之后,U(P,f)下降,L(P,f)上升.
同时可以证明前面一个引理,令P=P1∪P2,P是P1、P2的加细,所以L(P1,f)≤L(P1∪P2,f)≤U(P1∪P2,f)≤U(P2,f).
所以所有L有上界U0(任何一个U都可以),由确界定理得到存在一个supL存在,记为L,同理也有U=infU.
可以证明L=U.
这里的证明略去,可以看讲义的附录、去年的课程视频,或者是 Stein & Shaka Rchi 的 Fourier 分析书的附录.
/Claim/
L=U ⟺ ∀ε>0,∃剖分P使得U(P,f)−L(P,f)<ε.
/Proof/
“⟹”证明:
设L=U=I,由U+2ε不是上和的下界,知道,存在U(P,f)<U+2ε,同理,∃L(P,f)>L−2ε.
取P=P1∪P2(公共加细),得到
U(P,f)≤U(P1,f)L(P,f)≥L(P2,f)⟹U(P,f)−L(P,f)<I+2ε>I−2ε<ε
得证.
“⟸”证明:
由L=supL(P,f),U=infU(P,f),知道
U−L⟹U−L⟹U−L≤U(P,f)−L(P,f)<ε≤any ε>0≤0
结合U≥L,知道U=L.
/Theorem/
对于有界的f,有f在[a,b]上可积 ⟺ ∀ε>0,∃剖分P使得U(P,f)−L(P,f)<ε.
(此定理更好用)
/Claim/
连续函数皆可积,单调且有界的函数皆可积.
/Proof/
f连续,在闭区间上一致连续,∀ε>0,∃δ>0使得∀∣x−y∣<δ,有∣f(x)−f(y)∣<b−aδ. 任取一个剖分P,满足λ(P)<δ,
Iisupf−Iiinff=x,y∈Iisup(f(x)−f(y))≤b−aε
由∣Ii∣<δ知道∣f(x)−f(y)∣<b−aδ.
从而
U(P,f)−L(P,f)=i∑∣Ii∣(Iisupf−Iiinff)=i∑∣Ii∣(f(xi)−f(xi−1))=nb−ai∑(f(xi)−f(xi−1))=nb−a(f(b)−f(a))
当n足够大,就能得到f可积的结果.