外观
Einstein 场方程与时空的基本理论
约 14275 字大约 48 分钟
2025-09-14
广义相对论中的时间与空间
(1) 坐标钟与标准钟:弯曲时空中的任意坐标系 xμ(μ=0,1,2,3),如果把 x0 当作时间坐标,则以速率 x0/c 运行的钟称为坐标钟,t 称为坐标时间,c 是真空中的光速.
狭义相对论中,我们把固定在一个惯性系中的中称为标准钟,它的时间是这个惯性系的固有时间:
ds2=−c2dt2+dx2+dy2+dz2=−c2dt2⟹dt=cids
习惯用 τ 来标记固有时间,也就写成
dτ=cids
固有时正比于观者 (标准钟) 的世界线长度,且都是标量.
广义相对论中,可以对任意的观者 A 引入与它瞬时相对静止的局部惯性系 B,和狭义相对论一样,这个「局部惯性系」中的标准钟记录了这个系的固有时,A 和 B 的世界线 LA,LB 在这一时空点 P 相切. 那么
dτB=cidsB
根据微分几何,相切处 dsB=dsA,所以这里有 dτA=dτB.
注意
关于这个 dsB=dsA,非常简单的理解就是在 Euclidean 空间中拿勾股定理算. 微分几何中在流形上做同样的计算,得到相等的结果.
因此,A 的固有时也正比于自己的世界线长度,它的标准钟是随着自己移动的钟,也是瞬时静止局部惯性系的钟. 为了让这个正比关系更加自然,广义相对论中采用固有时为观者的世界线长度进行参数化.
下面具体计算观者的固有时 (通过与之 相对静止 的坐标系的坐标时计算):
dτ=cids=c1−gμνdxμdxν=c1−g00⋅dt
这也说明非 Cartesian 坐标系中,固有时和坐标时一般不同.
强调以下四点:
坐标钟是虚构的,仅有理论意义,不可直接测量. 标准钟是真实的,但是记录的是固有时.
用两种钟是因为标准钟记录的固有时在弯曲时空中只有局部意义,在大范围内有意义的只有坐标时,所以广义相对论的公式和定律等要用坐标量表示.
任何周期运动物体都可以作为标准钟. 标准钟可以沿任何类时世界线运动,并用自己的读数来参数化这条世界线.
观者固有时有两种测量方式:它自己的标准钟;相对于观者瞬时静止的自由下落钟.
固有时依赖于世界线,不依赖于坐标系;坐标时依赖于坐标系,不依赖于世界线.
过一点的不同世界线,固有时不同;在一点建立不同坐标系,坐标时不同.
(2) 固有距离的测量:考虑相邻两点 A,B,光信号在 A 钟的 (1)xA0 时刻从 A 射向 B,在 B 钟的 xB0 时刻到达,并反射回 A,在 A 的 (2)xA0 时刻到达 A 点. 这里所需要的坐标时为
Δx0=dx(2)0−dx(1)0
其中,dx(1)0=(1)xA0−xB0,dx(2)0=(2)xA0−xB0.
警告
本来想在这里画个图,但是折腾很久 Inkscape 感觉没什么好处… 还是算了. 之后或许会补上.
因为光速各向同性不是在坐标时下说的,所以 ∣dx(1)0∣ 不一定等于 ∣dx(2)0∣. 需要在 B 点引入瞬时静止的局部惯性系,与 Δx0 相对应的固有时间是
Δτ=c1−g00⋅Δx0
在这个系中,固有时表达的光速是各向同性的,并且值是 c,因此两点间空间距离是
dl=2cΔτ=21−g00⋅Δx0(1)
这和之前标准钟测得的时间相对应,是「标准尺」测得的距离. 但是 广义相对论中并无「标准尺」概念,固有距离应该依据固有时间来间接测定. 我们知道,
ds2=0=g00(dx0)2+2g0idx0dxi+gikdxidxk
这是「来」和「去」两个过程的光信号都满足的方程. 解得
dx0=g00−g0idxi±(g0ig0k−g00gik)dxidxk(2)
这里因为二次方程而得到的「±」分别对应「来」和「去」的光信号,而且要求的 Δx0 是它们的差:
Δx0=−g002(g0ig0k−g00gik)dxidxk
代入 (1) 式,得到
Δl=(gik−g00g0ig0k)dxidxk
或者写成 dl2=γikdxidxk,这里的
γik=gik−g00g0ig0k(3)
是纯空间度规 (不含时间部分),和 gμν 的空间部分 gik 并不等价. 这个 dl 就是 A,B 两邻点之间的纯空间距离 —— 固有距离.
(3) 物理上可实现的最普遍的时空坐标:
按照等效原理,引力场中的任一点都可以引入局部惯性系,采用 Cartesian 坐标
xμ=(x0,x1,x2,x3),x0=ct
t 是局部惯性系的坐标时. 线元为
ds2=ημνdxμdxν,μ,ν=0,1,2,3
这里的 η 是之前在 Chapter 2 中提到过的 Minkowski 度规. 引入连续、可微且 Jacobi 行列式满足
det∂xν∂x′μ=0
的坐标变换 x′μ=x′μ(xν),光速不变原理要求线元在坐标变换下不变,所以
ds2=ημνdxμdxν=gμνdx′μdx′ν⟹gμν=ηαβ∂x′μ∂xα∂x′ν∂xβ(4)
这正是度规的变换规则.
另外,时间是一维的、空间是三维的,一个有物理意义的坐标变换必须要保证新的坐标系中有一个时间坐标和三个空间坐标. 我们提出如下定理:
/Theorem/
欲使点变换 x′μ=x′μ(xν) 所得的四个新坐标 (x′0,x′1,x′2,x′3) 的第一个坐标表示时间,剩下表示空间,那么新的度规张量必须符合下述充要条件:
g00<0,g00g10g01g11<0g00g10g20g30g01g11g21g31g02g12g22g32g03g13g23g33,g00g10g20g01g11g21g02g12g22<0<0
/Proof/
设 xμ 是局部惯性系坐标,x′μ 是新的坐标.
对于新坐标空间中的一个固定点,应该有
x′i=const.,dx′i=0
注意
特别说明,一般指标是 i,j,k 都是指 1,2,3;如果是 μ,ν,⋯ 这些希腊字母,指 0,1,2,3,用以区分空间和时空.
这个固定点相对于局部惯性系的速度是
v′=dtdxi=dx0cdxi
考虑到 dx′i=0,所以
dxidx0=∂x′μ∂xidx′μ=∂x′0∂xidx′0=∂x′μ∂x0dx′μ=∂x′0∂x0dx′0
上面的相对速度被化为
v′=c(∂x0∂xi/∂x′0∂x0)
这个速度不能超过光速,这是限制条件. 因此:
vivi<c2⟹(∂x′0∂xi)(∂x′0∂xi)<(∂x′0∂x0)(∂x′0∂x0)
由我们之前的定义 (4),这等价于
g00<0
这就证明了第一个式子,它来源于光速的限制.
另外,固有距离 dl 必须是实数,这要求 dl2=γikdx′idx′k>0,由二次型正定的充要条件 (Jacobi 公式) 可得
γ11>0,γ11γ21γ12γ22>0,γ11γ21γ31γ12γ22γ32γ13γ23γ33>0
γik 的表达式是 (3),代入得到剩下三个不等式条件:
g00g10g01g11<0,g00g10g20g01g11g21g02g12g22<0,g00g10g20g30g01g11g21g31g02g12g22g32g03g13g23g33<0
注意
简单总结,这些对度规的限制来源于「光速不变」和「距离是实数」,也就是分别对时间和空间的限制.
下节会对坐标系 (也就是相应地对度规) 有更多限制.
警告
我觉得自己还是没弄懂固有距离那里的推导,或许我该画个图.
同时的传递性
狭义相对论中,我们知道静止于同一惯性系的不同空间点的钟,因为光速不变,总可以用光信号来校准,使它们「同时」/「同步」,这样可以建立起所谓的「同时面」.
注意
这里我们要对「同时」和「同步」两个概念做一下区分:「同时」指的是两个钟的时刻校准,而「同步」指钟的快慢校准.
(1) 「同时传递性」的条件:在狭义相对论中,校准空间中各处的钟是非常容易做到的,可以建立全空间的同时面. 但是广义相对论中时空是弯曲的,这使得同时传递性受到了挑战.
仍然用光信号来校准静止于各个空间点的钟,并在这个概念下定义「同时性」.
设 A,B 为 Riemann 时空中两个相邻的空间点,L,M 分别为两点的世界线. 在 A 的坐标时 (1)xA0,从 A 向 B 发射一个光信号,这个信号在 B 点的坐标时 xB0 到达 B,并反射回 A,在 A 点坐标时 (2)xA0 到达. 定义如下中间量:
dx(1)0dx(2)0xA0≡(1)xA0−xB0≡(2)xA0−xB0≡2(1)xA0+(2)xA0
这里,A,B 之间的距离是没有变化的,所以我们认为 xA0 应该是和 xB0 同时的一个时刻. 显然有 (仅仅是由定义):
xA0=21[(xB0+dx(1)0)+(xB0+dx(2)0)]=xB0+21(dx(1)0+dx(2)0)
所以两个异地的事件「同时」发生时,坐标时会相差:
Δx0=xA0−xB0=21(dx(1)0+dx(2)0)
利用 (2) 式,得到
Δx0=−g00g0idxi
到这里,可以沿着某一条路径对 Δx0 积分,来定义广义相对论中的「同时面」为时刻相差
∫L−g00g0idxi
的点的集合. 但是容易发现,这里的 Δx0 甚至不一定是全微分,沿着闭合路径的积分不等于零,所以如果两点相距有限的空间距离,沿着不同路径来校准这两点的坐标钟,得到的结果是不一样的,这导致 A 和 B 同时、B 和 C 同时不意味着 A 和 C 同时,也就是 同时性不一定具有传递性. 在广义相对论中,同时性具有传递性的充要条件是 Δx0 为全微分,即
∮Δx0=∮(−g00g0i)dxi=0
最直观的情况就是时轴正交,也就是 g0i=0 (这是一个充分条件). 当采用时轴正交坐标系时,可以把空间各点的坐标钟调整到同时,建立同时面 —— 因此时轴正交系在广义相对论中非常重要.
(2) 「钟速同步传递性」的条件:刚才是在讨论「同时」,现在尝试讨论「同步」. 这个条件比建立同时面要弱一些.
还是 A,B 两点,第一个同时时刻和第二个同时时刻,坐标钟分别相差
Δx(1)0Δx(2)0=(1)xA0−(1)xB0=−(g00g0i)(1)dxi=(2)xA0−(2)xB0=−(g00g0i)(2)dxi
两处时间流速之差:
δ(Δx0)≡((2)xA0−(1)xA0)−((2)xB0−(1)xB0)=Δx(2)0−Δx(1)0=−[(g00g0i)(2)−(g00g0i)(1)]dxi
这个量为零的充分条件是
∂x0∂(g00g0i)=0
这个充分条件弱于 g0i=0. 同时相应的充要条件是
∮(−g00g0i)1dxi=∮(−g00g0i)2dxi
这等价于
∂x0∂∮Δx0=∂x0∂∮(−g00g0i)dxi=0⟹∮(−g00g0i)dxi=ϕ
其中 ϕ 是与 x0 无关的一个常数. 这个充要条件也弱于之前同时面存在的充要条件 (那里要求闭合路径积分为零).
在满足 ϕ=const. 但是 ϕ=0 的坐标系中,可以把空间中静止各点的坐标钟「调得一样快」,但是不存在同时面.
注意
特别需要注意:上面讨论的「同时」和「同步」都是在说坐标钟,即使坐标钟同步了,标准钟依然不一定同步,这是不一样的两个概念.
场方程与运动方程
注意
这是相对论的核心:Einstein 场方程.
几点考虑
Einstein 建立场方程时,有下面几点考虑:
等效原理:Einstein 是根据等效原理猜测引力是一种几何效应的. 等效原理预期引力在数学上和惯性力具有同样的表现,即:度规 gμν 偏离 Lorentz 度规 ημν、Christoffel 符号不为零.
也就是,引力在数学上应该用度规张量和 Christoffel 符号的泛函来表示,Einstein 猜测这个泛函和时空的曲率有关.
提示
Einstein 当时并没有考虑到挠率,但是这恰好符合等效原理,因为等效原理同时要求时空的挠率为零.
Mach 原理:Mach 认为惯性力来源于加速物体和遥远星系的相互作用. Einstein 据此设想,场方程的一端应该反映时空的曲率,另一端则是物质 & 物质的运动.
广义相对性原理:物理规律是广义协变的,所以场方程必须是张量方程;同时场方程在没有引力源的真空中也应该成立,所以场方程要是一个微分方程.
注意
对于「微分方程」的一点理解:个人觉得是因为在真空中场方程仍然要能够描述时空的曲率这一局部的特性,并且和有源的时空区域建立联系,而描述局域性质的正是微分方程.
光速不变原理:这等价于要求 ds 是标量.
质点运动的短程线原理:这个原理假定,时空中的自由质点应该沿短程线运动. 也就是质点的运动路径满足
δ∫ds=0
即测地线.
注意
这不就是 Fermat 原理吗?
对应原理:弱场近似下,场方程应该近似为 Newton 引力的 Poisson 方程:
∇2φ=4πGρ
(φ 为万有引力势)
注意
这一点和 Bohr 的量子力学很相似,「在 ℏ→0 的情况下,氢原子轨道应该和经典情况的结果相等价」.
场方程的建立
从上面 1.、2.、3. 三个考虑,Einstein 推测场方程一端是物质场的能动张量 Tμν,另一侧是反映时空几何的某一个张量 Mμν,也就是
Mμν=κTμν
这里 κ 是一个常数. 因为能动张量是对称张量,有 10 个独立分量,所以 Mμν 也应该有 10 个独立分量,据此我们想到的是 Ricci 张量、度规张量 gμν 以及这两个张量的组合.
注意
感觉还是有必要弄清楚「能动张量」是什么. 下面这一段参考:
在电动力学中我们已经了解到电荷密度和电流密度可以构成一个四维矢量. 于是联想到:动量密度 (三维矢量) 和动量流密度 (三维二阶张量) 是否可以构成一个协变的量?也就是张量
考虑一组由 1∼n 编号标记的粒子流,它们的四维动量可以写成 pαn(t),四维的动量密度就是
Pα(xi,t)=n∑pαn(t)δ3(xi−xin(t))
后面的 δ3 函数作何理解?只需要理解为这是在求 t 时刻、xi 这一空间点的动量密度即可.
四维动量流密度 (单位时间内,通过单位面积的动量) 应当是:
Tαj(xi,t)=n∑pαn(t)dtdxjn(t)δ3(xi−xin(t))
这里的 n 不是一种指标... 只是一个标记粒子序号的符号罢了
可以发现,如果给前面的 Pα 两边乘上一个因子
dtdx0n(t)=dtdt
就能构造出一个四维二阶逆变张量 Tαβ,这就是能动张量:
Tαβ(xi,t)=n∑pαn(t)dtdxβn(t)δ3(xi−xin(t))
为了探究这个张量的一些性质,回忆狭义相对论中,我们有关系 (自然单位制):
Epi=γmγmx˙i=x˙i=dtdxi
对于 p0 这个分量,p0=γmc,E=γmc2,在自然单位制下也可以得到上面的结果
所以上式能够改写成对称形式
Tαβ(xi,t)=n∑Enpαnpβnδ3(xi−xin(t))⟹Tαβ=Tβα
接下来考察能动张量在无外力作用下的守恒性质. 在狭义相对论中,先仅仅考虑能动张量对空间分量的导数:
∂xi∂Tαi(xk,t)=n∑pαn(t)dtdxi(t)∂xi∂δ3(xk−xkn(t))=−n∑pαn(t)dtdxi(t)∂xin∂δ3(xk−xkn(t))
这里用到的是,δ 函数内部的两个变量反号,所以求导可以换一个变量,得到的结果只是加一个负号而已.
另外,为什么只求 Tαi 对 xi 的导数,不求对 xj 的导数?显然如果 i=j,
实际上上式是一个链式法则,虽然后面看起来是偏导数,但是 xk 和 xkn(t) 没有任何关系,所以其实是全导数. 化简掉这个链式法则:
∂xi∂Tαi(xk,t)=−n∑pαn(t)∂t∂δ3(xk−xkn(t))
利用 Leibniz 法则,得到
∂xi∂Tαi=−∂t∂[pαn(t)δ3(xk−xkn(t))]+n∑∂t∂pαn(t)δ3(xk−xkn(t))
容易发现前面一项正是 Tα0 对 x0 的偏导数. 合并之后得到四维的式子
∂xβ∂Tαβ=n∑∂t∂pαn(t)δ3(xk−xkn(t))
RHS 正好是所谓的「力密度」,因为粒子体系不受外力,这一项自然为零,这就在狭义相对论下证明了能动张量守恒.
一个我在看这一段的时候产生的疑问:为什么只证明 ∂βTαβ=0 就说明能动张量守恒了?不应该是 ∂μTαβ 的所有分量都是零才算守恒吗?
实际上这是我对能动张量的物理意义产生了一些曲解. 考虑能动张量本身的物理意义,T00 分量是能量密度、T0i 分量是动量密度 (能流密度),Tij 则是动量流密度 (或者说应力张量);∂βTαβ 按照 α 的取值有四个方程,其中 ∂βT0β=0 表示能量守恒、∂βTiβ=0 表示动量守恒,这已经满足了物理上所要求的守恒定律. 因此,能动张量的守恒方程只要求 能动张量的散度为零.
广义相对论下的推导要把原来的散度改为协变散度,这导致
Tαβ;βTαβ;β=−ΓρβαTρβ−ΓρββTαρ+n∑∂t∂pαn(t)δ4(xk−xkn(t))=−ΓρβαTρβ−∂ρln−g⋅Tαρ+n∑∂t∂pαn(t)δ4(xk−xkn(t))
这里用到了 Christoffel 符号的缩并,在 Chapter 2 - 一个特殊的 Christoffel 符号 提到过.
另外,广义相对论中的 Tαβ 和之前不一样,要做修正,因为 Tαβ 中包含的 δ4(x) 并不是协变的,为了保证能动张量在广义相对论下仍然是一个 张量,我们需要给它乘上一个 ∣g∣−1/2.
这里的原因是张量密度. 简单来讲,张量密度是一类和张量的坐标变换遵循类似规则的量,张量密度的变换规则类似下面:
εμ1′μ2′μ3′′=Jacobi∂xμ∂x′μ′εμ1μ2μ3∂x′μ1∂xμ1∂x′μ2∂xμ2∂x′μ3∂xμ3
前面多了一个 Jacobi 行列式的因子. 因为度规行列式的变换:
gμ′ν′=∂xμ′∂xμ∂xν′∂xνgμν⟹g′=∂xμ∂xμ′−2g
所以在变换中要乘上 w 次幂的 Jacobi 行列式的张量密度,在前面乘上 ∣g∣w/2 就能构造一个张量,w 称为张量密度的 权.
本段参考:
因为 d4x 的权是 +1,而
∫d4x⋅Φ(x)⋅δ4(x−y)=Φ(y)
所以 δ4 函数的权是 −1. 所以
Tμν=n∑∫timedτ⋅pμndτdxνnδ4(xi−xin(τ))
前面乘一个 1/−g 才能构造出张量.
于是公式变为
−g1∂μ(−g⋅Tμν)=−ΓμλνTμλ+−g1n∑∂t∂pαn(t)δ4(xk−xkn(t))
RHS 仍然是力密度,虽然是四维,而且同样经过 ∣g∣−1/2 因子的构造成为了张量;另外,含有联络的那一项表征了引力的影响,也就是说在广义相对论中引力的属性和其他力不一样,是时空弯曲带来的 (Christoffel 符号就表征了时空的弯曲). LHS 则是能动张量的散度.
这仍然证明了能动张量守恒,用公式表达,为
Tμν;ν=0⟹−g1∂xν∂(−g⋅Tμν)+ΓανμTαν=0(5)
因为能动张量是守恒的,也就是 Tμν;ν=0,所以 Mμν;ν=0,这个候选者被锁定为 Einstein 张量,因为它满足 Bianchi 恒等式 (我们在 Chapter 2 - 三个派生的重要张量 中提到过这一事实).
于是场方程写成:
Rμν−21gμνR=κTμν
当然也可以写出它的协变形式和混合形式.
运动方程的建立
按照 Einstein 的设想 4.、5.,自由质点 (这里指的是不受引力 & 惯性力之外的任何力的质点) 的运动方程应该是 Riemann 时空的测地线:
ds2d2xμ+Γαβμdsdxαdsdxβ=0
这就是自由质点的运动方程.
宇宙项
场方程两侧都是协变散度为零的张量,因此,加入任何一项协变散度为零的量不会影响等式. 1917 年 Einstein 试图建立静态的宇宙模型,曾经尝试在场方程中加入一个与度规成正比的项 Λgμν,并称这一项为宇宙项、常数 Λ 为宇宙学常数. 此时,场方程变为:
Rμν−21gμνR+Λgμν=κTμν
这一项是否应该加入的问题直到现在仍然在被争论.
(见 星系与宇宙 笔记)
关于挠率的考虑
前面所有讨论全部都是没有挠率的情况,Einstein 理论没有考虑时空的「扭曲」.
但是近年来的研究表明:描述时空对称的 Poincaré 群有两个重要的 Casimir 算符,一个和质量有关,一个和自旋有关. 据此很多人推测,除了质量在影响时空的几何结构,自旋也会对时空几何产生影响.
如果上述推测是对的,Einstein 方程就只能像 Maxwell 方程组中的某一个方程,应该还有关系描述挠率、自旋和曲率、质量的关系. 一种思路是这两组之间互不影响,有所谓的杨振宁方程描述「挠率 - 自旋」关系;另一种想法是这四者关系比较复杂:
但是等效原理 (这是有高精度实验支持的) 要求挠率在真空区极小 / 没有传播性,因此上述理论难以得到验证.
关于 Mach 原理的讨论
Newton 力学和狭义相对论都没有指出惯性力的本质是什么,也没有说明为什么惯性场和引力场能够等效 (或者说,惯性质量和「引力荷」成正比,可以利用单位制把它们化为相等的).
Mach 原理说,所有的惯性都来自遥远星系对加速物体施加的引力. Einstein 认同这一原理,并指出 Mach 原理导致:
- 在物体附近有物质堆积时,它的惯性质量应该增加;
- 邻近物质加速时,该物体应该受到一个与物质加速方向相同的惯性力;
- 转动的中空物体,一定会在内部产生径向离心力 & Coriolis 力.
Einstein 和 H.Thirring (他研究了转动的中空球壳) 认为广义相对论符合 Mach 原理. 但是有很多疑点:
- Mach 原理没有实验支持.
- Mach 原理没有统一的文字表述 / 计算公式.
- Mach 自己否认广义相对论符合他的思想;同时简单解场方程就能发现矛盾,比如纯真空的场方程 Rμν=0,可以解得一个特解 gμν=ημν,在这个解中质点加速运动是有惯性力的.
C.Brans & R.H.Dicke 明确指出广义相对论和 Mach 原理不一致,他们提出了一个符合 Mach 原理的标量 - 张量理论,当然并没有被实验验证.
而且直到广义相对论提出,Newton 水桶实验所讨论的惯性力起源问题仍然没有解决.
运动方程的导出及 Newton 近似
20 世纪 30 年代,Einstein 和 Фок (Vladimir Aleksandrovich Fock) 分别独立从场方程导出了运动方程,减少了广义相对论的基本方程.
(1) 4 - 速度:
固有时间
dτ=cids⟹dτ2=−c2ds2=−cgμνdxμdxν
这样就可以定义质点的四维速度 (4 - 速度):
uμ≡dτdxμ
且满足
uμuμ=gμνuμuν=dτ2gμνdxμdxν=−c2
如果用 c=1 的自然单位制,那么上面的式子就简化为 uμuμ=−1.
但是和狭义相对论一样,对于静质量为零的粒子,要分开考虑,有
c2dτ2=−ds2=0
需要找另外的仿射参量定义 4 - 速度,
uμ≡dλdxμ
且 uμuμ=0.
(2) 从场方程导出运动方程:一个粒子的能动张量可以表示为
Tμν=ρuμuν
这里 ρ 是瞬时静止的局部惯性系中的静质量密度. 场方程要求了能动张量守恒,所以利用 (5) 式:
−g1∂xν∂(−g⋅Tμν)+ΓανμTαν=0
也就是
∂x0∂(−g⋅Tμ0)+∂xi∂(−g⋅Tμi)+−g⋅ΓανμTαν=0
对这个式子体积分,有
∫∂x0∂(−g⋅Tμ0)d3x+∫∂xi∂(−g⋅Tμi)d3x+∫−g⋅ΓανμTανd3x=0
但是我们考察的是一个「质点」,所以在体积的边界上 ρ=0,中间一项用 Gauss 定理化简:
∫∂xi∂(−g⋅Tμi)d3x=∬−g⋅ρuμuids=0
dx0d∫ρuμu0−g⋅d3x+∫Γαβμ⋅ρuαuβ−g⋅d3x=0(6)
第一项用了一下偏导数提到积分号外的方法,并且考虑到其他三个变量都被积分了,剩下的只是 x0 的函数,所以改成了全导数.
另外,质量守恒的连续性方程:
(ρuν);ν=−g1(−g⋅ρuν),ν=0
也就是质量流的散度为零,第一个等号仅仅起到化简的作用.
上式两端乘 −g 因子再积分,得到的是
dx0d∫ρu0−g⋅d3x+∫∂xi∂(−g⋅ρui)d3x=0
已经将空间分量和时间分量分开写出.
第二项也可以像之前一样,使用 Gauss 定理得到为零. 同时在局部静止惯性系中,u0=c,dt=dτ,所以:
dx0d∫ρu0−g⋅d3x=dtd∫ρd3x=dτd∫ρd3x=0
注意
一开始我有疑问:为什么 −g 莫名其妙消失了?其实这是因为我们始终在局部静止惯性系中讨论问题,在这样的系中,不要忘记 gμν=ημν,局部的时空是平直的!所以这里 g=−1,当然可以更进一步化简公式.
我们将上述式子的 LHS 记作 m (正是该粒子的静止质量),很明显,质点的静止质量沿着它的世界线守恒.
回到 (6) 式,因为我们考虑的是质点的运动,所以可以把积分限制在一个很小的区域内,这个区域中 uμ 和 Γαβμ 都几乎不变化,可以提到积分号外面:
dx0d(uμ∫ρu0−g⋅d3x)dx0d(muμ)dτdx0dx0d(muμ)dτd(muμ)+Γαβμuαuβ⋅u01∫ρu0−g⋅d3x=0+u0mΓαβμuαuβ=0+mΓαβμuαuβ=0+mΓαβμuαuβ=0
这是在局部惯性系导出的. 但是仔细看,能够发现这是一个张量方程,也就是说这个方程能够在任意的参考系下成立. 当 m 为常数时,可化为测地线方程:
dτduμ+Γαβμuαuβdτ2d2xμ+Γαβμdτdxαdτdxβ=0=0
dτ∝ds,所以这就是测地线方程.
(3) 协变导数:
警告
不是为什么这个要拖到这个地方来讲啊,早点讲不好吗?
引入协变导数的概念:
dτDAμdτDAμ=Aμ;νuν=dτdAμ−ΓμνλAλuν=Aμ;νuν=dτdAμ+ΓλνμAλuν
测地线方程可以简化为:
dτDuμ=0 or dτD(dτdxμ)=0
(4) 运动方程的 Newton 近似:条件有很多,
引力场为弱场:
gμν=ημν+hμν,∣hμν∣≪1
(体现在与 Minkowski 的度规偏移很小)
引力场是静态的:gμν,0=ημν,0=0.
引力场空间缓变:∣gμν,i∣=∣hμν,i∣≪1.
粒子低速运动:
dx0dxi≪1,dτdxi≪dτdx0,dτdxi≪c
在这些条件下,Christoffel 符号的一阶近似是
Γαβμ=21ημρ(hρα,β+hρβ,α−hαβ,ρ)
运动方程化为下面的时间和空间部分:
dτd(mdτdx0)=0dτd(mdτdxi)+mΓ00i(dτdx0)2=0
m=const. 时 (粒子不分裂),由第一个方程就得到直线:x0=aτ+b. 代入下面的第二个方程,得到
dτ2d2xi=−Γ00ia2⟹(dx0)2d2xi=−Γ00i=21h00,i
而 x0=ct,因此
dt2d2xi=21c2h00,i
Newton 定律写成
mIdt2d2xi=mg(−∂xi∂φ)
φ=−2c2h00+const.(7)
边界条件是在无穷远处引力的作用趋于零,这时候度规与 Minkowski 度规的偏移量 h00→0,如果将此处作为引力势的零点,那么常数项也是零. 代入经典的 Newton 引力势公式,我们就能得到这种情况下的度规:
h00=c22φ=−rc22GM,g00=−1+h00=−(1+rc22GM)
所以弱场近似条件意味着
r≫rg=c22GM
这个 rg 被称为星体的引力半径,当然我们早就知道,这也是质量 M 的黑洞的半径.
提示
最后的 tip:在推导过程中我们发现 m 是作为同一个量出现在运动方程的两侧,而不是像 Newton 力学中一样,两边分别是引力荷和惯性质量. 这是理论的本质带来的.
广义相对论中的力学和电磁学方程
质点力学
狭义相对论中我们已经接触了四维动量、四维力等等
uμPμFμ=(γc,γv)=(γm0c,γm0v)=(E/c,p)=(γf⋅cv,γf)
广义相对论就是作下面的协变化:
,→;dτd→dτDγ→dτdt⎭⎬⎫
上面的量分别改写成:
uμPμFμ=dτdxμ=(cdτdt,vdτdt)=m0uμ=(E/c,p)=(m0cdτdt,m0vdτdt)=(cf⋅vdτdt,fdτdt)
原来的 Newton 定律写成
dτDPμ=Fμ
这里的 Fμ 不包括引力和惯性力,这两个是参考系和时空本身的作用.
电动力学
先回顾经典的 Maxwell 方程组,
⎩⎨⎧∇⋅E=4πρ∇⋅B=0∇×E+c1∂t∂B=0∇×B−c1∂t∂E=c4πj,μ0=ε0=1
Fμν,τ+Fτμ,ν+Fντ,μ=0Fμν,ν=c4πJμ(8)
式中的 Fμν 是电磁场张量,分量形式是
Fμν=0−E1−E2−E3E10B3−B2E2−B30B1E3B2−B10
四维电流密度:
Jμ=ρ0uμ=(cρ0,j)=(γρ0c,γρ0v)
电荷守恒在狭义相对论下可以改写成 Jμ,μ=0. 另外,电磁场张量可以用电磁 4 - 矢量 Aμ=(Φ,Ai) 表示:
Fμν=Aν,μ−Aμ,ν⟸⎩⎨⎧E=−∇Φ−c1∂t∂AB=∇×A
如果将这个表述代入 (8),则第一个式子成为恒等式,第二个式子简化为
Aμ,α,α=−c4πJμ⟸⎩⎨⎧∇2Φ−c21∂t2∂2Φ=−4πρ∇2A−c21∂t2∂2A=−c4πj
这里已经用了 Lorentz 规范,即
∇⋅A+c1∂t∂Φ=0(Aν,ν=0)
上面是狭义相对论,在广义相对论中方程应该改成协变形式,也就是
Fμν;τ+Fτμ;ν+Fντ;μ=0Fμν;ν=−g1(Fμν−g),ν=c4πJμJμ;μ=−g1(−g⋅Jμ),μ=0Fμν=Aν;μ−Aμ;νAμ;ν;ν−RμαAα=−c4πJμAν;ν=−g1(−g⋅Aν),ν=0(9)(10)(11)(12)(13)(14)
这里用到了 Chapter 2 - 几个重要的运算 的一些公式.
注意
上面其他的公式都好理解,唯独这第五个显得非常奇怪. 首先我不明白的是这个「;ν」怎么写到上面去了,后来一想原来是对协变坐标求导. 但是这里 Ricci 张量的来源也比较奇妙... 还是看教材的证明吧.
/Proof/ (第五个式子的证明)
把 (12) 式代入 (10) 式 (的协变形式):
Aν;μ;ν−Aμ;ν;ν=c4πJμ
注意
还是没讲清楚为什么要对协变坐标求导. 但是这个符号简单理解就是 gνλAν;μ;λ=Aν;μ;ν. 为什么可以直接升这个「被求导」的指标呢?因为指标提升是对张量的一个标准操作,在定义上可以直接对求协变微商后已经是一个张量进行,即使这个指标是带「;」的.
虽然升降指标之前说过了,但是我觉得不加说明直接对「;ν」使用有点流氓... 没有什么理由啊.
在 Chapter 2 - 曲率与挠率 这里引入曲率时,我们曾经考虑交换两次协变微商的顺序,研究它们的差值:
Aλ;μ;ν−Aλ;ν;μ=RρλμνAρ−2Γρ[μν]Aλ;ρ
套用到这里,两边同时升一下指标,
Aν;μ;ν−Aν;ν;μ=RρνμνAρ
这里没有挠率,所以 RHS 后面反称项没了.
继续,利用曲率张量的一系列对称性:
RρνμνAρ=gαρRανμβgβνAγgγρ=RανμβAγgβν⋅(gαρgγρ)=RανμβAγgβν⋅δαγ=RανμβAαgβν=RμβανAαgβν=RβμναAαgβν=RνμναAα=RμαAα=RμρAρ
注意
曲率张量的对称性太好了,所以到处变都没什么关系,各种各样奇妙的上下指标都能换来换去.
不过这里作者违背了自己之前的定义 —— Ricci 张量是 13 指标缩并,而是改成了别的教材里面的 14 缩并,幸好 Ricci 张量是对称张量...
把我们得到的公式套进证明一开头的式子,得到
Aν;ν;μ+RμρAρ−Aμ;ν;ν=c4πJμ
而 Lorentz 规范早已要求 Aν;ν=0,所以证得所求式,
Aμ;ν;ν−RμρAρ=−c4πJμ
Aμ;ν;ν 又可以写成 d'Alembert 算子的形式:□Aμ.
能动张量
还是从狭义相对论说起,在这里能动张量写成:
Tμν=εM1cM2cM3cS1/cT11T21T31S2/cT12T22T32S3/cT13T23T33
其中,Tik 是三维空间的「动量流密度张量」,Sk 是三维能流密度矢量,Mi 是三维动量密度矢量,ε 是能量密度标量.
Tμν 是一个对称张量,满足能量守恒定律 Tμν,ν=0 (我们之前已经说过了). 能量守恒在三维中表示为
∇⋅S=−∂t∂ε,∇⋅[T]=−∂t∂M
广义相对论只是把能量守恒变为 Tμν;ν=0 (变成协变微商).
下面是一些具体的表达式.
电磁场:
Tμν=4π1(FλμFλν−41gμνFρλFρλ)
理想流体:
Tμν=(ρ+c2p)uμuν+pgμν
这里 ρ 是局域静止惯性系的质量密度、p 是这个系的压强.
无相互作用的松散物质:
Tμν=ρuμuν
场方程的 Newton 近似
之前我们已经讲过质点运动方程的 Newton 近似,现在来说场方程的. 这一讨论可以由 Newton 的引力定律来确定场方程中的比例系数 κ,这一点和 Bohr 的氢原子模型很像.
场方程先写在这里:
Rμν−21gμνR=κTμν
两边同时降一个指标再缩并,得
R−2R=κT⟹R=−κT
这里把能动张量的迹记作 T. 把这个关系代回原来的场方程,得到
Rμν=κ(Tμν−21gμνT)
不得不说这似乎是我们更加经常见到的形式,我中二时期在笔记本上抄的就是这个版本.
这是场方程的另外一个表述形式罢了.
设引力源由非相对论性的理想流体构成 (粒子热运动速度远小于光速、粒子之间没有很强的相互作用、没有能量损耗),这个假设至少在我们做 Newton 近似的时候绝对是合理的. 因为这个假设,引力源内部的压强 p 远远小于其密度 ρ,能动张量正好符合上一节最后提到的第三种 —— 无相互作用的松散介质,为
Tμν=ρuμuν
假定介质宏观上静止 (这也是 Newton 近似下允许的),采用与介质相对静止的坐标系,有
uμ≡dτdxμ=−g001(c,0,0,0)
所以能动张量不为零的分量只有 T00=−ρc2/g00,张量的迹为
T=gμνTμν=ρuμuμ=−ρc2
而 Ricci 张量表示为
Rμν=Rλμλν=Γλμν,λ−Γλμλ,ν+ΓλμνΓρλρ−ΓλνρΓρμλ
所以先来对联络进行近似,和运动方程的 Newton 近似一样,
Γλμν≈21ηλρ(hρμ,ν+hρν,μ−hμν,ρ)
具体计算分量:
⎩⎨⎧Γ000=−21(h00,0+h00,0−h00,0)=0Γ00i=−21(h00,i+h0i,0−h0i,0)=−21h00,iΓ0ij=−21(h0i,j+h0j,i−hij,0)=−21(h0i,j+h0j,i)Γi00=21(hi0,0+hi0,0−h00,i)=−21h00,iΓi0j=21(hi0,j+hij,0−h0j,i)=21(h0i,j−h0j,i)Γijk=21(hij,k+hik,j−hjk,i)
明显,Γαμν 的所有分量全部是小量,这使得我们可以忽略 Rμν 表达式的后两项 Γαμν 二阶项. 具体计算 Ricci 张量的各个分量:
Rμν=Γλμν,λ−Γλμλ,ν=⎩⎨⎧R00=−21h00,i,iR0i=21(h0k,i,k−h0i,k,k)Rij=−21(−h00,i,j+hkk,i,j−hki,j,k−hkj,i,k+hij,k,k)
重复指标仍然表示求和,即使都是协变指标.
为了得到 Newton 近似,我们只对 00 分量方程感兴趣,把上面的所有结果代入场方程:
−21h00,i,i=κ(−g00ρc2−21g00⋅(−ρc2))≈κ(−η00ρc2+21η00⋅ρc2)=21κρc2
注意这里用的是场方程的逆变形式,因为之前我们求的是 T00 分量的值. 上式可以化为
h00,i,i=−κρc2
而引力势是:
φ=−2c2h00
这是 (7) 式. 所以引力势的 Laplace 算子为
∇2φ=2c4κρ
Newton 力学中的引力势 Poisson 方程则是 ∇2φ=4πGρ,形式上是完全一样的,同时我们还确定了 κ 的具体形式为
κ=c48πG
如果是自然单位制,就是 κ=8πG.
坐标条件与边界条件
(1) 坐标条件的引入:场方程中的各个张量有十个独立分量,因此场方程由十个分量方程构成. 方程以度规张量为未知数,其中包含 gμν 的分量、一阶、二阶偏导数,所以:场方程是由 10 个方程组成的二阶非线性偏微分方程组.
10 个方程 10 个未知量,理论上可以在给定边界条件的情况下确定度规. 但是 Bianchi 恒等式 Gμν;ν=0 和能动张量守恒 Tμν;ν=0 将 10 个独立方程的个数减少到了 6 个,这时我们已经不能唯一确定 10 个独立的 gμν 分量了.
注意
这里不得不吐槽作者了:我一开始看这一段,以为是恒等式共同减少了场方程的自由度;但是这两个恒等式 (Gμν;ν=0 & Tμν;ν=0) 完全是互相等价的,所以剩 6 个自由度的原因仅仅是因为一个恒等式有 4 个分量式.
那为什么要同时提到这两个等价的恒等式?这不是掩人耳目吗?
我们现在遇到的情况和在 Maxwell 理论中遇到的非常类似,在那里,我们有四个分量方程:
Fμα,σ=Aα,μ,α−Aμ,α,α=c4πJμ
但是电荷守恒定律 Jμ,μ=0 减少了这组方程的一个自由度,需要额外引入一个「规范条件」来定解. 但是引入了规范条件 (Lorentz 规范 Aμ,μ=0 / Coulumb 规范 ∇⋅A=0) 之后,仍然不能定解. 以 Lorentz 规范为例,规范后的方程为
□Aμ=Aμ,α,α=−c4πJμ
这时候 Aμ 还能任意加上一个 □α(xμ)=0 的标量函数,这样的规范变换 Aμ→Aμ+∂μα 称为第二类规范变换,也因此一次规范不能定解.
所以我们在场方程的语境下也要有相应的「规范条件」,这样的规范条件实际上是对坐标系做出选择 (选择坐标系有 4 个分量). 从物理的视角来说,度规是一个张量,所以其物理实际不依赖于坐标系的选择,具体的数学表达当然受限于坐标系.
当然,引力场的规范条件一般也不能完全确定坐标系 (或者说 gμν),例如:满足谐和条件 (下面会提到) 的坐标系就是不唯一的.
(2) 坐标条件与边界条件的非协变性:坐标条件 & 边界条件和场方程不同,这两者是非协变的,与坐标系的选择相关. 这种非协变性和广义相对性原理并不矛盾.
注意
这个问题提得有点蠢来着,那 Newton 力学在不同系里面定解也是一个道理,没看见说违反了相对性原理啊.
(3) 谐和坐标条件:谐和条件在广义相对论中比较重要,因为作弱场线性近似时,用谐和坐标比较方便;而且当引力场消失时,谐和坐标系能够自然地回到平直时空的惯性系.
谐和条件定义为:
Γλ≡gμνΓλμν=21gμνgλρ(gρμ,ν+gρν,μ−gμν,ρ)=0
为什么叫「谐和」条件?
因为满足上式的坐标 xμ 是调和函数,又叫谐和函数. 也就是这坐标满足谐和方程
□xμ=0
/Proof/ (证明满足谐和条件的坐标是谐和函数)
先化简谐和条件. 我们已经知道 Christoffel 符号的缩并是
Γμαμ=21gμρgμρ,α=∂xα∂(ln−g)
另外,Kronecker 符号的微商
δλμ,ν=(gλρgρμ),ν=gλρgρμ,ν+gρμgλρ,ν=0
由这两式可得
Γλ≡21gμν(−gρμgλρ,ν)+21gμν(−gρνgλρ,μ)−21gμνgλρgμν,ρ=−21gμνgρμgλρ,ν−21gμνgρνgλρ,μ−gλρ∂xρ∂(ln−g)=−δμρgλρ,μ−−ggλρ∂xρ∂(−g)=−gλρ,ρ−−ggλρ∂xρ∂(−g)=−−g1∂xρ∂(gλρ−g)
最后一步是凑出了一个全微分.
而调和方程本身可以展开来写:
□φ=0⟹−g1∂xρ∂(gλρ−g⋅∂xλ∂φ)=0
和上面的 Γλ 对比,如果 φ=xλ,则刚好相等,所以说这里其实是
Γμ=−□xμ=0
坐标就是一个调和函数.
如果空间中不存在引力场,则度规变成 Minkowski 度规,刚刚的谐和条件自然被满足.
Фок 和周培源都认为满足谐和条件的坐标系比其他坐标系更加优越.
(4) 谐和坐标下的弱场近似:刚刚我们提到作线性弱场近似时用谐和座标很方便. 在这种情况下,度规可以写成:
gμν=ημν+hμν,∣hμν∣≪1
还是之前 Newton 近似的老套路.
Christoffel 符号:
Γμαβ=21ημν(hνα,β+hνβ,α−hαβ,ν)=21(hμα,β+hμβ,α−hαβ,μ)
Ricci 张量:
Rμν=Γλμν,λ−Γλμλ,ν=21(hλμ,ν,λ+hλν,μ,λ−hμν,λ,λ−hλμ,λ,ν−hλλ,μ,ν+hμλ,λ,ν)
注意到第 4 项和第 6 项,有
−hλμ,λ,ν+hμλ,λ,ν=−gλρhρμ,λ,ν+hμλ,λ,ν=−hρμ,ρ,ν+hμλ,λ,ν=0
所以
Rμν=21(hλμ,ν,λ+hλν,μ,λ−hμν,λ,λ−hλλ,μ,ν)
定义一个差值:
hˉμν=hμν−21ημνhαα
则场方程 (自然单位制) 化成:
hˉμν,α,α+ημνhˉαβ,α,β−hˉμα,α,ν−hˉνα,α,μ=−16πGTμν
谐和条件也可以化成:hˉμα,α=0,于是上式 LHS 后三项都是零,得到
hˉμν,α,α=−16πGTμν
hˉμα,α=0 称为引力势的 Lorentz 规范条件.
和电磁场一样,上述方程无法完全定解. 在谐和条件下,方程解为
hˉμν(r,t)=2πκ∫rTμν(r′,t−cr)dV′
式中,dV′ 是体积元,r=[(xi−x′i)(xi−x′i)]1/2,这是推迟解. 把 Tμν 看作场源,LHS 表示离源距离为 r 处的引力势,这个引力势由 t−r/c 时刻的引力源物质分布和运动状态决定,这说明引力场以光速传播.
如果引力源局限在一个小区域,场点又距离引力源很远时,可以简化为
hˉμν=2πr0κ∫Tμν∗dV′
r0 是引力源到观测点的平均距离,「∗」表示推迟.
如果把引力场看成以 Minkowski 时空为背景的二阶张量场 hμν,量子化之后可以得到一种自旋为 2、静质量为 0 的引力子,它是一种以光速传播的 Boson.
更新日志
2025/9/14 19:07
查看所有更新日志
efdf3
-feat(note): add GR chapter-3于