连续变换的数学基础
群与李群
通过研究物理背后的数学结构可以使我们对物理对象的理解更为清晰、深刻。在这一部分,我们总以 三维旋转 为例,引入一些数学概念。在这份物理笔记中,我们不过多关注数学的细节。
在抽象代数中,我们接触过 群 group 的概念。群是一个集合 G 和一个二元运算 “⋅” 构成的数学结构,且该二元运算满足如下要求(群公理):
∀ a,b∈Ga⋅b∈G
∀ a,b,c∈G(a⋅b)⋅c=a⋅(b⋅c)
∃ e∈G,s.t. e⋅a=a⋅e=a
∀a∈G, ∃ b∈G,s.t. a⋅b=b⋅a=e
该二元运算常称为群的乘法。这个群记为 (G,⋅)。
现在考虑,我们若将某个三维旋转操作的集合记为 {R}。其中的元素就为旋转变换,其作用效果为改变某个特定坐标系 A 的取向。现在如下定义二元运算:∀ R1,R2∈{R},R1⋅R2 为:先进行 R2 操作,再进行 R1 操作。
不难验证,该二元运算满足群公理。所以 ({R},⋅) 构成了一个群,称为 旋转群。对于连续变换来说,它们不仅仅具有群结构,还有连续的性质。如何进行描述呢?
我们先介绍两个概念:
那么对于任意一个三维旋转变换都可以用一个 3×3 实正交矩阵 A 来描述,且 detA=1。例如:
A=⎝⎛1000cosθsinθ0−sinθcosθ⎠⎞
那么三维旋转群正是一般线性群的封闭子群,它是一个矩阵李群,满足以下性质:
- detA=1 “特殊” Special
- ATA=1n×n “正交” Orthogonal
三维旋转群实际上是三维特殊正交群,记为 SO(3)。
还有很多矩阵李群,如 特殊幺正群 SU(n)(“U” 表示幺正 unitary);再如 广义正交群 generalize orthogonal groups O(n;k),满足:
ATA=diag(n1,⋯,1,k−1,⋯,−1)
其中 O(1;3) 称为 洛伦兹群。
因为三维旋转变换是连续的,我们指出李群 SO(3) 是 连通的 connected。
到这里,我们把对三维旋转变换的研究等价于研究矩阵李群 SO(3)。任何连续变换都能够找到对应的连通李群。
李代数与指数映射
令 X 为 n×n 矩阵,其指数运算定义为:
eX≡n=0∑∞n!Xn
可以证明,上式右边总是收敛的。eX 是一个关于 X 的连续函数。
注意,此处我们已经引入了矩阵加法。
n×n 矩阵的对数运算定义为:
logX=n=1∑∞(−1)n+1n(X−I)n
关于矩阵的指数运算,我们后面可能用到以下性质:
eX+Y=m→∞lim(emXemY)m(1)
只要注意到 emXemY=1+mX+Y+O(m21),其证明是容易的。
- 对于任意 n×n 复矩阵,有:
det(eX)=etrX(2)
不做证明。
在物理学中,算子在特定表象中的表示就为矩阵,我们常用这种指数运算来构建起厄密算子与幺正算子之间的联系,此时我们习惯将指数运算记为:e−iX。我们下面就采用这种表示方法。
定义:对于一个矩阵李群 G 来说,这个矩阵李群的 李代数 Lie algebra 是所有使得 e−itX∈G,∀ t∈R 的矩阵 X 构成的集合。李群 G 对应的李代数记为 g。
我们有如下推论:
推论1:令 G 是一个矩阵李群,X 是其对应的李代数中的元素,那么所有 e−iX 都与矩阵李群的单位元相连接。
推论2:令 G 是一个矩阵李群,设 X 是其李代数 g 中的一个元素,A 是矩阵李群中的元素,那么:AXA−1∈g:
证明:
∵e−it(AXA−1)=n=0∑∞n!(−itAXA−1)n=n=0∑∞An!(−itX)nA−1=Ae−itXA−1∈G⇒AXA−1∈g
推论3:令 G 是一个矩阵李群,{An∣An=e−iXn∈G} 是这个矩阵李群中的矩阵列,且 limn→∞An=A,那么必定存在 X∈g 且 A=e−iX。
由矩阵李群的完备性和矩阵指数运算的连续性可得。这反映了李代数的完备性,即 ∀Xn∈g,limn→∞Xn=X∈g。
李代数具有如下性质:设 X,Y∈g,那么有:
- sX∈g, ∀ s∈R
- X+Y∈g
- −i(XY−YX)∈g
对于性质一的证明是直接的:
e−it(sX)=e−i(ts)X=e−it′X∈G⇒sX∈g
对于性质二,考虑到 (1) 有:
e−it(X+Y)=m→∞lim(em−itXem−itY)m
其中 e−mitX,e−mitY∈G,那么 (em−itXem−itY)m∈G。考虑到矩阵李群的完备性,得到:e−it(X+Y)∈G。所以 X+Y∈g
对于性质三,考虑到如下关系:
dtd(e−itXYeitX)∣t=0=−i(XY−YX)
因为 e−itX∈G,Y∈g,由 推论2 得到:e−itXYeitX∈g。导数实际上是如下极限:
i(XY−YX)=h→0limhe−ihXYeihX−Y
由性质一、二与李代数的完备性可以得到 −i(XY−YX)∈g。
性质一、二说明李代数是一个实线性空间。一般来说:X∈g 并不意味着 iX∈g。若满足这个要求,则我们称其对应的矩阵李群是 复 complex 的,对应的李代数成为一个复线性空间。
性质三实际上是在线性空间中定义了一个新运算:李括号 Lie bracket:
[X,Y]=XY−YX
李括号 [,⋅,] 是一个从 g×g→g 的映射。具体来说,实际上是:
∀ X,Y∈g⇒−i[X,Y]∈g
李括号具有如下性质,∀X,Y,Z∈g:
- [,⋅,] 具有双线性。
- [X,Y]=−[Y,X]
- [X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]]=0
对于 1,2 的验证是容易的。性质 3 可以直接展开得到。通过分析 (3) 式的对称性可以得到相同的结果:
记 f(X,Y,Z)=[X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]],有:
f(Y,X,Z)=[Y,[X,Z]]+[X,[Z,Y]]+[Z,[Y,X]]=−([X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]])=−f(X,Y,Z)
通过交换三次变量,得到:
f(X,Y,Z)=−f(Y,Z,X)
而从 f(X,Y,Z) 的形式可以看出,其具有轮换对称性,所以:
f(X,Y,Z)=f(Y,Z,X)
综上,得到:
f(X,Y,Z)=0
这称为 雅可比等式 Jacobi identity。
考虑李代数构成一个线性空间,可以取一组完备基底 {Xi},那么李括号的结果可以写为:
[Xi,Xj]=k∑cijkXk
cijk 称为李代数的 结构常数 structure constant。李代数的性质2,3 意味着结构常数将具有以下要求:
cijk=−cjikm∑(cijmcmkl+cjkmcmil+ckimcmjl)=0
这件事情反应了李代数的结构。
矩阵的指数运算实际上构成了一个从李代数到矩阵李群的 指数映射 exponential mapping:
exp:g→G
对于李代数 g 的一组完备基 {Xi},那么对应的矩阵李群 G 的任意元素都可以表示为如下形式:
exp(−im∑tmXm),∀ tm∈R
对于一个无穷小变换来说,上述元素应当趋近于单位元,令 tm→0。可得:
exp(−im∑tmXm)→1−im∑tmXm
即从无穷小变换对应矩阵李群元素中可以得到对应的李代数。
对于旋转群的讨论
下面以三维旋转变换为例进行说明。首先三维旋转变换构成 SO(3) 群,考虑其中一个有限操作:例如绕 x 轴为逆时针旋转 θ 角度:
A=⎝⎛1000cosθsinθ0−sinθcosθ⎠⎞
其无穷小变换为:
⎝⎛10001θ0−θ1⎠⎞=1+θ⎝⎛0000010−10⎠⎞=1−iθAx
其中:
Ax=⎝⎛00000i0−i0⎠⎞
可以验证:
exp(−iθAx)=A
注意到 Ax 的本征值为 0,1,−1 对应的本征向量为:
α1=⎝⎛100⎠⎞α2=21⎝⎛01i⎠⎞α3=21⎝⎛0i1⎠⎞
记
C=(α1,α2,α3)=⎝⎛1000212i02i21⎠⎞
那么可以得到:
C−1AxC=⎝⎛00001000−1⎠⎞=D⇒Ax=CDC−1
其中
C−1=C†=⎝⎛100021−2i0−2i21⎠⎞
现在可以进行指数运算了:
exp(−iθAx)=exp(−iθCDC−1)=Cexp(−iθD)C−1=C⎝⎛1000exp(−iθ)000exp(iθ)⎠⎞C−1=⎝⎛00000i0−i0⎠⎞=A
考虑沿着不同轴的无穷小旋转,得到李代数的矩阵表示为:
Ax=⎝⎛00000i0−i0⎠⎞Ay=⎝⎛00−i000i00⎠⎞Az=⎝⎛0i0−i00000⎠⎞
这就是李代数 so(3) 的一个 3 维表示。我们来看其李代数的结构,计算李括号:
[Ax,Ay]=⎝⎛00000i0−i0⎠⎞⎝⎛00−i000i00⎠⎞−⎝⎛00−i000i00⎠⎞⎝⎛00000i0−i0⎠⎞=⎝⎛0−10100000⎠⎞=iAz
更一般的,可以验证:
[Ai,Aj]=iϵijkAk(3)
在得到李代数的结构后,我们就可以进行推广:只要对于任意 n×n 矩阵 Ax,Ay,Az 满足 (3) 对应的关系,那么就可以将这三个矩阵作为 生成元 generator,利用指数映射得到一个 n 维的矩阵李群,这个 n 维矩阵李群显然与 SO(3) 的结构相同。我们称其为李群的 n 维表示。
例如,泡利矩阵 σx,σy,σz 满足 (3) 所要求的对易关系。那么矩阵李群:
{exp(−ii∑θiσi),∀ θi∈R}
构成了 SO(3) 的一个二维表示。另外这个群不是别的,正是 SU(2) 群,我们说 SO(3) 和 SU(2) 是 同构 的。
洛伦兹变换的代数结构
洛伦兹变换与洛伦兹群
整个量子场论是建立在 狭义相对论 基础上的。在狭义相对论中,光速不变 是一条基本原理,即在任何参考系中,都有:
t2−x2−y2−z2=t′2−x′2−y′2−z′2(4)
定义 间隔:
ds2=dt2−dx2−dy2−dz2(5)
考虑两惯性参考系 S1,S2,由于空间的均匀性与各项同性,任一间隔在 S1,S2 中的比值应当仅仅取决于两参考系相对速度 v 的绝对值,且只能连续的依赖于 ∣v∣:
ds22=α(∣v∣)ds12
同理有:
ds12=α(∣v∣)ds22
由上两式得到:
α(∣v∣)=1⇒ds12=ds22(6)
即间隔不随参考系改变。利用四矢量符号:xμ=(x0,x1,x2,x3)=(t,x,y,z),xμ=(x0,x1,x2,x3)=(t,−x,−y,−z) 以及 度规张量 metric tensor gμν=gμν=diag(1,−1,−1,−1),可以将间隔写为:
ds2=dxμdxμ=gμνdxμdxν=gμνdxμdxν
任意的线性变换具有以下形式;
x′μ=Λ νμxν+aμ(7)
当 aμ=0 时,我们称其为 洛伦兹变换 Lorentz Transformation;当 aμ=0 时,我们称其为 庞加莱变换 Poincaré Transformation。间隔不变性对洛伦兹变换矩阵有如下要求:
ds′2ds2=gμνdx′μdx′μ=gμνΛ ρμΛ σνdxρdxσ=gρσdxρdxσ
得到洛伦兹变换矩阵需要满足:
gμνΛ ρμΛ σν=gρσ(8)
使用 gρλ 同时作用于 (8) 式左右两边,可得:
Λν λΛ σν=δ σλ
即可以得到洛伦兹矩阵的逆:
(Λ−1) νλ=Λν λ
利用 Λ ρμ=(ΛT)ρ μ,(8) 式可以写为:
(ΛT)ρ μgμνΛ σν=gρσ(9)
当相邻的两个洛伦兹指标一上一下进行缩并时,才表示对应洛伦兹矩阵相乘。我们若要使 Λ 与 ΛT 相乘,我们必须引入度规张量,由于 g=diag(1,−1,−1,−1),(9) 式实际告诉我们所有洛伦兹变换的集合构成群 O(3,1),这也是之前提到的称 O(3,1) 为 洛伦兹群 的由来。
先分析一下 (9) 式,可得:
⇒⇒⇒⇒det(ΛTgΛ)=detgdetΛTdetgdetΛ=detgdetΛTdetΛ=1(detΛ)2=1detΛ=±1
再看分量,取 ρ,σ=0:
1⇒⇒=gμνΛ 0μΛ 0ν=i∑giiΛ 0iΛ 0i=(Λ 00)2−i=1∑3(Λ 0i)2(Λ 00)2=1+i=1∑3(Λ 0i)2Λ 00⩾1orΛ 00⩽−1
不存在连续的洛伦兹变换使得 detΛ,Λ 00 的取值的正负性发生变化,因此洛伦兹群是不连通的,它由四个连通子群构成。我们因此可以将洛伦兹变换进行分类:
- 正规正时 proper orthochronous 洛伦兹变换 L+↑
detΛ=+1,Λ 00⩾1
- 正规非正时 proper non-orthochronous 洛伦兹变换 L+↓
detΛ=+1,Λ 00⩽1
- 非正规正时 improper orthochronous 洛伦兹变换 L−↑
detΛ=−1,Λ 00⩾1
- 非正规非正时 improper non-orthochronous 洛伦兹变换 L−↓
detΛ=−1,Λ 00⩽1
之后我们提到,时间反演和空间反演变换将不同类型的洛伦兹变换联系起来。
洛伦兹代数
来看无穷小洛伦兹变换,其应当接近于恒等变换,由于 I∈L+↑,无穷小变换应当为:
Λ=I+ω(10)
考虑洛伦兹变换的定义 (8),将 (10) 代入得到:
⇒⇒gμν(δ ρμ+ω ρμ)(δ σν+ω σν)=gρσgρσ+ωσρ+ωρσ=gρσωσρ=−ωρσ
可以得到无穷小矩阵 {ωμν} 应当是反对称的,可以写为:
{ωμν}=⎝⎜⎜⎛0−∗−∗−∗∗0−∗−∗∗∗0−∗∗∗∗0⎠⎟⎟⎞
那么 ω 对角线之上的六个独立矩阵元 ωμν(μ<ν) 实际上可以充当六个无穷小群参数,我们对应引入六个生成元矩阵 Jμν,且定义 Jμν=−Jνμ。那么可以将无穷小变换写为:
Λ=I−iμ<ν∑ωμνJμν=I−2iωμνJμν(11)
通过比较 (10)(11),得到:
ω σρ=−2iωμν(Jμν) σρ
又因为:
ω σρ=gμρδ σνωμν=21(gμρδ σν−gνρδ σμ)ωμν(12)
比较 (11)(12) 得到生成元矩阵为:
(Jμν) σρ=i(gμρδ σν−gνρδ σμ)(13)
具体来说,这六个生成元可以显式写为:
J10=⎝⎜⎜⎛0−i00−i00000000000⎠⎟⎟⎞J12=⎝⎜⎜⎛000000i00−i000000⎠⎟⎟⎞J20=⎝⎜⎜⎛00−i00000−i0000000⎠⎟⎟⎞J23=⎝⎜⎜⎛00000000000i00−i0⎠⎟⎟⎞J30=⎝⎜⎜⎛000−i00000000−i000⎠⎟⎟⎞J31=⎝⎜⎜⎛0000000−i00000i00⎠⎟⎟⎞
我们注意到 J10,J20,J30 对应 boost,而 J12,J23,J31 对应旋转,习惯上定义:
Ji=21ϵijkJjk,Ki=Ji0(i=1,2,3)(14)
得到生成元后,我们来看李代数结构。首先
(JμνJρσ) βα=(Jμν) κα(Jρσ) βκ=−(gμαδ κν−gναδ κμ)(gρκδ βσ−gσκδ βρ)=−(gμαδ κνgρκδ βσ−gμαδ κνgσκδ βρ−gναδ κμgρκδ βσ+gναδ κμgσκδ βρ)=−(gμαgρνδ βσ−gμαgσνδ βρ−gναgρμδ βσ+gναgσμδ βρ)
同理若要计算 (JρσJμν) βα 只需要对上式的结果进行指标替换 μν↔ρσ:
(JρσJμν) βα=−(gραgμσδ βν−gραgνσδ βμ−gσαgμρδ βν+gσαgνρδ βμ)
于是李括号为:
[Jμν,Jρσ] βα==−(gρν(gμαδ βσ−gσαδ βμ)−gμρ(gναδ βσ−gσαδ βν) −gνσ(gμαδ βρ−gραδ βμ)+gμσ(gναδ βρ−gραδ βν))i(gνρJμσ−gμρJνσ−gνσJμρ+gμσJνρ) βα
即:
[Jμν,Jρσ]=i(gνρJμσ−gμρJνσ−gνσJμρ+gμσJνρ)(15)
这就是洛伦兹群的李代数结构。现在若我们要对任意一个对象进行洛伦兹变换,实际上就是要找到洛伦兹群某个特定的表示。在下一篇中我们会做这件事情。
由生成元可以表示任意一个洛伦兹变换:
Λ=exp(−2iωμνJμν)
庞加莱代数
当洛伦兹变换 Λ 与时空平移 a 同时存在时,我们称这种变换为庞加莱变换。记为 T(Λ,a),庞加莱变换的乘法为:
T(Λ2,a2)T(Λ1,a1)=T(Λ2Λ1,Λ2a1+a2)
所有庞加莱变换的集合也是一个矩阵李群,称为 庞加莱群 Poincaré group。庞加莱群有 10 个生成元:分别是洛伦兹群的 6 个生成元 Jμν 与时空平移对应的 4 个生成元 Pμ,无穷小庞加莱变换为:
T(I+ω,ϵ)=1−2iωμνJμν+iϵμPμ
考虑以下变换
T(Λ,a)T(1+ω,ϵ)T−1(Λ,a)
其中 ω,ϵ 为无穷小量,a 为有限量。
利用庞加莱变换的复合,可得:
==T(Λ,a)T(1+ω,ϵ)T−1(Λ,a)T(Λ(1+ω)Λ−1,Λϵ−ΛωΛ−1a)1−21i(ΛωΛ−1)μνJμν+i(Λϵ−ΛωΛ−1a)μPμ(16)
且有:
T(Λ,a)T(1+ω,ϵ)T−1(Λ,a)=T(Λ,a)(1−21iωρσJρσ+iϵρPρ)T−1(Λ,a)(17)
利用 ω 与 ϵ 的系数分别相等,得到:
T(Λ,a)JρσT−1(Λ,a)=Λμ ρΛν σ(Jμν−aμPν+aνPμ)T(Λ,a)PρT−1(Λ,a)=Λμ ρPμ(18)
以 (18) 式第一式进行说明,通过比较 (16)(17) 得到:
(ΛωΛ−1)μνJμν+2(ΛωΛ−1a)μPμ=ωρσT(Λ,a)JρσT−1(Λ,a)
上式左边可以写为:
===gμμ′Λ ρμ′ω σρ(Λ−1) νσJμν+gμμ′Λ ρμ′ω σρ(Λ−1) νσaνPμ+gνν′Λ σν′ω ρσ(Λ−1) μρaμPνΛμ ρωρσΛν σJμν+Λμ ρωρσΛν σaνPμ+Λν σωσρΛμ ρaμPνΛμ ρωρσΛν σJμν+Λμ ρωρσΛν σaνPμ−Λν σωρσΛμ ρaμPνΛμ ρΛν σ(Jμν−aμPν+aνPμ)
于是得到:
T(Λ,a)JρσT−1(Λ,a)=Λμ ρΛν σ(Jμν−aμPν+aνPμ)
现在再令 T(Λ,a) 的取值为无穷小变换 T(I+ω,ϵ),考虑 (18) 式第一式,其成为:
LHSRHS=(1−2iωμνJμν+iϵμPμ)Jρσ(1+2iωμνJμν−iϵμPμ)=Jρσ−2iωμν[Jμν,Jρσ]+iϵμ[Pμ,Jρσ]=(δμ ρ+ωμ ρ)(δν σ+ων σ)(Jμν−ϵμPν+ϵνPμ)=Jρσ+(δν σωμ ρ+δμ ρων σ)Jμν+(−ϵρPσ+ϵσPρ)
令含有 ωμν 与 ϵμ 的项分别相等,并利用 (12) 式可以得到庞加莱代数的李括号,对于 (18) 的第二式使用相同的方法,我们将最终结果写为:
[Jμν,Jρσ]=i(gνρJμσ−gμρJνσ−gνσJμρ+gμσJνρ)[Pμ,Jρσ]=i(gμρPσ−gμσPρ)[Pμ,Pσ]=0(19)
有关庞加莱代数就讲这么多。