连续变换的数学基础

群与李群

通过研究物理背后的数学结构可以使我们对物理对象的理解更为清晰、深刻。在这一部分,我们总以 三维旋转 为例,引入一些数学概念。在这份物理笔记中,我们不过多关注数学的细节。

在抽象代数中,我们接触过 群 group 的概念。群是一个集合 GG 和一个二元运算 “\cdot” 构成的数学结构,且该二元运算满足如下要求(群公理):

  • 封闭性

 a,bGabG\forall\ a,b\in G\quad a\cdot b\in G

  • 结合律

 a,b,cG(ab)c=a(bc)\forall\ a,b,c\in G\quad (a\cdot b)\cdot c = a\cdot(b\cdot c)

  • 存在单位元

 eG,s.t.  ea=ae=a\exist\ e\in G,\quad s.t.\ \ e\cdot a = a\cdot e = a

  • 存在逆元

aG,  bG,s.t.  ab=ba=e\forall a\in G,\ \exist\ b\in G,\quad s.t.\ \ a\cdot b = b\cdot a = e

该二元运算常称为群的乘法。这个群记为 (G,)(G,\cdot)

现在考虑,我们若将某个三维旋转操作的集合记为 {R}\{R\}。其中的元素就为旋转变换,其作用效果为改变某个特定坐标系 AA 的取向。现在如下定义二元运算: R1,R2{R}\forall\ R_1,R_2\in\{R\}R1R2R_1\cdot R_2 为:先进行 R2R_2 操作,再进行 R1R_1 操作。

不难验证,该二元运算满足群公理。所以 ({R},)(\{R\},\cdot) 构成了一个群,称为 旋转群。对于连续变换来说,它们不仅仅具有群结构,还有连续的性质。如何进行描述呢?

我们先介绍两个概念:

  • 一般线性群:具有实矩阵元的所有 n×nn\times n 可逆矩阵配以矩阵乘法构成群,记为 GL(n;R)\mathrm{GL}(n;\mathbb{R})

    若矩阵元为复数,对应的一般线性群记为 GL(n;C)\mathrm{GL}(n;\mathbb{C})。一般线性群中元素矩阵元的取值可以连续变化,这本身就体现了某种连续的性质。

  • 矩阵李群:一般线性群的封闭完备子群。

    李群 指具有群结构的光滑微分流形,其群作用与微分结构相容。以下我们主要研究矩阵李群。其封闭性是对于群乘法而言;完备性要求:若每个矩阵元有极限如下:
     aij,maij\ a_{ij,m} \rightarrow a_{ij}
    那么矩阵的极限应当有:

    An=(aij,m)n×n(aij)n×n=AG A_n = (a_{ij,m})_{n\times n} \rightarrow (a_{ij})_{n\times n} = A\in G

那么对于任意一个三维旋转变换都可以用一个 3×33\times 3 实正交矩阵 AA 来描述,且 detA=1\det A=1。例如:

A=(1000cosθsinθ0sinθcosθ)A = \begin{pmatrix} 1 & 0 & 0\\ 0 & \cos\theta & -\sin\theta\\ 0 & \sin\theta & \cos\theta\\ \end{pmatrix}

那么三维旋转群正是一般线性群的封闭子群,它是一个矩阵李群,满足以下性质:

  • detA=1\det A=1 “特殊” Special
  • ATA=1n×nA^TA = 1_{n\times n} “正交” Orthogonal

三维旋转群实际上是三维特殊正交群,记为 SO(3)SO(3)

还有很多矩阵李群,如 特殊幺正群 SU(n)SU(n)(“U” 表示幺正 unitary);再如 广义正交群 generalize orthogonal groups O(n;k)O(n;k),满足:

ATA=diag(1,,1n,1,,1k)A^TA = \mathrm{diag}(\underbrace{1,\cdots,1}_{n},\underbrace{-1,\cdots,-1}_{k})

其中 O(1;3)O(1;3) 称为 洛伦兹群

因为三维旋转变换是连续的,我们指出李群 SO(3)SO(3)连通的 connected

到这里,我们把对三维旋转变换的研究等价于研究矩阵李群 SO(3)SO(3)。任何连续变换都能够找到对应的连通李群。

李代数与指数映射

XXn×nn\times n 矩阵,其指数运算定义为:

eXn=0Xnn!e^X \equiv \sum_{n=0}^{\infty}\frac{X^n}{n!}

可以证明,上式右边总是收敛的。eXe^X 是一个关于 XX 的连续函数。

注意,此处我们已经引入了矩阵加法。

n×nn\times n 矩阵的对数运算定义为:

logX=n=1(1)n+1(XI)nn\log X = \sum_{n=1}^{\infty}(-1)^{n+1}\frac{(X-I)^n}{n}

关于矩阵的指数运算,我们后面可能用到以下性质:

  • Lie product Formula

eX+Y=limm(eXmeYm)m(1)e^{X+Y} = \lim_{m\rightarrow\infty} (e^{\frac{X}{m}}e^{\frac{Y}{m}})^m \tag{1}

只要注意到 eXmeYm=1+X+Ym+O(1m2)e^{\frac{X}{m}}e^{\frac{Y}{m}} = 1 +\frac{X+Y}{m} + O(\frac{1}{m^2}),其证明是容易的。

  • 对于任意 n×nn\times n 复矩阵,有:

det(eX)=etrX(2)\det (e^X) = e^{\mathrm{tr X}} \tag{2}

不做证明。

在物理学中,算子在特定表象中的表示就为矩阵,我们常用这种指数运算来构建起厄密算子与幺正算子之间的联系,此时我们习惯将指数运算记为:eiXe^{-iX}。我们下面就采用这种表示方法。

定义:对于一个矩阵李群 GG 来说,这个矩阵李群的 李代数 Lie algebra 是所有使得 eitXG, tRe^{-itX}\in G,\forall\ t\in \mathbb{R} 的矩阵 XX 构成的集合。李群 GG 对应的李代数记为 g\mathfrak{g}

我们有如下推论:

推论1:令 GG 是一个矩阵李群,XX 是其对应的李代数中的元素,那么所有 eiXe^{-iX} 都与矩阵李群的单位元相连接。

推论2:令 GG 是一个矩阵李群,设 XX 是其李代数 g\mathfrak{g} 中的一个元素,AA 是矩阵李群中的元素,那么:AXA1gAXA^{-1}\in \mathcal{g}

证明:

eit(AXA1)=n=0(itAXA1)nn!=n=0A(itX)nn!A1=AeitXA1GAXA1g\begin{aligned} \because e^{-it(AXA^{-1})} &= \sum_{n=0}^{\infty} \frac{(-itAXA^{-1})^n}{n!}\\ &= \sum_{n=0}^{\infty} A\frac{(-itX)^n}{n!}A^{-1}\\ &= Ae^{-itX}A^{-1} \in G \Rightarrow AXA^{-1}\in \mathcal{g} \end{aligned}

推论3:令 GG 是一个矩阵李群,{AnAn=eiXnG}\{A_n|A_n = e^{-iX_n}\in G\} 是这个矩阵李群中的矩阵列,且 limnAn=A\lim_{n\rightarrow \infty} A_n = A,那么必定存在 XgX\in \mathfrak{g}A=eiXA = e^{-iX}

由矩阵李群的完备性和矩阵指数运算的连续性可得。这反映了李代数的完备性,即 Xng,limnXn=Xg\forall X_n\in \mathfrak{g},\quad \lim_{n\rightarrow\infty}X_n = X \in \mathfrak{g}

李代数具有如下性质:设 X,YgX,Y\in \mathfrak{g},那么有:

  1. sXg,   sRsX\in \mathfrak{g},\ \ \forall\ s\in \mathbb{R}
  2. X+YgX+Y\in\mathfrak{g}
  3. i(XYYX)g-i(XY-YX)\in\mathfrak{g}

对于性质一的证明是直接的:

eit(sX)=ei(ts)X=eitXGsXge^{-it(sX)} =e^{-i(ts)X} = e^{-it'X} \in G \Rightarrow sX\in \mathfrak{g}

对于性质二,考虑到 (1)(1) 有:

eit(X+Y)=limm(eitXmeitYm)me^{-it(X+Y)} = \lim_{m\rightarrow\infty} (e^{\frac{-itX}{m}}e^{\frac{-itY}{m}})^m

其中 eitXm,eitYmGe^{-\frac{itX}{m}},e^{-\frac{itY}{m}}\in \mathrm{G},那么 (eitXmeitYm)mG(e^{\frac{-itX}{m}}e^{\frac{-itY}{m}})^m \in G。考虑到矩阵李群的完备性,得到:eit(X+Y)Ge^{-it(X+Y)}\in G。所以 X+YgX+Y\in \mathfrak{g}
对于性质三,考虑到如下关系:

ddt(eitXYeitX)t=0=i(XYYX)\frac{d}{dt}(e^{-itX}Ye^{itX})|_{t=0} = -i(XY-YX)

因为 eitXG,Yge^{-itX}\in G,Y\in \mathfrak{g},由 推论2 得到:eitXYeitXge^{-itX}Ye^{itX}\in \mathfrak{g}。导数实际上是如下极限:

i(XYYX)=limh0eihXYeihXYhi(XY-YX) = \lim_{h\rightarrow 0} \frac{e^{-ihX}Ye^{ihX}-Y}{h}

由性质一、二与李代数的完备性可以得到 i(XYYX)g-i(XY-YX)\in\mathfrak{g}

性质一、二说明李代数是一个实线性空间。一般来说:XgX\in \mathfrak{g} 并不意味着 iXgiX \in \mathcal{g}。若满足这个要求,则我们称其对应的矩阵李群是 复 complex 的,对应的李代数成为一个复线性空间。

性质三实际上是在线性空间中定义了一个新运算:李括号 Lie bracket

[X,Y]=XYYX[X,Y] = XY-YX

李括号 [,,][,\cdot,] 是一个从 g×gg\mathfrak{g} \times \mathfrak{g} \rightarrow \mathfrak{g} 的映射。具体来说,实际上是:

 X,Ygi[X,Y]g\forall\ X,Y\in\mathfrak{g}\Rightarrow -i[X,Y] \in \mathfrak{g}

李括号具有如下性质,X,Y,Zg\forall X,Y,Z\in\mathfrak{g}

  1. [,,][,\cdot,] 具有双线性。
  2. [X,Y]=[Y,X][X,Y] = -[Y,X]
  3. [X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]]=0[X,[Y,Z]] + [Y,[Z,X]] + [Z,[X,Y]]=0

对于 1,21,2 的验证是容易的。性质 33 可以直接展开得到。通过分析 (3)(3) 式的对称性可以得到相同的结果:
f(X,Y,Z)=[X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]]f(X,Y,Z) = [X,[Y,Z]] + [Y,[Z,X]] + [Z,[X,Y]],有:

f(Y,X,Z)=[Y,[X,Z]]+[X,[Z,Y]]+[Z,[Y,X]]=([X,[Y,Z]]+[Y,[Z,X]]+[Z,[X,Y]])=f(X,Y,Z)\begin{aligned} f(Y,X,Z) &= [Y,[X,Z]] + [X,[Z,Y]] + [Z,[Y,X]]\\ &= -([X,[Y,Z]] + [Y,[Z,X]] + [Z,[X,Y]])\\ &= -f(X,Y,Z)\\ \end{aligned}

通过交换三次变量,得到:

f(X,Y,Z)=f(Y,Z,X)f(X,Y,Z) = -f(Y,Z,X)

而从 f(X,Y,Z)f(X,Y,Z) 的形式可以看出,其具有轮换对称性,所以:

f(X,Y,Z)=f(Y,Z,X)f(X,Y,Z) = f(Y,Z,X)

综上,得到:

f(X,Y,Z)=0f(X,Y,Z) = 0

这称为 雅可比等式 Jacobi identity

考虑李代数构成一个线性空间,可以取一组完备基底 {Xi}\{X_i\},那么李括号的结果可以写为:

[Xi,Xj]=kcijkXk[X_i,X_j] = \sum_{k}c_{ijk}X_k

cijkc_{ijk} 称为李代数的 结构常数 structure constant。李代数的性质2,3 意味着结构常数将具有以下要求:

cijk=cjikm(cijmcmkl+cjkmcmil+ckimcmjl)=0\begin{aligned} &c_{ijk} = -c_{jik}\\ & \sum_m (c_{ijm}c_{mkl} + c_{jkm}c_{mil} +c_{kim}c_{mjl}) = 0 \end{aligned}

这件事情反应了李代数的结构。

矩阵的指数运算实际上构成了一个从李代数到矩阵李群的 指数映射 exponential mapping

exp:gG\exp:\mathfrak{g}\rightarrow G

对于李代数 g\mathfrak{g} 的一组完备基 {Xi}\{X_i\},那么对应的矩阵李群 GG 的任意元素都可以表示为如下形式:

exp(imtmXm), tmR\exp (-i\sum_{m}t_mX_m),\quad \forall\ t_m\in\mathbb{R}

对于一个无穷小变换来说,上述元素应当趋近于单位元,令 tm0t_m \rightarrow 0。可得:

exp(imtmXm)1imtmXm\exp (-i\sum_{m}t_mX_m) \rightarrow 1-i\sum_{m}t_mX_m

即从无穷小变换对应矩阵李群元素中可以得到对应的李代数。

对于旋转群的讨论

下面以三维旋转变换为例进行说明。首先三维旋转变换构成 SO(3)SO(3) 群,考虑其中一个有限操作:例如绕 xx 轴为逆时针旋转 θ\theta 角度:

A=(1000cosθsinθ0sinθcosθ)A = \begin{pmatrix} 1 & 0 & 0\\ 0 & \cos\theta & -\sin\theta\\ 0 & \sin\theta & \cos\theta\\ \end{pmatrix}

其无穷小变换为:

(10001θ0θ1)=1+θ(000001010)=1iθAx\begin{pmatrix} 1 & 0 & 0\\ 0 & 1 & -\theta\\ 0 & \theta & 1\\ \end{pmatrix} = 1 + \theta \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -1\\ 0 & 1 & 0\\ \end{pmatrix} = 1 - i\theta A_x

其中:

Ax=(00000i0i0)A_x =\begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -i\\ 0 & i & 0\\ \end{pmatrix}

可以验证:

exp(iθAx)=A\exp(-i\theta A_x) = A

注意到 AxA_x 的本征值为 0,1,10,1,-1 对应的本征向量为:

α1=(100)α2=12(01i)α3=12(0i1)\alpha_1 = \begin{pmatrix} 1\\ 0\\ 0\\ \end{pmatrix}\quad \alpha_2 = \frac{1}{\sqrt{2}}\begin{pmatrix} 0\\ 1\\ i\\ \end{pmatrix}\quad \alpha_3 = \frac{1}{\sqrt{2}}\begin{pmatrix} 0\\ i\\ 1\\ \end{pmatrix}

C=(α1,α2,α3)=(100012i20i212)C = (\alpha_1,\alpha_2,\alpha_3) = \begin{pmatrix} 1 & 0 & 0\\ 0 & \frac{1}{\sqrt{2}} & \frac{i}{\sqrt{2}}\\ 0 & \frac{i}{\sqrt{2}} & \frac{1}{\sqrt{2}}\\ \end{pmatrix}

那么可以得到:

C1AxC=(000010001)=DAx=CDC1C^{-1}A_xC^ = \begin{pmatrix} 0 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & -1\\ \end{pmatrix} = D \Rightarrow A_x = CDC^{-1}

其中

C1=C=(100012i20i212)C^{-1} = C^\dagger = \begin{pmatrix} 1 & 0 & 0\\ 0 & \frac{1}{\sqrt{2}} & -\frac{i}{\sqrt{2}}\\ 0 & -\frac{i}{\sqrt{2}} & \frac{1}{\sqrt{2}}\\ \end{pmatrix}

现在可以进行指数运算了:

exp(iθAx)=exp(iθCDC1)=Cexp(iθD)C1=C(1000exp(iθ)000exp(iθ))C1=(00000i0i0)=A\begin{aligned} \exp(-i\theta A_x) &= \exp(-i\theta CDC^{-1})\\ &= C \exp(-i\theta D) C^{-1}\\ &= C \begin{pmatrix} 1 & 0 & 0\\ 0 & \exp(-i\theta) & 0\\ 0 & 0 & \exp(i\theta)\\ \end{pmatrix}C^{-1}\\ &= \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -i\\ 0 & i & 0\\ \end{pmatrix} = A\\ \end{aligned}

考虑沿着不同轴的无穷小旋转,得到李代数的矩阵表示为:

Ax=(00000i0i0)Ay=(00i000i00)Az=(0i0i00000)A_x =\begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -i\\ 0 & i & 0\\ \end{pmatrix}\quad A_y =\begin{pmatrix} 0 & 0 & i\\ 0 & 0 & 0\\ -i & 0 & 0\\ \end{pmatrix}\quad A_z =\begin{pmatrix} 0 & -i & 0\\ i & 0 & 0\\ 0 & 0 & 0\\ \end{pmatrix}

这就是李代数 so(3)\mathfrak{so}(3) 的一个 33 维表示。我们来看其李代数的结构,计算李括号:

[Ax,Ay]=(00000i0i0)(00i000i00)(00i000i00)(00000i0i0)=(010100000)=iAz\begin{aligned} [A_x,A_y] &= \begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -i\\ 0 & i & 0\\ \end{pmatrix}\begin{pmatrix} 0 & 0 & i\\ 0 & 0 & 0\\ -i & 0 & 0\\ \end{pmatrix}-\begin{pmatrix} 0 & 0 & i\\ 0 & 0 & 0\\ -i & 0 & 0\\ \end{pmatrix}\begin{pmatrix} 0 & 0 & 0\\ 0 & 0 & -i\\ 0 & i & 0\\ \end{pmatrix}\\ &= \begin{pmatrix} 0 & 1 & 0\\ -1 & 0 & 0\\ 0 & 0 & 0\\ \end{pmatrix} = iA_z \end{aligned}

更一般的,可以验证:

[Ai,Aj]=iϵijkAk(3)[A_i,A_j] = i\epsilon_{ijk}A_k \tag{3}

在得到李代数的结构后,我们就可以进行推广:只要对于任意 n×nn\times n 矩阵 Ax,Ay,AzA_x,A_y,A_z 满足 (3)(3) 对应的关系,那么就可以将这三个矩阵作为 生成元 generator,利用指数映射得到一个 nn 维的矩阵李群,这个 nn 维矩阵李群显然与 SO(3)SO(3) 的结构相同。我们称其为李群的 nn 维表示。

例如,泡利矩阵 σx,σy,σz\sigma_x,\sigma_y,\sigma_z 满足 (3)(3) 所要求的对易关系。那么矩阵李群:

{exp(iiθiσi), θiR}\{\exp(-i\sum_{i} \theta_i\sigma_i),\forall\ \theta_i\in\mathbb{R}\}

构成了 SO(3)SO(3) 的一个二维表示。另外这个群不是别的,正是 SU(2)SU(2) 群,我们说 SO(3)SO(3)SU(2)SU(2)同构 的。

洛伦兹变换的代数结构

洛伦兹变换与洛伦兹群

整个量子场论是建立在 狭义相对论 基础上的。在狭义相对论中,光速不变 是一条基本原理,即在任何参考系中,都有:

t2x2y2z2=t2x2y2z2(4)t^2-x^2-y^2-z^2=t'^2-x'^2-y'^2-z'^2 \tag{4}

定义 间隔

ds2=dt2dx2dy2dz2(5)ds^2 = dt^2 - dx^2 - dy^2 -dz^2 \tag{5}

考虑两惯性参考系 S1,S2S_1,S_2,由于空间的均匀性与各项同性,任一间隔在 S1,S2S_1,S_2 中的比值应当仅仅取决于两参考系相对速度 v\bm{v} 的绝对值,且只能连续的依赖于 v|\bm{v}|

ds22=α(v)ds12ds_2^2 = \alpha(|\bm{v}|)ds_1^2

同理有:

ds12=α(v)ds22ds_1^2 = \alpha(|\bm{v}|)ds_2^2

由上两式得到:

α(v)=1ds12=ds22(6)\alpha(|\bm{v}|) = 1 \Rightarrow ds_1^2 =ds_2^2 \tag{6}

即间隔不随参考系改变。利用四矢量符号:xμ=(x0,x1,x2,x3)=(t,x,y,z),xμ=(x0,x1,x2,x3)=(t,x,y,z)x^{\mu} = (x^{0},x^1,x^2,x^3) = (t,x,y,z),x_{\mu} = (x_{0},x_1,x_2,x_3) = (t,-x,-y,-z) 以及 度规张量 metric tensor gμν=gμν=diag(1,1,1,1)g^{\mu\nu} = g_{\mu\nu}= \mathrm{diag}(1,-1,-1,-1),可以将间隔写为:

ds2=dxμdxμ=gμνdxμdxν=gμνdxμdxνds^2 = dx^{\mu}dx_{\mu} = g_{\mu\nu}dx^{\mu}dx^{\nu}= g^{\mu\nu}dx_{\mu}dx_{\nu}

任意的线性变换具有以下形式;

xμ=Λ  νμxν+aμ(7)x'^{\mu} = \Lambda^{\mu}_{\ \ \nu}x^{\nu} + a^{\mu} \tag{7}

aμ=0a^{\mu} = 0 时,我们称其为 洛伦兹变换 Lorentz Transformation;当 aμ0a^{\mu} \neq 0 时,我们称其为 庞加莱变换 Poincaré Transformation。间隔不变性对洛伦兹变换矩阵有如下要求:

ds2=gμνdxμdxμ=gμνΛ  ρμΛ  σνdxρdxσds2=gρσdxρdxσ\begin{aligned} ds'^2 &= g_{\mu\nu}dx'^{\mu}dx'^{\mu}\\ &= g_{\mu\nu}\Lambda^{\mu}_{\ \ \rho}\Lambda^{\nu}_{\ \ \sigma}dx^{\rho} dx^{\sigma}\\ ds^2 &= g_{\rho\sigma}dx^{\rho} dx^{\sigma} \end{aligned}

得到洛伦兹变换矩阵需要满足:

gμνΛ  ρμΛ  σν=gρσ(8)g_{\mu\nu}\Lambda^{\mu}_{\ \ \rho}\Lambda^{\nu}_{\ \ \sigma} = g_{\rho\sigma} \tag{8}

使用 gρλg^{\rho\lambda} 同时作用于 (8)(8) 式左右两边,可得:

Λν  λΛ  σν=δ  σλ\Lambda_{\nu}^{\ \ \lambda}\Lambda^{\nu}_{\ \ \sigma} = \delta^{\lambda}_{\ \ \sigma}

即可以得到洛伦兹矩阵的逆:

(Λ1)  νλ=Λν  λ(\Lambda^{-1})^{\lambda}_{\ \ \nu} = \Lambda_{\nu}^{\ \ \lambda}

利用 Λ  ρμ=(ΛT)ρ  μ\Lambda^{\mu}_{\ \ \rho} = (\Lambda^T)^{\ \ \mu}_{\rho}(8)(8) 式可以写为:

(ΛT)ρ  μgμνΛ  σν=gρσ(9)(\Lambda^T)^{\ \ \mu}_{\rho}g_{\mu\nu}\Lambda^{\nu}_{\ \ \sigma} = g_{\rho\sigma} \tag{9}

当相邻的两个洛伦兹指标一上一下进行缩并时,才表示对应洛伦兹矩阵相乘。我们若要使 Λ\LambdaΛT\Lambda^T 相乘,我们必须引入度规张量,由于 g=diag(1,1,1,1)g = \mathrm{diag}(1,-1,-1,-1)(9)(9) 式实际告诉我们所有洛伦兹变换的集合构成群 O(3,1)O(3,1),这也是之前提到的称 O(3,1)O(3,1)洛伦兹群 的由来。

先分析一下 (9)(9) 式,可得:

det(ΛTgΛ)=detgdetΛTdetgdetΛ=detgdetΛTdetΛ=1(detΛ)2=1detΛ=±1\begin{aligned} &\det(\Lambda^T g \Lambda) = \det g\\ \Rightarrow& \det\Lambda^T \det g \det\Lambda = \det g\\ \Rightarrow& \det \Lambda^T\det\Lambda = 1\\ \Rightarrow& (\det \Lambda)^2 = 1\\ \Rightarrow& \det \Lambda = \pm 1\\ \end{aligned}

再看分量,取 ρ,σ=0\rho,\sigma=0

1=gμνΛ  0μΛ  0ν=igiiΛ  0iΛ  0i=(Λ  00)2i=13(Λ  0i)2(Λ  00)2=1+i=13(Λ  0i)2Λ  001orΛ  001\begin{aligned} 1 &= g_{\mu\nu}\Lambda^{\mu}_{\ \ 0}\Lambda^{\nu}_{\ \ 0}\\ &= \sum_{i} g_{ii}\Lambda^{i}_{\ \ 0}\Lambda^{i}_{\ \ 0}\\ &= (\Lambda^{0}_{\ \ 0})^2 - \sum_{i=1}^3 (\Lambda_{\ \ 0}^i)^2\\ \Rightarrow & (\Lambda^{0}_{\ \ 0})^2 = 1 + \sum_{i=1}^3 (\Lambda_{\ \ 0}^i)^2\\ \Rightarrow & \Lambda^{0}_{\ \ 0} \geqslant 1 \quad or\quad \Lambda^{0}_{\ \ 0} \leqslant -1\\ \end{aligned}

不存在连续的洛伦兹变换使得 detΛ,Λ  00\det\Lambda,\Lambda^0_{\ \ 0} 的取值的正负性发生变化,因此洛伦兹群是不连通的,它由四个连通子群构成。我们因此可以将洛伦兹变换进行分类:

  • 正规正时 proper orthochronous 洛伦兹变换 L+L_{+}^{\uparrow}

detΛ=+1,Λ  001\det \Lambda = +1,\quad \Lambda^0_{\ \ 0} \geqslant 1

  • 正规非正时 proper non-orthochronous 洛伦兹变换 L+L_{+}^{\downarrow}

detΛ=+1,Λ  001\det \Lambda = +1,\quad \Lambda^0_{\ \ 0} \leqslant 1

  • 非正规正时 improper orthochronous 洛伦兹变换 LL_{-}^{\uparrow}

detΛ=1,Λ  001\det \Lambda = -1,\quad \Lambda^0_{\ \ 0} \geqslant 1

  • 非正规非正时 improper non-orthochronous 洛伦兹变换 LL_{-}^{\downarrow}

detΛ=1,Λ  001\det \Lambda = -1,\quad \Lambda^0_{\ \ 0} \leqslant 1

之后我们提到,时间反演和空间反演变换将不同类型的洛伦兹变换联系起来。

洛伦兹代数

来看无穷小洛伦兹变换,其应当接近于恒等变换,由于 IL+I\in L_{+}^{\uparrow},无穷小变换应当为:

Λ=I+ω(10)\Lambda = I + \omega \tag{10}

考虑洛伦兹变换的定义 (8)(8),将 (10)(10) 代入得到:

gμν(δ  ρμ+ω  ρμ)(δ  σν+ω  σν)=gρσgρσ+ωσρ+ωρσ=gρσωσρ=ωρσ\begin{aligned} &g_{\mu\nu}(\delta^{\mu}_{\ \ \rho} + \omega^{\mu}_{\ \ \rho})(\delta^{\nu}_{\ \ \sigma}+\omega^{\nu}_{\ \ \sigma}) = g_{\rho\sigma}\\ \Rightarrow & g_{\rho\sigma} + \omega_{\sigma\rho} + \omega_{\rho\sigma} = g_{\rho\sigma}\\ \Rightarrow & \omega_{\sigma\rho} = - \omega_{\rho\sigma}\\ \end{aligned}

可以得到无穷小矩阵 {ωμν}\{\omega_{\mu\nu}\} 应当是反对称的,可以写为:

{ωμν}=(0000)\{\omega_{\mu\nu}\} = \begin{pmatrix} 0 & * & * & *\\ -* & 0 & * & *\\ -* & -* & 0 & *\\ -* & -* & -* & 0\\ \end{pmatrix}

那么 ω\omega 对角线之上的六个独立矩阵元 ωμν(μ<ν)\omega_{\mu\nu}(\mu<\nu) 实际上可以充当六个无穷小群参数,我们对应引入六个生成元矩阵 JμνJ^{\mu\nu},且定义 Jμν=JνμJ^{\mu\nu} = -J^{\nu\mu}。那么可以将无穷小变换写为:

Λ=Iiμ<νωμνJμν=Ii2ωμνJμν(11)\Lambda = I - i\sum_{\mu<\nu}\omega_{\mu\nu}J^{\mu\nu} = I-\frac{i}{2}\omega_{\mu\nu}J^{\mu\nu} \tag{11}

通过比较 (10)(11)(10)(11),得到:

ω  σρ=i2ωμν(Jμν)  σρ\omega^{\rho}_{\ \ \sigma} = -\frac{i}{2}\omega_{\mu\nu}(J^{\mu\nu})^{\rho}_{\ \ \sigma}

又因为:

ω  σρ=gμρδ  σνωμν=12(gμρδ  σνgνρδ  σμ)ωμν(12)\omega^{\rho}_{\ \ \sigma} = g^{\mu\rho}\delta^{\nu}_{\ \ \sigma} \omega_{\mu\nu} = \frac{1}{2}(g^{\mu\rho}\delta^{\nu}_{\ \ \sigma}-g^{\nu\rho}\delta^{\mu}_{\ \ \sigma}) \omega_{\mu\nu} \tag{12}

比较 (11)(12)(11)(12) 得到生成元矩阵为:

(Jμν)  σρ=i(gμρδ  σνgνρδ  σμ)(13)(J^{\mu\nu})^{\rho}_{\ \ \sigma} = i(g^{\mu\rho}\delta^{\nu}_{\ \ \sigma}-g^{\nu\rho}\delta^{\mu}_{\ \ \sigma}) \tag{13}

具体来说,这六个生成元可以显式写为:

J10=(0i00i00000000000)J20=(00i00000i0000000)J30=(000i00000000i000)J12=(000000i00i000000)J23=(00000000000i00i0)J31=(0000000i00000i00)\begin{aligned} &J^{10} = \begin{pmatrix} 0 & -i & 0 & 0\\ -i & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ \end{pmatrix}\quad &J^{20} = \begin{pmatrix} 0 & 0 & -i & 0\\ 0 & 0 & 0 & 0\\ -i & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ \end{pmatrix}\quad &J^{30} = \begin{pmatrix} 0 & 0 & 0 & -i\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ -i & 0 & 0 & 0\\ \end{pmatrix}\\ \\ &J^{12} = \begin{pmatrix} 0 & 0 & 0 & 0\\ 0 & 0 & -i & 0\\ 0 & i & 0 & 0\\ 0 & 0 & 0 & 0\\ \end{pmatrix}\quad &J^{23} = \begin{pmatrix} 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0\\ 0 & 0 & 0 & -i\\ 0 & 0 & i & 0\\ \end{pmatrix}\quad &J^{31} = \begin{pmatrix} 0 & 0 & 0 & 0\\ 0 & 0 & 0 & i\\ 0 & 0 & 0 & 0\\ 0 & -i & 0 & 0\\ \end{pmatrix}\\ \end{aligned}

我们注意到 J10,J20,J30J^{10},J^{20},J^{30} 对应 boost,而 J12,J23,J31J^{12},J^{23},J^{31} 对应旋转,习惯上定义:

Ji=12ϵijkJjk,Ki=Ji0(i=1,2,3)(14)J^{i} = \frac{1}{2}\epsilon^{ijk}J^{jk},\quad K^i = J^{i0}\quad (i=1,2,3) \tag{14}

得到生成元后,我们来看李代数结构。首先

(JμνJρσ)  βα=(Jμν)  κα(Jρσ)  βκ=(gμαδ  κνgναδ  κμ)(gρκδ  βσgσκδ  βρ)=(gμαδ  κνgρκδ  βσgμαδ  κνgσκδ  βρgναδ  κμgρκδ  βσ+gναδ  κμgσκδ  βρ)=(gμαgρνδ  βσgμαgσνδ  βρgναgρμδ  βσ+gναgσμδ  βρ)\begin{aligned} (J^{\mu\nu}J^{\rho\sigma})^{\alpha}_{\ \ \beta} &= (J^{\mu\nu})^{\alpha}_{\ \ \kappa}(J^{\rho\sigma})^{\kappa}_{\ \ \beta}\\ &= -(g^{\mu\alpha}\delta^{\nu}_{\ \ \kappa}-g^{\nu\alpha}\delta^{\mu}_{\ \ \kappa})(g^{\rho\kappa}\delta^{\sigma}_{\ \ \beta}-g^{\sigma\kappa}\delta^{\rho}_{\ \ \beta})\\ &= -(g^{\mu\alpha}\delta^{\nu}_{\ \ \kappa}g^{\rho\kappa}\delta^{\sigma}_{\ \ \beta} - g^{\mu\alpha}\delta^{\nu}_{\ \ \kappa}g^{\sigma\kappa}\delta^{\rho}_{\ \ \beta} - g^{\nu\alpha}\delta^{\mu}_{\ \ \kappa}g^{\rho\kappa}\delta^{\sigma}_{\ \ \beta} + g^{\nu\alpha}\delta^{\mu}_{\ \ \kappa}g^{\sigma\kappa}\delta^{\rho}_{\ \ \beta})\\ &= -(g^{\mu\alpha}g^{\rho\nu}\delta^{\sigma}_{\ \ \beta} - g^{\mu\alpha}g^{\sigma\nu}\delta^{\rho}_{\ \ \beta} - g^{\nu\alpha}g^{\rho\mu}\delta^{\sigma}_{\ \ \beta} + g^{\nu\alpha}g^{\sigma\mu}\delta^{\rho}_{\ \ \beta})\\ \end{aligned}

同理若要计算 (JρσJμν)  βα(J^{\rho\sigma}J^{\mu\nu})^{\alpha}_{\ \ \beta} 只需要对上式的结果进行指标替换 μνρσ\mu\nu\leftrightarrow \rho\sigma

(JρσJμν)  βα=(gραgμσδ  βνgραgνσδ  βμgσαgμρδ  βν+gσαgνρδ  βμ)(J^{\rho\sigma}J^{\mu\nu})^{\alpha}_{\ \ \beta} = -(g^{\rho\alpha}g^{\mu\sigma}\delta^{\nu}_{\ \ \beta} - g^{\rho\alpha}g^{\nu\sigma}\delta^{\mu}_{\ \ \beta} - g^{\sigma\alpha}g^{\mu\rho}\delta^{\nu}_{\ \ \beta} + g^{\sigma\alpha}g^{\nu\rho}\delta^{\mu}_{\ \ \beta})

于是李括号为:

[Jμν,Jρσ]  βα=(gρν(gμαδ  βσgσαδ  βμ)gμρ(gναδ  βσgσαδ  βν)  gνσ(gμαδ  βρgραδ  βμ)+gμσ(gναδ  βρgραδ  βν))=i(gνρJμσgμρJνσgνσJμρ+gμσJνρ)  βα\begin{aligned} [J^{\mu\nu},J^{\rho\sigma}]^{\alpha}_{\ \ \beta} =& -(g^{\rho\nu}(g^{\mu\alpha}\delta^{\sigma}_{\ \ \beta}-g^{\sigma\alpha}\delta^{\mu}_{\ \ \beta}) - g^{\mu\rho}(g^{\nu\alpha}\delta^{\sigma}_{\ \ \beta}-g^{\sigma\alpha}\delta^{\nu}_{\ \ \beta})\\ &\ \ - g^{\nu\sigma}(g^{\mu\alpha}\delta^{\rho}_{\ \ \beta}-g^{\rho\alpha}\delta^{\mu}_{\ \ \beta}) + g^{\mu\sigma}(g^{\nu\alpha}\delta^{\rho}_{\ \ \beta}-g^{\rho\alpha}\delta^{\nu}_{\ \ \beta}))\\ =& i(g^{\nu\rho}J^{\mu\sigma}-g^{\mu\rho}J^{\nu\sigma}-g^{\nu\sigma}J^{\mu\rho}+g^{\mu\sigma}J^{\nu\rho})^{\alpha}_{ \ \ \beta} \end{aligned}

即:

[Jμν,Jρσ]=i(gνρJμσgμρJνσgνσJμρ+gμσJνρ)(15)[J^{\mu\nu},J^{\rho\sigma}] = i(g^{\nu\rho}J^{\mu\sigma}-g^{\mu\rho}J^{\nu\sigma}-g^{\nu\sigma}J^{\mu\rho}+g^{\mu\sigma}J^{\nu\rho})\tag{15}

这就是洛伦兹群的李代数结构。现在若我们要对任意一个对象进行洛伦兹变换,实际上就是要找到洛伦兹群某个特定的表示。在下一篇中我们会做这件事情。

由生成元可以表示任意一个洛伦兹变换:

Λ=exp(i2ωμνJμν)\Lambda = \exp(-\frac{i}{2}\omega_{\mu\nu}J^{\mu\nu})

庞加莱代数

当洛伦兹变换 Λ\Lambda 与时空平移 aa 同时存在时,我们称这种变换为庞加莱变换。记为 T(Λ,a)T(\Lambda,a),庞加莱变换的乘法为:

T(Λ2,a2)T(Λ1,a1)=T(Λ2Λ1,Λ2a1+a2)T(\Lambda_2,a_2)T(\Lambda_1,a_1) = T(\Lambda_2\Lambda_1,\Lambda_2a_1+a_2)

所有庞加莱变换的集合也是一个矩阵李群,称为 庞加莱群 Poincaré group。庞加莱群有 1010 个生成元:分别是洛伦兹群的 66 个生成元 JμνJ^{\mu\nu} 与时空平移对应的 44 个生成元 PμP^{\mu},无穷小庞加莱变换为:

T(I+ω,ϵ)=1i2ωμνJμν+iϵμPμT(I+\omega,\epsilon) = 1-\frac{i}{2}\omega_{\mu\nu}J^{\mu\nu} + i\epsilon_{\mu}P^{\mu}

考虑以下变换

T(Λ,a)T(1+ω,ϵ)T1(Λ,a)T(\Lambda,a)T(1+\omega,\epsilon) T^{-1}(\Lambda,a)

其中 ω,ϵ\omega,\epsilon 为无穷小量,aa 为有限量。

利用庞加莱变换的复合,可得:

T(Λ,a)T(1+ω,ϵ)T1(Λ,a)=T(Λ(1+ω)Λ1,ΛϵΛωΛ1a)=112i(ΛωΛ1)μνJμν+i(ΛϵΛωΛ1a)μPμ(16)\begin{aligned} &T(\Lambda,a)T(1+\omega,\epsilon) T^{-1}(\Lambda,a)\\ =& T(\Lambda(1+\omega)\Lambda^{-1},\Lambda\epsilon-\Lambda \omega\Lambda^{-1}a)\\ =& 1 - \frac{1}{2}i(\Lambda\omega\Lambda^{-1})_{\mu\nu}J^{\mu\nu} + i(\Lambda\epsilon - \Lambda \omega \Lambda^{-1}a) _{\mu} P^{\mu} \end{aligned}\tag{16}

且有:

T(Λ,a)T(1+ω,ϵ)T1(Λ,a)=T(Λ,a)(112iωρσJρσ+iϵρPρ)T1(Λ,a)(17)\begin{aligned} T(\Lambda,a)T(1+\omega,\epsilon) T^{-1}(\Lambda,a) = T(\Lambda,a)(1 - \frac{1}{2}i\omega_{\rho\sigma} J^{\rho\sigma} + i\epsilon_{\rho}P^{\rho}) T^{-1}(\Lambda,a) \end{aligned}\tag{17}

利用 ω\omegaϵ\epsilon 的系数分别相等,得到:

T(Λ,a)JρσT1(Λ,a)=Λμ  ρΛν  σ(JμνaμPν+aνPμ)T(Λ,a)PρT1(Λ,a)=Λμ  ρPμ(18)\begin{aligned} & T(\Lambda,a)J^{\rho\sigma} T^{-1}(\Lambda,a) = \Lambda_{\mu}^{\ \ \rho}\Lambda_{\nu}^{\ \ \sigma}(J^{\mu\nu}-a^{\mu}P^{\nu}+a^{\nu}P^{\mu}) \\ & T(\Lambda,a)P^{\rho} T^{-1}(\Lambda,a) = \Lambda_{\mu}^{\ \ \rho}P^{\mu} \end{aligned}\tag{18}

(18)(18) 式第一式进行说明,通过比较 (16)(17)(16)(17) 得到:

(ΛωΛ1)μνJμν+2(ΛωΛ1a)μPμ=ωρσT(Λ,a)JρσT1(Λ,a)(\Lambda\omega\Lambda^{-1})_{\mu\nu}J^{\mu\nu} + 2(\Lambda \omega \Lambda^{-1}a) _{\mu} P^{\mu} = \omega_{\rho\sigma} T(\Lambda,a)J^{\rho\sigma}T^{-1}(\Lambda,a)

上式左边可以写为:

gμμΛ  ρμω  σρ(Λ1)  νσJμν+gμμΛ  ρμω  σρ(Λ1)  νσaνPμ+gννΛ  σνω  ρσ(Λ1)  μρaμPν=Λμ  ρωρσΛν  σJμν+Λμ  ρωρσΛν  σaνPμ+Λν  σωσρΛμ  ρaμPν=Λμ  ρωρσΛν  σJμν+Λμ  ρωρσΛν  σaνPμΛν  σωρσΛμ  ρaμPν=Λμ  ρΛν  σ(JμνaμPν+aνPμ)\begin{aligned} &g_{\mu\mu'}\Lambda_{\ \ \rho}^{\mu'}\omega^{\rho}_{\ \ \sigma}(\Lambda^{-1})^{\sigma}_{\ \ \nu} J^{\mu\nu} + g_{\mu\mu'}\Lambda_{\ \ \rho}^{\mu'}\omega^{\rho}_{\ \ \sigma}(\Lambda^{-1})^{\sigma}_{\ \ \nu} a^{\nu} P^{\mu} + g_{\nu\nu'}\Lambda_{\ \ \sigma}^{\nu'}\omega^{\sigma}_{\ \ \rho}(\Lambda^{-1})^{\rho}_{\ \ \mu}a^{\mu} P^{\nu}\\ =& \Lambda_{\mu}^{\ \ \rho}\omega_{\rho\sigma}\Lambda^{\ \ \sigma}_{\nu}J^{\mu\nu}+ \Lambda_{\mu}^{\ \ \rho}\omega_{\rho\sigma}\Lambda^{\ \ \sigma}_{\nu} a^{\nu}P^{\mu}+ \Lambda^{\ \ \sigma}_{\nu}\omega_{\sigma\rho}\Lambda^{\ \ \rho}_{\mu}a^{\mu} P^{\nu}\\ =& \Lambda_{\mu}^{\ \ \rho}\omega_{\rho\sigma}\Lambda^{\ \ \sigma}_{\nu}J^{\mu\nu}+ \Lambda_{\mu}^{\ \ \rho}\omega_{\rho\sigma}\Lambda^{\ \ \sigma}_{\nu} a^{\nu}P^{\mu} - \Lambda^{\ \ \sigma}_{\nu}\omega_{\rho\sigma}\Lambda^{\ \ \rho}_{\mu}a^{\mu} P^{\nu}\\ =& \Lambda_{\mu}^{\ \ \rho}\Lambda^{\ \ \sigma}_{\nu}(J^{\mu\nu} - a^{\mu}P^{\nu} + a^{\nu}P^{\mu} ) \end{aligned}

于是得到:

T(Λ,a)JρσT1(Λ,a)=Λμ  ρΛν  σ(JμνaμPν+aνPμ)T(\Lambda,a)J^{\rho\sigma}T^{-1}(\Lambda,a) = \Lambda_{\mu}^{\ \ \rho}\Lambda^{\ \ \sigma}_{\nu}(J^{\mu\nu} - a^{\mu}P^{\nu} + a^{\nu}P^{\mu} )

现在再令 T(Λ,a)T(\Lambda,a) 的取值为无穷小变换 T(I+ω,ϵ)T(I+\omega,\epsilon),考虑 (18)(18) 式第一式,其成为:

LHS=(1i2ωμνJμν+iϵμPμ)Jρσ(1+i2ωμνJμνiϵμPμ)=Jρσi2ωμν[Jμν,Jρσ]+iϵμ[Pμ,Jρσ]RHS=(δμ  ρ+ωμ  ρ)(δν  σ+ων  σ)(JμνϵμPν+ϵνPμ)=Jρσ+(δν  σωμ  ρ+δμ  ρων  σ)Jμν+(ϵρPσ+ϵσPρ)\begin{aligned} LHS &= (1-\frac{i}{2}\omega_{\mu\nu}J^{\mu\nu} + i\epsilon_{\mu}P^{\mu})J^{\rho\sigma}(1+\frac{i}{2}\omega_{\mu\nu}J^{\mu\nu} - i\epsilon_{\mu}P^{\mu})\\ &= J^{\rho\sigma} - \frac{i}{2}\omega_{\mu\nu}[J^{\mu\nu},J^{\rho\sigma}] + i\epsilon_{\mu}[P^{\mu},J^{\rho\sigma}]\\ RHS &= (\delta_{\mu}^{\ \ \rho} + \omega_{\mu}^{\ \ \rho})(\delta_{\nu}^{\ \ \sigma} + \omega_{\nu}^{\ \ \sigma})(J^{\mu\nu} -\epsilon^{\mu}P^{\nu} + \epsilon^{\nu}P^{\mu} )\\ &= J^{\rho\sigma} + (\delta_{\nu}^{\ \ \sigma}\omega_{\mu}^{\ \ \rho}+\delta_{\mu}^{\ \ \rho}\omega_{\nu}^{\ \ \sigma})J^{\mu\nu} + (-\epsilon^{\rho}P^{\sigma}+\epsilon^{\sigma}P^{\rho}) \end{aligned}

令含有 ωμν\omega_{\mu\nu}ϵμ\epsilon_{\mu} 的项分别相等,并利用 (12)(12) 式可以得到庞加莱代数的李括号,对于 (18)(18) 的第二式使用相同的方法,我们将最终结果写为:

[Jμν,Jρσ]=i(gνρJμσgμρJνσgνσJμρ+gμσJνρ)[Pμ,Jρσ]=i(gμρPσgμσPρ)[Pμ,Pσ]=0(19)\begin{aligned} &[J^{\mu\nu},J^{\rho\sigma}] = i(g^{\nu\rho}J^{\mu\sigma}-g^{\mu\rho}J^{\nu\sigma}-g^{\nu\sigma}J^{\mu\rho}+g^{\mu\sigma}J^{\nu\rho})\\ &[P^{\mu},J^{\rho\sigma}] = i(g^{\mu\rho}P^{\sigma}-g^{\mu\sigma}P^{\rho})\\ &[P^{\mu},P^{\sigma}] = 0\\ \end{aligned}\tag{19}

有关庞加莱代数就讲这么多。