感觉代数比上一期的几何难很多。看书有很多看不懂的。

20-3-31

群的基本概念

群是一个代数结构。代数结构就是说有一些集合,它们有某种抽象的相似之处,并且可以在它们上面定义一些运算。在这些不同的集合上面,同一种运算是被分别重载的,但只要在一个集合上面设想了某个运算,那这个运算在别的集合上重载的方式就由于那些相似之处的存在而几乎不言自明了。还有一些可以作为“相似之处”的性质,是由于它们可以使得数学或物理上的处理变得简明、符合实际等,经常被人们使用。

群具备一些性质。具体说来,是:

  • 结合律
  • 幺元

物理上,群常常用来刻画对称性。

群的基本性质

一些延伸的概念
  • 阶。阶就是集合里元素的数目。

  • 子群。就是具有同样群结构的子集。

  • 左右陪集。陪集就是一特定的元素与一特定子群元素相乘得到的集合。注意到,若两个(左)陪集相交,则它们相等。作为初学者,我第一次看到这个结论感到很意外,并且它的推论持续地使我感到意外。

  • 拉格朗日定理。这个定理说,对于有限群,(子群的阶)整除(群的阶)。因为总可以写$G=g_{1} H+g_{2} H+\cdots$。这个等式右边各项被记在一个写作G/H的集合里面。

  • 正规子群和商群。若对整个群的所有元素g有$g^{-1} H g=H$,那么H是正规子群。注意,正规这个概念是针对整个子群,而不是针对里面的每一个元素的。若是对于H的每个元素h,都可交换(gh=hg),那H叫G的中心。如果对于整个G做不到,而只能对G的一个子群做到,那这样的集合叫正规化子或中心化子。

    可以证明我们能在G/H上定义(普通的)乘法。这样,如果也能有逆(注意到,这要求H是正规子群),可以证明G/H是群。这就是商群。

  • 单群。这样的群没有正规子群。有一个著名的有限单群分类定理,里面涉及一个808,017,424,794,512,875,886,459,904,961,710,757,005, 754,368,000,000,000 阶的魔群。有都市传说称该群蕴藏着宇宙的终极对称性。

  • 共轭。$g_{2}=g^{-1} g_{1} g$表明$g_1,g_2$(通过g)共轭。注意到,这是一个等价关系,因而具有等价类。事实上,等价类(共轭类)的数目也整除群的阶数。考虑某一等价类的代表元素$g$,其有中心化子H,且可以知道H是一个群。注意到,若g与f通过a共轭,那么g与f也通过右陪集Ha的每一个元素共轭,并且不通过任何其他元素共轭。这样一来,就可将与g共轭的每个元素对应于商群G/H的一个元素。于是,共有|H|个等价类。

    例如,在酉矩阵集合$U(n)$中,具有相同特征值的矩阵互相共轭。

群在集合上的作用
  • 如果我们给一个集合X加一个“几何结构”,把它的元素当成点,那就可以可视化一些代数操作。
  • 定义点x的轨道为$G x \equiv\{g x: g \in G\}$。有一个结论说轨道的的长度整除群的阶,显然上一节最后一个结论(关于共轭)可以作为其推论。定义x的稳定化子S为G中使gx=x的元素g构成的集合。如果$g_1x=g_2x$,那么$g_1^{-1}g_2$是S的一员,因此$g_1S=g_2S$。因此,轨道的长度正是|G/S|。从这个角度看,那个结论并不特别出人意料。
  • 若存在一个轨道等于X,那么这个群的作用是transitive的。
  • 若$G \rightarrow \operatorname{Map}(X \rightarrow X)$是一一(one-to-one)的,就说这个作用是effective或faithful的。
  • 若存在一个x使得其轨道长|G|,那这个群的作用是free的。

群的表示

群表示论是研究怎样把群$G$同态映射为子群$\mathrm{G} \mathrm{L}(n, \mathbb{C})$的学问,也就是说,用一组复矩阵将群的元素表示出来。对我来说,得知哪怕只是有限群都可以完全由矩阵表示都是非常惊讶的,因为群的定义似乎并不包含“线性”的意思。

确实有说法管能用有限维矩阵表示的群叫“线性”群。不过,要解决我的疑问,需要知道Cayley定理。这是说,群G同态于$\text{Sym}(G)$的一个子群。而$\text{Sym}(G)$是很容易由矩阵表示的。这么看,好像表示又显得很平凡,没什么用。不过,不可约表示不止一种。人们寻找非平凡的表示,描述/可视化群在不同(物理)对象上的作用,利用群自带的结构在群的作用上做文章。

  • 线性表示中,$D\left(g_{1}\right) D\left(g_{2}\right)=D\left(g_{1} g_{2}\right), \quad D\left(g^{-1}\right)=[D(g)]^{-1}$,$D^{\prime}(g)=C^{-1} D(g) C$,等皆同前几节中所述。

  • real和pseudo-real表示:如果$D^{*} \sim D$,但不存在一个使得G中所有元素的$D(g)$都为实的基底,那就说D是pseudo-real的表示。

  • 不可约表示是说,不存在基底使得该表示可以写成别的表示的直和。为了在线性代数的语境下更好地理解这概念,考虑不变子空间。这是说,对于一组作用在V上的线性映射$\left\{A_{\alpha}\right\}$,若V的子空间U有任意$x \in U \Rightarrow A_{\alpha} x \in U$,那么U是不变子空间。而若不存在非平凡的不变子空间,就说$\left\{A_{\alpha}\right\}$是不可约的。要不然,就把V写成$V=U \oplus U^{\prime}$。一般来讲 (with unitarity——见下文) 我们可以选择,使得$U'$也是不变子空间,这样的话在矩阵表示上就很容易把$\left\{A_{\alpha}\right\}$的表示写成两个矩阵的直和。

  • Schur引理。这是说,对于两个不可约的线性算子的集合,$A_{\alpha}: U \rightarrow U$和$B_{\alpha}: V \rightarrow V$,以及一个线性算子$\Lambda: U \rightarrow V$,若对$\forall \alpha$有$\Lambda A_{\alpha}=B_{\alpha} \Lambda$,那么要么

    • $\Lambda = 0$

    要么

    • $\Lambda$是双射。这意味着它可逆并且UV同维数。

    证明不难,而且我不关心。注意到,特别的,如果A=B,那$\Lambda$只能是0或$I$的倍数。

群的特征标(character)
  • 取一正定、厄密、半双线性(这里直接改成双线性会有什么问题吗?)的内积,记为$(,)$。由此再定义一内积

    $\langle\mathbf{x}, \mathbf{y}\rangle=\sum_{g \in G}(D(g) \mathbf{x}, D(g) \mathbf{y})$

    容易知道,新内积仍然正定,有$\langle D(g) \mathbf{x}, D(g) \mathbf{y}\rangle=\langle\mathbf{x}, \mathbf{y}\rangle$,这表明对于这个内积而言,D是酉的。我们由这个内积的性质知道只要改变基底便可以使得D都是酉矩阵。以上步骤对于有限群(求和必然收敛)都成立,故有限群的表示均可为酉表示。

  • 取$D^{J}(g): V_{J} \rightarrow V_{J}$为一不可约表示的矩阵形式。J为标记具体表示的index,我们可以简写$dim(V_J)$为$dim(J)$。取一待定矩阵M,定义一个算子

    $\Lambda=\sum_{g \in G} D^{J}\left(g^{-1}\right) M D^{K}(g)$

    容易知道对每个g都有$D^{J}(g) \Lambda=\Lambda D^{K}(g)$。这样,从Schur引理就知道

    $\Lambda_{i l}=\sum_{g \in G} D_{i j}^{J}\left(g^{-1}\right) M_{j k} D_{k l}^{K}(g)=\lambda(M) \delta_{i l} \delta^{J K}$

    现在,我们选取一些特定的M,以此得到一些关于D的信息。取M[j][k]=1,其他地方为0,就有

    $\sum_{g \in G} D_{i j}^{J}\left(g^{-1}\right) D_{k l}^{K}(g)=\lambda_{j k} \delta_{i l}, \delta^{J K}$。

    求出$\lambda$之后,带回去,得到

    $\frac{1}{|G|} \sum_{g \in G} D_{i j}^{J}\left(g^{-1}\right) D_{k l}^{K}(g)=(\operatorname{dim} J)^{-1} \delta_{j k} \delta_{i l} \delta^{J K}$。

    或者,对于酉表示下的D,

    $\frac{1}{|G|} \sum_{g \in G}\left(D_{i j}^{J}(g)\right)^{*} D_{k l}^{K}(g)=(\operatorname{dim} J)^{-1} \delta_{i k} \delta_{j l} \delta^{J K}$

    这是一个正交归一的关系。

  • 类函数是指值仅由共轭等价类决定的函数。一个典型的例子是矩阵的迹。我们定义特征标$\chi(g) \stackrel{\text { def }}{=} \operatorname{tr} D(g)$,上节的正交归一关系决定了

    $\frac{1}{|G|} \sum_{g \in G}\left(\chi^{J}(g)\right)^{\*} \chi^{K}(g)=\frac{1}{|G|} \sum_{i} d_{i}\left(\chi_{i}^{J}\right)^{\*} \chi_{i}^{K}=\delta^{J K}$

    所以就很自然地有一个内积,$\left\langle\chi^{1}, \chi^{2}\right\rangle \stackrel{\text { def }}{=} \frac{1}{|G|} \sum_{i} d_{i}\left(\chi_{i}^{1}\right)^{\*} \chi_{i}^{2}$。不可约表示的特征标就成了一组自然的基。若D是可约的,那么$\chi(g)=n_{1} \chi^{1}(g)+n_{2} \chi^{2}(g)+\cdots$。那么就有$n_{J}=\left\langle\chi, \chi^{J}\right\rangle=\frac{1}{|G|} \sum_{i} d_{i}\left(\chi_{i}\right)^{\*} \chi_{i}^{J}$。实际上,这组正交归一关系还是完备的,即正交函数的数目等于空间的维数,$\sum dim(J)^2 = |G|$。

    这个完备性我不知道怎么证明。事实上,这样的话,$\left\{ \chi^J \right\}$也是完备的,它本身是个类函数,而完备性说明这组基底的维数等于不可约表示的数目。所以,不可约表示的数目等于共轭类的数目。

群上的代数
  • 取线性空间$\mathbb{C}(G)$,其基为g。在上面定义乘法,就有群代数。在群代数上,自然有表示D,定义为

    $\mathbf{g} \mathbf{g}_{i}=\mathbf{g}_{j} D_{j i}(g)$。

    这时候这些D的元素只是0和1。这种表示叫regular representation。

  • 另一方面,从一个群的表示可以自然地得到一个群代数的表示:

    $D^{J}\left(x_{1} \mathbf{g}_{1}+x_{2} \mathbf{g}_{2}+\cdots\right) \stackrel{\text { def }}{=} x_{1} D^{J}\left(g_{1}\right)+x_{2} D^{J}\left(g_{2}\right)+\cdots$

  • 上文提到,$\left\{ \chi^J \right\}$也是完备的。这样,对于$\left|\chi^J\right\rangle$就有$I = \sum\left|\chi^J\right\rangle\left\langle\chi^J\right|=\sum P^J$,其中$I$是$\mathbb{C}(G)$的单位元。

    有性质$\mathbf{P}^{J}=\sum_{i} \mathbf{e}_{i i}^{J}=\frac{\operatorname{dim} J}{|G|} \sum_{g \in G}\left[\chi^{J}(g)\right]^{*} \mathbf{g}$,$\mathbf{P}^{J} \mathbf{P}^{K}=\delta^{J K} \mathbf{P}^{K}$。这个P是从一个可约表示向其中一个不可约表示方向的投影算符。

20-4-2

关于一些矩阵群记号

  • $\mathrm{G} \mathrm{L}(n, \mathbb{C})$的意思是general linear map。

  • $\mathrm{SL}(n, \mathbb{F})$中,S的意思是det = 1.

  • U的意思是Unitary。O是orthogonal。

  • Sp是Symplectic。$\mathrm{Sp}(2 n, \mathbb{F})=\left\{S \in \mathrm{GL}(2 n, \mathbb{F}): S^{T} \omega S=\omega\right\}$。其中,omega是一个skew-symmetric矩阵,可以由坐标变换化成

    $\omega=\left(\begin{array}{cc}0 & -I_{n} \\ I_{n} & 0\end{array}\right)$。

    矩阵S的行列式是1.

SU(2)的几何:一点感觉

  • 李群是几何对象。它是有群结构的微分流形。

  • SU(2)一个元素可以写成

    $U=\left(\begin{array}{cc}x^{0}+i x^{3} & i x^{1}+x^{2} \\ i x^{1}-x^{2} & x^{0}-i x^{3}\end{array}\right)$

    $\left(x^{0}\right)^{2}+\left(x^{1}\right)^{2}+\left(x^{2}\right)^{2}+\left(x^{3}\right)^{2}=1$

    所以说,它是三维超球面上的点。SU(2)的一组未归一化的基是I和泡利矩阵。泡利矩阵有对易关系

    $\left[\hat{\sigma}_{i}, \hat{\sigma}_{j}\right]=2 i \epsilon_{i j k} \hat{\sigma}_{k}, $and $\sigma_{i}\hat{\sigma}_{j}+\hat{\sigma}_{j} \hat{\sigma}_{i}=2 \delta_{i j} I$

    我们将元素g写成$g=U=x^{0} I+i x^{1} \hat{\sigma}_{1}+i x^{2} \hat{\sigma}_{2}+i x^{3} \hat{\sigma}_{3}$。系数带i,因为我们希望这些矩阵厄密,这意味着本征值(观测量)是实数。

  • 元素g可以看做是幺元I附近的切空间中的元素。这个切空间叫做李代数$\mathfrak{g}$。当然,要称为李代数,还得在这个切空间上有一个满足一些条件的李括号运算。

    切空间的基底$i \hat{\lambda}_{i}$称为李代数生成元。其中的李括号运算$\left[i \hat{\lambda}_{i}, i \hat{\lambda}_{j}\right]=-f_{i j}^{k}\left(i \hat{\lambda}_{k}\right)$中,f叫做结构常数。

  • 将I到$I+i \epsilon \lambda_{i}$的向量叫做Li。Li在另一点g的推前$L_{i}(g)$被定为$g\left(I+i \epsilon \hat{\lambda}_{i}\right)$。例如,

    $\begin{aligned} g\left(I+i \epsilon \hat{\sigma}_{3}\right) &=\left(x^{0}+i x^{1} \hat{\sigma}_{1}+i x^{2} \hat{\sigma}_{2}+i x^{3} \hat{\sigma}_{3}\right)\left(I+i \epsilon \hat{\sigma}_{3}\right) \\ &=\left(x^{0}-\epsilon x^{3}\right)+i \hat{\sigma}_{1}\left(x^{1}-\epsilon x^{2}\right)+i \hat{\sigma}_{2}\left(x^{2}+\epsilon x^{1}\right)+i \hat{\sigma}_{3}\left(x^{3}+\epsilon x^{0}\right) \end{aligned}$

    可知,$L_{3}=-x^{2} \partial_{1}+x^{1} \partial_{2}+x^{0} \partial_{3}$,并且这个定义是global的。我们称Li是左不变的向量场,因为$g_{*}^{\prime}\left[L_{i}(g)\right]=L_{i}\left(g^{\prime} g\right)$。注意到,这里字母L代表left,困扰我一段时间的“为什么管角动量叫L”问题大概可以解决了。

    李括号运算在李群这个流形的每一点都成立。例如,在这个例子里,可以验算

    $\left[L_{i}, L_{j}\right]=-2 \epsilon_{i j k} L_{k}$

    结构常数f也不依赖于位置。这是由于取李括号的运算和推前的运算commute。

  • 李代数到李群的映射称为exponential map。设想流形上的轨迹$\frac{d x^{\mu}}{d t}=X^{\mu}(x(t))$,若我们取$g(t)=Exp \left(i t \hat{\lambda}_{i}\right)$,那么

    $\frac{d}{d t} g(t)=\lim _{\epsilon \rightarrow 0}\left\{\frac{1}{\epsilon}\left[g(t)\left(I+i \epsilon \hat{\lambda}_{i}\right)-g(t)\right]\right\}=L_{i} g(t)$

    所以说,实际上Exp(t, Li)将向量场Li映射到流形上的点g(t)。

  • 有左不变向量,也有右不变向量。

    $\begin{aligned}\left(I+i \epsilon \hat{\sigma}_{3}\right) g &=\left(I+i \epsilon \hat{\sigma}_{3}\right)\left(x^{0}+i x^{1} \hat{\sigma}_{1}+i x^{2} \hat{\sigma}_{2}+i x^{3} \hat{\sigma}_{3}\right) \\ &=\left(x^{0}-\epsilon x^{3}\right)+i \hat{\sigma}_{1}\left(x^{1}+\epsilon x^{2}\right)+i \hat{\sigma}_{2}\left(x^{2}-\epsilon x^{1}\right)+i \hat{\sigma}_{3}\left(x^{3}+\epsilon x^{0}\right) \end{aligned}$

    对应右不变向量场的分量

    $R_{3}=x^{2} \partial_{1}-x^{1} \partial_{2}+x^{0} \partial_{3}$

    我觉得可以认为Li就是沿着流形上的点去变化($g-e$)而得到的向量场的变化(推前),而Ri则是沿着局部向量场变化而得到的流形上的点的变化(“推前”?)。因此,它们有反效果:

    $\left[R_{i}, R_{j}\right]=+f_{i j}^{k} R_{k}$
    $\left[L_{i}, L_{j}\right]=-f_{i j}^{k} L_{k}$

    另外$\left[L_{i}, R_{j}\right]=0$,因为这两个操作完全独立。

  • 一个特别的微分形式是Maurer-Cartan形式。记右不变的MC形式为$d g g^{-1}=\omega_{R}=\left(i \hat{\sigma}_{i}\right) \omega_{R}^{i}$。对于SU(2),

    $\begin{aligned} g &=x^{0}+i x^{1} \hat{\sigma}_{1}+i x^{2} \hat{\sigma}_{2}+i x^{3} \hat{\sigma}_{3} \\ g^{-1} &=x^{0}-i x^{1} \hat{\sigma}_{1}-i x^{2} \hat{\sigma}_{2}-i x^{3} \hat{\sigma}_{3} \end{aligned}$

    而,由幺正性

    $\begin{aligned} d g &=d x^{0}+i d x^{1} \hat{\sigma}_{1}+i d x^{2} \hat{\sigma}_{2}+i d x^{3} \hat{\sigma}_{3} \\ &=\left(x^{0}\right)^{-1}\left(-x^{1} d x^{1}-x^{2} d x^{2}-x^{3} d x^{3}\right)+i d x^{1} \hat{\sigma}_{1}+i d x^{2} \hat{\sigma}_{2}+i d x^{3} \hat{\sigma}_{3} \end{aligned}$

    得到恶心的

    $\begin{aligned} d g g^{-1}=& i \hat{\sigma}_{1}\left(\left(x^{0}+\left(x^{1}\right)^{2} / x^{0}\right) d x^{1}+\left(x^{3}+\left(x^{1} x^{2}\right) / x^{0}\right) d x^{2}+\left(-x^{2}+\left(x^{1} x^{3}\right) / x^{0}\right) d x^{3}\right) \\ &+i \hat{\sigma}_{2}\left(\left(-x^{3}+\left(x^{2} x^{1}\right) / x^{0}\right) d x^{1}+\left(x^{0}+\left(x^{2}\right)^{2} / x^{0}\right) d x^{2}+\left(x^{1}+\left(x^{2} x^{3}\right) / x^{0}\right) d x^{3}\right) \\ &+i \hat{\sigma}_{3}\left(\left(x^{2}+\left(x^{3} x^{1}\right) / x^{0}\right) d x^{1}+\left(-x^{1}+\left(x^{3} x^{2}\right) / x^{0}\right) d x^{2}+\left(x^{0}+\left(x^{3}\right)^{2} / x^{0}\right) d x^{3}\right) \end{aligned}$

    第一个观察是$\omega_{R}^{i}\left(R_{j}\right)=\delta_{j}^{i}$。从这一点,知道这些微分形式是右不变向量场的对偶空间的基底。同样,左不变的为$g^{-1} d g=\omega_{L}=\left(i \hat{\sigma}_{i}\right) \omega_{L}^{i}$。还有一个性质,就是求外导数的时候,

    $d \omega_{R}=d\left(d g g^{-1}\right)=\left(d g g^{-1}\right) \wedge\left(d g g^{-1}\right)=\omega_{R} \wedge \omega_{R}$

    $\begin{aligned} \omega_{R} \wedge \omega_{R} &=\omega_{R}^{i} \wedge \omega_{R}^{j}\left(i \hat{\sigma}_{i}\right)\left(i \hat{\sigma}_{j}\right) \\ &=\frac{1}{2} \omega_{R}^{i} \wedge \omega_{R}^{j}\left[i \hat{\sigma}_{i}, i \hat{\sigma}_{j}\right] \\ &=-\frac{1}{2} f_{i j}^{k}\left(i \hat{\sigma}_{k}\right) \omega_{R}^{i} \wedge \omega_{R}^{j} \\ d \omega_{R}^{k} &=-\frac{1}{2} f_{i j}^{k} \omega_{R}^{i} \wedge \omega_{R}^{j} \end{aligned}$

    同理$d \omega_{L}^{k}=+\frac{1}{2} f_{i j}^{k} \omega_{L}^{i} \wedge \omega_{L}^{j}$。这些东西的用处对我尚不明确。不过,它里面有cartan,这说明它至少对一些人来说很重要。

    • 补充——至少对于SU(2)群,mc形式实际上是有物理意义的,左MC形式是自体坐标系下的角速度,而右mc形式是空间坐标系下的角速度。
  • SU(2)对应三维旋转,这是我从前在别处看过的。可以用欧拉角来参数化这个群。根据其定义,三次转动坐标系:

    $\begin{aligned} U &=\exp \left\{-i \phi \hat{\sigma}_{3} / 2\right\} \exp \left\{-i \theta \hat{\sigma}_{2} / 2\right\} \exp \left\{-i \psi \hat{\sigma}_{3} / 2\right\} \\ &=\left(\begin{array}{cc}e^{-i \phi / 2} & 0 \\ 0 & e^{i \phi / 2}\end{array}\right)\left(\begin{array}{cc}\cos \theta / 2 & -\sin \theta / 2 \\ \sin \theta / 2 & \cos \theta / 2\end{array}\right)\left(\begin{array}{cc}e^{-i \psi / 2} & 0 \\ 0 & e^{i \psi / 2}\end{array}\right) \\ &=\left(\begin{array}{cc}e^{-i(\phi+\psi) / 2} \cos \theta / 2 & -e^{i(\psi-\phi) / 2} \sin \theta / 2 \\ e^{i(\phi-\psi) / 2} \sin \theta / 2 & e^{+i(\psi+\phi) / 2} \cos \theta / 2\end{array}\right) \end{aligned}$

    从此式可以知道xi和欧拉角的关系。

  • 事实上,李群这个流形上有自然的度规。

    $\begin{aligned}“ d s^{2}” &=\left(d x^{0}\right)^{2}+\left(d x^{1}\right)^{2}+\left(d x^{2}\right)^{2}+\left(d x^{3}\right)^{2} \\ &=\frac{1}{4}\left(d \theta^{2}+\cos ^{2} \theta / 2(d \psi+d \phi)^{2}+\sin ^{2} \theta / 2(d \psi-d \phi)^{2}\right) \\ &=\frac{1}{4}\left(d \theta^{2}+d \psi^{2}+d \phi^{2}+2 \cos \theta d \phi d \psi\right) \end{aligned}$

    体积元$\sqrt{g} d \theta d \phi d \psi$是$\frac{1}{8} \sin \theta d \theta d \phi d \psi$。

  • 关于SO(3)和SU(2)。

    • 后者是前者的双覆盖。这就是说,前者只占据半个超球面。或者说,2pi*2pi*pi可以包括所有的三维旋转。$\mathrm{SO}(3) \simeq \mathrm{SU}(2) / \mathbb{Z}_{2}$。

    • 从后者到前者。取后者一元素U,由于泡利矩阵的性质,$\hat{\sigma}_{i}^{\prime}=U \hat{\sigma}_{i} U^{-1}$也是无迹、厄密的,$\hat{\sigma}_{i}^{\prime}=\hat{\sigma}_{j} R_{j i}$,因此

      $\begin{aligned} 2 \delta_{i j} &=\hat{\sigma}_{i}^{\prime} \hat{\sigma}_{j}^{\prime}+\hat{\sigma}_{j}^{\prime} \hat{\sigma}_{i}^{\prime} \\ &=\left(\hat{\sigma}_{l} R_{l i}\right)\left(\hat{\sigma}_{m} R_{m j}\right)+\left(\hat{\sigma}_{m} R_{m j}\right)\left(\hat{\sigma}_{l} R_{l i}\right) \\ &=\left(\hat{\sigma}_{l} \hat{\sigma}_{m}+\hat{\sigma}_{m} \hat{\sigma}_{l}\right) R_{l i} R_{m j} \\ &=2 \delta_{l m} R_{l i} R_{m j} \end{aligned}$

      $R_{m i} R_{m k}=\delta_{i k}$。

      R是O(3)的元素。而当U=I时,R=I,因此行列式是1。故R是SO(3)的元素。

    • 从前者到后者。这需要一个六分仪。

      在这个例子中,经过两面夹角为$\theta$的镜子反射,太阳光被偏折了$2\theta$。现在,假设在$\mathfrak{g}$上有$\widehat{\mathbf{x}}=x^{i} \hat{\sigma}_{i}$,可以写出向量x被镜子n反射的情况:

      $\left(-\hat{\sigma}_{i} n^{i}\right) \widehat{\mathbf{x}}\left(\hat{\sigma}_{k} n^{k}\right)=\left(x^{j}-2(\mathbf{n} \cdot \mathbf{x})\left(n^{j}\right)\right) \hat{\sigma}_{j}=\widehat{\mathbf{x}}-2(\mathbf{n} \cdot \mathbf{x}) \widehat{\mathbf{n}}$

      再套一层,相当于被两面成$\theta/2$的镜子反射

      $-\left(\hat{\sigma}_{1} \cos \theta / 2+\hat{\sigma}_{2} \sin \theta / 2\right)\left(-\hat{\sigma}_{1}\right) \widehat{\mathbf{x}}\left(\hat{\sigma}_{1}\right)\left(\hat{\sigma}_{1} \cos \theta / 2+\hat{\sigma}_{2} \sin \theta / 2\right)$

      上式等于

      $\left(\cos \theta / 2-\hat{\sigma}_{1} \hat{\sigma}_{2} \sin \theta / 2\right) \hat{\mathbf{x}}\left(\cos \theta / 2+\hat{\sigma}_{1} \hat{\sigma}_{2} \sin \theta / 2\right)$
      $\quad=\hat{\sigma}_{1}\left(\cos \theta x^{1}-\sin \theta x^{2}\right)+\hat{\sigma}_{2}\left(\sin \theta x^{1}+\cos \theta x^{2}\right)+\hat{\sigma}_{3} x^{3}$

      正是偏转了$\theta$。上式事实上可以写成

      $U \hat{\sigma}_{i} U^{-1}=\hat{\sigma}_{j} R_{j i}$

      $U=\exp \left\{-\frac{i}{2} \hat{\sigma}_{3} \theta\right\}=\exp \left\{-i \frac{1}{4 i}\left[\hat{\sigma}_{1}, \hat{\sigma}_{2}\right] \theta\right\}$

      上式最右边表示这束光线的偏折是在1,2-平面内完成的。说实话,这两式我觉得并不是推导上显然的,更像是一种马后炮,是对于以上物理图景正确性的补充说明。这种镜子打光的图景是有用的。

      而$U(R) \hat{\sigma}_{i} U^{-1}(R)=(-U(R)) \hat{\sigma}_{i}(-U(R))^{-1}$,所以一个R对应两个U。

  • SO(n)的旋量表示。在高维下,泡利矩阵变成了N个一组的狄拉克矩阵,这种矩阵满足Clifford代数:

    $\hat{\gamma}_{\mu} \hat{\gamma}_{\nu}+\hat{\gamma}_{\nu} \hat{\gamma}_{\mu}=2 \delta_{\mu \nu} I$

    关于这些矩阵,有一个大概的情况是,如果N为偶数,那么他们都是$2^n\times 2^n$的厄密阵,为奇数,则对于2n+1维,在2n维基础上加一个$\hat{\gamma}_{2 n+1}=-(i)^{n} \hat{\gamma}_{1} \hat{\gamma}_{2} \cdots \hat{\gamma}_{2 n}$。

    事实上,可以推广在m,n-平面内的旋转:

    $e^{-i \frac{1}{4}\left[\hat{\gamma}_{m}, \hat{\gamma}_{n}\right] \theta} \hat{\gamma}_{i} e^{i \frac{1}{4 i}\left[\hat{\gamma}_{m}, \hat{\gamma}_{n}\right] \theta}=\hat{\gamma}_{j} R_{j i}$

    这样$\hat{\Gamma}_{m n}=\frac{1}{4 i}\left[\hat{\gamma}_{m}, \hat{\gamma}_{n}\right]$正是一个高维旋转的矩阵。该矩阵所作用的 $2^{[N / 2]}$维线性空间正是SO(N)的旋量表示。

    我总觉得很奇怪。我中学的时候看科普书,讲说只有实数、复数、四元数、八元数具有某种特殊性(这是数学上的事,我不清楚),但是这个“Clifford代数”所做的似乎是把$2^{[n/2]}$元数和n维旋转对应起来。那低维旋转有什么特殊之处吗?

李代数

  • 李代数(李括号)自有其形式化的定义。具体来说,他是

    • 反对称的:$[X, Y]=-[Y, X]$
    • 线性的:$[\lambda X+\mu Y, Z]=\lambda[X, Z]+\mu[Y, Z]$
    • 满足雅克比恒等式的:$[[X, Y], Z]+[[Y, Z], X]+[[Z, X], Y]=0$
  • 此外,还有一些没听说过的概念。

    • 比如说,理想。理想是李代数的子代数$\mathfrak{i} \subseteq \mathfrak{g}$,其满足$[\mathfrak{i}, \mathfrak{g}] \subseteq \mathfrak{i}$。事实上,在更general的场景下,也有理想的概念。环$(R,+, \cdot)$,是有加法和乘法的半群(对乘法是半群)。理想则是说,对于可交换的$(R,+)$,左(右)理想中的元素带着加法构成一个子群,并且r*i(i*r)仍然在理想中。比如说,全体偶数是整数环Z的理想。就像正规子群可以得到商群一样,用理想可以得到商环(为什么翻译成理想?照着柏拉图的idea翻译成理型不好吗?)。同样地,在李代数里面,也可以以此得到商代数$\mathfrak{g}-\mathfrak{i}$。事实上,商群的李代数就是商代数。

    • 还有伴随表示。它叫伴随表示,是因为$g X g^{-1}=\operatorname{Ad}(g) X$。但是引入它更合适的是从矩阵上开始:定义$\operatorname{ad}(X) Y=[X, Y]$。雅克比恒等式给出

      $(\operatorname{ad}(X) \operatorname{ad}(Y)-\operatorname{ad}(Y) \operatorname{ad}(X)) Z=\operatorname{ad}([X, Y]) Z$

      此式即为$[\operatorname{ad}(X), \operatorname{ad}(Y)]=\operatorname{ad}([X, Y])$。这说明它和李括号是交换的。

      由于

      $\exp [\operatorname{ad}(t X)] Y=Y+t[X, Y]+\frac{1}{2} t^{2}[X,[X, Y]]+\cdots$

      为了达成$\operatorname{Ad}(\operatorname{Exp} Y)=\exp (\operatorname{ad}(Y))$的效果,我们才让$g X g^{-1}=\operatorname{Ad}(g) X$。

    • 基灵形式。这个“形式”是一个0-形式,它是一个定义在李代数上的内积$\langle X, Y\rangle=\operatorname{tr}(\operatorname{ad}(X) \operatorname{ad}(Y))$。在物理上,定义killing度规$g_{i j}=\operatorname{tr}\left\{\operatorname{ad}\left(X_{i}\right) \operatorname{ad}\left(X_{j}\right)\right\}$。书上说,负定的killing场(正定的killing度规)意味着这个李代数和对应的李群是紧的,但没说为什么这么定义。我想,是不是因为这件事对应李群作为一个流形处处曲率是正的呢?但这并不是”紧“的必要条件。很难理解。

    • 卡西米尔不变量。若killing度规有逆,那么定义quadratic Casimir:$\hat{C}_{2}=g^{i j} \hat{X}_{i} \hat{X}_{j}$,它的主要性质是$\left[\hat{C}_{2}, \hat{X}_{i}\right]=0$。由schur引理,这事意味着$\hat{C}_{2}=c_{2} I$。

20-4-4

  • 研究李群的表示时,方便的办法是先研究李代数的表示,然后放到指数上得到李群的表示。

    • 以SU(2)做例子,看看李群的表示。我们知道李括号$\left[J_{1}, J_{2}\right]=i \hbar J_{3}$,其中令$\hbar=1$即可。表示论的目的是找到所有满足这一关系的矩阵组们。让我们回忆一下在量子力学里面人们怎样解决这个问题。(在量子力学中,相当于对于自旋j=1/2, 1, 3/2…的情况各有一表示)

      人们创建升降算符$J_{+}=J_{1}+i J_{2}, \quad J_{-}=J_{+}^{\dagger}=J_{1}-i J_{2}$。可以发现,如果J3有一个本征矢$|j, m\rangle$,其有本征值m,那么它也有本征矢$J_{\pm}|j, m\rangle$,其有本征值$m\pm1$。然而升降算符把m这部分角动量升到顶了之后再升必须是0。于是,

      $\begin{aligned} 0 &=\| J_{+}|j, j\rangle \|^{2} \\ &=\left\langle j, j\left|J_{+}^{\dagger} J_{+}\right| j, j\right\rangle \\ &=\left\langle j, j\left|J_{-} J_{+}\right| j, j\right\rangle \\ &=\left\langle j, j\left|\left(J^{2}-J_{3}\left(J_{3}+1\right)\right)\right| j, j\right\rangle \\ &=\left[c_{2}-j(j+1)\right]\langle j, j | j, j\rangle \end{aligned}$

      这里面,我们利用了$J^{2} \equiv J_{1}^{2}+J_{2}^{2}+J_{3}^{2}$是quadratic Casimir,因此正比于Id这个事实。当我们知道了$c_{2}=j(j+1)$之后,我们就可以去算升降算符的“大小”:

      $\begin{aligned} \| J_{-}|j, m\rangle \|^{2} &=\left\langle j, m\left|J_{-}^{\dagger} J_{-}\right| j, m\right\rangle \\ &=\left\langle j, m\left|J_{+} J_{-}\right| j, m\right\rangle \\ &=\left\langle j, m\left|\left(J^{2}-J_{3}\left(J_{3}-1\right)\right)\right| j, m\right\rangle \\ &=[j(j+1)-m(m-1)]\langle j, m | j, m\rangle \end{aligned}$

      反正结果是

      $\begin{aligned} J_{3}|j, m\rangle &=m|j, m\rangle \\ J_{-}|j, m\rangle &=\sqrt{j(j+1)-m(m-1)}|j, m-1\rangle \\ J_{+}|j, m\rangle &=\sqrt{j(j+1)-m(m+1)}|j, m+1\rangle \end{aligned}$

      我们取j为半整数的结果正是$J_{-}|j,-j\rangle=0$。如果取别的数,那么就搞不成这一点,就会有无数的m<-j的态。这是物理上不行的,而数学上这导致$\| J_{-}|j, m\rangle \|^{2}<0$,破坏了unitarity。

    • 再来看SU(3)的情况。正如在SU(2)中,李代数的基底是泡利矩阵(对应j=1/2的角动量的(未归一化的)分量)一样,在SU(3)中,盖尔曼的lambda阵作为3维SU矩阵的构成了李代数的基底:

      $\begin{array}{c}\hat{\lambda}_{1}=\left(\begin{array}{ccc}0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 0\end{array}\right), & \hat{\lambda}_{2}=\left(\begin{array}{ccc}0 & -i & 0 \\ i & 0 & 0 \\ 0 & 0 & 0\end{array}\right), & \hat{\lambda}_{3}=\left(\begin{array}{ccc}1 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & 0\end{array}\right) \\ \hat{\lambda}_{4}=\left(\begin{array}{ccc}0 & 0 & 1 \\ 0 & 0 & 0 \\ 1 & 0 & 0\end{array}\right), & \hat{\lambda}_{5}=\left(\begin{array}{ccc}0 & 0 & -i \\ 0 & 0 & 0 \\ i & 0 & 0\end{array}\right), & \hat{\lambda}_{6}=\left(\begin{array}{ccc}0 & 0 & 0 \\ 0 & 0 & 1 \\ 0 & 1 & 0\end{array}\right) \\ \hat{\lambda}_{7}=\left(\begin{array}{cccc}0 & 0 & 0 \\ 0 & 0 & -i \\ 0 & i & 0\end{array}\right), & \hat{\lambda}_{8}=\frac{1}{\sqrt{3}}\left(\begin{array}{ccc}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & -2\end{array}\right)\end{array}$

      他们满足$\operatorname{tr}\left(\hat{\lambda}_{i} \hat{\lambda}_{j}\right)=2 \delta_{i j}$。

      正如同$\operatorname{ad}\left(J_{3}\right) J_{\pm}=\left[J_{3}, J_{\pm}\right]=\pm J_{\pm}$一样,在这里也可以定义升降算符。首先,我们可以验证矩阵3和8是commute的,具有一样的本征矢。我们拿这两个东西当成J3,拿其他的矩阵构造升降算符。现在,对于任何满足SU(3)的李代数的一组矩阵(并且,其第3个和第8个也commute),我们搞出

      $T_{\pm}=\frac{1}{2}\left(\Lambda_{1} \pm i \Lambda_{2}\right)$
      $V_{\pm}=\frac{1}{2}\left(\Lambda_{4} \pm i \Lambda_{5}\right)$
      $U_{\pm}=\frac{1}{2}\left(\Lambda_{6} \pm i \Lambda_{7}\right)$

      然后可以验证

      $\begin{aligned} \operatorname{ad}\left(\Lambda_{3}\right) T_{\pm} &=\left[\Lambda_{3}, T_{\pm}\right]=\pm 2 T_{\pm} \\ \operatorname{ad}\left(\Lambda_{3}\right) V_{\pm} &=\left[\Lambda_{3}, V_{\pm}\right]=\pm V_{\pm} \\ \operatorname{ad}\left(\Lambda_{3}\right) U_{\pm} &=\left[\Lambda_{3}, U_{\pm}\right]=\mp U_{\pm} \\ \operatorname{ad}\left(\Lambda_{8}\right) T_{\pm} &=\left[\Lambda_{8}, T_{\pm}\right]=0 \\ \operatorname{ad}\left(\Lambda_{8}\right) V_{\pm} &=\left[\Lambda_{8}, V_{\pm}\right]=\pm \sqrt{3} V_{\pm} \\ \operatorname{ad}\left(\Lambda_{8}\right) U_{\pm} &=\left[\Lambda_{8}, U_{\pm}\right]=\pm \sqrt{3} U_{\pm} \end{aligned}$

      画个图,就会发现

      这六个升降算符可以把本征矢$\left|\lambda_{3}, \lambda_{8}\right\rangle$对应的本征值们往六个不同的方向推。例如,

      $\Lambda_3T_\pm\left|\lambda_{3}, \lambda_{8}\right\rangle=(\lambda_3\pm2)T_\pm\left|\lambda_{3}, \lambda_{8}\right\rangle$

      $\Lambda_8T_\pm\left|\lambda_{3}, \lambda_{8}\right\rangle=(\lambda_8)T_\pm\left|\lambda_{3}, \lambda_{8}\right\rangle$

      同样,有限维下我们也得有一个最高态,在这个态这里任何一个升降算符都可以把它打到0。就像SU(2)中对j的约束一样,这里对$\lambda_3,\lambda_8$的约束是它们得是自然数。把它们记成p,q,而(p,q)对应的表示的维数是

      $d=\frac{1}{2}(p+1)(q+1)(p+q+2)$。

      我们也是按着之前的步骤,先得到最高态,然后往下降(注意,有的态可以从最高态用不止一条路降下来,导致简并),对某种情况(例如p=3, q=1)作一个图大概长这样:

      说实话,这个玩意有什么用,我也不知道。不过既然这些矩阵叫Gell-Mann矩阵,那可能是在粒子物理里面有一些用处吧。

      这个书看得,真的是很头疼。。。感觉看到了很多骨架,每一块肉都要自己花时间长出来才行。如果之前学过相关的物理,那还好说,没学过的话,我作为一个没什么数学感觉的人,能做的就只有paraphrase原文的段落,没有办法按照自己的想法把这些东西整理起来。兴许之后学得多了回头再看会好些