文章

线性代数速通(一)

如果你还不会矢量

不会吧?那你到底学了些啥?

爱因斯坦记号

首先,让我们先考虑实的矢量,即分量都是实数的矢量。

矢量和对偶矢量

一个矢量会有很多分量,写为 $\pmb{v}=(v^1,v^2,v^3,\cdots)$ 。为了简单起见,我们直接用 $v^m$ 来表示这个矢量,这个上标 $m$ 就表示对应于哪个分量。这么做,矢量加法和数乘都依然表现正常

\[\begin{aligned} \pmb{v}+\pmb{u}=(v^1+u^1,v^2+u^2,\cdots)\quad&\Leftrightarrow\quad v^m+u^m\\ \alpha\pmb{v}=(\alpha v^1,\alpha v^2,\cdots)\quad&\Leftrightarrow\quad\alpha v^m. \end{aligned}\]

我们还可以构造一个具有下标的数学对象,形如 $u_m$。它被称为 对偶矢量,和矢量一样,可以相加或是数乘。目前看来,这只是上下标的区别。

对偶矢量的一个独特之处在于,它可以「吃」一个矢量,得到一个数

\[\sum_mv^mu_m=s\in\mathbb{R}.\]

用数学家的话说:一个对偶矢量是一个从矢量到数的映射。

以上表达式更通常的写法是 $v^mu_m=s$,直接忽略求和记号。在以后我们也将沿用这种记法:相乘的两项如果具有相同的指标,且一上一下,那么就默认对这对指标求和。 这被称为 爱因斯坦求和约定

张量

作为对矢量的拓展,我们也可以想象一个具有 多个指标 的数学概念,称为 张量。举例来说,

\[T^{abc}{}_{de}\]

是一个具有 $3$ 个上指标和 $2$ 个下指标的张量,称为 $(3,2)$ 型张量。这也就意味着它可以「吃」两个矢量,同时被三个对偶矢量「吃」,而得到一个数。即

\[T^{abc}{}_{de}x^dy^ev_au_bw_c=s\in\mathbb{R}.\]

由于这个张量自己同时具有上标和下标,因此它甚至可以「自己吃自己」1

\[T^{abm}{}_{cm}=T^{ab}{}_c.\]

右边得到的结果是一个 $(2,1)$ 型张量。虽然它是一个新的张量,但因为是 $T$ 自己吃自己得到的,因此我们通常也用 $T$ 命名它。

一个很有用的张量是 $\delta^a{}_b$,被称为 克罗内克$\delta$。它只有在 $a=b$ 时取 $1$,其他时候都取 $0$。显然我们会发现

\[\delta^a{}_bT_a=T_b,\quad \delta^a{}_bT^b=T^a.\]

注意到,在使用爱因斯坦求和约定的过程中,求和的指标是一上一下这点非常重要,同时我们也需要保证相加时每一项具有一致的指标,否则这个表达式就是没有意义的。

内积与二次型

一个特殊的 $(0,2)$ 型张量是 内积张量 $g_{mn}$。之所以有这个名字,是因为它给出了矢量之间的 内积,或者说我们所熟悉的 点积

\[\pmb{v}\cdot\pmb{u}=v^mg_{mn}u^n.\]

在我们熟悉的欧氏空间中,$g_{mn}$ 在 $m=n$ 时取 $1$,否则取 $0$,此时

\[\pmb{v}\cdot\pmb{u}=g_{mn}v^mu^n=v^1u^1+v^2u^2+\cdots.\]

当然,我们也可以定义一些更一般的内积。但总的来说,它们应该满足一些性质:

  • 对称性,即 $\pmb{v}\cdot\pmb{u}=\pmb{u}\cdot\pmb{v}$。这反映在内积张量上就是 $g_{mn}=g_{nm}$;
  • 非负性,即任意一个矢量 自己和自己内积 的结果应该非负 $v^2=\pmb{v}\cdot\pmb{v}\geqslant 0$。这个内积结果被称为这个矢量 模长 的平方;
  • 非退化性,这就是说,只有零矢量 $\pmb{0}$ 才具有零的模长,其他任意 $\pmb{v}\ne\pmb{0}$ 都具有 $v^2>0$。

后两条组合起来被称为 正定性

更更一般地,有时我们只要求保留第一条对称性,一个例子是相对论的闵氏时空。此时的 内积张量 通常被称为 二次型。一个二次型实际上就是一个对称的 $(0,2)$ 型张量 $T_{mn}$。

从内积张量还可以定义对偶矢量的内积 $g^{mn}$,满足

\[g^{ab}g_{bc}=\delta^a{}_c.\]

$g_{mn}$ 的一个独特之处在于它可以用来 升降指标,例如对于一个矢量 $v^m$,用内积可以将其变为一个对偶矢量

\[v^mg_{mn}=v_n.\]

虽然任何一个 $(0,2)$ 型张量如此作用的结果都是一个对偶矢量2,但只有内积作用的结果仍称为 $v$,这是因为这样一来就有

\[\pmb{v}\cdot\pmb{u}=v_mu^m\]

这个较好的性质。同样 $g^{mn}$ 也可以用于将下标变为上标。

出于这个原因,有时候也会把 $v^mu_m$ 直接称为内积。

狄拉克记号

对于复矢量空间,更常用的是狄拉克记号3。在这一部分中我们也将试图更加(略微)严谨地对待问题。

矢量与对偶矢量

在狄拉克记号中,一个矢量记为 $\ket{a}$,也称为 右矢,而对偶矢量则记为 $\bra{a}$,也称为 左矢。加减法的记号和通常一样,数乘则通常记在竖线一侧 $c\ket{b}$ 和 $\bra{a}c$,但记在另一侧的写法也会出现。

对偶矢量和矢量的结合被记为

\[\braket{a|b}\in\mathbb{C}.\]

由前文我们知道,在大多数情况下 对偶矢量可以和矢量互相对应,在狄拉克记号下,这个对应规则具体来说是

\[\begin{aligned} \ket{a}\quad&\leftrightarrow\quad\bra{a}\\ c\ket{a}\quad&\leftrightarrow\quad\bra{a}c^*,\quad c\in\mathbb{C}. \end{aligned}\]

由于这样对应的存在,$\braket{a|b}$ 也可以被看作 $\ket{a}$ 和 $\ket{b}$ 的内积。由于内积是线性的,就有

\[\braket{a|c|b}=\bra{a}(c\ket{b})=c\braket{a|b},\quad c\in\mathbb{C}.\]

与实空间内积不同的是,这个内积是 共轭对称

\[\braket{a|b}=\braket{b|a}^*.\]

这意味着任何矢量的模长 $\braket{a|a}$ 是一个实数。

在一些严格的数学书中,可能会看到复内积空间的另一个奇怪性质:第二变元共轭线性。 如果把 $\braket{a|b}$ 中 $\ket{a}$ 看作第二变元,这件事实际上非常显然,只需要记住对偶矢量的对应规则:

\[(c\ket{a})~\cdot~\ket{b}=(\bra{a}c^*)\ket{b}=c^*\braket{a|b}.\]

在爱因斯坦记号中,我们实际上忽略了矢量空间的基这一问题。在这里我也并不给出严格定义,但正如我们在欧氏空间中熟悉的那样,一组基 ${\ket{a_i}}$ 实际上就是一组矢量,满足 任意 一个矢量 $\ket{x}$ 都可以被 唯一地 写为

\[\ket{x}=\sum_ix^i\ket{a_i}\]

的形式。这里的 $x^i$ 实际上就是爱因斯坦记号中的「分量」。

比基更好的东西是 正交归一基,它是指一组满足

\[\braket{a_i|a_j}=\delta_{ij}\]

的基。对于一般的基,这个结果就是我们讲过的内积

\[\braket{a_i|a_j}=g_{ij}.\]

正交 是指对于 $i\ne j$ 有 $\braket{a_i|a_j}=0$,而 归一 是指

\[\sum_j\braket{a_i|a_j}=1.\]

算符

一个 算符 将一个矢量映射为另一个矢量。

\[X\ket{a}=\ket{b}.\]

在线性代数中,我们研究的都是线性算符,即它们都满足 线性性

\[\begin{aligned} (X+Y)\ket{a}&=X\ket{a}+Y\ket{a}\\ X(\ket{a}+\ket{b})&=X\ket{a}+X\ket{b}. \end{aligned}\]

同样也有作用在对偶矢量上的算符,在狄拉克记号下记作

\[\bra{a}X=\bra{b}.\]

有两个重要的算符,分别是 单位算符 $I$ 和 零算符 $0$。单位算符作用在任何矢量上都得到那个矢量本身

\[I\ket{v}=\ket{v},\]

零算符作用在任何矢量上则都得到 $0$。

有时单位算符也被记为 $1$ 或 $1_V$。注意到,单位算符和数字 $1$ 是不同的东西。

逆算符

对于一个算符 $X$,有可能 存在这样一个算符 $X^{-1}$,使得

\[X^{-1}X=XX^{-1}=I.\]

如果存在的话,那么就称这个算符 $X^{-1}$ 是 $X$ 的 逆算符,$X$ 称为 可逆的

不难发现

\[(X^{-1})^{-1}=X.\]

伴随算符

算符作用在矢量上对应的对偶矢量是

\[X\ket{a}\quad\leftrightarrow\quad\bra{a}X^\dagger.\]

其中 $X^\dagger$ 称为 $X$ 的 伴随算符,不过物理学家更愿意称其为 共轭转置,我们稍后会看到原因。

一个重要的概念是 自伴算符 或者称为 厄米算符,即满足 $A=A^\dagger$ 的算符。

当算符夹在内积中时 $\braket{a|X|b}$,根据内积的性质可知

\[\braket{a|X|b}=\braket{b|X^\dagger|a}^*.\]

与伴随相关的另一种算符被称为 幺正算符 或者 酉算符,即满足 $A^\dagger A=I$ 的算符。幺正算符满足一个重要的性质,即它是 保持内积不变 的,也即 $A\ket{a}$ 和 $A\ket{b}$ 的内积满足

\[\braket{a|A^\dagger A|b}=\braket{a|b}.\]

一些别的算符

一个有趣的算符是 $\ket{a}\bra{b}$,它的伴随算符是 $\ket{b}\bra{a}$,并且它一般是不可逆的。读者可以思考一下这是怎么回事。

对于一组正交归一的基,更有趣的一个算符是

\[\sum_i\ket{a_i}\bra{a_i}=1.\]

这实际上就是单位算符,因此,可以把它插入到各种地方4,这被称为 单位分解(resolution of identity)。它的伴随自然是它本身。

算符与矩阵

通过单位分解,我们会发现

\[\ket{x}=\sum_i\ket{a_i}\braket{a_i|x}=\sum_ix^i\ket{a_i},\]

这意味着 $\ket{x}$ 的分量就是 $x^i=\braket{a_i|x}$。如果考虑的对象是一个算符,则

\[X\ket{v}=\sum_{i,j}\ket{a_i}\braket{a_i|X|a_j}\braket{a_j|v}.\]

假设我们记 $\braket{a_i|X|a_j}=X^i{}_j$,那么这个结果就是

\[\sum_{i,j}X^i{}_jv^j\ket{a_i}.\]

可以发现 $X^i{}_j$ 实际上就是一个 $(1,1)$ 型张量。我们也确实知道,一个 $(1,1)$ 型张量吃一个矢量会吐出一个矢量,这也符合算符的定义。

单位算符对应的张量就是 $\delta^i{}_j$。

$\braket{a_i|X|a_j}$ 被称为 $X$ 的 矩阵元。由内积的性质我们知道,$X^\dagger$ 的矩阵元即为

\[\braket{a_i|X^\dagger|a_j}=\braket{a_j|X|a_i}^*.\]

这正是 $X$ 的矩阵元的 共轭转置

矩阵记法实际上也是线性代数的常见记法,矢量记为列向量而对偶矢量记为行向量。对这一记法我们不再过多介绍,不过 矩阵 实际上就是指 $(1,1)$ 型张量5

基变换

最后我们简单介绍一下有关基变换的过程。正如我们熟悉的欧氏空间中一样,我们可以选取不同的基来描述同一个矢量,选取不同的基不会改变矢量本身,只是改变了我们描述它的方式6

举例来说,同一个矢量 $\ket{x}$ 在基 $\ket{a_i}$ 和 $\ket{b_i}$ 下分别可以被写为

\[\ket{x}=\sum_i\ket{a_i}\braket{a_i|x}=\sum_i\ket{b_i}\braket{b_i|x}.\]

即它的分量表达式分别为 $x^i(a)=\braket{a_i|x}$ 和 $x^i(b)=\braket{b_i|x}$。因此,如果你想要从一组基 $\ket{a_i}$ 变换到另一组基 $\ket{b_i}$ 下,那么新的分量就是

\[x^i(b)=\braket{b_i|x}=\sum_j\braket{b_i|a_j}\braket{a_j|x}=U^i{}_jx^j(a).\]

其中 $U^i{}_j=\braket{b_i|a_j}$ 被称为 基变换矩阵

既然算符可以在基下展开,我们同样也可以写出它的基变换

\[X^i{}_j(b)=\braket{b_i|X|b_j}=\sum_{k,\ell}\braket{b_i|a_k}\braket{a_k|X|a_\ell}\braket{a_\ell|b_j}=U^i{}_kX^k{}_\ell(a)U_j{}^\ell.\]

对偶矢量和更多指标的张量也可以用一样的方法变换。

脚注

  1. 听起来十分变态 

  2. 即带一个下标 

  3. 实系数矢量自然也是可以的 

  4. 就像计算的时候乘一个 1 一样 

  5. 更准确地说是方矩阵 

  6. 即它的分量 

本文由作者按照 CC BY 4.0 进行授权