文章

线性代数速通(二)

线性空间

线性空间

之所以这么晚才提及线性空间,是因为这不是一篇严格的数学教材。

一个 线性空间 是一个矢量组成的集合,举例来说,我们熟悉的三维欧氏空间 $\mathbb{R}^3$ 就是一个线性空间。线性空间的一个重要的性质是:将线性空间中的矢量任意相加或数乘1,得到的结果都仍然是这个空间中的矢量。 这被称为线性空间的 封闭性

把这句话写为公式就是,对于线性空间 $V$ 中的任意一些矢量 $\ket{v_i}$ 和一些任意的数 $c_i$

\[\sum_ic_i\ket{v_i}=\ket{x}\in V.\]

这里一个细节在于 $c_i$ 是实数还是复数。实际上正是这点决定了这个线性空间是 实线性空间 还是 复线性空间。它们的性质有一些微妙的差异。

每线性空间 $V$ 中都有一个特殊的元素,就是 零元,或者称为 加法单位元,也就是2 $0_V$。它就和我们通常理解的 零矢量 一样,任何矢量乘 $0$ 后就会得到它;任何矢量加上它结果不变。线性空间理论的公理之一是:零元是存在且唯一的

对于一个线性空间 $V$,我们总可以在其中选择一组基 $\ket{v_i}$,使得它不多不少正好可以用来 唯一 线性表示 所有 $V$ 中的矢量

\[\ket{v}=\sum_ic_i\ket{v_i}.\]

这也正是基的定义。

我们会发现,对于同一个线性空间,无论如何选取基,一组基中矢量的个数是一样多的。这个数量就被称为这个线性空间的 维数,记作 $\dim V$。注意到线性空间可以是无穷维的3,但本文中如不特别说明讨论的都是 有限维线性空间

它们也是线性空间

对于一个线性空间 $V$,它其中矢量的对偶矢量的集合也构成一个线性空间,称为 $V$ 的 对偶空间,记作 $V^*$。

一个线性空间上的算符也可以相加和数乘,我们在介绍算符的线性性的时候已经见过这件事了。这意味着算符实际上也构成一个线性空间。这个线性空间有时记作 $\mathcal{L}(V)$ 或者 $\hom(V,V)$。

子空间

一个线性空间 $V$ 的 子空间 $W$ 是指它的一个特殊的子集,这个子集自己也同样是一个线性空间。也就是说它也具有封闭性。

一个例子是三维欧氏空间 $\mathbb{R}^3$ 中的 $xOy$ 平面,这是一个 $2$ 维子空间。

一种有趣的子空间是某个算符的 不变子空间。顾名思义,对于某个算符 $A$,如果子空间 $W$ 中的任何矢量经过 $A$ 的作用后仍然在 $W$ 中,那么 $W$ 就称为 $A$ 的不变子空间。一个例子是接下来会介绍的特征子空间。

对于线性空间中的一组矢量 $\ket{a_i}$,它们的任意线性组合

\[\ket{x}=\sum_ic_i\ket{a_i}\]

的集合构成线性空间的一个子空间,这个空间称为 $\ket{a_i}$ 生成 的(子)空间。

本征值和本征矢量

非对易性

前文提到,一个线性空间上的所有算符也构成一个线性空间。不仅如此,更特别的一件事是 算符还可以相乘。两个算符 $A$ 和 $B$ 相乘得到一个复合算符 $AB$,它作用在矢量上就得到

\[AB\ket{x}=A(B\ket{x}).\]

在算符乘法中很重要的一点是:算符乘法是非对易的,即通常来说

\[AB\ne BA.\]

为了更清楚地看清这点,我们可以把算符乘法在爱因斯坦记号下写出:

\[(AB)^i{}_j=\braket{v_i|AB|v_j}=\sum_k\braket{v_i|A|v_k}\braket{v_k|B|v_j}=A^i{}_kB^k{}_j.\]

显然,在一般情况下

\[A^i{}_kB^k{}_j\ne B^i{}_kA^k{}_j=A^k{}_jB^i{}_k.\]

我们用两个算符的 对易子 来刻画这种非对易关系

\[[A,B]=AB-BA.\]

为了直观理解这件事,可以试着考虑作用在三维欧氏空间的 转动算符。将一个三维物体先绕着 $x$ 轴转动 $90^\circ$ 再绕着 $z$ 轴转 $90^\circ$ 和按照相反的顺序操作,会得到不同的结果。

本征值与本征矢量

一个算符 $A$ 的 本征矢量 是指满足

\[A\ket{a}=a\ket{a}\]

的矢量 $\ket{a}$,其中 $a$ 是一个数,称为这个本征矢量对应的 本征值。 $A$ 的本征矢量实际上就是 $A$ 作用上去后方向不变的矢量。

一般来说,一个算符有多个本征矢量。在这其中的一部分可能具有相同的本征值,这种情况被称为有 重根。由一个算符 $A$ 的所有本征值为 $a$ 的本征矢量 $\ket{a_i}$ 可以生成一个线性子空间,这个子空间被称为 $A$ 的 特征子空间

不难发现,对于 $A$ 的特征子空间中任何一个矢量都是 $A$ 的本征矢量,且它们的本征值相同

\[A\sum_ic_i\ket{a_i}=\sum_ic_iA\ket{a_i}=a\sum_ic_i\ket{a_i}.\]

因此,我们可以在特征子空间中任意选取一些 合适的 本征矢量作为子空间的基。至于什么是 合适的,接下来就会看到一个例子。

对于 $n$ 维复线性空间上的算符,它总是有 $n$ 个线性独立的本征矢量4,这意味着它的本征矢量总是可以作为线性空间的一组基。

厄米算符的本征矢量

对于一个厄米算符5,它的所有本征值一定都是实数。这是因为考虑任意一个本征矢量 $\ket{a}$,有

\[a\braket{a|a}=\braket{a|A|a}=\braket{a|A|a}^*=a^*\braket{a|a}^*.\]

而 $\braket{a|a}$ 是一个实数,因此 $a$ 也一定是实数。

厄米算符的另一个很好的特点是,它的本征矢量作为基可以被选为是一组正交归一的基。

首先,一个本征矢量乘一个数仍然是本征矢量,因此总可以把这组基调节为归一的。

关于正交性,假设有两个本征矢量不是正交的,那么

\[a_j\braket{a_i|a_j}=\braket{a_i|A|a_j}=\braket{a_j|A|a_i}^*=a_i\braket{a_i|a_j},\]

这就意味着 $a_i=a_j$,即它们在同一个特征子空间中。而这样一来,我们完全可以在这个特征子空间中重新选取两个正交的矢量用作这组基。

这样一来,在这组基下 $A$ 就可以被写为一个对角矩阵,即

\[A^i{}_j=\braket{a_i|A|a_j}\]

只有对角元非零,且这个时候对角元就是 $A$ 的所有本征值。这个过程称为 对角化

共同对角化

考虑两个对易的厄米算符,即

\[[A,B]=0.\]

假设我们已经选取了一组正交归一的基 $\ket{a_i}$ 将 $A$ 对角化,那么 $B$ 作用在这些矢量上会得到什么呢?不妨设

\[B\ket{a_1}=\sum_ib_i\ket{a_i},\]

那么由于它们对易,可以得到

\[AB\ket{a_1}=\sum_ia_ib_i\ket{a_i}=BA\ket{a_1}=a_1\sum_ib_i\ket{a_i}.\]

由于 $\ket{a_i}$ 是一组基,而这个矢量等式成立的条件是两侧的每一个分量都相等,因此

\[a_ib_i=a_1b_i.\]

这就意味着只有当 $a_i=a_1$ 时 $b_i$ 才能取非零值。换言之,$B\ket{a_1}$ 是 $A$ 的这个特征子空间中的矢量。$A$ 的特征子空间同时也是 $B$ 的不变子空间

既然如此,对 $B$ 来说,完全可以暂不考虑这个空间以外的部分6。只看这一个子空间,由于 $B$ 是厄米的,它自然可以在这个子空间中找到一组本征基对角化。

另一方面,这是 $A$ 的一个特征子空间,因此这其中任何一组基都是 $A$ 的本征基。于是在同一组基下,$A$ 也可以对角化。

将以上的操作对所有 $A$ 的特征子空间进行,我们就会得到一组基 $\ket{v_i}$,使得 $A$ 和 $B$ 可以同时被对角化。这组基中每一个矢量,都同时是 $A$ 和 $B$ 的本征矢量,因此我们也将这组基记为 $\ket{a_i,b_j}$,其中

\[A\ket{a_i,b_j}=a_i\ket{a_i,b_j},\quad B\ket{a_i,b_j}=b_j\ket{a_i,b_j}.\]

行列式、迹与特征多项式简述

一个算符所有本征值的乘积称为它的 行列式;所有本征值的和称为它的

\[\det A=\prod_ia_i^{r_i},\quad\mathrm{tr}\,A=\sum_ir_ia_i,\]

其中 $r_i$ 表示重根数量。

一个很重要的问题是,如何求一个算符的本征值和本征矢量?

回顾本征值的定义式

\[A\ket{a}=a\ket{a},\]

如果我们用 $\mathbb{1}$ 表示单位算符,那么这个式子可以被移项后写为

\[(A-a\mathbb{1})\ket{a}=0.\]

一个很有意思的解读是:$\ket{a}$ 是 $(A-a\mathbb{1})$ 本征值为零的本征矢量。而存在一个为零的本征值就意味着行列式为零。因此,我们似乎就写出了一个方程

\[\det(A-a\mathbb{1})=0.\]

绕了一圈怎么又回到了求行列式?那不是还要求本征值吗?实际上,如果我们写出矩阵的形式,那么还真有一种直接计算行列式的方法。但这个方法在任何一本线代书中都一定有涉及,我就不写了。总之,可行。这里的等式左侧就被称为 $A$ 的 特征多项式,它是以 $a$ 为变量的一个次数等于空间维数的代数多项式。

这么一来,我们就可以求出本征值了。接下来,就是求解线性方程组来确定本征矢量了。小学生的高斯消元法不能不会吧?

不止行列式,矩阵的迹也可以直接求出,它就等于矩阵对角元之和,即 \(\mathrm{tr}\,X=X^i{}_i=\sum_i\braket{e_i|X|e_i}.\) 注意到行列式和迹的矩阵求法都很神奇地不依赖于基的选取。

行列式的另一个有趣应用在于判断算符是否可逆。注意到如果 $A$ 是可逆的,那么知道 \(A\ket{a}=\ket{b}\) 就应当可以从 $\ket{b}$ 反推出 $\ket{a}=A^{-1}\ket{b}$。但如果 $A$ 有一个零本征值和对应的本征矢量 $\ket{a_0}$,那么 \(A\ket{a_0}=0\) 就无法进行上述反推。因此,$A$ 可逆的前提是 $\det A\ne 0$。可以证明反之也成立。

脚注

  1. 数学上这被称为线性组合 

  2. 在没有歧义时也会直接将它记作 $0$,注意到这和数字零是不一样的东西 

  3. 它甚至可以是不可数无穷维的,这种情况在量子力学中很常见 

  4. 这一定程度上是因为代数基本定理:特征方程是一个 $n$ 阶代数方程,在复数域上一定有 $n$ 重根 

  5. 如果你不记得的话,就是 $A=A^\dagger$ 的算符——这非常重要! 

  6. 因为不变子空间内的矢量经过 $B$ 的作用仍然是这个子空间的矢量,这个子空间对于 $B$ 来说就像一个完整的线性空间一样 

本文由作者按照 CC BY 4.0 进行授权