量子力学(一)
某人曾经说过:量子力学不就是线性代数吗。 因此,学习量子力学很重要的一点是学会线性代数。可以参见前几篇入门 线性代数 的内容,特别是 狄拉克记号 和 本征值和本征矢量 这两个大章节,张量 的相关内容也可以阅读一下,至于量子力学中涉及到的 不可数无穷维线性空间 的内容,在本系列中也会做介绍。
量子力学基本原理:以自旋为例
现代量子力学的一大基本假设是:微观粒子的所有可能状态构成一个(复)线性空间,每一个可能的状态就是其中一个矢量,而可观测量是其上的厄米算符。这件事初看有些抽象,因此接下来以自旋为例解释一下。
施特恩-盖拉赫实验
在经典力学中,自旋就是指一个粒子在以某个确定的角动量 $\pmb{S}=(S_x,S_y,S_z)$ 自转。它具有如下特性:
- 在任何一个方向上(例如 $z$ 方向)测量它的角动量分量,得到的结果都是一个 $-|\pmb{S}|\leqslant S_z\leqslant|\pmb{S}|$ 的定值;
- 可以同时测定它在所有方向上的角动量分量,即可以确定地测量出它完整的角动量 $\pmb{S}=(S_x,S_y,S_z)$。
但在量子力学中,这两件看起来显然的事都不再成立。
考虑一个自旋为 $1/2$ 的电子1,著名的 施特恩-盖拉赫实验 告诉我们,电子的自旋满足的是如下特性:
- 在任何一个方向测量它的角动量分量,只会得到 $+\hbar/2$ 或 $-\hbar/2$ 两者中的一个值;
- 第一次测量时,会得到两者之一的随机值,随后在 同一个方向上 无论多少次测量,都始终得到同一个结果;
- 第一次测量(例如测量 $S_z$)得到确定值后,换一个方向(例如 $S_x$)进行测量,将会同样得到 $\pm\hbar/2$ 的随机结果,而此时再回到 $S_z$ 方向测量,发现又得到了 $\pm\hbar/2$ 的随机结果。
最后一条发现的意义在于,第二次 $S_x$ 的测量 消除了对第一次测量的「记忆」,使得电子又回到了 $S_z$ 方向随机的状态。这实际上就意味着,我们无法同时测定电子在所有方向上的角动量分量。 这就是我们也许听说过的 不确定性原理。
自旋的量子力学解释
首先,从前两条特性中可以看出,电子在第一次测量 $S_z$ 后会处于两种状态中的一种。我们将这两种可能的状态分别用两个矢量表示
\[\ket{\uparrow},\qquad\ket{\downarrow}.\]注意到这两个矢量是线性代数中的抽象矢量,而非实际空间中自旋方向的矢量 $\pmb{S}$。
将这两个矢量作为基,可以生成一个二维复矢量空间 $\mathcal{H}$,称为 希尔伯特空间2。进一步地,我们认为这两个矢量是正交归一的
\[\braket{\uparrow|\uparrow}=\braket{\downarrow|\downarrow}=1,\quad\braket{\uparrow|\downarrow}=0.\]而电子的 $S_z$ 作为 可观测量 则是希尔伯特空间上的一个厄米算符3。$\ket{\uparrow}$ 和 $\ket{\downarrow}$ 是它的本征矢量
\[S_z\ket{\uparrow}=\frac{\hbar}{2}\ket{\uparrow},\quad S_z\ket{\downarrow}=-\frac{\hbar}{2}\ket{\downarrow},\]本征值则分别是对应的测量值。
测量理论
现在我们对第一条特性进行一下补充。具体来说,对于一系列以相同方式制备的电子进行实验表明,测量 $S_z$ 会以某个确定的概率 $p$ 得到 $+\hbar/2$ 的值,而以 $1-p$ 的概率得到 $-\hbar/2$。
现在认为,希尔伯特空间中的每一个模长为 $1$ 的矢量
\[\ket{s}=\alpha\ket{\uparrow}+\beta\ket{\downarrow},\quad|\alpha|^2+|\beta|^2=1\]都表示电子的一个可能状态。这个矢量对应的状态会以 $p=|\alpha|^2$ 的概率测量得到 $+\hbar/2$,以 $1-p=|\beta|^2$ 的概率得到 $-\hbar/2$。
接下来,为了解释第二条特性,我们认为每次对于一个可观测量(例如 $S_z$)进行测量时,量子态 $\ket{s}$ 就会随机 坍缩 到这个可观测量的某一个本征态上。具体坍缩的概率由刚刚所说的系数决定。
根据线性代数的知识,$\ket{s}$ 坍缩到 $\ket{\uparrow}$ 的概率 $|\alpha|^2$ 还可以写为 $|\braket{s|\uparrow}|^2$。因此当进行过一次测量得到 $\ket{\uparrow}$ 后,再次测量时坍缩到另一个态的概率 $|\braket{\uparrow|\downarrow}|^2$ 为零,也就是说当我们多次测量 $S_z$ 时,电子的量子态变化如下:
\[\ket{s}\to\ket{\uparrow}\to\ket{\uparrow}\to\ket{\uparrow}\to\cdots.\]于是我们一直得到相同的测量结果
基变换
最后,为了解释最后一条特性,我们需要知道 $S_x$ 的测量会得到什么结果。
根据刚才的讨论,我们知道测量 $S_x$ 应该会使得量子态坍缩到它的本征态上。假设这两个本征态分别为
\[S_x\ket{+}=\frac{\hbar}{2}\ket{+},\quad S_x\ket{-}=-\frac{\hbar}{2}\ket{-},\]根据实验中对 $S_z$ 的测量结果可知,这些本征态坍缩到 $S_z$ 本征态上的概率为 $|\braket{\pm|\uparrow}|^2=|\braket{\pm|\downarrow}|^2=1/2$。很自然的想法是取
\[\ket{+}=\frac{1}{\sqrt{2}}\ket{\uparrow}+\frac{1}{\sqrt{2}}\ket{\downarrow},\quad\ket{-}=\frac{1}{\sqrt{2}}\ket{\uparrow}-\frac{1}{\sqrt{2}}\ket{\downarrow}.\]这样同时也可以满足 $\ket{+}$ 和 $\ket{-}$ 的正交归一关系4。
实际上可以有很多种满足条件的选择,这个选择只是一种约定俗成。另一个可能的例子是
\[\ket{+}=\frac{1}{\sqrt{2}}\ket{\uparrow}+\frac{i}{\sqrt{2}}\ket{\downarrow},\quad\ket{-}=\frac{1}{\sqrt{2}}\ket{\uparrow}-\frac{i}{\sqrt{2}}\ket{\downarrow}.\]这被用于定义 $S_y$ 的两个本征态。这样就可以完成对完整的三维自旋希尔伯特空间的描述。
矩阵形式
最后的最后,我们可以用 $\ket{\uparrow}$ 和 $\ket{\downarrow}$ 作为基把以上内容用矩阵的形式写出来。此时一个任意的量子态对应列向量
\[\ket{s}=\alpha\ket{\uparrow}+\beta\ket{\downarrow}\quad\to\quad\begin{pmatrix} \alpha\\\beta \end{pmatrix}.\]而三个方向的角动量分量则分别可以用 泡利矩阵 来描述
\[S_i=\frac{\hbar}{2}\sigma^i,\quad i=x,y,z.\]其中泡利矩阵为
\[\sigma^x=\begin{pmatrix} 0&1\\1&0 \end{pmatrix},\quad\sigma^y=\begin{pmatrix} 0&i\\-i&0 \end{pmatrix},\quad\sigma^z=\begin{pmatrix} 1&0\\0&-1 \end{pmatrix}.\]而本征态则分别为
\[\ket{x,\pm}=\frac{1}{\sqrt{2}}\begin{pmatrix} 1\\\pm 1 \end{pmatrix},\quad\ket{y,\pm}=\frac{1}{\sqrt{2}}\begin{pmatrix} 1\\\pm i \end{pmatrix}.\]虽然原则上可以通过前一节的定义直接计算各个算符如何作用在各个态上,但矩阵形式可以让计算变得更加简单直观5。
更多关于角动量代数
在经典力学的自旋中,实际上还有一个常见的可观测量,那就是总角动量 $|\pmb{S}|$。在量子力学中我们也同样可以定义 总角动量算符,唯一的区别在于,对于算符而言,开根号是一件复杂的事,因此我们直接使用总角动量的平方
\[S^2=S_x^2+S_y^2+S_z^2.\]通过矩阵形式可以看出,总角动量算符实际上正比于单位算符6
\[S^2=\frac{3\hbar^2}{4}\begin{pmatrix} 1&0\\0&1 \end{pmatrix}.\]这意味着任何态都是总角动量算符的本征态,本征值为 $3\hbar^2/4$。也就是说,测量任何状态下电子的总角动量(的平方),都会得到 $3\hbar^2/4$。
通过矩阵形式,我们还可以求出三个角动量算符的对易子
\[[S_x,S_y]=\frac{\hbar}{2}S_z,\quad[S_y,S_z]=\frac{\hbar}{2}S_x,\quad[S_z,S_x]=\frac{\hbar}{2}S_y,\]以及总角动量算符和它们的对易子
\[[S^2,S_i]=0.\]显然,因为总角动量算符正比于单位算符,所以它和这里所有的算符都对易。这样的算符在将来会很有用。
希尔伯特空间
总结一下自旋这个例子中的内容,可以得到现代量子力学的几个基本结论:
- 微观粒子的所有可能状态构成一个线性空间,称为 希尔伯特空间;
- 每个可观测量对应希尔伯特空间上的一个厄米算符,它的本征值就是所有可能的测量值;
- 对处在某个特定量子态 $\ket{\psi}$ 上的粒子测量某个可观测量 $A$,这个粒子会随机坍缩到 $A$ 的某个本征态 $\ket{a_i}$ 上,并得到对应的本征值作为测量结果。坍缩的概率是 $|\braket{a_i|\psi}|^2$。
通常,这里的 $\braket{a_i|\psi}$ 被称为 跃迁振幅。一般而言,$\braket{\phi|\psi}$ 的模方就表示量子态 $\ket{\psi}$ 坍缩或者说 跃迁 到量子态 $\ket{\phi}$ 的概率。
由于一个态跃迁到自己的概率应该是 $1$,我们要求所有可能的物理的态满足
\[\braket{\psi|\psi}=1,\]即都是归一化的7。
由于可观测量都是厄米算符,根据线性代数所学,它的本征态 ${\ket{a_i}}$ 可以组成希尔伯特空间的一组正交归一的基,这样一来我们就可以把空间中的所有态在这组基下展开
\[\ket{\psi}=\sum_ic_i\ket{a_i},\quad\sum_i|c_i|^2=1.\]这组基称为 $A$ 的 本征基。选取这组基就意味着将 $A$ 进行了对角化。
什么是物理的
尽管这里介绍了很多概念,但需要注意到:希尔伯特空间中的抽象矢量 $\ket{\psi}$ 是不能被直接观测到的。这只是用于描述我们观察到的物理所引入的数学工具。
我们自然可以认为量子态 $\ket{\psi}$ 是某种「本质」的东西,或者认为只有实验观测到的东西才是「本质」的。无论如何,这些只是不同世界观的选择。
在物理上,能被观测到的只有 内积 和 矩阵元 的模方
\[|\braket{\phi|\psi}|^2,\quad|\braket{\phi|A|\psi}|^2.\]也即,最终可测量的都是这些 实数值。也可以说,只有这些模方才是物理的。
这意味着,我们的理论在幺正变换下应当是不变的。也就是说,假如对理论中的所有量子态和算符都做幺正变换
\[\ket{\psi}\mapsto U\ket{\psi},\quad A\mapsto UAU^\dagger,\]其中 $U^\dagger U=1_{\mathcal{H}}$,则这个理论中所有物理的结果都应当保持不变
\[\begin{aligned} \braket{\phi|\psi}&\mapsto\braket{\phi|U^\dagger U|\psi}=\braket{\phi|\psi}\\ \braket{\phi|A|\psi}&\mapsto\braket{\phi|U^\dagger UAU^\dagger U|\psi}=\braket{\phi|A|\psi}. \end{aligned}\]作为一个特例,数乘 $e^{i\varphi}$ 也是一个幺正变换
\[\ket{\psi}\mapsto e^{i\varphi}\ket{\psi}.\]这意味着,我们可以给理论中的所有量子态乘一个相位,而不改变任何物理。
期望值
根据测量理论,我们已经知道对于任意一个量子态 $\ket{\psi}$,对可观测量 $A$ 进行测量会随机得到它的本征态中的一个。于是我们就可以计算出,经过多次的测量,或者更准确地说,对大量以相同方式制备(处在同一量子态)的粒子进行测量得到的 平均值 或者说 期望值 是
\[\braket{A}=\sum_ip_ia_i.\]注意到,这里的概率是
\[p_i= |\braket{a_i|\psi}|^2=\braket{\psi|a_i}\braket{a_i|\psi}.\]而不同的测量值就是不同的本征值
\[A\ket{a_i}=a_i\ket{a_i}.\]这就意味着 $A$ 的测量期望值可以被写为
\[\begin{aligned} \braket{A}&=\sum_i\braket{\psi|a_i}\braket{a_i|\psi}a_i\\ &=\sum_i\braket{\psi|A|a_i}\braket{a_i|\psi}\\ &=\braket{\psi|A|\psi}. \end{aligned}\]这里最后一步用到了单位分解。
不确定性原理
假设一个系统中有两个可观测量 $A$ 和 $B$,可能会出现两种情况:
对易的可观测量
第一种情况是 $A$ 和 $B$ 对易。根据线性代数的知识,我们知道它们可以被 同时对角化,即我们可以在希尔伯特空间中找到一组基 $\ket{a_i,b_j}$,使得它同时是 $A$ 和 $B$ 的本征基。此时,空间中的所有态都可以表示为
\[\ket{\psi}=\sum_{i,j}c_{ij}\ket{a_i,b_j}.\]此时,如果我们先测量 $A$ 再测量 $B$,且两次测量结果分别为 $a_1$ 和 $b_1$,那么量子态的坍缩过程就应该如下:
\[\ket{\psi}=\sum_{i,j}c_{ij}\ket{a_i,b_j}\to\sum_jc^\prime_{1j}\ket{a_1,b_j}\to\ket{a_1,b_1}.\]我们会发现,在这之后即使再次测量 $A$,也不会回到最开始那样随机的状态。换而言之,此时 $A$ 和 $B$ 可以被同时准确测量。
非对易的可观测量
另一种情况是 $A$ 和 $B$ 不对易。此时它们将无法被同时对角化。就像自旋的三个分量一样,这意味着它们将无法被同时测量。