4 矩阵力学——量子力学的第一种形式
图6 海森堡
我们知道,20世纪初,普朗克、爱因斯坦和玻尔等创立了量子理论,但到1925年,还没有一种量子理论能以统一的结构来概括这一领域已经积累的知识,当时的量子力学可以说是本质上相互独立的、有时甚至相互矛盾的部分的混合体。为此,提出一个适合微观世界的量子表达形式的统一理论体系,便成为当时科学界的当务之急。
1925年,德国物理学家海森堡提出了一种矩阵的数学形式来表达量子世界,这就成为量子力学的第一个版本——矩阵力学。
矩阵力学的思想出发点,是针对丹麦物理学家玻尔提出的原子结构模型中许多物理量(如电子轨道、位置等)都是一些不可以直接观测的量。反之,海森堡要用可以观测量(如原子的谱线频率、强度等)来描述原子系统。他认为一切都不能臆想,要从事实——唯一能被观测和检验到的事实——推论出来。1925年7月的一天,海森堡关于原子谱线问题的计算有了结果。他说:“差不多是夜里三点钟,计算结果最终出来了。我深深地被震惊了。我很兴奋,一点也不想睡。于是,我离开房间,坐在一块岩石上等日出。”在计算中,他采用了一种二维表格来表示物理量,表中每个数据用横坐标和竖坐标的两个交量来表示。比如下面这个3×3的方块表格:
其实就是3×3矩阵。海森堡的表格和玻尔的原子模型不同,它没有作任何假设和推论,不包含任何不可观察的数据。但作为代价,它采纳了一种二维的庞大结构。然而,让人不能理解的是,这种表格难道也能像普通的物理变量一样进行运算吗?你怎么把两个表格加起来,或乘起来呢?海森堡准是发疯了。
海森堡坚信所有的物理变量都要按照这种表格的方式来改写。正如我们不能用νx,而必须用νx,y来表示电子频率一样。νx,y是什么东西?它竟然有两个坐标,这就是一张二维表格。是的,物理世界就是由这些表格构筑的。海森堡坚定地沿着这条奇特的表格式道路去探索物理学的未来。
一般而言,设想有一个物理过程,自n状态开始,到m状态结束,如果假设它分两步进行,中间要经过某个k状态。现在引入物理量C(n,m)描述自n状态到m状态的过程,a(n,k)描述自n状态到k状态的过程,b(k,m)描述自k状态到m状态的过程,那么就应该有
也就是对所有的中间过程k求和。这个公式暗藏玄机,后来我们知道这就是矩阵乘法,这是矩阵力学的核心算法。
现在我们不妨提出这样一个问题:把两个表格乘起来,这代表了什么意义呢?
熟悉线性代数的读者都知道,对于下列方程组:
可以写成更紧凑的形式:
这里括号中排成阵列的数就构成了矩阵,它用行数和列数来标识。
我们可以把矩阵当成一个数,当然它是有其独特加法和乘法的数。两个矩阵A,B如能相加,C=A+B,则一定具有同样的行数和列数,且Cnm=Anm+Bnm;若两个矩阵A,B能相乘,C=A×B,则前一个矩阵的列数一定与后一个矩阵的行数相等,且。对于普通的实数和复数,乘法满足交换律ab=ba,但是对于矩阵,乘法不一定满足交换律,即A×B≠B×A。假设A是一个2×2的表格,B也是一个2×2的表格:
把两个表格乘起来也应该是一个2×2的表格:
其中
这分明是矩阵的乘法,请记住,矩阵是量子力学经常用到的、独特的“数”形式,具有独特的算法。因此可以表述相应的物理现象。或者反过来说,特定的物理现象,要求具有特定算法的“数”来表述它。
人们把基于粒子坐标和动量等物理量表示成矩阵的量子力学称之为矩阵力学。矩阵力学解释了原子领域的一系列问题,其中包括氢原子的谱线问题、光谱在电磁场中的分裂、光的散射等。但由于矩阵算法当时还不为物理学家所熟悉,大家早已习惯了普通的以字母和符号代表的物理公式,认为矩阵力学建立的基础是瞎猜也不为过,所以矩阵力学并没有被物理学家所接受。但是,有人看出了其中的非凡之处,英国物理学家狄拉克就指出,海森堡的矩阵力学表明,量子力学用到的物理量,可能是非对易关系的,即不满足乘法交换律。可以想见矩阵力学带给当时物理学的冲击,怎么粒子的坐标、动量这些我们习惯了的量突然变成了不可对易的怪物了呢?人们一时还转不过弯儿来。后来我们将看到,物理操作的非对易性是量子力学的核心。量子力学的对易关系表明所要观察的两个力学量之间是否满足不确定关系,也就是测量一个的时候会干扰到另一个。比如观测A,对于非对易关系的力学量B,在测量A的同时也变化了;反之亦然。对于满足对易关系的力学量,无论如何测量都不会影响其他的对易关系的力学量。
总之,量子力学是一个最不可思议、最有颠覆性的物理理论。比如说在牛顿力学中,我们用六个实数描写一个粒子的状态。这六个数,三个数是粒子在三维空间的位置,三个数是粒子的动量。但是在微观世界中,对粒子状态如此描述就是错误的。量子力学告诉我们,描写粒子的位置和动量的这些物理量,根本不是数,而是矩阵。在这里,动量和位置这两个物理量不遵守乘法交换律,也就是说:电子动量×电子位置≠电子位置×电子动量,这是什么原因?很明显这个公式代表先测电子动量,再测电子位置,与先测电子位置再测电子动量,其结果是不一样的,而这又说明什么呢?这是因为观测电子动量的行为影响到电子位置的数值,反过来也一样。这叫作非对易性。这简直是莫名其妙。但这莫名其妙的理论却能正确地反映微观实验观测到的结果。许多传统的物理量,现在都要看成是一些独立的矩阵来处理。从数到矩阵,这真是神来之笔。