1.7 广义相对论里的时间
进一步细看卡鲁扎—克莱因理论的5维时空之前,我们先来考察最终成为标准理论一部分的电磁相互作用描述方法。这里我们特别关心的是量子粒子的电磁相互作用是如何描述的(我们在1.5节说过,麦克斯韦理论的量子形式,即它的洛伦兹推广,说明了带电粒子对电磁场的响应),它又是如何推广到标准模型的强弱相互作用的。这是德国大数学家(兼理论物理学家)外尔在1918年提出的纲领。(1933~1955年间,外尔是普林斯顿高等研究院的主角之一,爱因斯坦当时也在那儿;尽管他的主要物理学贡献是更早时候在德国和瑞士完成的。)外尔高度的独创性思想是为了拓展爱因斯坦的广义相对论,以便能以自然的方式将麦克斯韦的电磁论(1.2和1.6节简介过这个伟大理论)融入时空的几何结构。他的做法是,引入一个今天称为“规范联络”的概念。最后,外尔的思想经过某些微妙的改变成为粒子物理学标准模型中处理相互作用的普遍方式。用数学的语言来说[主要是通过(Andrzej Trautman,1970)的影响],这个规范联络的思想现在是用纤维丛的概念来理解的(A7节),我们在图1.12已经看见了(1.3节也提过)。重要的是,我们要认识外尔原始的规范联络思想与稍后提出的卡鲁扎-克莱因理论之间的异同。
我将在1.8节更详细地描述外尔如何推广爱因斯坦广义相对论的几何去包容麦克斯韦理论。我们将看到,外尔的理论并不涉及任何时空维的增加,但它弱化了爱因斯坦理论所依赖的度规概念。因此我有必要先说明度规张量g在爱因斯坦理论中所实际扮演的物理角色。g其实是定义时空的伪黎曼结构的基本量。物理学家常用符号gab(或gij,gμν,等等)来记张量g的分量集合,但我不想在这儿讨论这些问题的细节,甚至也不解释名词张量的数学含义。我们只需要知道能赋予g的直接的物理意义是什么。
假定我们在时空流形中有一条连接两点——或两个事件——P和Q的曲线,代表一个有质量的粒子从事件P到后来事件Q的历史。(事件一词通常用来指时空的一点。)我们称曲线为那个粒子的世界线。而g的作用,就是确定曲线的“长度”,这个长度在物理上解释为粒子所携带的理想时钟所测量的P与Q之间的时间间隔(而不是一个距离的度量)(图1.14a)。
我们必须记住,根据爱因斯坦的相对论,“时间经历”不是绝对确定地同时在宇宙中发生。相反,我们必须以完全的时空观点来考虑问题。我们不能将时空“切”成一系列3维空间截面,让每个截面代表一族“在同一时刻发生的”事件。老天没给我们什么绝对的嘀嗒着的“宇宙时钟”,它的每一声嘀嗒都对应着同时发生的事件构成的一个完整的3维空间,而接着的一声嘀嗒,伴随着另一个同时事件的3维空间,等等。所有这些3维空间一起构成时空(图1.15,其中,可以想象我们的宇宙时钟在每天正午鸣响)。暂时这样看时空是没问题的,这样我们可以将4维图像与我们日常的3维空间经验(其中的事件“随时间演化”)联系起来,但我们将持这样的观点:那样时空切割,彼此都一样,没有哪一个是特别的或“老天给的”。整个时空是一个绝对概念,但我们不认为时空有什么特殊的切割方式让我们为它赋予某个宇宙时间的概念。(这都是1.7节所说的广义协变性的一部分,更具体的描述见附录A5,它告诉我们,特殊的坐标选择——特别是“时间”选择的选择——没有直接的物理意义。)相反,不同粒子的世界线都有各自的时间经历概念,正如前面说过的,这取决于它特殊的世界线和度规g。然而,两个不同粒子的时间概念的差别是很小的——除非粒子间的相对速度能与光速相比(或者说,除非我们处于某个引力的时空弯曲效应显著的区域)——正因为这种差别很小,我们在日常生活中才不会察觉不同时间经历的差别。
在爱因斯坦的相对论中,如果有两条不同的世界线连接两个特殊的事件P和Q(图1.14b),那么两个情形的“长度”(度量时间的流逝)可以是不同的(我们已多次直接观测到了这个效应,例如,用高速飞机或在不同高度飞行的飞机上的非常精确的时钟)[Will1993]。这个反直觉的事实实质上就是我们熟悉的狭义相对论中(所谓)双生子详谬的另一种表述。那个详谬说,宇航员以很高的速度从地球飞向遥远星球然后回到地球,会比在他旅行期间一直留在地球的孪生兄弟经历更短的时间历程。两兄弟虽然连接着相同的两个事件P(他们一起在航行即将出发的点)和Q(宇航员回到地球),却有不同的世界线。
就狭义相对论说(主要是匀速运动),这个问题的时空描述如图1.16,其中多出宇航员到达遥远星球的事件R。图1.17同样说明了度规如何决定时间的流逝,这也适用于广义相对论的情形——其中,对(大质量)物体的世界线来说,其延伸的“长度”度量取决于度规g,提供了物体在那个期间所经历的时间间隔。在两个图中都画了零锥,它们是爱因斯坦度规g的重要物理表现,描绘了每个时空事件的光速。我们看到,在宇航员或粒子的世界线上的每一个事件点,世界线的方向一定处于(双)零锥的内部,这说明了光速的重要极限是不可能(局域地)超越的。
图1.18展示了(双)零锥的未来部分的物理解释,它是从事件X发出的一道(假想的)闪光的历史,图1.18a说明整个3维空间的图景,图1.18b是对应的时空图(压缩了一个空间维)。双锥的过去部分类似地由向X汇聚的一道(假想)闪光代表。图1.18c告诉我们零锥其实是每个事件点X上的无穷小结构,严格说来,只能局域地存在X的切空间(见A5节图A10)。
这些(双)锥代表了“时间”度量为零的时空方向。这个特征的出现是因为时空几何严格说来是伪黎曼的,而不是黎曼的(1.1节说过)。我们常说这种特殊的伪黎曼几何是洛伦兹的,其时空结构只有一个时间维和(n-1)个空间维,而且在时空流形的每个点都有这样的双零锥。零锥呈现了时空结构的最重要特征,告诉我们信息传播的极限。
g提供的时间度量如何直接与这些零锥联系呢?在这一点上,我考虑过的世界线是普通有质量粒子的历史,而它们传播比光慢,从而其世界线一定处于零锥之内。但我们也必须考虑以光速的(自由)旅行。根据相对论,假如时钟以光速运动,那它就不会记录任何时间信息!这样,无质量粒子世界线上任意两个事件P、Q之间的世界线(沿曲线测量)的“长度”总是零,而不论那两个事件分离多远(图1.19)。我们称如此世界线为零线。有些零线是测地线(见后),自由光子的世界线就是零测地线。
经时空某特殊点P的所有零测地线族扫过P点的整个光锥(图1.20),而P点的零锥只描述P光锥在顶点的无穷小结构(见图1.18)。零锥告诉我们P的时空方向,它们决定了光速,即切空间在P点的结构指出了度规g决定的零“长度”的方向。(在文献中,“光锥”一词也常用来指我这里所说的零锥。)光锥(和上面的零锥一样)有两个部分,一个定义未来零方向,一个定义过去零方向。相对论约束质量粒子不能超过光速,这个要求可明确表述为如下事实:质量粒子的世界线的切空间都处于相应事件的零锥之内(图1.21)。像这样的切方向完全处于零锥内的光滑曲线,叫类时的。于是,质量粒子的世界线实际上是类时曲线。
与类时曲线互补的概念是类空3—曲面——或者,在考虑n维时空时,叫类空(n-1)—曲面或类空超曲面。这种超曲面的切方向都在过去和未来零锥之外(图1.21)。在广义相对论中,这是“时刻”或“t =常数的空间”(t为适当的时间坐标)的恰当推广。显然,这样的超曲面可任意选择,但如果我们想说这种问题是动力学行为的决定论,则我们需要的正是这一类的曲面,我们要求曲面上的“初始数据”是确定的,而那些数据就根据某些恰当的方程(通常是微分方程,见A11节)来(局域地)决定系统向过去或未来的演化。
作为相对论的另一个特征,我们可以指出,假如从P到Q的世界线的“长度”(这里指流逝的测量时间)大于P、Q之间的其他任何世界线的长度,则一定是我们所说的测地线[5],也就是弯曲时空中的“直线”(图1.22)。奇怪的是,“长度”在时空中的这种极大化性质,恰与寻常欧几里得几何的情形相反,在那儿,连接P、Q的直线是两点间的最短路径。根据爱因斯坦的理论,在引力作用下自由运动的粒子的世界线总是测地线。但是,图1.16中宇航员的路线包含了加速运动,所以不是测地线。
狭义相对论的平直时空是没有引力场的,被称为闵可夫斯基空间(我将它记为),以俄罗斯/德国数学家闵可夫斯基(Hermann Minkowski)的名字命名,他在1907年第一次引进了时空概念。这里的零锥是均匀分布的(图1.23)。爱因斯坦的广义相对论继承了同样的概念,不过因为引力场的存在,零锥可以是非均匀分布的(图1.24)。度规g(在时空的每一点有10个分量)决定了零锥结构,却不能完全由结构来决定。零锥结构有时也被称为时空的共形结构(每点9个分量),特别参见3、5节。除了这个洛伦兹的共形结构而外,g还决定了一个标度(每点1个分量),它确定了爱因斯坦理论中理想时钟度量时间的速率(图1.25)。至于时钟在相对论中如何运行,可以参见[Rindler 2001; Hartle 2003]。