第25讲  相对论的实验基础

第六章    狭义相对论(1)

§6.1  相对论的实验基础

物理规律都是相对于一定参考系表述出来的。在前几章中,我们一直没有讨论参考系问题。我们知道,宏观电磁场的普遍规律可以表为麦克斯韦方程组。这组方程究竟在那些参考系中成立呢?从一个参考系变到另一个参考系时,基本规律的形式如何改变?基本物理量E和B如何变换?这些问题都是必须回答的。在电动力学中参考系问题是一个很基本的物理问题,这个问题的解决是和新时空观的建立联系在一起的。人们在研究高速运动现象,特别是电磁波的传播现象时,揭示了旧时空观的局限性,建立了新的时空观。

相对论主要是关于时空的理论。相对论时空观的建立是人们对物理现象认识上的一个飞跃。相对论对近代物理学的发展,特别是核物理和高能物理的发展起着重要的作用。现在相对论已经成为物理学主要理论基础之一。局限于惯性参考系的理论称为狭义相对论,推广到一般参考系和包括引力场在内的理论称为广义相对论。狭义相对论是已经牢固地建立起来的理论。本章仅限于讨论狭义相对论。狭义相对论的主要内容包括:

(1)惯性参考系之间时空坐标的洛伦兹变换及其物理意义,这是相对论时空观的集中反映。

(2)物理规律在任一惯性系中可表为相同的形式,即物理规律的协变性。协变性要求是对各种场和粒子间相互作用规律的探索的主要理论指导之一。

(3)把电动力学基本规律——麦克斯韦方程组和洛伦兹力公式表示为协变形式,从而使电动力学成为明显相对论性的理论,可用来解决任意速度带电粒子与电磁场的相互作用问题。

(4)把量子力学基本规律推广为协变性的相对论力学,由此得到相对论的质量、能量和动量的关系。这些关系是原子能应用的主要理论基础,是解决高能粒子运动和转化过程的运动学问题的主要工具。

本章阐述狭义相对论的基本内容。我们从实验事实出发,引入相对论的两个基本原理——相对性原理和光速不变原理,由此导出时空坐标的洛伦兹变换式,并着重讨论相对论的时空概念。然后我们根据相对论时空观解决电动力学的参考系问题,把电动力学基本方程表为适用于一切惯性参考系的形式,并导出势和电磁场的变换关系。最后我们把力学规律推广为相对论协变形式,并讨论相对论的质量、能量和动量的关系。

 

§6.1.1 相对论的实验基础

1. 相对论产生的历史背景  物理规律需要用一定参考系表示出来。在经典力学中,根据实践经验引入了惯性参考系。我们知道力学的基本运动定律对所有惯性系成立。关于电磁现象,人们从长期实践中总结出电磁场的基本规律,在此基础上必然提出参考系问题,即所总结出来的电磁现象的基本规律究竟适用于什么参考系。

参考系问题在电动力学中由于下述原因而变得更为突出:

从电磁现象总结出来的麦克斯韦方程组,可以得到波动方程,并由此波动方程得出电磁波在真空中的传播速度为c。

按照旧时空概念,如果物质运动速度相对于某一参考系为c,则变换到另一个坐标系时,其速度就不可能沿各个方向都是c。从旧概念出发,电磁波只能对一个特定参考系的传播速度为c,因而麦氏方程组也就只能对该特殊参考系成立。如果确实这样,则经典力学中一切惯性参考系等价的相对性原理在电磁现象中就不再成立。因而由电磁现象可以确定一个特殊参考系,这样便可以把相对于该特殊参考系的运动称为绝对运动。

寻找这个特殊参考系和确定地球相对于这参考系的运动成为上世纪末物理学的一个重要课题。电磁学的进一步发展要求解决这一问题,而当时的科学发展水平已使得精确测量光速成为实际可能。多次试验结果都没有发现任何绝对运动的效应,从而迫使人们接受在真空中光速相对于任何参考系都等于c的结论。

光速相对于任何参考系都等于c的事实与旧时空概念发生矛盾,这个矛盾是人们第一次研究高速现象时被揭露出来的。电磁波的传播就是人们首先接触到的高速现象。在此之前,实践中所接触到的力学现象都属低速范围(与光速相比是相当低速的),旧时空观与新实验事实的矛盾反映了旧时空观的局限性,并要求人们根据新的实践结果发展和深化对时空的认识。

除电磁现象之外,十九世纪末期人类的实践活动已开始深入到物质的微观领域,电子、X射线和放射性的发现推进了微观物理学的发展。在微观领域,人们遇到了许多新的现象和新的规律性,使经典物理学的许多基本概念都发生动摇,需要予以重新考虑。这个时期物理学面临着大变革,反映新时空概念的相对论也是在这种情况下提出来的。相对论和任何其他科学理论一样,是生产水平和科学技术发展到一定阶段的必然产物。

在相对论的建立过程中,人们对电磁场的认识也发生了一个飞跃。19世纪人们对一切自然现象的认识都带有机械论的局限性,对电磁现象也是这样。人们认为既然声波、水波等都是在某个介质中的机械震动的传播现象,电磁波也应该是某种充满空间的弹性介质(以太)内的波动现象。该弹性介质就构成电磁波传播的特殊参考系。特殊参考系被实验否定的事实以及电磁现象中相对性原理的建立,最终破除了电磁波的机械观,使人们认识到电磁波就是作为物质的电磁场本身的运动形式,而不是在某种“以太”介质内的机械运动现象。

2. 相对论的实验基础  如前所述,按照旧时空概念,真空中电磁波沿任意方向的传播速度只有在某个特殊参考系中才等于c。如果能够精确测定各个方向光速的差异,就可以确定地球相对于这特殊参考系的运动,或者说地球相对于“以太”的运动。

迈克尔孙—莫来(Michelson-Morley)实验(1887年)是测量光速沿不同方向的差异的主要实验。首先我们对地球运动所引起的效应作一数量级估计。地球绕太阳运动的速度约为30 km/s,因而地球相对于“以太”参考系的运动速度最小应有同一数量级。根据理论推算(由以下的推导可以看出),当整个实验在地球上进行时,由于地球“绝对运动”所引起的可观测效应只有(υ/c)2的数量级,即108数量级。因此,如果要设计一个实验观察地球绝对运动的效应,该实验应达到108的精确度。19世纪末的科学发展水平已使得这种精密测定成为可能。

 

迈可尔孙-莫来实验装置如图6-1所示。由光源S发出的光线在半反射镜M上分为两束,一束透过M,被M1反射回到M,再被M反射而直达目镜T;另一束被M反射至M2,再反射回M而直达目镜T。

为叙述简单计,设调整两臂长度使有效光程MM1 = MM2 = l。设地球相对于“以太”的绝对运动速度υ沿MM1方向,则由于光线MM1M与MM2M的传播时间不同,因而有光程差,在目镜T中将观察到干涉效应。

 

 

用经典速度合成法则可以算出光线MM1M与MM2M的传播时间,经典速度合成法则如图6-2所示。图中υ表示观察者相对于以太的运动速度,u表示观察者参考系中所看到的沿θ方向传播的光速,c是以太参考系的光速。由图可见
                       
解出u得
                      
因此,在地球上观察到沿υ方向传播的光速为c
υ,逆着υ方向传播的光速为c + υ ,而垂直于υ方向传播的光速为(c2 υ2)1/2。因此,光线MM1M的传播时间为
                         
(6.1---1)
光线MM2M的传播时间为
                                  
(6.1---2)
两束光的光程差为
                                                
(6.1---3)
把仪器转动90°,使两束光位置互换,应该观察到干涉条纹移动个数为
                                             
(6.1---4)

利用多次反射可以使有效臂长l达到10米左右。设
                   λ ≈ 5×10
7 m ,  (υ / c)2 ≈ 108 ,
则由(6.1---4)式,干涉条纹应该移动0.4个左右,而实验观察到的上限仅为0.01个。

自从第一次实验之后,不同的实验工作者还进行过多次迈可尔孙—莫来实验,以不断提高的精确度否定了地球相对于以太的运动。除了这些用光学方法做的实验之外,近年还用其他技术做过类似的实验,如1958年用微波激射所做的实验和1970年用穆斯堡尔(Mossbauer)效应做的实验。这两实验定出地球相对于以太运动速度的上限分别为3×10−2 km/s和5×10−5 km/s。综合所有实验结果,我们可以肯定实际上不存在地球相对于以太的运动。

 

 

 

 

 

 

 

迈可尔孙实验否定了特殊参考系的存在,它表明光速不依赖于观察者所在参考系。用星光作光源的实验还证明了光速也不依赖于光源相对于观察者的运动。关于光速和光源运动无关的另一实验证据是对双星运动的观测。双星绕其质心运动,若光速依赖于光源速度的话,则双星中向着地球运动的一颗星发出的光将比另一颗星发出的光传播得较快,因而在地球上观察到的双星运动轨道将受到歪曲。实际没有观察到这种情况,表明两颗星发出的光的传播速度是一样的。

 

近年用高速运动粒子作为光源进行实验,对光速不依赖于光源运动提供更精确的实验检验。实验所用的光源为π0介子。π0介子是在高能质子与质子碰撞中产生出来的一种不稳定粒子,它的质量为电子质量的264.12倍,它的寿命为0.87×10−16,主要衰变为两个光子
                            
其中γ表示光子。在Alvager等人所做的实验中,π0介子以速度0.9975c运动,在运动中衰变为两个光子。实验测定沿π0介子运动方向放出的光子速度为(2.9977±0.0004)108 m/s,与用静止光源测得的光速一致。

到目前为止,所有实验都指出关速不依赖于观察者所在的参考系,而且与光源的运动速度无关。光速不变性是迄今人们认识到的电磁现象的一条基本规律。真空中的光速c是最基本的物理常量之一,它是在任意惯性参考系中测出的真空中电磁波传播速度。

除了检验光速不变性的实验之外,对其他相对论效应都有实验检验,这些效应及其检验将在本章以后各节中加以阐述。现在举出一些较为重要的实验:

(1)横向多普勒(Doppler)效应实验,证实相对论的运动时钟延缓效应。

(2)高速运动粒子寿命的测定,证实时钟延缓效应。

(3)携带原子钟的环球飞行实验,证实狭义相对论和广义相对论的时钟延缓总效应。

(4)相对论质能关系和运动学的实验检验。原子核能的利用完全证实相对论质能关系。高能物理学中各种粒子的衰变、产生、碰撞和转化过程服从相对论的能量和动量守恒定律。相对论运动学已成为分析高能物理现象的一种主要工具。这是目前对狭义相对论的相当广泛和有力的实验验证。

由此看来,现在狭义相对论已经有广泛的实验基础,它是正确反映当代科学实践的一门物理理论。

狭义相对论是在光速不变性的实验基础上建立起来的,它否定了绝对参考系的存在,由此发展了经典力学中的相对性原理。狭义相对论的相对性原理认为,包括电磁现象和其他物理现象在内,所有惯性参考系都是等价的。在这基础上建立了相对论的时空观。

 

§6.1.2 相对论的基本原理  洛伦兹变换

1. 相对论的基本原理  在总结新的实验事实之后,爱因斯坦(Einstein)提出了两条相对论的基本假设:

(1)相对性原理   所有惯性参考系都是等价的。物理规律对于所有惯性参考系都可以表为相同的形式。也就是不论通过力学现象,还是电磁现象,或其他现象,都无法觉察出所处参考系的任何“绝对运动”。相对论原理是被大量事实所精确检验过的物理学基本原理。

(2)光速不变原理   真空中的光速相对于任何惯性系沿任意方向恒为c,并与光源运动无关。

相对论的基本假设是和旧时空概念矛盾的。旧时空概念是从低速力学现象抽象出来的,集中反映在关于惯性坐标系的伽利略(Galileo)变换中。设惯性系Σ'相对于Σ以速度υ运动,并选x和x'轴沿运动方向,伽利略变换式为
                         
                          *
                         
                          *                          
(6.1---5)
(6.1---5)式反映的时空观的特征是时间与空间的分离。时间在宇宙中均匀流逝着,而空间好像一个容器,两者之间没有联系,也不与物质运动发生关系。在低速现象中还没有暴露出这种观点的错误,但是在高速现象中旧时空观与客观实际的矛盾立即显示出来。

光速不变性与旧时空观矛盾的性质可以用一个简单例子说明。如图6-3,设有一光源和一些接收仪器,我们在惯性系Σ上观察闪光的发射和接收。取光源发出闪光时刻所在点为Σ的原点O,在Σ上观察,1秒之后光波到达半径为c的球面上,这是处于球面上的一些接收器(图6-3中的P1,P2和P等)同时接收到光讯号。这球面是一个波阵面。现在我们再考察在另一惯性系Σ'上对所发生的物理事件是怎样描述的。设Σ'相对于Σ以速度υ沿x轴方向运动,并取光源发光时刻所在点为Σ'的原点O '。即在光源发光时刻,两参考系Σ和Σ'的原点O和O '重合。当接收器受到光波时,O '已经离开O。如图6-3所示,当P1接收到讯号时,O '距P1较近,而距P2较远。但由于Σ'上所测量的光速仍然是c,因此Σ'上的观察者必然认为,光波到达P1的时刻较早于到达P2的时刻。原来在Σ上观察到同时发生的两事件(P1和P2同时接收到光波),在Σ'上看来就变为不同时。原来在Σ上看到的波阵面是球面P1PP2,而在Σ'上看来,由于光波不是同时到达此面上,因此波阵面不再是P1PP2面,而是另外一个以O '为球心的球面。

从这例子看出,光速不变性所导致的时空概念是和经典时空概念有深刻矛盾的。所有最基本的时空概念,如同时性,距离,时间,速度等都要根据新的实验事实重新加以探讨。相对论的一个主要内容就是关于时空的理论。

时间和空间是运动着的物质存在的形式。时空概念是从物质运动中抽象出来的,而不是独立于物质运动之外的概念。离开物质及其运动,就没有所谓绝对的时空概念。在经典力学中,由低速现象抽象出来的时空观带有一定局限性,当我们研究高速现象特别是电磁波传播现象时,发现旧时空观与实验事实相矛盾,这是完全可以理解的。人们对时空的认识和对一切事物的认识一样,都是在不断的实践中逐步发展和加深的。

2. 间隔不变性  与旧时空观集中反映在伽利络变换式一样,相对论时空观集中反映在从一惯性系列到另一惯性系的时空坐标变换式,现在我们根据相对论基本原理导出相对论时空坐标变换式。

首先我们从物质运动中抽象出事件的概念,物质运动可以看作一连串事件的发展过程,事件可以有各种不同的具体内容,但是它总是在一定地点于一定时刻发生的,因此我们就用用四个坐标(x , y , z , t)来代表一个事件。相对论坐标变换是在不同参考系上观察同一事件的时空坐标变换关系。设同一事件在惯性系Σ上用(x , y , z , t)表示,在另一惯性系Σ'上用(x', y' , z' , t ')表示,我们要导出这两组坐标的关系。

惯性系的概念本身要求从一惯性系到另一惯性系的时空坐标变换必须是线性的。设有一不受外力作用的物体相对于惯性系Σ作匀速运动,它的运动方程由x和t的线性关系描述。在另一惯性系Σ'上观察,这物体也是作匀速运动,因而用x'和t' 的线性关系描述,由此可知,从(x , t)到(x ' , t ')的变换式必须是线性的。

现在再考察光速不变性对时空变换的限制。考虑两特殊事件(参看图6-3):第一事件为光讯号在某时刻从O点发出,第二事件是在另一地点P接收到该讯号。选取两参考系的原点在闪光发出时刻重合,并且同时开始计时,即第一事件在两参考系中都用(0,0,0,0)表示。设物体P接收到讯号的空时坐标在两参考系上分别为(x , y , z , t)和(x ', y ' , z ' , t ')。由于两参考系上测出的光速都是c,因而有
                      
                     
就是说,当二次式
                                            
(6.1---6)
亦为零时,另一二次式
                                          
(6.1---7)
亦为零。

上面我们选择了两特殊事件,这两事件之间用光讯号联系着。一般来说,两事件不一定用光讯号联系,它们可能用其他方式联系,或者根本没有任何联系。以第一事件空时坐标为(0,0,0,0),则第二事件空时坐标(x , y , z , t)可以是任意的。在这情形下,二次式(6.1---6)和(6.1---7)就不一定为零,而是可以取任何值。问题是,在一般情况下,二次式(6.1---6)和(6.1---7)应有什么关系?

通过线性变换,可以把二次式(6.1---7)变为关于x , y , z , t的二次式F2(x , y , z , t )。当二次式(6.1---7)为零时, F2(x , y , z , t ) = 0,但同时二次式(6.1---6)亦等于零,因此,二次式F2(x , y , z , t )最多只与(6.1---6)式差一常因子。由此,
               
式中因子A只可能依赖于两参考系相对速度的绝对值(因为在空间中不存在特定方向)。因为两参考系是等价的,反过来亦应有关系
              
由于系数A不依赖于相对速度的方向,因此上面两式中的A应该是一样的。比较以上两式可得A2 = 1,由变换的连续性应取A = ±1.因此有
                          
(6.1---8)
时,,所以取A=1)

关系式(6.1---8)是光速不变性的数学表示,它是相对论时空观的一个基本关系。

二次式(6.1---6)的负值称为事件(x , y , z , t )和事件(0 , 0 , 0, 0)之间的间隔,用s2表示,
                                      
(6.1---9)
在另一惯性系中观察到这两事件的间隔s' 2为
                                    
(6.1---10)
关系式(6.1---8)可写为
                                                    
(6.1---11)
这关系称为间隔不变性,它表示两事件的间隔不因参考系变换而改变。

一般来说,两事件(x1 , y1 , z1 , t1)与(x2 , y2 , z2 , t2)的间隔为
                   
(6.1---12)
在另一参考系上观察这两事件的空时坐标为
                
(x1' , y1' , z1' , t1')和(x2 ', y2' , z2' , t2' )
其间隔为
                  
(6.1---13)
由间隔不变性有s2 = s'2 。

间隔是相对论时空观的一个基本概念。有(6.1---12)式,若两事件在同一地点相继发生,令 t2 − t1 = Δt ,有s2 = c2Δt2 。在这情形下间隔就是光速乘以时间的平方。若两事件的同时在不同地点发生,则s2 = (Δx)2 。在这情形下,间隔就是两事件的空间距离平方的负值。由此可见,间隔概念是把时间与空间距离统一起来的一个概念,其物理含义在下一节中再进一步讨论。

例1  参考系Σ'相对于Σ以速度υ沿x轴方向运动。在Σ'上有一静止光源S和一反射镜M,两者相距为z0' 。从S上向z' 轴方向发出闪光,经M发射后回到S。求两参考系上观察到的闪光发出和接收的时间和间隔。

   两参考系上观察到的物理过程如图6-4所示。在Σ'上观察,闪光发出和接收之间的时间为
                         
发出和接收是在同一地点S上发生,因此
                      
两事件的间隔为
             

在Σ上观察,设闪光发出和接收之间的时间为Δt ,在这时间内,光源已运动了Δx = υΔt 。光讯号传播的路程为
                      
因而
                         
                      
                         
两事件的间隔为
                 
与υ正交方向的距离是不变的。因为若z0' =φ(υ)z0 ,由相对性原理应有z0 =φ(−υ)z0' 。但由于空间没有特定方向,φ(υ)只能依赖υ的数值,而不依赖于其方向,由
                    
得φ2 (υ) = 1,再由变换的连续性应有φ2(υ) = 1,因此
                               z0 = z0'
比较以上所得公式,得
                          
                           
由此可见,在两参考系中观察到的两事件之间的时间是不同的,但间隔Δs2则是一样的。

 

 

3. 洛伦兹变换  根据变换的线性和间隔不变性(6.1---8)式,可以导出相对论式时空坐标变换关系。为简单计,选两坐标系的x轴和x'轴都沿Σ'相对于Σ的运动方向。在这情形下,y和z不变,变换具有特殊形式
                          
                          
                          
                                            
(6.1---14)
由于x轴和x'轴正向相同,应取a11 > 0;又由于事件t于t' 的正向相同,应取a22 > 0。把(6.1---14)式代入(6.1---8)式得
          
比较系数得
                          
                          
                                              
(6.1---15)
由上式的第一和第三式得
                                  
(6.1---16)
代入(6.1---15)第二式得
                                                  
(6.1---17)
这些系数都可以用Σ'相对于Σ的运动速度υ表出。设Σ '的原点为O '。在Σ上观察,O '点以速度υ沿x轴方向运动,因此其坐标为x = υt。但O '点在Σ '上的坐标永远是x ' = 0。因而(6.1---14)第一式有
                       
解出
                                                 
(6.1---18)
由(6.1---16)—(6.1---18)式得
                                         
(6.1---19)
                      
把(6.1---19)式代入(6.1---14)式得相对论时空坐标变换公式:
                             
                                *
                               
                                             
(6.1---20)

由(6.1---20)式解出x,y,z,t可得反变换式。用相对性原理可以更简单地导出反变换。因为Σ和Σ'是等价的,所以从Σ系到Σ'系的变换应该与从Σ'到Σ系的变换具有相同形式。若Σ'相对于Σ的运动速度为υ(沿x轴方向),则Σ相对于Σ'的速度为 −υ。因此只要把(6.1---20)式中的υ改为 −υ即得反变换式
                             
                             
                             *
                                             
(6.1---21)

变换式(6.1---20)和(6.1---21)称为洛伦兹变换式,它是同一时间在两不同参考系上观察的时空坐标之间的关系。洛伦兹变换反映相对论的时空观,其物理意义在下一节中再讨论。

例2  在图6-3中,设闪光从O点发出。在Σ上观察,光讯号于1秒之后同时被P1和P2接收到。设Σ '相对于Σ的运动速度为0.8c,求P1和P2接收到讯号时在Σ '上的时刻和位置。

   P1接收到讯号在Σ上的空时坐标为(c,0,0,1)。这事件在Σ'上观察时,由洛伦兹变换式(6.1---20)得
                         
                        
                        
                        
即P1接收到讯号是在Σ '上的空时坐标为(c/3,0,0,1/3)。注意Σ '上测得沿x轴方向的光速为x'/t' = c。

P2接收到讯号是在Σ上的空时坐标为(−c,0,0,1)。由洛伦兹变换式可得该事件在Σ'上的空时坐标为(−3c,0,0,3)。注意沿 −x' 轴方向的光速仍为c。

在Σ上同时的两事件(P1和P2同时接收到讯号),在Σ '上看来变为不同时,P1接收到光波较早于P2接收到光波。

在Σ和Σ'上观察到P1和P2接收到讯号这两件事之间的事件差别,空间距离和间隔分别为
              Σ
:Δt = 0 ,    Δx = 2c    Δs2 =
4c2
              Σ'
:Δt ' = 8/3 ,Δx ' = 10c / 3, Δs' 2 = 4c
2
我们看到,两参考系上测得P1和P2之间的距离不同,但两事件的间隔是一致的。

从本节的两例可以看出,相对论的时间、距离是相对的,同时性也是相对的,但两事件的间隔却有绝对意义。

 

课下作业:教材第235页,第1题。

1、证明牛顿定律在伽俐略变换下是谐变的,Maxwell方程组在伽俐略变换下不是谐变的。

 

补充题:

1.  相对论的实验基础是什么?

2.  爱因斯坦提出的两条相对论的基本假设是什么?

3.  为什么说,惯性系的概念本身要求从一个惯性系到另一个惯性系的时空坐标变换必须是线性的?

4.  有两个惯性系Σ和Σ’,选两坐标系的x 轴和 x’ 轴都沿Σ’ 相对与Σ的运动方向,惯性系Σ’ 相对于惯性系Σ以速度v沿x 轴正方向运动,在时刻t=t’=0 时,两惯性系的原点重合。设某事件在惯性系Σ中的表示为(x,y,z,t),该事件在Σ’ 中的描述为(x’,y’,z’,t’),请直接给出Σ→Σ’ 及  Σ’→Σ的坐标变换表达式。