几何学的真实原理(闵氏几何是什么)

1905年,爱因斯坦正式提出了狭义相对论;1908年,闵可夫斯基给出了狭义相对论的几何表述,也就是我们这里说的闵氏几何。爱因斯坦一开始对这套几何语言很反感,认为这些纯数学上的“花架子”没什么用,还增加了相对论的复杂度。但是,他很快就发现闵氏几何非常重要,发现这绝不是什么纯数学技巧,而是有着深刻物理内涵的洞见。而且,如果要建立广义相对论,少了它根本不行。

几何学的真实原理(闵氏几何是什么)(1)

几何语言清晰直观,在处理许多问题时有很大的优势,这在双生子佯谬里体现得非常明显:使用代数语言,使用洛伦兹变换去处理双生子佯谬,其中难度之大思维之绕,绝对是对智商极大的考验;而使用几何语言,这个问题就简单得不像是个问题。然而,目前绝大部分介绍相对论的书籍文章还是使用的代数语言,所以你还是能经常看到许多人在一些非常简单的问题上纠缠不清,争论不休。

梁灿彬老师说他上世纪80年代从“言必称几何”的芝加哥大学回来以后,就一直在国内大力推广相对论的几何语言,但是不明白为啥过了三十多年大众对它还是很排斥。长尾科技就在这篇文章里跟大家好好聊一聊,希望能够解开大家跟闵氏几何之间的心结。

因为这是从零开始的一篇文章,所以我暂时就只谈相对论里最简单的几何语言,也就是狭义相对论里的闵氏几何。至于广义相对论里涉及的黎曼几何,我们后面再说。

01为什么很多人觉得几何语言难?

了解相对论的人大多知道一点闵氏几何,知道我们可以通过画时空图的方式来解决一些很复杂的问题,但是他会觉得闵氏几何很难:把时空图画出来很难,画出来之后去解释时空图更难当看到别人对着时空图“轻而易举”地把问题解决了,他心里没底。他无法理解为什么你说时空图里的这个代表了相对论的里的那个,为什么你对时空图里的一些点、线、面做这样的处理就对应着相对论里的那个问题。所以,他觉得你在时空图里做的那些几何操作非常“虚”,他不理解这些几何背后的实质,自然会觉得很难。

然而,这不该是几何该给我们留下的印象啊。我们平常接触的几何,一个点、一条线、一个正方形、一个圆,这些都是我们日常生活里一些形状的完美投射,它们非常的实在,一点都不虚。很多在代数上不好理解的东西,我们把它画到几何图形上一下子就理解了。几何原本就应该比代数更加简单直观,但是为什么到了相对论这里,大家反而觉得几何语言更加难以接受了呢?原因就是狭义相对论里使用的几何并不是我们熟知的欧式几何,而是一种全新的闵氏几何,当我们把欧式几何里的一些习惯和常识代入进来的时候,自然会引起各种水土不服。

所以,这里我们先不谈闵氏几何和欧式几何的具体区别,我们先来看看狭义相对论是怎么和闵氏几何对上眼了的。为什么狭义相对论不用欧式几何来描述,而非得使用一个我们不熟悉的闵氏几何呢?这个问题不清楚,讲再多闵氏几何的性质也是白搭。

02两个基本假设

为什么狭义相对论要使用我们不熟悉的闵氏几何,原因当然还是得从自身来找。大家都知道狭义相对论有两条基本假设:相对性原理光速不变。从这两个假设出发我们可以很自然的推导出狭义相对论里各种奇奇怪怪的结论,这里我们先来审查一下这两个假设。

几何学的真实原理(闵氏几何是什么)(2)

相对性原理物理定律在所有的惯性参考系里都是平等的,不存在一个特殊的惯性系。这一点很自然,伽利略很早就发现这点了,他意识到一个人在一个匀速移动(惯性系)的密闭船舱里根本无法区分这艘船到底是静止的还是以某个速度匀速运动。无法区分的意思就是这两个参考系(静止和匀速运动)是平等平权的,否则,你就应该有办法把它们区分开。

不同的是:伽利略只敢给力学定律打包票,他只敢说我们无法用力学实验区分两个惯性系,其他定律(比如电磁学实验)能不能区分惯性系他就不敢说了。爱因斯坦说你不敢打包票我来,我打赌所有的物理定律(力学的也好,电磁学或者其他的也好)都无法区分惯性系,你在船舱里做什么实验都也无法区分这艘船是静止的还是匀速运动的。

从这里我们可以感觉到,相对性原理好像并没有那么反常识,它只是把伽利略的那套相对性原理的适用范围给扩大了。那么,狭义相对论里那么多结论的“诡异”似乎就应该来自另外一个假设,也就是光速不变

光速不变真空中的光速在所有的惯性系里都是一样的。不论你在哪个惯性系(注意一定要是惯性系,非惯性系里光速就没人管它了)里测量光速,在静止的地面也好,飞速的火车飞船里测也好,测得的光速都是一个定值c。

这就太反常识了,怎么能够在不同的参考系里测量同一个物体的速度都相同呢?比如,在一辆速度为300km/h的高铁上,有一个人以5km/h的速度朝车头走去。那么,高铁上的人会觉得他的速度是5km/h,而地面的人会觉得他的速度是300 5=305km/h,这两个速度肯定是不一样的。但是,如果我把这个人换成一束光,让这束光射向车头,光速不变就是说不管你是在高铁上测量,还是在地面上测量,这束光的速度都是c。你以为在地面上测量的光速应该是c 300km/h么?对不起,并不是这样。

你觉得这个事诡异么?诡异!为什么会这样呢?不知道,光速不变是狭义相对论的一个基本假设,这个类似数学里的公理,我们只能假设它是对的,但是却无法证明它是对的,它的可靠性由实验保证。其实,这个事情很多人还是知道的,但是,大多数人并不知道如果我们再深挖一下光速不变原理的秘密,我们就能找到一条通向闵氏几何的隐秘通道

03光速不变的秘密

光速不变说你在任何惯性系中测量光速,得到的结果都是c,我们来定量的分析一下这个原理。

假设我们在K系里测量一束光,假设这束光在Δt的时间内走了Δl的距离,那么显然就有Δl=Δt×c。如果我们把这束光在x,y,z三个坐标轴方向移动距离的分量记为Δx,Δy,Δz,那么根据勾股定理就有:Δl²=Δx² Δy² Δz²,再把这两个式子合起来就能得到:Δx² Δy² Δz²-(Δt×c)²=0。如果这时候我们用一个新的量Δs²表示左边的东西,那么就有Δs²=Δx² Δy² Δz²-(Δt×c)²=0。

好,事情发展到这里,一切都非常容易理解,上面的事情倒腾来倒腾去就是一束光在空间里走了一段距离,然后套用了小学生都知道的距离等于速度乘以时间而已。而且,大家也会发现这个事跟光速不变也没有什么关系,你就是把上面的光换成一颗子弹,把光速c换成子弹的速度,那么上面的一切推理都还是那样的。没错,因为光速不变说的是光速在不同的惯性系里都一样,那么我们还得再考察一个惯性系

还是上面那束光,我们这次在另一个参考系K’里对它进行测量。假设我们测量的结果是它在Δt’的时间内走了Δl’,我们同样对这个距离做一个分解,假设它在x,y,z三个坐标轴方向移动距离的分量记为Δx’,Δy’,Δz’。根据光速不变原理,光在这个参考系里的速度还是c,那么,按照上面的逻辑,我们依然可以得到Δs’²=Δx’² Δy’² Δz’²-(Δt’×c)²=0

当我们把K和K’这两个参考系了的结果拿来对比的时候,光速不变原理带来的反常效应就出现了:大家有没有发现Δs和Δs’的表达式的形式完全一致,而且值还相等(都等于0)?

我们只是把K系里测量的时间和距离全都换成了K’系里测量的时间和距离,其它的东西我们一概没动。而在牛顿力学里,ΔsΔs’的表达式形式是不一样的,因为牛顿力学里另一个惯性系的测量速度会加上两个参考系之间的相对速度。也就是说在牛顿体系里,在K’系里测量的光速应该是c加上两个参考系的相对速度,这样Δs’的形式就Δs跟不完全一样了,而相对论是用光速不变强制保证了它们的形式一致

这一点大家好好想一想,它并不难理解,但是却是后面的关键。我们现在等于说是定义了一个Δs对于光来说,这个Δs的值在不同的参考系里是相等的,刚好都是0

那么,重点来了:如果我把这个Δs从光推广到所有物体,我仍然从两个不同的惯性系K和K’去测量这个物体在空间上运动的距离Δx、Δy、Δz和时间上经过的间隔Δt,然后一样把它们组合成Δs和Δs’。那么,这个物体的Δs和Δs’之间有没有什么关系呢?它们是不是还跟光的Δs和Δs’一样相等并且都等于0呢?

是否等于0很好回答,一看就知道肯定不等于0。假设博尔特1秒钟跑10米,那么Δt=1、Δx=10,不考虑另外两个维度(Δy=Δz=0),看看Δs²的表达式:Δs²=Δx² Δy² Δz²-(Δt×c)²=100 0 0-(1×3×10^8)²,这显然是个非常大的负数。那么问题的关键就落在在惯性系K和K’里测量的这两个值Δs和Δs’是否相等,也就是说,如果博尔特在跑步,我们从地面和火车上测量得到的 Δs和Δs’是否相等

这个答案我直接告诉大家:一样

这个证明过程其实也非常简单,这不就是同一个事件看它在不同的惯性系里是否满足某个式子么?同一个事件在不同惯性系下变换关系,在相对论里这不就是洛伦兹变换的内容么?所以,你直接用洛伦兹变换去套一下Δs和Δs’,你很简单就能发现它们是相等的,这里我就不做具体计算了,当作课后习题。

所以,我们通过分析就得到了这样一个结论:在相对论里,不同惯性系里测量一个物体的位移、时间等信息可能不一样,但是它们组合起来的Δs²=Δx² Δy² Δz²-(Δt×c)²确是相等的,而这个值对光来说还刚好就是0

注意了,这个结论极其重要,正是它决定了为什么我们要使用闵氏几何来描述狭义相对论,甚至,从某种角度来说,它几乎包含了闵氏几何里的全部奥秘。为了让大家更好地了解这个结论背后的意义,我们先去看一看欧式几何里的类似情况。

04欧式几何不变量

在欧式几何里也有一些量是不随坐标系的变化而变化的,比如最简单的线段的长度

在二维的欧式几何里,我们假设在一个直角坐标系里有两点A(x1,y1)、B(x2,y2),令Δx=x2-x1,Δy=y2-y1,那么,利用勾股定理就能非常容易的算出AB之间的距离Δl²=Δx² Δy²。这时候我们如果在建一个新的直角坐标系,在这个新的坐标系里原来A、B两点的坐标变成了A(x1’,y1’)、B(x2’,y2’),同样令Δx’=x2’-x1’,Δy’=y2’-y1’,AB之间新的距离Δl’²=Δx’² Δy’²。这时候我们可以很轻松的验证Δl=Δl’,也就是说Δx² Δy²=Δx’² Δy’²

几何学的真实原理(闵氏几何是什么)(3)

这个结论一点都不奇怪,我们都可以很直观的感觉到,为什么呢?因为欧式几何就是我们日常熟悉的空间啊,我们现在就假设有一跟2米长的尺子AB,我在一个直角坐标系里计算它的长度的平方Δl²=Δx² Δy²=2²=4,难不成我在另一个坐标系里算得它的长度的平方Δl’²=Δx’² Δy’²还能不等于4么?我这把尺子的长度是一定的,如果我在不同坐标系下得到尺子的长度却不一样了,那还了得,那这几何就有问题了。

因此,在欧式几何里,Δl²=Δx² Δy²也是一个坐标系不变量,这个值不随你取坐标系的变化而变化。很显然的,如果把欧式空间从二维推广到三维,那么这个不变量自然就可以写成Δl²=Δx² Δy² Δz²;推广到四维,我们用t表示第四个维度,那么Δl²=Δx² Δy² Δz² Δt²,再往上推广几维,我就加几个分量就行了。

大家肯定注意到了:在欧式几何里,不随坐标系变化的是Δl²=Δx² Δy² Δz² Δt²,而我们上面在讲狭义相对论的时候,不随惯性系变化的量Δs²=Δx² Δy² Δz²-(Δt×c)²。这两者非常的相似,这个光速c是个常数,可以不用考虑,为了方便计算我们甚至可以直接约定c=1,这样的话Δl²Δs²的差别就仅仅只差一个Δt前面的负号而已。

那么,这种形式上的相似和那个负号的差别到底意味着什么呢?毕竟它们一个代表的是不随惯性系的变化而变化的量(Δs²),一个代表的是欧式几何里不随坐标系的变化而变化的量(Δl²),一个是物理量,一个是几何量,好像并没有直接的关系。但是,我们这样想想:如果我想用一种几何来描述狭义相对论里Δs²=Δx² Δy² Δz²-(Δt×c)²不随惯性系的变化而变化的这种性质,我们肯定就不能选欧式几何了(因为欧式几何里不随坐标系变化的量是Δl²=Δx² Δy² Δz² Δt²)。所以我们需要一种新的几何,在这种新几何里,不随坐标系变换而变化的量是类似Δs²这样带有一个负号的量,这种全新的几何自然就是闵氏几何

你这时候心里可能有点疑惑:我们真的可以只凭借不随参考系变化的量是Δs²和Δl²,就断定这是两种不同的几何么?Δs²和Δl²这些东西到底意味着什么?或者说,到底是什么决定了一种几何?

05线元决定几何

我们从小就在学习欧式几何,我们学习直线、三角形、圆等很多几何图形,我们关心它们的各种性质,比如两点的距离、曲线的长度、两条线的夹角、一个图形的面积。但是,大家有没有想过:在欧式几何的各种各样的性质里,有没有哪个是最基本的?也就是说,我们能不能只定义这个最基本的量,其他的各种量都可以从这个量里衍生出来?这样的话,我们就只需要抓住这一个最基本量的性质,就可以抓住这种几何的性质了。

答案是:有,这个最基本的量就是弧长,准确地说是组成任意曲线、弧线的基本元段长

要把这个说清楚,我们这里得稍微引入一丢丢微积分的思想,别慌,这个很容易理解的~在欧式几何里,我们很容易求一根线段的长度(直角坐标系里利用勾股定理就行了),但是,如果要你求一条任意曲线的长度呢?

几何学的真实原理(闵氏几何是什么)(4)

比如上图的曲线AB,这是随手画的很一般的一条曲线,不是什么特殊的圆弧,你要怎么求它的长度呢?数学家们是这么考虑的:我在曲线AB之间取一些点,比如P1、P2、P3,然后这三个点就把这段圆弧的分成了四个部分。我们用线段把这几个点连起来,这样我们就得到了一条折线,这时候我们就用折线的长度(也就是这四条线段的和AP1 P1P2 P2P3 P3B)来近似代替曲线AB的长度。当然,你肯定会说,曲线的长度明显比这四条线段加起来更长啊,你怎么能用折线的长度来代替曲线呢?

是的,如果你只在AB之间取三个点,那么曲线AB的长度肯定要比折线的长度多很多,这样近似的误差很大。但是,如果我再多取一些点呢?我在AB之间取十个、一百个甚至一千一万个点,那么,这成千上万条线段组成的折线的总长度跟曲线AB比呢?当然,还是会短一些,但是,你可以想象,这时候这些折线已经跟曲线AB非常接近了。如果一根1米长的曲线被你分成了1万条线段,这时候你用肉眼根本分辨不出来这是原来的曲线还是折线。但是你内心还是知道折线要短一些,那么接下来就是重点了:如果我在曲线AB之间放无穷多个点呢

无穷是一个很迷人,同时也很迷惑人的词汇。从上面的分析我们知道:当我们在曲线AB里放越多的点,这些小线段连起来的折线就越接近曲线AB本身。那么,当我们放了无穷多个点的时候,这无穷多个线段组成的折线是不是就应该等于曲线AB的长度了?答案是肯定的,而这,就是微积分最朴素也是最核心的思想。

几何学的真实原理(闵氏几何是什么)(5)

在这种思想的指导下,我们要求任意曲线的距离,最终还是要求小线段的距离,因为无穷多个小线段累加起来的长度就是曲线的长度。因此,我们只要知道如何求无穷小的线段的长度,我们就能用微积分的思想求出任意曲线的长度,我们把这个最基本小线段称为曲线的一个元段长,记做dl

几何学的真实原理(闵氏几何是什么)(6)

在欧式几何里,我们把基本元段dl在坐标系里分解一下,用dx和dy表示dl在x轴和y轴上的分量,那么根据勾股定理就有dl²=dx² dy²,我们就把dl²称之为线元

提炼出了线元这个概念以后,我们就可以开始反推了。在任何一种几何里,如果我们确定了线元,就等于知道了元段dl的长度,然后就可以利用上面微积分的思想求任意一段曲线的长度。那么,接下来,我们会发现几何里的其他性质都可以按照这些定义。比如,我们就可以把两点之间的距离定义为这两点之间所有可能的曲线里最短的一条,把两条直线的夹角定义为弧长和半径的比值(想象在一个圆里,半径固定,弧长越大角度越大),其他什么面积、体积之类的几何性质就都可以根据这些基本性质来定义。

最后,你会发现只要给定了一个线元,我们就能把它所有的几何性质都确定下来,也就是说:线元决定几何。

那么,什么是欧式几何呢?欧式几何就是由欧式线元(dl²=dx² dy²)决定的几何。非欧几何呢?只要你的线元不是欧式线元,那么这个线元决定的几何就是非欧几何。用这种新线元,我们一样可以定义出在这种新几何里的曲线长度、两点的距离、线的夹角等等几何性质。

几何学的真实原理(闵氏几何是什么)(7)

那么,闵氏几何是什么?闵氏几何的线元又是什么呢?

答:很显然,闵氏几何就是由闵氏线元决定的几何。闵氏线元是这样的ds²=-dt² dx² dy² dz²,如果只考虑二维闵氏几何的话,那么ds²=-dt² dx²。

闵氏线元(ds²=-dt² dx²)跟欧式线元(dl²=dx² dy²)十分相像,它们之间唯一的差别就在于闵氏线元的第一个分量dt²的前面是负号,而欧式线元全部都是正号。也因为如此,闵氏几何欧式几何也非常像,所以闵氏几何还有一个称呼,叫伪欧几何。但是,我们也要特别注意这个负号,正是这个负号,决定了闵氏几何和我们熟悉的欧式几何里所有不一样的地方,而这些不一样,恰恰是我们通过闵氏几何来理解狭义相对论的关键。

06闵氏几何与狭义相对论

我们现在知道了,所谓的闵氏几何,不过是由闵氏线元ds²=-dt² dx² dy² dz²决定的几何。在这种几何里面,曲线的长度、两点的距离、线的夹角等一切性质都有这个第一项带了一个负号的闵氏线元决定

看看这个闵氏线元ds²=-dt² dx² dy² dz²,再看看我们最开始提到的那个在狭义相对论里不随惯性系的变化而变化的量Δs²=Δx² Δy² Δz²-(Δt×c)²,是不是非常像?在相对论里有两种单位制:国际单位制几何单位制。国际单位制就是我们平常熟悉的那一套单位制,几何单位制就是选择光速c=1,这样可以大大简化在用几何处理相对论问题的难度。采用几何单位制的话,不随惯性系变化的Δs²=Δx² Δy² Δz²-Δt²,这就真的跟闵氏线元ds²=-dt² dx² dy² dz²一模一样了。

这就是为什么我们要用闵氏几何,而不是欧式几何来描述狭义相对论的根本原因

在牛顿的世界里,时间是绝对的,三维的空间也是绝对的,一根木棒在三维空间里随便怎么变换,随便怎么变换参考系,它在三维空间里的长度是一定的,这个是跟三维的欧式线元对应的(因为三维的欧式线元dt² dx² dy²也不随坐标系的变化而变化)。

但是,在狭义相对论里,空间不再是绝对的,不再是一成不变的,我们熟悉的尺缩效应不就是说从不同的惯性系里观测同一把尺子,这个尺子的长度是不一样的么?这就是说空间上的“长度”在狭义相对论的不同惯性系里不再是不变量。但是,我们发现如果把时间也考虑进来,把三维空间和一维时间一起组合成四维时空,那么这个四维时空里的间隔Δs²=Δx² Δy² Δz²-Δt²就是不随惯性系的变化而变化的量(这个在前面说过,用洛伦兹变换可以非常方便的证明)。

几何学的真实原理(闵氏几何是什么)(8)

所以,在牛顿的世界里,三维空间是绝对的,他必须保证同一把尺子在不同的三维空间的坐标系里长度是一样的,也就是说在度量三维空间里长度的方式(这个有个更专业的概念叫度规,这里我们知道就行)必须跟坐标系无关,而欧式几何正好有这样的特性,所以牛顿力学的背景是欧式几何

而在狭义相对论里,三维空间并不是绝对的,三维空间里一把尺子的长度在不同惯性系里是不一样的。但是,三维空间和一维时间组成的四维时空是绝对的。四维时空里如果也有这样一把“尺子”,那么这把“尺子”无论从哪个惯性系来看,它的四维“长度”都是一样的。而狭义相对论的这种四维“长度”,或者说我们在四维时空里度量长度的方式,它跟闵氏线元表达式的形式是一样的。也就是说只有在闵氏几何里,狭义相对论的时空间隔才对应于他们几何里的“长度”的概念,所以我们要使用闵氏几何来描述狭义相对论。

理解这一段非常的重要,因为只有理解了这个,你才能从根本上把闵氏几何和狭义相对论对应起来。有很多闵氏几何的科普文章里上来就是直接给你画时空图,然后告诉你闵氏几何里的这种图形这个几何性质对应着狭义相对论里的这种概念,这样很多人就感觉难以接受,然后对几何语言产生抵触的心理。

好,既然我们打算用闵氏几何来描述狭义相对论,那么肯定就要把狭义相对论里的物理语言翻译成闵氏几何里的几何语言。几何肯定是离不开画图的,在欧式几何里我们经常会画出一个几何图形在空间上的样子,这是空间图。而狭义相对论把时间和空间看作一个整体, 它要求我们以同等的地位来看待时间和空间,所以我们需要画出一个事件同时在时间和空间里的样子,这种图就叫时空图

07时空图

在时空图里,你能非常自然地感觉到时间和空间被统一起来了,因为时空图里的时间轴和空间轴有着完全的平等的地位

几何学的真实原理(闵氏几何是什么)(9)

在时空图里,一个粒子现在在哪,你找到它的空间坐标(x,y,z),记下现在的时间t,那么你就得到了它的时空信息(x,y,z,t),那这个时空信息就对应时空图里的一个点,这就叫时空点

同样的,你再记下它下一个时刻t1的位置(x1,y1,z1),那么它又对应了坐标系的另一个点(x1,y1,z1,t1)。所以,一个粒子在任一时刻的时间、空间信息就都对应了时空图里的一个点。那么,如果考察这个粒子的全部历史,你就可以得到一系列的这种时空点,这些点在时空图里就会形成一条线,这条能代表粒子全部历史的线就叫粒子的世界线

现实生活里一个粒子有四个维度(三维空间 一维时间),那么对应的坐标轴应该也是四维的,但是我们在二维平面里勉强可以画出三维图形,对四维图形实在无能为力。为了方便起见,我们假设粒子只沿x轴方向运动,这样我们就可以不考虑y轴和z轴的情况,从而把四维的问题简化为二维,然后我们就可以很愉快的在一张二维的纸上画这二维时空图了。

我们先建立一个坐标系,横轴x代表粒子的空间信息,纵轴t代表粒子的时间信息。为了再次简化问题,我们采用几何单位制,也就是取光速c=1,然后我们再来看一些具体问题。

问题1一个静止不动的粒子在时空图里是什么样的?或者说它的世界线是什么样的

这个答案很容易想到,一个粒子静止不动,就是在空间上没动,那么它的x坐标一直为零,但是时间依然在流逝,也就是粒子的时间坐标在一直变大。所以,静止不动的粒子是世界线是一条跟t轴重合,垂直于x轴的直线

几何学的真实原理(闵氏几何是什么)(10)

问题2:一个匀速向右运动的粒子的世界线是什么样的

这个也不难想象,一个匀速向右运动的粒子,它在时间轴不停往上走的同时,空间轴上也在不停地往右走,那么这个粒子的世界线应该是一条斜直线。问题是,斜多少?是所有的坐标空间它都可以斜,还是有什么限制?这个问题我们先放着,先看看第三个问题。

问题3:一条朝右上方45°的斜直线(如下图的L1)代表了什么粒子的世界线

几何学的真实原理(闵氏几何是什么)(11)

我们先来算一算这个粒子的速度:我们在粒子的世界线L1上取两个点,也就是假设粒子在t1时刻在位置x1,在t2时刻在位置x2。因为这条直线是45°的,所以很显然x2-x1=t2-t1,.那么粒子的速度v=(x2-x1)/(t2-t1)=1

速度等于1是什么意思?我们在画图的时候采用的是几何单位制,也就是取光速c=1(如果我们不采用几何单位制,那么竖轴的单位就不是t,而是ct,本质并没有什么不同)。现在这个粒子的速度等于1,其实就是代表这个粒子的速度是光速,速度是光速那自然就是光子了,那么这条45°斜直线就代表了光子的世界线

从这里我们可以看到,在时空图里,光子的世界线是45°的斜直线。我们也知道在相对论里任何有质量粒子的速度都是小于光速的,那么一个有质量的粒子做匀速直线运动的世界线该是一条什么样的斜直线呢?是在区域1还是区域2

我们可以这样想一下:如果粒子的速度比光速小,那么假设粒子在t1时刻在x1处,那么到了t2时刻它肯定到不了x2地方,那么这两点的连线肯定就在L1的上方,也就是区域1。其实我们也可以想一个极端的粒子,假设这个粒子在原点不动,那么粒子的世界线就是跟t轴重合,粒子速度到达光速就是45°的那条直线,那么速度在静止和光速之间的粒子世界线自然就是在区域1的斜直线了。

现在我们知道了这样一个结论:在时空图里,45°的斜直线代表了光子的世界线(如L1),比光子世界线更陡,更加靠近t轴的斜直线(如L2)是有质量粒子匀速直线运动,或者说惯性运动(速度小于光速)的世界线。

几何学的真实原理(闵氏几何是什么)(12)

有了这样的基本认识,我们来用几何语言分析一下狭义相对论里入门教材里必定会碰到的问题:火车闪光问题。这个问题之所以重要,是因为它揭示了同时的相对性,也就是说在一个惯性系看来是同时发生的事件,在另一个参考系里不一定是同时发生的。爱因斯坦敏锐地发现了这点,然后借此从看似牢不可破的牛顿力学里撕开了一道口子。

08同时的相对性

在牛顿力学里,时间是绝对的,所以同时必然也是一个绝对的词汇。在一个参考系看来是同时发生的事件,不管谁来看都绝对是同时发生的,这也是一个非常符合常识的论述。

但是,爱因斯坦用一个简单的火车实验就让人们的这个信念坍塌了,这个实验是这样的:假设地面上有一辆匀速运动的火车,在某一个时刻,地面上的观察者发现这个火车的车头和车尾同时被闪电击中。也就是说,对于地面参考系而言,闪电击中车头和车尾这两个事件是同时发生的。但是,爱因斯坦认为在火车参考系里,这两个事件就不是同时发生的。

原因也很简单,我们假设在闪电击中火车头尾的时候,在地面这两点的中点有一个观察者。因为两个事件在地面系看起来是同时发生的,所以,站在地面中间的那个观察者肯定会同时看到车头和车尾发过来的闪光,所以这两个事件是同时的。

但是,站在火车中间的观察者就不是这样了,因为车头车尾的闪光在向中间传播的时候,火车本身也在前进,所以火车中间的人就会先看到车头发过来的闪光,后看到车尾发过来的闪光。所以,火车上的观察者就会觉得这闪电击中车头和车尾这两个事件不是同时发生的,而是击中车头的先,击中车尾的后。

几何学的真实原理(闵氏几何是什么)(13)

爱因斯坦从这个火车闪光实验出发,发现了同时的相对性,进而打开了狭义相对论的大门。这个实验比较简单,整个逻辑过程也不复杂,但是这样讲不够直观,不够具有普遍性。因为很多人会把这个实验当做一个特例来处理,也就是只有当他们意识到要讲同时的相对性的时候才会想起这个实验,平常就会把这个实验带来的同时的相对性给忘了,然后带来一系列的“相对论诡异疑难”。下面我们从几何语言来看看这个问题,看看如何让这个重要问题更直观,更具有普遍性。

我们假设闪电同时击中车头车尾(从地面系观测)的时候,火车的车尾M’、车头N’刚好经过地面的M和N点,P点为地面MN的中点,P’为火车上的中点,我们来看看怎么在时空图上描述这个闪电击中火车的问题。

我们先来看看地面上M和N点的世界线,因为M、N在地面上没有动,所以M和N点的世界线都是一条沿着时间轴t竖直向上的直线(空间位置没动,只有时间t在动)。同样的,在MN中间的P点也没动,它的世界线也是一条竖直向上的直线。这三条线好画,那么在火车上的M’、N’和P’,它们都在做匀速直线运动,那它们的世界线是什么样的呢?这个我们上一节刚好说了,做匀速运动的粒子的世界线是一条比45°线更陡的斜直线。那我们把这六个点的世界线都画出来,不难理解应该就是下面这样(横轴为空间x,纵轴为时间t,这里省略了)。

几何学的真实原理(闵氏几何是什么)(14)

下面是关键的了,怎么画车头、车尾的闪光向中点传播的过程?我们知道,闪电击中车头车尾之后,这个事件就会向四面八方发射光信号(所以四面八方的人都能看到火车被闪电击中了),但是,其他的信号我们都不关心,我们只关心被地面中点P和火车中点P’所接收到的那一束光信号。那么,这个光信号要怎么画呢?它们的出发点肯定在m和n,那接下来呢?这次我们再次想起了上一节中提到的:光子的世界线是45°的斜直线。那么我们就加上这两条45°的世界线,最后的图就是下面这样的。

几何学的真实原理(闵氏几何是什么)(15)

这两根世界线跟两个中点P、P’的世界线产生了三个交点A、B、C,这是三个很有意思的点,我们来分析一下它们的物理含义。

首先是A点,A点是闪光世界线跟地面中点P点的世界线交点,它们相交了是什么意思?纵轴代表时间,横轴代表空间,相交了就代表这两个粒子此时时间和空间信息都一样,都一样那就是相遇了啊,具体到我们这个问题就是闪光传播到了地面上的中点。因为地面没有动,M和N点到P点的距离又是一样的,那么车头车尾的闪光肯定同时到达地面中点,所以它们都相交于A点是正确的。

再来看B点和C点。B点是车尾的闪光的世界线和火车里面的中点P’世界线的交点,那B点代表的意思自然就是火车中间的观察者观察到车尾的闪光这个事件。同理,C点是车头闪光世界线跟P’世界线的交点,那C点就是火车中间的观察者观察到车头闪光的这个事件。这样看就非常明显了,纵坐标是时间轴,那么B事件明显就是在C事件之后发生的啊。

这正是同时的相对性的表现:对于地面系,它们都交于A点,所以是同时的;对于火车系,它们分别交于B点C点,所以是不同时的,这在时空图里极为直观。

这里有一个事要强调一下:我们在这个火车闪光问题里虽然涉及到了地面系和火车系,但是我们是一直在地面系来分析问题的。我们画的时空图,不管是地面上的点还是火车上的点,我们都是在地面系画,因为毕竟一张图只有一个坐标系嘛。那么,我们能不能在一张图里同时把地面系和火车系两个惯性系都画上呢

答案当然是可以的。

09两个坐标系

我们来具体看看这个问题:假设我们现在已经画了一个地面系的直角坐标系x-t,那么我们要如何把火车系的坐标系x’-t’画出来

几何学的真实原理(闵氏几何是什么)(16)

第一次遇到这个问题的同学可能有点懵,不着急我们一步步来,我们先看看火车系的纵轴t’要怎么画。要画火车系的纵轴,我们先想想一个坐标系的纵轴的是什么意思?我们知道如果我们让一个点的横坐标为零,那么这个点的轨迹就是跟纵轴重合的。还记得我们上面说的静止粒子的世界线么?静止粒子的空间坐标x为0,所以它的世界线就是垂直于x轴,与t轴重合的一条直线。那么,火车系的t’轴自然也是在火车系里静止在原点处粒子的世界线

这一点很重要,大家好好理解一下,也就是说我们只要把火车系处于原点处粒子的世界线画出来,我们就能得到火车系的t’轴。那么,一个在火车系静止的点,在地面系看来它是在做匀速直线运动,而匀速直线运动的点的世界线,我们上面也说了,就是一条比45°更陡的斜直线。所以,火车系的t’轴就是这样一条更陡的斜直线,如下图所示:

几何学的真实原理(闵氏几何是什么)(17)

火车系的t’轴画好了,那火车系的x’轴呢?大家可以看到我在图上用虚线画了一根与t’垂直的轴,并且特意标明了“错误的x’轴”。为什么要这样标呢?因为这是相对论初学者极容易犯的错误。我们已经习惯了欧式几何,欧式几何里直角坐标系都是相互垂直的,所以到了这里很多人看到我们已经画出了t’轴,就立马条件反射地画一根和t’轴垂直的当做x’轴,但是这是错误的,为什么呢?

这里我们第一次感受到了闵氏几何的异样。我在最开始花了那么大的篇幅告诉大家为什么狭义相对论要使用闵氏几何,我们也知道了闵氏几何的线元跟欧式几何不一样(时间项前面多了一个负号),所以,我们在画时空图处理狭义相对论问题的时候,一定要意识到自己虽然是在欧式平面里画图,但是我们画的是闵氏几何里的图形

有人可能会有点疑问,我们前面不是已经用时空图解决了同时的相对性问题么?我们不是已经把爱因斯坦火车闪光问题用时空图画出来了么,我没感觉啥异样啊?那只是因为那个问题比较简单:它只有一个坐标系,而且也不涉及到线长相关的问题,所以我即便在一个欧式直角坐标系里把它画出来了,它也暂时没什么冲突。如果我们生活在一个闵氏空间里,那么我们画出的闵氏直角坐标系肯定都是相互垂直的,但是我们生活在欧式空间里,我已经用一个欧式空间里的直角坐标系画了一个闵氏坐标系,那么另一个就肯定不可能再是垂直的了。

这里的逻辑有点绕,大家可以细细品味,搞得不是很懂也不要紧,我接下来会把另一个坐标系画出来,大家能看懂再回去看上面的一段话就明白了。

好,回到正题,我们再来看看火车系正确的x’轴该怎么画。我们再来整体回顾一下这个事情:我们现在是已经画好了地面系x-t,要画火车系x’-t’,火车系和地面系它有没有什么关系呢?有啊,洛伦兹变换说的不就是地面系和火车系的关系么?什么是洛伦兹变换?比如我在地面系观测到了一个粒子的位置和速度,现在我想知道它在火车系里是什么情况,我并不需要重新再到火车系里测量一遍这个粒子的位置和速度,我只需要根据洛伦兹变换就可以直接得到火车系里那个粒子的运动情况。所以,洛伦兹变换就是两个惯性系之间的联系,我只要知道了一个惯性系里粒子的运动情况,立马我就可以知道其他惯性系里粒子运动的情况。

所以,我们可以根据洛伦兹变换来找到两个惯性系之间的联系。我现在不是根据地面系的坐标轴来找火车系的坐标轴么?我们对着洛伦兹变换改就是了。洛伦兹变换是下面这样的:

几何学的真实原理(闵氏几何是什么)(18)

其中,x,y,z,t代表地面系里观测到的,x’,y’,z’,t’是火车系里观测到的。v是火车系相对地面系的速度,火车的速度一旦给定了,这个v就是一个定值,c是光速,所以右边的γ都是一个常数。如果我们再根据几何单位制来,取c=1,那么洛伦兹变换就可以简化成下面的样子:

几何学的真实原理(闵氏几何是什么)(19)

因为我们只考虑火车系相对地面系在x轴方向上的运动,所以在y和z方向上还跟原来一样,我们可以不考虑。我们现在画图也是来画x-t图,所以我们重点关注这两个式子:

几何学的真实原理(闵氏几何是什么)(20)

这是什么呢?这不就是火车系了的x’和t’么?我现在要画的就是x’的坐标轴,也就是火车系的空间坐标轴,那怎么找到这个坐标轴呢?这个我们前面也提过:纵坐标的那条线就是横坐标为0的所有点的集合,反过来也是,横坐标就是纵坐标为0的点的集合。所以,我们令火车系的时间等于0,也就是纵坐标t’=0就能找到横坐标x’轴了

那我们令t’=γ(t-vx)=0,因为γ是一个不为零的常数,所以就只有t-vx=0了,也就是t=vx

这在x-t坐标系里就是一条过原点的直线,斜率为火车的速度v(斜率就是这条直线的倾斜程度,你可以理解为一个坡越陡斜率越大。当直线与横轴重合的时候,斜率为0;当直线跟横轴成45°的时候,斜率为1;当直线跟纵轴重合的时候,斜率为无穷大)。因为我们这里是几何单位制,光速为1,在狭义相对论里任何有质量的物体它的运动速度都是小于光速的,所以火车的速度v肯定是小于1的,也就是说这条直线的斜率比45°的直线(刚好是光的世界线)小。

再者,我们可以用同样的方法令x’=γ(x-vt)=0,就能得到火车系的纵轴是这样一条直线:t=x/v。它的斜率是1/v,因为v小于1,所以1/v是个大于1的数,所以这条斜直线的斜率比45°要大(我们前面画的也正是这样)。这里我给一个初中数学的结论:斜率互为倒数(比如v和1/v)的两条直线它们是关于y=x,也就是45°的直线对称的。所以,我们的x’轴是跟t’轴关于45°的直线对称的。这样我们就能精确地把它画出来了,如下图:

几何学的真实原理(闵氏几何是什么)(21)

第一次看到这样一个坐标系的同学可能会感觉非常别扭,为什么火车系x’-t’的坐标系不是正交的,不是一个直角呢?我们得这样看:它们是正交的,只不过它们是在闵氏几何里正交,我们现在强行把它画在欧式几何里,那么肯定就看起来不正交了

还有同学也会有疑惑,你不是说狭义相对论里惯性系都是平权的么?那么为什么这里把地面系画成直角的,而把火车系画成了一个小于直角的坐标系?我要是人就在火车里,我非要把火车系画成直角的,不行么?行,当然行。你可以按照上面的思路把火车系画成直角的基准系,再反推过去画地面系,最终的两个图虽然形状不一样,但是实质上还是等价的。

理解这个双坐标系非常关键,它第一次向我们展示了闵氏几何不一样的地方。有了它,我们就可以很方便的处理不同惯性系里的一些事情,比如,我们喜闻乐见的尺缩效应。

10尺缩效应

……

文章太长只能分两篇,剩余部分见下篇~

下篇:闵氏几何是什么?它如何统一时空并极大简化了狭义相对论?(下)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页