一般我們在教科書上,看到廣義相對論的由來基本都是這個樣子的:
狹義相對論橫空出世,成功地解釋了Maxwell方程和麥可-莫雷實驗等一系列別的當年有問題的實驗,接著人們以電磁理論的狹義相對論化的成功案例為出發點,開始嘗試當年已有的各種別的理論的相對論化,大部分都取得了成功,但在搞牛頓引力的時候發生了不可調和的障礙,等等等等,於是進程中斷,最後愛因斯坦通過水桶實驗進而想到了等效原理,從引力質量與慣性質量的相等發現了引力與非勻速直線運動的等價,並最終發現了廣義相對論,最終解決了這個大難題。當然在這個序列中肯定還會提一下牛頓引力在當時看來的一些問題比如水星近日點進動,這標誌著牛頓引力存在缺陷甚至是根本性的紕漏,所以需要「升級」。
這是最一般的歷史流程,我們從狹義相對論出發,自然地將各種線索串聯起來,並最終得到了廣義相對論。
但,我們也可以從一些完全不同的角度出發來考慮廣義相對論的由來,比如,我們接著上次的文章(關注我們的公眾號「奇蹟號」並發送「狹義相對論」提取閱讀),接著往下走。
###
在《狹義相對論》一文中,我們已經論述了,在滿足一些看上去非常基本沒有任何特別之處的條件後,我們自然而然地就得到了狹義相對論所要求的閔科夫斯基時空。
接著,如果我們為時空加上「各向同性」與「時空平移不變」,我們就自然得到了狹義相對論。
那麼,一個很自然的問題就來了:如果後面兩個條件不加上,會怎麼樣?
讓我們將上面這兩個條件換成一個更加寬泛的條件:時空上每個時空點周圍的鄰域,都同構於一個同樣維度的閔科夫斯基時空。
也可以這麼說,每個時空點的領域和一個標準的狹義相對論的閔科夫斯基時空之間,只差一個坐標變換。
很顯然,這樣定義的時空比狹義相對論中的時空要寬泛得多,所以這樣的時空及其上的物理學,我們就稱為「廣義相對論」。
好了,上面是一個框架性的定義,下面開始看看在這個定義下,具體會有一些什麼樣的好玩的東西。
首先,我們要找出刻畫著兩者的基礎物理量或者說數學對象。
在狹義相對論中,我們已經知道,物質的運動所導致的就是世界線的傾斜,這個過程可以看作是一個時空上的贗轉動,或者說Boost,推動。
其中的坐標變換可以寫為(為了簡化,我們只考慮一個空間方向):
進一步,為了簡單又不失一般性,我們可以通過恰當的坐標單位選擇,使得這個閔科夫斯基時空的特徵速度或者說極限速度為1(這就是自然單位制),從而可以化簡為:
這樣的坐標變換下,我們最感興趣的自然就是這麼一個東西:裡面有什麼是不變量麼?
容易發現,時空的「長度」是一個不變量:
即,無論v取什麼值,這個長度在上述坐標變換下都是不變的。
進一步,這個如果寫成真正的三維空間加一維時間的(3+1)維時空形式,那麼這個長度就是:
或者可以用張量的手法寫為:
而,所有的坐標變換都可以看作是左邊的形式不變,改變的是右邊的那個張量。同時我們又知道坐標變換對應的就是每個時空點鄰域上的那個特有的性質,因此也就是說,這右邊的張量現在應該就是我們要找的那個物理量,那個數學對象。
我們稱這個張量為「度規張量」,因為它給出了時空上一個鄰域內的「長度」的定義。
同時我們也知道,在閔科夫斯基時空中,勻速直線運動所帶來的坐標變換是不會改變這個張量的。也就是說,引起度規張量改變的,絕對不是勻速直線運動這麼平庸的東西。
因此,我們現在手上所有的就是這麼一個東西:
一個時空M,其上的每個點都可以由一組坐標x^μ給出,同時,每個坐標位置x^μ的鄰域內,都有一個只屬於其內部的度規張量g_μυ(x^μ)。
於是,一個很自然的問題就是:在這麼一個直觀上很「擰巴」的時空上,一個「不受任何外力」的點粒子,會如何運動?
既然說是「不受任何外力」,那也就是說,這枚點粒子的運動是「勻速直線」運動——只不過,現在在這個「擰巴」的時空裡,這種「勻速直線」在每一個鄰域上都成立,但連結成一個整體的時候則未必了。
這種局部上是勻速直線而整體上卻不是的特性,我們可以用一個數學對象來刻畫,它成為「聯絡」。
而,在繼續介紹聯絡之前,我們從另一個角度出發來考慮這個問題。
在傳統的物理世界中,「不受外力作用」的粒子的運動軌跡,可以用另一個數學概念來刻畫,那就是「最短路徑」。
比如在一個什麼都沒有的空間中,點粒子的運動是直線,因為直線是連結兩點的最短路徑。而,如果我們來看一個光線從空氣射入水中的運動軌跡,此時我們都知道會發生折射現象,而這種折射也可以用「最短路徑」來刻畫——當然,這裡更直觀的說法是「最短耗時」。
因此,如果我們將這個原理「借用」到現在的新的時空中,那麼這個問題就變成了求這麼一個「擰巴」的時空上的最短路徑,或者這裡更應該說是「極值路徑」的問題了:
其中,對線元l的積分和對線元l的平方的積分,在線元l必然不小於零的情況下,很容易證明是等價的,而這裡之所以用線元的平方,僅僅是因為這樣計算方便(俗稱偷懶)。
而,現在的積分其實就是在給定路徑x^μ(t)的情況下,對這個路徑上每一點的線元求積分,即是路徑的泛函。而在給定初態末態的情況下,求泛函的極值所對應的路徑,要用的就是(固定初末態的)變分為零這個數學工具了,因此後面就是一陣沒啥技術含量的計算。
唯一需要說明的,就是度規張量g_μυ是存在「逆」的,也就是最後一行右側的那一段補充:g^μυ。這個逆元的作用,就是和度規張量無論以哪種方式乘在一起,最後都得到一個「單位矩陣」,這也是最後一行中比較麻煩的步驟所在。
而,進一步,對於最後一行的結果,我們可以進一步構造如下的東東:
由於現在度規和路徑的選擇無關,所以這裡最後的結果可以說是最一般化以後的結果了,其中Γ部分可以被完全確定下來,而C部分則只能確定到它對於兩個下標是反對稱的(第二行右側)。
我們將Γ部分稱為時空的「聯絡」,而C部分稱為時空的「擾率」。
其中,在低速情況下,速度矢量v^μ的時間分量v^t基本保持為1,而其三個空間分量基本為0,從而上面的式子告訴我們:現在點粒子運動受到的「加速度」基本完全就是由度規所決定的了。這就可以類比到各種形形色色的「勢能場」上去了,比如我們的終極目標:引力場。
同時,看,我們又看到「聯絡」這東西了。
聯絡的本意,指的是將一個點的鄰域和它「隔壁鄰居」那個點的領域聯繫起來的數學對象,即:
你看,這裡無窮小間隔的鄰域之間坐標變換就是最後那括號中的東西。
因此,回到那個「不受外力作用」的點粒子的「自由」運動問題上來,顯然此時既然點粒子的運動不受別的因素的作用,那唯一影響其軌跡的就只是不同點之間的「坐標變換」了,也就是說,只有這個代表了「無窮小間隔上的坐標變換」的聯絡,是改變點粒子運動軌跡的唯一元兇了——這個結論和上面通過極值曲線得到的結論是吻合的。
但,聯絡本身的任意性非常大,而且本身和度規張量沒啥關係。
因此,為了消除那些不合適的、非必須的聯絡的任意性,我們就需要引入一些特殊的限制條件。
讓我們考慮這麼一個情況:一個點的鄰域和閔科夫斯基時空差一個恆等坐標變換,這當然是允許的;而後,它「隔壁」的一個鄰點的鄰域和這個點的鄰域這兩者之間差一個空間轉動,這當然也是允許的。將這樣的構造推廣出去,時空的每個點和那個最初的點之間就差一個純粹的空間轉動,別的什麼都不差——而且,更重要的是,轉動是不會改變度量的。
也就是說,這樣得到的時空,從度量的角度來看,和閔科夫斯基時空是完全一致的,但從聯絡的角度來看,卻暗藏了極大的「引力相互作用」。這樣的情況當然是不允許的。
因此,我們就有必要引入一個條件:度規張量在聯絡作用下是不變的。或者簡稱呼為「保度規」。
這裡就需要解釋一下什麼叫「不變」了。
讓我們考慮標量場在現在這個「擰巴」時空上的「梯度」:
但這個很和諧的關係到了矢量場的「梯度」時,就有點麻煩了,因為現在兩個不同時空點上的矢量場隸屬於兩個不同的鄰域,是在兩個不同的「閔氏時空」中的。
為了解決這個問題,我們就需要使用聯絡——它將兩個鄰域的閔氏時空通過一個坐標變換聯繫在了一起。
從而,現在對於矢量我們就有:
其中括號中分號後的部分只是為了區分現在這個矢量「隸屬於」那個鄰域。
現在這個微分法則稱為「協變微分」。
然後,由於兩個矢量可以和度規張量「合併」稱為一個標量,就如一開始說長度線元的時候那樣,那麼根據微分的萊布尼茲法則,我們就可以很容易地得到關於度規的「協變微分」:
現在,我們終於可以來說說什麼叫「度規張量不變」了,這個意思其實就是說對於度規張量的協變微分,在時空上恆等與零:
這個約束條件就被稱為聯絡與度規的適配條件,由此我們就可以去掉聯絡的各種多餘的任意性,將其唯一確定為:
你看,和前面通過極值曲線得到的結果是一樣的。
非但從兩個不同的角度得到的聯絡是一樣的,我們還可以進一步來考慮現在「不受外力作用」的點粒子的運動方程,直接從聯絡的「坐標變換」的意義出發:既然不受外力作用,那就是說粒子軌跡上的任意一點的切矢量,沿著軌跡的方向看都是「不變」的,即使切矢量在自己方向上的協變微分為零。
用數學公式來寫就是:
看上去是不是特簡單?而且結果就是上面極值曲線的運動方程。
因此,到這裡我們終於可以說:極值曲線和自平行曲線在現在我們的時空中是完全等價的。
當然,在上述推導中,我們是假定了聯絡對它的兩個下標是對稱的。我們可以放棄這個要求,從而就可以得到一個反對稱的張量C,它是非常任意的,而且,就是在極值曲線的研究中所出現的那個「C部分」。
###
現在,讓我們回顧一下。
在上一篇文章的基礎上,我們放棄了「各向同性」與「時空平移不變」這兩個要求,改為每個點的鄰域都與閔氏時空相差一個坐標變換。這個要求的改變,為我們帶來了一個每個點的鄰域都不同的時空,且在每個點的鄰域這個無窮小局部裡,時空觀是狹義相對論的,只不過一旦考慮連起來的整體,就不是狹義相對論的了,而是一個處處擰巴的「彎曲時空」。
在這個時空中,我們假定粒子的運動軌跡是極值曲線,然後得到了運動方程與聯絡的表達。同時,我們又研究了作為連接無窮小間隔的兩點及其鄰域的坐標變換的聯絡,並為了消除這種定義的聯絡的任意性而引入了適配條件,從而得到了粒子的運動方程和聯絡的表達。
並且,我們發現,這兩條路得到的結果,是一樣的。
因此,我們現在其實建立在這麼三條假設上:
1.假定時空每個點的鄰域和閔氏時空就差一個坐標變換;
2.假定粒子運動軌跡是極值曲線(極長或者極短或者駐值)或者自平行曲線;
3.假定度規和聯絡滿足適配條件的約束。
在這三條假定下,我們得到了粒子的運動方程(從極值曲線和自平行入手的結果等價)、聯絡與度規的關係,以及,相當任意的擾率。
而,愛因斯坦的廣義相對論,就是要求擾率恆為零的上述時空的物理理論。
假設我們將擾率恆為零這個假設去掉,我們就得到了愛因斯坦-嘉當理論,其中通過分析我們發現,物質的質量引起時空度規和聯絡的改變,而物質的自旋則會引起時空擾率的改變。這樣的理論在宏觀上依然是愛因斯坦的相對論,因為宏觀上自旋可以認為可以忽略。但在微觀上,特別在緻密星體內部,此時自旋就不可忽略,從而可以得到和傳統相對論不同的結果。
我們還可以進一步丟掉一些假設。
比如,我們可以去掉度規和聯絡的適配約束,此時聯絡是一個自由量,度規是和聯絡無關的另一個自由量,這樣得到的理論在經典範疇裡意義不大,但在量子化以後卻可以有很不錯的表現,被很多前輩用來構造規範場論化的引力理論,然後再將適配約束作為規範條件引入,總之很有意思。
作為比較,傳統的廣義相對論的量子化方案會考慮將聯絡作為與身為廣義坐標的度規對應的廣義動量。
當然,引力的量子化方案也可以不是在廣義相對論的範疇裡打圈。
比如,彭加萊規範場論認為彭加萊群可以作為和規範場論中的各類李群一樣的主叢結構,從而建立一套完全規範場論形式的彭加萊引力理論,其和廣義相對論在某種程度上也是非常接近的。
我們還可以再進一步扔掉一些假定。
比如,我們可以扔掉前面三個假定的第一條,於是現在時空點的鄰域就可以非常任意了,和閔氏時空可以完全不同。
而,我們知道閔氏時空的特點就是各向同性與處處相等,因此去掉這個假定後的最一般化的時空,就是特徵速度非但在不同點上是不同的,在不同方向上也是不同的,且這種不同無法通過坐標變換來消除。
於是,這就是一個贗Finsler時空。
……
###
我們這次講的主要內容可以看作是在已經知道時空到底是怎麼個扭曲法的前提下(也就是知道了度規張量),物質在上面究竟是怎麼運動的(當然我們只考慮點粒子,非點粒子的話就會有潮汐力,這個也很有意思)。可以說是時空中物質的運動學。
廣義相對論還有另一大部分的內容,是物質作用下時空的運動學,也就是物質是如何影響時空的扭曲與形變的,這個下次再說。
(未完待續)
長按下圖請關注「奇蹟號」