"上帝的饋贈: 最小作用量原理 (1)-泛函變分法

2021-02-15 MrScience參上
最近沉迷於物理世界, 學到分析力學的最小作用量原理 (Principle of least action), 不禁感嘆自然世界之奇妙, 正如愛因斯坦評價, 它使物理學家們窺探到了那麼一點點「上帝」創造世界的秘密. 所以非常想寫篇關於這個美妙的物理定律的文章, 正好我也藉此機會給自己的理論體系梳理一遍.
全文會有點長, 所以我主要打算分成若干部分, 這一部分主要是講最小作用量原理的理論數學基礎: 泛函求極值問題-變分法. 

一. 從光的折射到最速降線的提出

初中都學過光的折射原理, 想必各位一定非常熟悉下面這張圖片以及公式:

這個公式就是著名的Snell公式, 那麼這個公式是如何推出? 這個規律是怎麼得出的? 或者更直接一點, 為什麼光在不同介質會發生折射現象? 1650年法國數學家費馬 (Fermat) 提出光通過介質時滿足所耗時間最短, 或程 (Optical path length) 最短原理, 這被認為是最小作用量應用的第一個例子. 簡單來說, Fermat認為, 光在經過不同介質的時候, 自動會選擇耗時最短的路徑, 而光在水中以及空氣中的速度並不同, 所以光為了"省時"而選擇了"費力"的非直線路徑! 就好比你要穿過河流到斜對岸, 你並不會直接選擇先跑過去然後遊泳的直線路徑, 因為跑步和遊泳的速度並不一樣, 由於跑步的速度大於遊泳的速度, 所以我們肯定是選擇多跑一段直線距離, 從而減少遊泳的距離 (這不就是初中幾何應用題麼哈哈哈)

這就是大名鼎鼎的Fermat原理, 而我們其實用幾何方法也可以非常容易證得折射公式! 但是, 問題就在於Fermat提出的所謂 "最短時間原理 (Principle of least time)" 的理論依據是什麼? 為什麼光會自動選擇時間最短的路徑? 我們似乎已經對最小作用量原理有了猜測, 是否自然界的萬物的變化皆會有個所謂的"最小作用量", 這個最小作用量到底是什麼? 我們保留疑問, 來看到下一個數學史上非常著名的最速降線 (Brachistochrone curve) 問題. 

1630年,伽利略在做斜面實驗時發現,兩個相同的小球從起點滑向終點,最快的路徑並不是直線而是一條曲線。我們知道兩點之間的直線只有一條,但曲線卻有無數條,一個問題便是在這許多曲線中哪一條是最快的曲線?這就是著名的最速降線問題。伽利略認為最快的曲線是一條弧線(圓的一部分),這是錯誤的。1696年,約翰·伯努利將小球下落的空間分成許多小的下落層,每層高度為h,當h很小時,可認為小球做勻速運動,利用能量守恆定律,可求得小球到達每一層速度均不同。小球為了在最短時間內下落,速度方向就會不斷改變,當h趨近於無窮小時,路徑就變成一條連續的曲線,即最速降線。可以證明它是一條倒著的擺線。

John Bernoulli所提出的最速降線問題, 是變分法 (Calculus of Variations) 發展的標誌. 變分學作為數學的一個分支, 其創立與物理學是分不開的. 那什麼是變分法? 我們接下來就要從泛函 (Functional) 的極值開始講起. 

二. 泛函的極值-變分問題

首先搞清楚什麼是泛函. 泛函簡單來說是函數的函數 (這裡和複合函數有區別, 泛函中定義域是函數組成的集合: A functional is a mapping from a set of functions to the real numbers.), 你給泛函輸入一個函數, 泛函就輸出一個數值. 我們用最速降線的例子來解釋什麼是泛函. 我們在研究小球降落的不同路徑會得到不同的時間, 很顯然, 我們可以定義時間T為函數的因變量或者輸出數值, 而輸入值也就是自變量是不同的路徑, 這不同的路徑就是泛函的自變量, 因為不同路徑是用不同的函數表示出來. 

其中y表示的是最短的路徑, y-hat表示的是其他可能路徑的集合 (也可記作y-bar, 即在y上加一小橫槓), 可以認為是在y的基礎上加上y的動 (perturbation), 是所有的加上擾動的函數集合. 所以η表示擾動函數, ε是一個常數, 用來擾動的程度大小. 

由於路徑的初始點和終點確定, 所以在這兩點的擾動為0, 即η(x1)=η(x2)=0. 我們把這個擾動稱為變分 (Variation), 用δy表示, 即

微積分中, 我們都熟知分 (differential) 的概念, 那麼變分和微分有什麼區別呢? 我們可以通過下圖來區分兩者:

我們可以發現, 簡單來說微分是用來描述函數本身的變化 (dy, 函數y的微分), 而變分則是描述由於函數擾動而產生的變化 (δy, 函數y的變分). 但是微分和變分算子運算規則類似, 我們可以先推導變分算子和微分算子之間的關係: 

這兩個推導公式告訴我們: 1. 微分算子和變分算子換序結果不變; 2. 變分算子可以穿插積分內外. 我們可以利用這個結論去完成進一步數學推導工作. 

其中x1, x2是兩個給定點的是橫坐標, 多元函數f是關於x, y和y'的函數(where f is a function assumed to have atleast second-order continuous partial derivatives with respect to x, y, and y'), 泛函J(y)表示在不同的路徑選擇下的輸出值, 我們可以理解為是時間t. 我們把這樣的問題稱為固定端點變分問題  (fixed endpoint variational problem). J在y的可取範圍內有極值 (local extremum). 現在我們給y加上擾動εη(x), 這個式子就變成了


也就是說, 多元函數f的自變量變成了由y的擾動而產生的無數可能路徑y-bar, 而y+εη, y'+εη'都是關於x的函數, 多元函數f也是關於x的函數, 而這個泛函是對x積分, 所以經過定積分之後變量就變成了ε, 如下圖:

這樣泛函J就可以寫成是關於ε的時間函數T. 這時候重點的推導步驟來了, 我們為什麼要在這裡把變分問題稱為泛函極值問題, 就是因為我們需要在不同路徑下選擇時間最短的路徑, 也就是令T(ε)達到最小的時候的路徑, 也就需要求T(ε)的極值, 我們可以通過令T的一階導數為0. 於是我們有:

因為當T取到極值的時候, y-bar也就和y重合, 也就是擾動為0, 但是擾動函數η不能恆為0, 不然就不會產生擾動, 我們只能令常數ε (當然這裡是作為變量) 為0, 即ε=0, 我們改寫以下公式:

也就是說, 泛函J的變分就是在ε趨近於0的時候的T對ε的一階導數, 令其等於零, 就是令泛函J的變分等於零. 只要在泛函中加入任何擾動, 都會使泛函的值變大, 所以擾動為0的時候, 就是泛函關於擾動的一個極小值. 擾動用一個很小的數ε乘上一個連續函數η(x). 當ε趨近於0, 意味著擾動也趨近於0. 所以當擾動為0時, 泛函對擾動程度的導數也為0. 這就非常巧妙的把對函數求導的問題轉化成了一個單變量求導問題. 

三. 歐拉-拉格朗日方程

接下去我們對泛函的變分δJ=0做進一步運算, 利用分部積分: 

將結果代入δJ, 得到,

由於擾動函數η不恆為0, 所以令上式等於0的條件是大括弧的等式恆為0, 即, 

這就是我們所想要的第一個方程, 稱為歐拉-拉格朗日方程 (Euler-Lagrange Equation), 也被稱為歐拉方程的第一種形式.  兩端固定問題的邊界值為y(x1)和y(x2). 如果f不顯含x, 也就是f與x無關, 我們可以得到歐拉方程的第二種形式:

這個方程可以幫助我們求解泛函下的極值, 這裡f是已知的. 我們可以這個方程解決很多工程上複雜的問題, 比如上面提到的最速降線, Fermat原理, 懸鏈線問題等等. 對於最速降線來說, 可以用f表示路徑函數, 然後利用這個微分方程求解最短路徑y. 具體計算不再贅述, 有興趣可以看下圖詳細證明過程, 可以看出最速降線實質就是擺線 (Cycloid)


四. 總結

看到這裡, 其實我們已經能理解什麼叫做變分法, 簡單來說就是從一個狀態達到另一個狀態會有不同的路徑, 不同的路徑代表最優的路徑加上擾動, 這些擾動就是變分. 我們要求最優路徑非常簡單, 就是令擾動趨近於0, 這樣就把問題簡化成求導問題, 最後導出歐拉方程. 顯然, 最小作用量原理的推導必須要用到變分法的知識, 所以下一塊內容就正式進入分析力學, 讓我們拭目以待!

Reference

1. S. Axler, F.W. Gehring, K.A. Ribet, Calculus of Variation. 

2. 張偉偉, 淺說最小作用量原理,值得你學習!  環球物理. 

3. 知乎用戶, 如何理解最小作用量原理?  https://www.zhihu.com/question/26435474/answer/115096370

相關焦點

  • 圖像處理中的數學原理詳解10——理解泛函的概念
    2.4 從泛函到變分法本文引用地址:http://www.eepw.com.cn/article/201703/346087.htm  作為數學分析的一個分支,變分法(Calculus of
  • 39.積分、泛函 + 歐拉-拉格朗日方程、實數、標量、變分法、極值、弧微分、範數(數學篇)
    變分法(高數)極值(高中)弧微分(高數)範數(高數)看不懂call小嗷2.1 積分積分是微積分學與數學分析裡的一個核心概念。2.最速降線最速降線問題是伽利略提出的著名問題:一個質點在重力作用下,從一個給定點到不在它垂直下方的另一點,如果不計摩擦力,問沿著什麼曲線滑下所需時間最短。
  • 最速降線與測地線:變分法及兩個例子
    摘要:變分法是求解泛函極值問題的方法。
  • 關於工程力學中的各類變分原理
    另一方面,當應力、應變關係能保證餘能函數的存在又假定在應力變化的過程中幾何邊界條件不變時,根據餘虛功原理就有最小餘能原理成立(這意味著表示系統總餘能的泛函取駐值),通過引入Lagrange乘子把最小餘能原理加以推廣,同樣也可產生一整族的變分原理。
  • 扔個包子出去狗跑直線的秘密,物理學的最小作用量原理
    骨頭、羽毛、植物的莖、蜂巢、螞蟻窩的構造,都是最符合自身的目的,又是最節省原材料的。這些自然現象的背後,就是最小作用量原理。圖2 太空中的水滴是個完美的球形最小作用量原理的演變過程最小作用量原理從一開始的朦朧、模糊的觀念到定量化的具有完美數學表達式的物理學基本原理,經歷了漫長的發展演變過程。
  • 變分法——歐拉-拉格朗日方程
    之前我們接觸的最多的是函數:也就是數與數的對應,今天我們來接觸一個更高一級的玩意:泛函
  • 物理學中最小作用量原理-恆態的世界
    物理學中最小作用量原理-恆態的世界首先說明,本文旨在以通俗易懂的語言描述物理學中的最小作用量原理,不用公式定理,也不提及物理學家的名字,純粹以說理方式闡述,更嚴謹更科學的描述可以參見由科普中國審閱的百度百科詞條:最小作用量原理
  • 【物理攫英】密度泛函理論與第一性原理分子動力學簡介
    其歷史可以追溯到Thomas、費米Fermi和Dirac的研究中,他們依據局域電子密度的簡單泛函得出了動能與多體系交換能的近似表達式。隨後,Slater 用法進一步闡述了這些構想,最後,直到六十年代中期,Kohn及其他研究人員才共同奠定了現代理論的基礎。自那時起,特別是在過去的二十年中,密度泛函理論在電子結構問題中的應用有了很大幅度的增長。
  • 螞蟻都知道走折射路線,最小作用量原理的物理之美
    假如你是造物主,想用最簡潔的原理創造一個有規律的世界,那麼最小作用量原理可能是你的最佳選擇,因為這條原理貫穿了經典物理學到現代物理學,甚至在宇宙學、經濟學、生物學中都發揮著作用。最小作用量原理費馬原理雖然只適用於幾何光學當中,但是在其他領域同樣起著指導作用,比如約翰·伯努利曾經藉助這個思想,成功地解決了最速降線問題。有了費馬原理的思想,再經過多位數學家和物理學家的推進,在18世紀發展出最小作用量原理。
  • 特約報告:密度泛函理論
    密度泛函之所以成為理論,其基礎在於Hohenberg- Kohn定理嚴格證明了體系的基態密度和體系的能量之間有一一對應的關係,並可以通過以許可的密度函數為搜索變量,使體系的能量泛函極小化以尋找體系的基態密度並由此得到體系的基態能量及其他性質。遺憾的是,能量泛函的精確形式迄今未知。因此尋找越來越精確的近似泛函是密度泛函理論研究最基本的問題。
  • 密度泛函理論(二)
    Kohn-Sham方程下面我們需要求解能量泛函的最小值,也就是體系的基態,在求解能量最小值的時候,需要注意到系統的波函數需要滿足正交關係在密度泛函理論中,所有的量在理論上都是精確的,只有交換關聯泛函採用的是近似方法得到的。通常的近似方法有局部密度近似(LDA)和廣義梯度近似(GGA)。1. 局域密度近似
  • 密度泛函理論(五):實際計算中的問題
    在實際應用中,由於計算量和波函數函數積分的問題,我們還需要考慮能量截斷和模糊處理(smearing)。然後,本文將簡要介紹密度泛函理論在實際計算中的算法和第一性原理-分子動力學方法。離子能量的最小化指,在進行電子能量最小化後,計算每個離子的受力,然後將離子能量最小化,在連續進行電子能量最小化和離子能量最小化後,整個體系的能量將達到最小化。
  • 關於密度泛函理論(DFT)的基本假設和理論
    然而,對於化學所研究的體系來說,很多方法的問題是運算量太大,對於動輒成千上萬個原子的模擬往往力不從心。二、Hohenberg – Kohn 定理1. H-K第一定理:對於一個電子密度和能量1. 局域密度近似(Local Density Approximation, LDA)LDA是最簡明的交換-關聯泛函,並且提出得很早——幾乎是和DFT一起提出的。注意,LDA本身不是一個泛函的名稱,而是一種近似方法;LDA包含很多泛函。LDA的思想從其名稱就可以看出來:我們可以近似認為空間各點處的
  • 分析學的5大「步」:微積分到函數論、泛函分析、微分方程
    年,卡瓦列利發表不可分元法的論文,提出卡瓦列利原理,用於計算面積和體積;1650年,沃利斯把卡瓦列利的方法系統化,並進行推廣。微分起源於作曲線的切線和函數的極大值、極小值問題。首位真正的先驅工作是,費爾馬於1629年陳述的概念;1669年,巴羅使用了微分三角形,這已經很接近現代微分法。
  • 常見的交換關聯泛函
    局域密度近似泛函(LDA)局域密度近似泛函(Local Density Approximations)是最簡單的一種近似方法。該方法假設交換關聯勢僅和電子的密度有關,即如果再考慮自旋,上式還須改寫成雜化泛函(Hybrid functionals)不論是局域密度近似泛函(LDA)還是廣義梯度近似泛函(GGA)普遍存在一個問題:用它們計算的帶隙常常小於實際測量值。對於光伏材料來說,帶隙絕對是最重要的幾個參數之一,為了能夠準確地計算帶隙,在這裡我們還要介紹雜化泛函。
  • 密度泛函理論初探(更正版)
    Schrodinger方程中最討厭的是加和項,對於多電子體系(除氫外幾乎全部中槍)這個方程的維度動輒可以達到數十維,比如一個水分子擁有10個電子,其全波函數是30維的。而對於一個蛋白質分子...呵呵噠。
  • 《創世記》中的上帝觀
    :創1:1;創15:15;創28:15;創21:33  上帝的名稱在《創世記》中有許多,都有豐富的屬靈含義。我們通過本書的上帝觀可以更好地認識上帝,親近上帝,服侍上帝,見證上帝的聖名。一、創造宇宙萬有的神詩104:24「耶和華啊,你所造的何其多,都是你用智慧造成的,遍地滿了你的豐富。」二、尋找失喪的人的神  創3:9「耶和華 神呼喚那人,對他說:『你在哪裡?』」
  • 密度泛函理論簡介:A brief summary
    當然,對於密度泛函理論,仍應以一種批判的眼光看待:它不是萬能的。從實際操作層面上來說,儘管密度泛函理論已經成為物理、化學、材料等研究領域的基礎工具之一,具有足夠高的計算精度,但它其實並不能求出薛丁格方程的精確解,因為交換關聯泛函的精確形式永遠無法準確給出,這使得計算所得出的結果與實際結果之間必然存在誤差。
  • 實變函數與泛函分析錦囊
    >5積分論6微分與不定積分7度量空間和賦范線性空間8有界線性算子和連續線性泛函9內積空間和希爾伯特 (Hilbert) 空間0課程簡介 1集合 (set) 1.1集合的表示1.2集合的運算1.3對等 (equipotency) 與基數 (cardinal)1.4可數集合 (countable set)1.5不可數集合 (uncountable set)1.6 本章小結2點集 (point set