一. 從光的折射到最速降線的提出
初中都學過光的折射原理, 想必各位一定非常熟悉下面這張圖片以及公式:
這個公式就是著名的Snell公式, 那麼這個公式是如何推出? 這個規律是怎麼得出的? 或者更直接一點, 為什麼光在不同介質會發生折射現象? 1650年法國數學家費馬 (Fermat) 提出光通過介質時滿足所耗時間最短, 或光程 (Optical path length) 最短原理, 這被認為是最小作用量應用的第一個例子. 簡單來說, Fermat認為, 光在經過不同介質的時候, 自動會選擇耗時最短的路徑, 而光在水中以及空氣中的速度並不同, 所以光為了"省時"而選擇了"費力"的非直線路徑! 就好比你要穿過河流到斜對岸, 你並不會直接選擇先跑過去然後遊泳的直線路徑, 因為跑步和遊泳的速度並不一樣, 由於跑步的速度大於遊泳的速度, 所以我們肯定是選擇多跑一段直線距離, 從而減少遊泳的距離 (這不就是初中幾何應用題麼哈哈哈)
這就是大名鼎鼎的Fermat原理, 而我們其實用幾何方法也可以非常容易證得折射公式! 但是, 問題就在於Fermat提出的所謂 "最短時間原理 (Principle of least time)" 的理論依據是什麼? 為什麼光會自動選擇時間最短的路徑? 我們似乎已經對最小作用量原理有了猜測, 是否自然界的萬物的變化皆會有個所謂的"最小作用量", 這個最小作用量到底是什麼? 我們保留疑問, 來看到下一個數學史上非常著名的最速降線 (Brachistochrone curve) 問題.
1630年,伽利略在做斜面實驗時發現,兩個相同的小球從起點滑向終點,最快的路徑並不是直線而是一條曲線。我們知道兩點之間的直線只有一條,但曲線卻有無數條,一個問題便是在這許多曲線中哪一條是最快的曲線?這就是著名的最速降線問題。伽利略認為最快的曲線是一條弧線(圓的一部分),這是錯誤的。1696年,約翰·伯努利將小球下落的空間分成許多小的下落層,每層高度為h,當h很小時,可認為小球做勻速運動,利用能量守恆定律,可求得小球到達每一層速度均不同。小球為了在最短時間內下落,速度方向就會不斷改變,當h趨近於無窮小時,路徑就變成一條連續的曲線,即最速降線。可以證明它是一條倒著的擺線。二. 泛函的極值-變分問題
首先搞清楚什麼是泛函. 泛函簡單來說是函數的函數 (這裡和複合函數有區別, 泛函中定義域是函數組成的集合: A functional is a mapping from a set of functions to the real numbers.), 你給泛函輸入一個函數, 泛函就輸出一個數值. 我們用最速降線的例子來解釋什麼是泛函. 我們在研究小球降落的不同路徑會得到不同的時間, 很顯然, 我們可以定義時間T為函數的因變量或者輸出數值, 而輸入值也就是自變量是不同的路徑, 這不同的路徑就是泛函的自變量, 因為不同路徑是用不同的函數表示出來.其中x1, x2是兩個給定點的是橫坐標, 多元函數f是關於x, y和y'的函數(where f is a function assumed to have atleast second-order continuous partial derivatives with respect to x, y, and y'), 泛函J(y)表示在不同的路徑選擇下的輸出值, 我們可以理解為是時間t. 我們把這樣的問題稱為固定端點變分問題 (fixed endpoint variational problem). J在y的可取範圍內有極值 (local extremum). 現在我們給y加上擾動εη(x), 這個式子就變成了
也就是說, 多元函數f的自變量變成了由y的擾動而產生的無數可能路徑y-bar, 而y+εη, y'+εη'都是關於x的函數, 多元函數f也是關於x的函數, 而這個泛函是對x積分, 所以經過定積分之後變量就變成了ε, 如下圖:
這樣泛函J就可以寫成是關於ε的時間函數T. 這時候重點的推導步驟來了, 我們為什麼要在這裡把變分問題稱為泛函極值問題, 就是因為我們需要在不同路徑下選擇時間最短的路徑, 也就是令T(ε)達到最小的時候的路徑, 也就需要求T(ε)的極值, 我們可以通過令T的一階導數為0. 於是我們有:
因為當T取到極值的時候, y-bar也就和y重合, 也就是擾動為0, 但是擾動函數η不能恆為0, 不然就不會產生擾動, 我們只能令常數ε (當然這裡是作為變量) 為0, 即ε=0, 我們改寫以下公式:
也就是說, 泛函J的變分就是在ε趨近於0的時候的T對ε的一階導數, 令其等於零, 就是令泛函J的變分等於零. 只要在泛函中加入任何擾動, 都會使泛函的值變大, 所以擾動為0的時候, 就是泛函關於擾動的一個極小值. 擾動用一個很小的數ε乘上一個連續函數η(x). 當ε趨近於0, 意味著擾動也趨近於0. 所以當擾動為0時, 泛函對擾動程度的導數也為0. 這就非常巧妙的把對函數求導的問題轉化成了一個單變量求導問題.
三. 歐拉-拉格朗日方程
接下去我們對泛函的變分δJ=0做進一步運算, 利用分部積分:
將結果代入δJ, 得到,
四. 總結
看到這裡, 其實我們已經能理解什麼叫做變分法, 簡單來說就是從一個狀態達到另一個狀態會有不同的路徑, 不同的路徑代表最優的路徑加上擾動, 這些擾動就是變分. 我們要求最優路徑非常簡單, 就是令擾動趨近於0, 這樣就把問題簡化成求導問題, 最後導出歐拉方程. 顯然, 最小作用量原理的推導必須要用到變分法的知識, 所以下一塊內容就正式進入分析力學, 讓我們拭目以待!Reference
1. S. Axler, F.W. Gehring, K.A. Ribet, Calculus of Variation.
2. 張偉偉, 淺說最小作用量原理,值得你學習! 環球物理.
3. 知乎用戶, 如何理解最小作用量原理? https://www.zhihu.com/question/26435474/answer/115096370