$\S$ 1 最小作用量原理之簡史:
『迄今為止我們的經驗使我們有充分理由相信, 大自然是可構想出來的數學概念之實現。』
--- Albert Einstein (1879 -- 1955) ---
從古希臘時代以來, 追求數學上的簡單與完美成了探索大自然知識的原動力。 這其中最重要的代表性人物當然首推畢達哥拉斯, 這個學派提出兩個信念: 第一、大自然是根據數學原理建立的, 第二、一旦數的結構被抓住, 我們就能揭示大自然的秩序。
聖經創世紀: 上帝說: 要有光於是就有了光。 對於光的追求應是人類歷史最重要的一件事。 歷史上第一個利用極值原理推出光的物理定律可能是古希臘亞力山卓 Hero證明 的反射定律。當光線由一介質到另一介質, 例如由空氣到水時, 不僅光速(率) $v_1$要變化(比如變到$v_2$), 而且連光線的方向也要變化, 後來由 W. Snell(1580--1626) 與法國數學家笛卡兒(R. Descarte; 1596--1650)發現, 光線所走的是這樣子的一條路線, 它使得 $v_1$ 除以 $v_2$ 等於 $\sin\theta_1$ 除以 $\sin\theta_2$。 爾後費馬 (P. Fermat; 1601--1665) 在他去逝的那一年提出一個神秘原理, 今天我們通稱為 費馬原理。這原理證明了, 這條路線也是所需時間最少的路線。 光所選擇的是使得它到達目的地所花時間最短的那條路線。 這似乎暗示光是有人性, 它會選擇甚麼是對它最有利的途徑。
費馬原理(Fermat's principle)在幾何光學的成功引導人們思考, 是不是力學系統也可以用類似此原理, 富有神學、哲學味道的說法導出呢? 答案是肯定的, 就是最小作用量原理(least action principle), 形式與費馬原理略為不同。
最小作用量原理是由18世紀的法國物理學家(Pierre L. M. de Maupertuis; 1698--1759)所提, 其目的之一是 想推廣費馬原理至一般力學系統, 他仍然是從光的理論著手而後宣稱
『作用是質量、速度和所遍歷路徑的乘積的總和, 自然界的行為就是要使這種作用, 及其總和在數學上的複合量, 儘可能的小。』
Maupertuis從最小作用量原理出發, 成功地得到了各種力學、光學定律, 他提出這一原理是為了堅持其神學信仰, 他並且還宣稱這條原理不僅是 自然界的普遍規律, 而且還是上帝存在的第一個科學證明。 自此上帝由古希臘和文藝復興時代科學家認為的"幾何學家" 搖身一變成為更博學的人物, 不單單是幾何學家, 更是對一切都精通的數學大師。
繼 Maupertuis 之後, L. Euler(1707--1783) 亦堅持此信念對變分學(法)與 古典力學作了重要的貢獻, Euler處理的是單個質點運動, 然而 Joseph-Louis Lagrange(1736--1813) 則處理多個質點交互作用的運動, 為此他引進廣義座標的概念而且他的方法比Euler高明, 而Euler也展現高超的人格, 將已經整理好的文章擱置而讓Lagrange先發表, 從此Lagrange就成為Euler的 科學繼承人, 我們將他們推導出來的微分方程稱為Euler-Lagrange方程以 表揚他們的貢獻。Lagrange藉由變分法統一了力學, 而且如Hamilton所言把它處理成 "一首科學的詩", 這個代表作就是 《分析力學》。
一個好的理論有它自己的生命, 是受一種神秘的內在的邏輯支配的。 最小作用量原理到19世紀得到進一步的完善推廣, 其中最重要的工作是愛爾蘭物理學家 William Rowan Hamilton (1805-1865), 他以類比法把牛頓力學發展成強調其與光學之波傳遞之類似性。 他引進所謂的廣義動量及Hamiltonian函數並將Euler-Lagrange方程 改寫為一階聯立微分方程組 就是以他為名的Hamiltonian系統, 自此牛頓力學獲得完美的詮釋並取得 優雅與對稱的形式, 而其重要性在百年之後的量子力學才為人們所認識。
普朗克(Max Karl Ernst Ludwig Planck; 1858一1947), 德國物理學家。 他於1900年 研究黑體輻射導出了能量量子和頻率之間的著名關係式 $$ E=\hbar\nu $$ 引入了以他的名字命名的自然界的一個新常數 $\hbar$, 從而指出了輻射能量的量子性, 開創了物理學的新時代, 成為近代物理學的奠基者。 令人驚訝的是普朗克常數$\hbar$與作用量有相同之量綱, $$ [\hbar] = [E][\nu] ={\rm M}{\rm L}^2{\rm T}^{-2} {\rm L}^{-1} ={\rm M}{\rm L}{\rm T}^{-2} = [\hbox{作用量}] $$ 這也暗示量子力學 可以透過最小作用量原理來詮釋, 最終使得普朗克 成為這個原理最忠實的擁護者。
所有的力學依最小作用量原理或按牛頓定律來描述, 實際上是等價的, 不多也不少。 但是當我們對於物理學的認識超過牛頓力學時, 最小作用量原理的優越性就更加明顯。 有別於牛頓定律, 它讓我們認識到整個過程是重要的, 而且不受座標變換之影響, 透過這個原理加上對稱(symmetry)使人們對於 守恆律有了最深刻之認識。 這些基本上構成了我們理解大自然的根本要素。 最小作用量原理考慮了所有的路徑、經歷, 這似乎展現了大自然人性的一部分, 這也帶給人們無限的安慰, 也難怪有不少物理學家相信造物者是從最小作用量原理的角度來考慮問題。
『當發現了自然界的第一批數學的、邏輯的統一性時, 人們為由此所導致明析的、美麗的和簡單性所陶醉, 相信自己已真正辨認出全能上帝的永恆思想。上帝的心智 在三段式論證中雷鳴與迴響。祂還以圓錐曲線、平方、開方和比例的方式思想, 與歐幾里得一樣作幾何。祂創造了刻卜勒定律讓行星去遵循;祂讓自由落體之速度隨 時間成正比增加, 祂創造了正弦定律讓光在折射時遵循; $\ldots$ 祂想出了所有物體的原形, 並設計了其變體; 當我們對這些創造中的任一個進行再發現時, 我們把握了上帝的心意。』
---William James(1842 -- 1910; Pragmatism, 1907) ---
$\S$ 2 何謂作用量:
『最小作用量原理在物理學定律中享有最崇高的地位..... 而且似乎統治著自然界中所有可逆的過程。』
--- Max Planck (1845--1918) ---
作用量(action)的中文翻譯並不是很精確, 我建議讀者查一下英英辭典(牛津), 其解釋 如下
Action: the process of doing something in order to achieve a purpose.
所謂作用量, 是指質點整個運動過程 --- 從某個初始時刻到另一個終止時刻 --- 的一個性質。
以牛頓力學而言, 我們關心的是質點在每時每刻之狀態。作用在質點上的力是依照牛頓運動第二定律 $F=ma$ 來決定, 如果給定質點在這時刻的位置與速度就可以推出在下一時刻的位置與速度。 通過不斷重複這個過程我們可以確定質點在任何時刻的位置與速度, 這整個過程是透過微分方程即微分法來描述。 另一方面, 作用量原理則是考慮質點所有可能的路徑, 基本上是從比較結構性的角度看問題。
作用量經由Leibniz(1646--1716)、Maupertuis、Euler、Lagrange之研究, 最後是愛爾蘭物理學家 Hamilton給予如下之定義, 作用量等於動能減位能再對時間做積分: $$ \hbox{作用量} = (\hbox{動能}-\hbox{位能})\times \hbox{時間} $$ 其量綱(因次)為 $$ \hbox{[作用量]} = {\rm M} {\rm L}^2 {\rm T}^{-1} $$ 動能是"動"、位能是 "靜", 所以作用量原理告訴我們如何在動、靜之間取得平衡。 不同的路徑的作用量都不同, 因此我們的數學問題是要找出作用量最小的那條路徑。
$\S$ 3 費馬原理:
『光線從一點行至另一點所遵循之路徑, 依所需之時間最短者。』
--- 費馬(Fermat: 1601--1665) ---
由費馬原理直接之推論便是折射定律: 假設光線從 $P(a,b)$ 點經過第一種介質在 臨界面上的一點 $X(x,0)$ 射入第二種介質, 到達 $Q(c,d)$ 點, 形成入射角 $\theta_1$、折射角 $\theta_2$, 而在兩個介質中之速率分別為 $v_1$、$v_2$, 則光線從 $P$ 經過 $X$ 至 $Q$ 所需之時間為 $$ T=T(x)= {\sqrt{(x-a)^2 +b^2} \over v_1} +{\sqrt{(c-x)^2 +d^2} \over v_2} $$ 其微分等於零(時間最短) $$ T'(x)=0\quad \Longrightarrow\quad {x-a \over v_1 \sqrt{(x-a)^2 +b^2}}= {c-x \over v_2 \sqrt{(c-x)^2 +d^2}} $$ 但 $$ \sin \theta_1 = {x-a \over \sqrt{(x-a)^2 +b^2}}\,,\qquad \sin \theta_2 = {c-x \over \sqrt{(c-x)^2 +d^2}} $$ 故可得折射定律 \begin{equation} {\sin \theta_1 \over v_1} = {\sin \theta_2 \over v_2} \end{equation}
利用微積分費馬證明了這條由正弦定律所決定的路徑, 正是使得光線由$P$點到$Q$點所需時間最短, 這樣Hero 的反射定律在1600年之後, 由一個類似且同樣重要的折射定律所補充。 所以藉由折射定律只要測量每一介質對真空的折射率, 就可以知道任何兩個介質相對折射率, 另外可以預測的是假使我們去測量水中的光速, 會發現比空氣慢, 而兩者之比恰好是折射率, 這是很奇妙的一件事, 因為折射率可經由角之測量而得。 由折射定律可肯定的是, 由於接近地表的大氣密度比高空的大氣密度大得多, 因此光在密度大的地表的速度比高空慢, 因此射向我們的太陽光線在稀薄的大氣中停留的時間將會更長, 因此日出之後, 我們所看到太陽光的路線是彎曲的, 也就是說, 此時太陽實際上位於地平線下方。
費馬原理說的是最短時間原理, 但這有其侷限, 後來最小作用量原理針對這弱點改進, 將時間 取代為作用量, 從此我們就將費馬原理視為最小作用量原理的特例。
$\S$ 4 Euler-Lagrange方程:
如果你將質點在每一個位置上的動能減去它在該點的位能, 然後沿著運動的軌跡對時間 作積分, 則你得到的數值一定會比依實際上的真實路徑積分的值要大一些。』
--- Richard P. Feynman (1918-1988) ---
一個運動系統之動能是 $T$、位能是 $U$, 則由時間 $t_1$ 至 時間 $t_2$ 其真正運動路徑是使得積分(作用量) \begin{equation} S=\int_{t_1}^{t_2} L(x,{\dot x},t) dt, \qquad L=T-U % \eqno (4.1) \end{equation} 產生極小值者。
透過分部積分我們可以計算作用量 $S$ 之變分(variation) \begin{eqnarray*} \delta S&=&\int_{t_1}^{t_2}L(x+\delta x,{\dot x}+\delta{\dot x},t)dt- \int_{t_1}^{t_2}L(x,{\dot x},t)dt \cr & =&\int_{t_1}^{t_2}\left(L+{\partial L\over{\partial x}}\delta x+ {\partial L\over{\partial{\dot x}}}\delta{\dot x}\right)dt- \int_{t_1}^{t_2}L(x,{\dot x},t)dt \cr \end{eqnarray*} 然而 $$ {d\over dt}\bigg({\partial L\over{\partial{\dot x} }}\delta x\bigg)= {\partial L\over{\partial{\dot x}}}{d\over{dt}}(\delta x)+ {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg)\delta x $$ 因此 $$ \delta S={\partial L\over{\partial{\dot x}}}\delta x\bigg\vert_{t_1}^{t_2}+ \int_{t_1}^{t_2}\left[{\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg)\right]{\delta x}dt $$ 我們要求$\delta x(t_1)=\delta x(t_2)=0$ 也就是說: 所有的路徑有相同的起點與終點則 \begin{equation} \delta S=\int_{t_1}^{t_2}\left[{\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg) \right]{\delta x}dt % \eqno(4.2) \end{equation} 所以 $S$ 有最小值產生之必要條件為 $\delta S=0$, 這就是 Euler--Lagrange 方程 \begin{equation} {\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg)=0 % \eqno(4.3) \end{equation} 其中$-{d\over dt}$代表分部積分一次。 因為Lagrangian $L$ 之量綱是能量$[L]={\rm M}{\rm L}^2{\rm T}^{-2}$, 所以作用量$S$之量綱為$[S]=[L][t]={\rm M}{\rm L}^2{\rm T}^{-1}$, 而且Euler-Lagrange方程是量綱平衡(dimensional balance) $$ {[L]\over [x]} = {1\over [t]}\cdot {[L]\over [x]/[t]} $$ 在變分學或古典力學我們也以作用量$S$對$x$之變分來表示Euler-Lagrange方程 $$ {\delta S\over \delta x} \equiv {\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg)=0 $$ 我們以熟悉的虎克定律來說明Euler-Lagrange方程 (學數學或科學心裡面一定要有Example!)。 它是說:在彈性限度內, 重量與伸長量(位移)成正比: $$ F\propto x\quad \Longrightarrow\quad F= -kx,\qquad [k]={\rm M}{\rm T}^{-2} $$ 這裡負號代表恢復力, 假設$m$是質點的質量則藉由牛頓第二運動定律 可以將虎克定律表示為二階微分方程 $$ m \ddot x +kx =m \ddot x +{\delta \over \delta x}\bigg({1\over 2}kx^2\bigg) =0 $$ 這個系統的動能與位能分別是 ${1\over 2} m \dot {x}^2$、$ {1\over 2}kx^2$, 所以Lagrangian為 $$ L = T-U = {1\over 2} m \dot {x}^2 -{1\over 2}kx^2 $$ 簡單的計算可推得Euler-Lagrange方程 $$ m \ddot x +kx = {d\over dt} \bigg({\partial L \over \partial \dot x}\bigg) - {\partial L\over \partial x}=0 $$ 與牛頓定律一樣不多也不少。
實際上我們結論得太快, 從 (4.2) 到 (4.3) 是一條漫長的路 $$ \int_{t_1}^{t_2}\left[{\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg) \right]{\delta x}dt =0\quad\Longrightarrow\quad {\partial L\over{\partial x}}- {d\over dt}\bigg({\partial L\over{\partial{\dot x}}}\bigg)=0 \quad (???) $$ 歷史上第一位解決這問題的是 Du Bois Reymond。 Du Bois Reymond 引理: 已知 $f$ 是定義在區間 $[a,b]$ 之連續函數, 若 $$ \int_a^b f(x) \varphi(x) dx =0,\qquad \forall \varphi \in C[a,b] $$ 且$\varphi(a)=\varphi(b)=0$, 則唯一的可能性是 $f(x)=0, \forall x\in [a,b]$。
Du Bois Reymond引理對於廣義函數理論有決定性的影響, 這個工具是研究偏微分方程弱解與泛函分析對偶空間的利器。
$\S$ 5 Hamilton 系統:
Hamilton對於甚麼東西是重要的有一種卓越的見解, 我認為這是一個數學家曾經有過 最傑出的見解之一, 他所發現的力學形式其重要性在百年之後的量子力學才 為人們所認識。』
--- Paul A. M. Dirac (1902--1984) ---
我們談另一種處理古典力學的方法----- Hamilton力學, 這是愛爾蘭數學 物理學家 Hamilton 所提。在古典力學基於對稱性之考量, 我們 (約定俗成) 以 $p$ 表示動量、 $q=x$ 代表位置, 已知 $L(q,{\dot q},t)$ 為 Lagrangian 則其 Hamiltonian 為 \begin{equation} H(p,q,t)={\partial L\over{\partial{\dot q}}}{\dot q}-L(q,{\dot q},t) =p{\dot q}-L(q,{\dot q},t) % \eqno (5.1) \end{equation} 即 Hamiltonian $H(p,q,t)$ 為 Lagrangian $L(q,{\dot q},t)$之 Legendre 變換, 其中 \begin{equation} p={\partial L\over\partial{\dot q}}\qquad \hbox{廣義動量(generalized momenta)} % \eqno(5.2) \end{equation} 廣義動量 $p={\partial L\over\partial{\dot q}}$ 是愛爾蘭物理學家Hamilton所引進。其背後理由可以從量綱分析的角度來看: $$ [p]=\bigg[{\partial L\over\partial{\dot q}}\bigg] ={{\rm M}{\rm L}^2 /{\rm T}^2\over {\rm L}/{\rm T}} = {\rm M}{\rm L}{\rm T}^{-1} = [\hbox{動量}] $$ 通常我們是以位置、速度來描述一個運動系統, 但是Hamilton獨到的眼光是他看到 Hamiltonian $H$以動量 $p$、位置 $q$ 為自變數是完全合理且自然的, 因為 $p$、$q$ 乘積之量綱正好是作用量 (action); $$ [pq]={\rm M}{\rm L}{\rm T}^{-1}{\rm L} = [S]=[\hbox{作用量}] $$ 換句話說:一個物理系統必須以作用量為基準, 這個事實在 Hamilton 系統會再次出現。 通常之 Lagrangian 為 \begin{eqnarray} L(x,{\dot x},t) &=&L(q,{\dot q},t)\nonumber\\ &=&{m\over2}{\dot x}^2-U(x) \qquad \hbox{(動能 $-$ 位能)}\nonumber\\ &=&{m\over{2}}{\dot q}^2 - U(q) %(5.3) \end{eqnarray} 此時 Hamiltonian 為 \begin{eqnarray} H(p,q,t)&=&{\partial L\over\partial{\dot x}}{\dot x}-L =p \dot x -L\nonumber\\ &=&m{{\dot x}}^2 - {m\over{2}}{{\dot x}}^2+U(x)\qquad \hbox{(動能 $+$ 位能)}\nonumber\\ &=&{p^2\over 2m} + U(q) %\eqno (5.4) \end{eqnarray} Hamilton引進廣義動量(generalized momenta) $p={\partial L\over\partial{\dot q}}$, 並令$F={\partial L\over\partial q}$ 代表力, 簡單的量綱分析可驗證 $F$確實是力; $$ [F]=\bigg[{\partial L\over\partial q}\bigg] = [L][q]^{-1} = {\rm M}{\rm L}^2 {\rm T}^{-2}{\rm L}^{-1} = {\rm M} {\rm L} {\rm T}^{-2} $$ 所以Euler-Lagrange方程可以改寫為 \begin{equation} {d\over dt}\bigg({\partial L\over\partial{\dot q}} \bigg) ={\partial L\over\partial q} \quad \Longleftrightarrow\quad \dot p ={\partial L\over\partial q}=F %\eqno(5.5) \end{equation} 這個方程式正是牛頓第二運動定律, 這就是Hamilton推廣牛頓力學與Lagrange 力學之動機。
定理5.1. Euler-Lagrange方程等價於 Hamilton系統 \begin{equation} {\dot p}={\partial L\over\partial q},\quad \bigg(p={\partial L\over\partial{\dot q}}\bigg) \quad \Longleftrightarrow\quad {\dot p}=-{\partial H\over\partial q},\qquad {\dot q}={\partial H\over\partial p} % \eqno(5.6) \end{equation}
證明: $H=H(p,q,t)$由全微分知 \begin{equation} dH={\partial H\over\partial p}dp+{\partial H\over\partial q}dq+ {\partial H\over\partial t}dt % \eqno(5.7) \end{equation} 但另一方面$H=p{\dot q}-L$、$L=L(q, \dot q, t)$ \begin{eqnarray} dH&=&d(p{\dot q}-L)\nonumber\\ &=&{\dot q} dp+pd{\dot q}-dL\nonumber\\ &=&{\dot q} dp+pd{\dot q} -{\partial L\over\partial q}dq -{\partial L\over\partial{\dot q}}d{\dot q} -{\partial L\over\partial t}dt\nonumber\\ &=&{\dot q} dp-{\partial L\over\partial q}dq -{\partial L\over\partial t}dt % \eqno(5.8) \end{eqnarray} 比較 (5.7)、(5.8)兩式得(由全微分) $$ {\dot q}={\partial H\over\partial p},\qquad {\partial H\over\partial q}= -{\partial L\over\partial q},\qquad {\partial H\over\partial t}=-{\partial L\over\partial t} $$ 而且 $$ {\dot p}={\partial L\over\partial q}=-{\partial H\over\partial q} $$
Hamilton系統有兩組方程式: 第一組告訴我們粒子的動量如何隨時間變化, 另一組告訴我們位置如何隨時間變化。 在任何情況下, 變化率總是由該時刻的位置與動量所決定。 Hamilton系統透露了一個重要的訊息----作用量(action) \begin{eqnarray*} \dot p = -{\partial H\over \partial q}\quad &\Longrightarrow&\quad {[p]\over [t]} = {[H]\over [q]}\\ \dot q = {\partial H\over \partial p}\quad &\Longrightarrow&\quad {[q]\over [t]} = {[H]\over [p]} \end{eqnarray*} 藉由作用量之關係: $[\hbox{作用量}]= [t][H]=[p][q]$, 我們可以非常容易且自然地記住Hamilton系統 (頂多差一個負號而這可取一個特例來驗證)。
我們再以熟悉的虎克定律為例 $$ m{\ddot x}+ k x=m \ddot q + kq=0 $$ 則其Lagrangian與Hamiltonian分別為 \begin{eqnarray*} L(q, \dot q)&=& T-U= {m\over 2}{\dot q}^2 - {1\over 2} kq^2, \cr H(p,q) &=& T+U= {p^2 \over 2m} +{1\over 2} kq^2 \end{eqnarray*} 廣義動量正是原來的動量 $p={\partial L\over\partial{\dot q}}=m \dot x$, 而且方程式可以改寫為 $$ m{\ddot x}=- k x \quad \Longrightarrow\quad \dot p= -kx = {\partial L \over\partial x} $$ 也就是說虎克定律可以表示為Hamilton系統 $$ \dot p = -{\partial H\over \partial q}=-kq,\qquad \dot q = {\partial H\over \partial p}={p\over m} $$ 一般而言牛頓定律或Euler-Lagrange是位置函數$q$的二階微分方程, 但Hamilton系統則是位置函數$q$與廣義動量$p$的一階聯立微分方程組。
Hamilton系統有非常好的對稱性, 如果引進新的變數 $$ u={1\over \sqrt{2}}(q+ip),\qquad u^*={1\over \sqrt{2}}(q-ip) $$ 則Hamilton 系統 (5.6) 可以改寫為複數形式的 Hamilton 系統 \begin{equation} {dp \over dt} = -{\partial H\over\partial q},\qquad {dq \over dt} = {\partial H\over\partial p} \qquad \Longleftrightarrow\qquad i{du\over dt} = {\partial H \over \partial u^*} %\eqno(5.9) \end{equation}
$\S$ 6 對稱與守恆律:
『 假如你對某件事物做了某些事情($operation$)之後, 它看起來和原來完全相同, 那麼它就是對稱的。』
--- Hermann Weyl (1885--1955) ---
最小作用量原理為人們開闢了有關對稱性不變性與守恆律的新天地。 以動量(能量)守恆定律而言, 它表明這兩條定律是空間(時間)均勻性有關。 所謂均勻性是指空間中(時間上)都不存在任何特殊的位置(時間), 以專業術語就是空間(時間)平移不變。
我們說物理定律是``對稱的'', 意思是我們可以對物理定律或者對我們表達物理定律的方式做一些事, 結果沒有任何差異。 對稱說明了那些沒有改變或不能發生的事, 所以對稱是現代物理學研究的動力。 在數學中常常把不變性(invariance)稱為對稱性。Hermann Weyl曾說: 「我的研究工作嘗試把真理與美統一起來, 可是如果要我在兩者之中擇一的話, 通常我都選擇美。」 其實他心中的美就是對稱。當數學應用到物理時, 美學判斷的有效性最為可觀。 數學家在他們的研究中, 受到結構美之概念形式的強烈期望所驅使, 是相當平常的。 Carl Jacobi (1804--1851) 是第一位發現對稱性與守恆律之關聯, 然而早年把「對稱性、不變性及守恆量之間最關鍵的聯繫」 結晶成形為愛因斯坦發展廣義相對論鋪路的則是德國女性數學家 Emmy Noether (1882-1935)。 在廣義相對論發展之初, 人們發覺(表面上看來)在彎曲的四維空間中, 能量是不守恆的, 這是一個理論基礎上的缺陷。Noether把這問題解決了, 她利用對稱性證明彎曲的四維空間之能量是守恆的。 對她而言, 把對稱性與基本自然律聯繫在一起的理念是非常自然的。 $$ \hbox{對稱性}\quad \Longleftrightarrow\quad \hbox{不變性}\quad \Longleftrightarrow\quad \hbox{守恆律} $$ Noether對於對稱性與守恆律的構想, 給了美與真理之間一個最具體的鏈結。
我們還是以熟悉的虎克定律為例。
定理6.1. 虎克定律滿足能量守恆 \begin{equation} E(t)=\frac12 m\dot x^2+\frac12 kx^2=C(\hbox{常數}) \end{equation}
證明: 直接微分 \begin{eqnarray*} \frac{dE}{dt}& =&m\frac{dx}{dt}\frac{d^2 x}{d t^2}+kx\frac{dx}{dt}\\ & =&\frac{dx}{dt}\bigg(m\frac{d^2 x}{d t^2}+kx\bigg)=0 \end{eqnarray*}
特別注意的是, 整個證明過程並不依賴微分方程的精確解, 微分方程本身就已經告訴我們這個秘密了。從證明的過程反推回去, 如果直接乘 $\frac{dx}{dt}$, 也可以得到能量守恆律, 並且分別得到動能 $T$ 與位能 $U$ \begin{eqnarray*} \frac{dx}{dt}\bigg(m\frac{d^2 x}{d t^2}+kx\bigg) & =&\frac{d}{dt}\bigg[\frac12 m\bigg(\frac{dx}{dt}\bigg)^2+\frac12 kx^2\bigg]\cr & =&\frac{d}{dt}(T+U) \end{eqnarray*} 在推導過程中, 也清楚看到動能$T$是由加速度而來, 位能$U$則是力的結果 \begin{eqnarray*} && m\frac{d^2 x}{d t^2}\quad +\quad{\delta\over \delta x}\bigg({1\over 2}kx^2\bigg)\quad =\quad 0\cr &&\hskip14pt \downarrow\hskip72pt \downarrow\cr &&\hskip13pt T\hskip69pt U\cr \end{eqnarray*} 方程式 (6.1) 可以視為古典力學的Hamilton-Jacobi方程式, 它除了說明能量守恆之外, 藉由守恆律我們可以將二階微分方程經由適當的積分降階為一階微分方程! 但是更值得問的是為何要乘 ${dx\over dt}$? 這裡面有非常深刻的物理意義與數學本質。
定理6.2. 若$\partial H/\partial t=0$ (時間 $t$ 沒有明顯出現在 $H$ 之表現式), 則 $H$ 是一守恆量。
證明: 直接對時間$t$全微分 \begin{eqnarray*} {d H\over dt} &=& {\partial H\over \partial t} +{\partial H\over \partial p}\dot p +{\partial H\over \partial q}\dot q \cr &=&{\partial H\over \partial p}\dot p +{\partial H\over \partial q}\dot q \cr &=&-{\partial H\over \partial p}{\partial H\over \partial q} +{\partial H\over \partial q}{\partial H\over \partial p}=0 \end{eqnarray*}
特別提醒讀者偏導數 $\partial H/\partial t$ 與全微分 $dH/ dt$ 是兩回事, 不要混為一談。對虎克定律而言 $$ H(p,q) = T+U= {p^2 \over 2m} +{1\over 2} kq^2 $$ 與時間 $t$ 無關, 因此 Hamiltonian $H(p,q)$ 是一守恆量。但這還是無法解釋為什麼方程式乘 ${dx\over dt}$ 可以推得守恆律? 我們回到作用量 $$ S[x]=\int_{t_1}^{t_2} L(x, \dot x) dt = \int_{t_1}^{t_2}\bigg({1\over 2} m\dot x^2 - {1\over 2} kx^2\bigg) dt $$ 因為 Lagrangian $L$ 與時間 $t$ 無關, 所以如果考慮時間平移變換 $$ x^* = x,\qquad t^* = t+\epsilon,\qquad 0\lt \epsilon \lt \infty $$ 可以驗證作用量 $S$ 是時間平移變換不變 \begin{eqnarray*} S[x^*]&=& \int_{t^*_1}^{t^*_2}\left[ {1\over 2} m\bigg({dx^*\over dt^*}\bigg)^2 - {1\over 2} k(x^*)^2\right] dt^* \cr &=& \int_{t_1+\epsilon}^{t_2+\epsilon} \bigg({1\over 2} m \dot x^2 - {1\over 2} kx^2\bigg) dt \cr &=& \int_{t_1}^{t_2} \bigg({1\over 2} m\dot x^2 - {1\over 2} kx^2\bigg) dt = S[x] \end{eqnarray*} 因此 $$ \lim_{\epsilon\to 0} {x^*(t^*) - x(t)\over \epsilon} =\lim_{\epsilon\to 0} {x(t+\epsilon) - x(t)\over \epsilon}=\dot x $$ 這項稱為時間平移變換之infinitesimal generator, 正是方程式乘${dx\over dt}$的理由, 從而推導出對應之守恆律。
Noether定理: 假設作用量$S[u]$對所有的線性變換$T_\epsilon, T_0=I, \epsilon\gt 0$是不變的 $$ S[T_\epsilon u]=S[u],\qquad \forall \epsilon \gt 0, \quad \forall u $$ 則(取變分得) $$ \langle \delta S[u], M\rangle =0,\qquad M={dT_\epsilon \over d\epsilon}\bigg|_{\epsilon=0} =\lim_{\epsilon\to 0} {T_\epsilon -I \over \epsilon} $$ 最後這個等式可以表示為散度, 因此是一守恆律方程。
Noether的定理告訴我們作用量的每一種連續對稱性都將有一個守恆律與之對應, 這是一個非常深刻的定理, 更深入的討論我們就留給讀者去查閱相關的著作。
本文是作者於2009年暑假在中研院數學所 《數學名題及其故事》 一系列演講的第一個題目, 在此特別謝謝李志豪教授的鼓勵與安排。
參考資料
關於最小作用量原理的科普介紹讀者可以參考《可畏的對稱》 (五南出版)第七章之論述, 另外 《自然規律中蘊蓄的統一性》 (Hidden Unity in Natural Law) 的第六章則有比較深入的討論。
---本文作者任教於國立交通大學應用數學系---