最小二乘法的前世今生,及其與平均值的關係

2020-12-04 數學原來如此

張三同學近5次月考的數學成績分別為: 98,114,103,108,99。如果只能使用一個數據來描述張三的成績,我猜你會使用算術平均數: (98+114+103+108+99)/5=104.4。

算術平均數在我們生活中如此的常用,以至於我們沒有去思考它的合理性和適用範圍?僅僅依據經驗做事,我們的確少了很多思維上的折磨,但有時也會做出錯誤的判斷。比如,這裡我們將張三第5次月考的成績改為13分,直接使用算術平均數來描述張三的成績就不合理了。

算術平均值是統計學中最基本、最常用的一種平均指標。18世紀中葉,人們就在天文和航海領域熟練運用算術平均數來減少相同條件下的數據測量誤差了。英國著名數學家科茨在1750年也在減少誤差使用到了加權平均( The weighted average)。但是我們很難確保他們是否真的懂得使用平均值減少數據誤差的數學原理。

Let p be the place of some object defined by observation, q, r, s the places of the same object from subsequent observations. Let there also be weights P,Q, R, S reciprocaly proportional to the displacements which may arise from the errors in the single observation, and which are given from the given limits of error; and the weights P, Q, R, S are conceived as being placed at p, q, r, s, and their centre of gravity z is found: I say the point Z is the most probable place of the object, and may be most safely had for its true place.(科茨作品中關於加權平均的記載)

以上面的5次月考成績為例,我們先跳出平均數這個圈,來看看一般性原理。為了能夠直觀理解,我們先來作一個簡圖。

現在我們要找到一個合適的y值,使得它能替代這5次成績。一個好的想法是讓y到這五個點的豎直距離之和最小。

記這5個點到y的豎直距離之和為Z,則

Z=|y-98|+|y-114|+|y-103|+|y-108|+|y-99|

絕對值不利於後續計算,因為只需求當Z取最小時的y值,因此可以使用等價形式:

很容易看出這是一個二次函數,在對稱軸y=y』處取得最小值。其中

y』=( 98+114+103+108+99)/5 ,且y』恰好是這5次月考成績的算術平均值。

總結一下,為了找出最能代表5次月考成績的真值y,我們使用了到y值的「距離平方的和」最小的原理。用今天我們熟悉的稱呼叫做「最小二乘法(least square method)」,這裡的二乘就是平方的意思。

從上面的分析,我們已經知道最小二乘法的發現與平均值密切相關,並且可以牽強的追溯到科茨的時代。但是真正的清晰闡述這個原理的是,18世紀法國著名數學家勒讓德(Legendre,1752-1833)。當然,與上面的成績分析也沒有一點關係,最初都是用於解決測量數據誤差的問題。

闢謠:此圖不是數學家勒讓德

勒讓德的思路是這樣的:在實際問題中,一個數據受到多個因素的制約,因此可以根據數據得到多個下面這樣的方程:

E=a+bx+cy+...(其中,a,b,c為已知數,x,y為未知數)

這裡的E指的誤差。根據方程組知識,如果這樣的(含有n個未知數的)方程恰好有n個,則E為0,沒有誤差。但是如果這樣的方程多於n個,那麼誤差E必然存在。

勒讓德與最小二乘法

那如何使得誤差最小呢?勒讓德的做法是讓所有方程的誤差平方和最小。

勒讓德使用的求和符號與現在不同,他的符號是現在通用的積分符號

勒讓德的處理方式很巧妙,一直到現在我們都很少有改動,最後讓我們一起來看看最小二乘法「二維的情況」,以及勒讓德之前和之後的數學家們的一些工作。

勒讓德(只有這張抽象的圖了)

(一).最小二乘法「二維的情況」

比如,人體脂肪與年齡的關係(高中教材人教A版必修三85頁):

畫出散點圖,可以觀察得到這些點在直線f(x)=ax+b的周圍。為了敘述方便,記原始數據中的年齡為xi,脂肪百分比為yi。

使用最小二乘法原理,誤差的平方的和z要最小:

帶入數據接出a≈0.557,b≈-0.448.即,這條擬合直線方程為:f(x)=0.557x-0.448

(二).其他數學家的工作

首先,作為第一次的有效嘗試,梅耶(Mayer)將得到的27個方程E=a+bx+cy+...分成了3組(如下圖一),並進行了簡單的各自求和運算,得到3個方程(如下圖二)。3個方程3個未知數可以解出唯一的一組值。

圖一:梅耶的分組

圖二:求解

這樣的做法與求平均值類似,它也能較好的較少誤差。但是與我們的最小二乘法還有相當大的距離。

接著,著名的法國數學家拉普拉斯( Laplace,1749-1827)在梅耶的方法上做了較大的改進,他不再對數據進行分組,而是將得到的所有24個方程進行加減運算(第一個就是將所有方程相加,這已經相當於是求平均值了),得到4個方程,再進行計算。拉普拉斯這樣的處理方式,把數據作為整體來看待(而非梅耶一樣的分組處理),並進行不同的數據組合,能夠將所有的未知數綜合來考慮,能進一步的減小誤差。這或許在一定程度上對勒讓德關於最小二乘法有了一定的啟發作用。

然後,是高斯的工作。高斯(Gauss,1777-1855)是一個平時默默無聲,關鍵時候出來嚇人的頂級數學家。與他同時代的很多數學家都吃過他的苦頭,多年嘔心瀝血公布於世的研究成果,卻被高斯告知他多年前便已研究好,只是沒有公開而已,勒讓德也不例外。1805年,勒讓德正式對外公布了他關於最小二乘法的研究成果。但是年輕高斯卻不屑一顧,因為他說早在1795年他就用到了這個方法。

事情經過大致是這樣的,1801年,義大利天文學家皮亞齊發現了第一顆小行星——穀神星。經過40天的跟蹤觀測後,因為某些原因,皮亞齊失去了穀神星的位置,而此後各類計算方法都沒有得到該行星的運行軌跡。

高斯決定試一試,通過短時間的計算,他得到了穀神星的運行軌道,據此,奧地利天文學家奧爾伯斯重新發現了穀神星。這是一個他一生都引以為傲的傳奇經歷。據他後來回憶,在此過程中他運用了最小二乘法。

由於當時他並沒有公布計算方法,因此圍繞最小二乘法,高斯與勒讓德展開了一場激烈的優先權之爭。此處略去爭論的具體內容,但值得我們注意的是,撇開優先權不論,高斯老爺子的確比勒讓德走得遠得多。

勒讓德說,誤差的平方和最小是合理的,但為什麼會合理?或者什麼時候是合理的?勒讓德並沒有說明白。但高斯做到了,高斯第一次的將最小二乘法與概率論結合在一起,並由此開發出一個新工具——「正態分布」。

設一次測量得到了n個數據:a,b,c,...。 它們與真實值這間的誤差x分別為:x-a,x-b,x-c,...。高斯引入了下面的概率密度函數:

1822年,高斯證明了,在誤差的平均值為0,且方差相等的線性模型中,最小二乘法進行回歸分析是最佳的。高斯為最小二乘法的合理性做了最重要的論述。

最小二乘法,始於算術平均數,最終與正態分布強強結合,成為了數據處理與分析必不可少的工具。感謝勒讓德,感謝高斯,以及所有對之有貢獻的數學家們!

參考文獻:

1.The Measurement of Uncertainty before 1900 .Stephen M. Stigler

2.維基百科

相關焦點

  • 最小二乘法
    最小二乘法原理  在我們研究兩個變量(x, y)之間的相互關係時,通常可以得到一系列成對的數據(x1, y1、x2, y2... xm , ym);將這些數據描繪在x -y直角坐標系中(如圖1), 若發現這些點在一條直線附近,可以令這條直線方程如(式1-1)。
  • 什麼是最小二乘法
    值得慶幸的是,在4個月前,測量攻城獅通過查閱大量資料,終於攻克難關,實現運用EXCEL的方式,運算最小二乘法計算平面度,經反覆測試,目前與海克斯康三次元、美國Micro-VU、兆豐的GOOD VISON、賽斯特的OMM等設備計算結果一致。
  • 手把手教你最小二乘法
    今天這期推送的主題是介紹最小二乘法以及如何利用最小二乘法對已有數據進行擬合。之所以會想到這個主題,是因為前段時間在準備美賽時看到很多最小二乘法的應用,但多數關於其原理的帖子要麼晦澀難懂要麼不夠清楚,就像下面這樣,於是乎萌生出這個想法。        (全文共2479字,我也不知道什麼時候能看完。
  • 最小二乘法與線性回歸
    回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。        線性回歸是一種最為我們熟悉的方式,故接下來我們就來詳細了解線性回歸。1.
  • 第48篇 最小二乘法
    1806年,法國科學家勒讓德獨立創立最小二乘法,但因不為世人所知而默默無聞。勒讓德曾與高斯為誰最早創立最小二乘法原理發生爭執。1809年,高斯使用的最小二乘法的方法發表於《天體運動論》中。1829年,高斯提供了最小二乘法的優化效果強於其他方法的證明,因此最小二乘法也被稱為高斯-馬爾可夫定理。
  • 最小二乘法詳細介紹
    高斯使用的最小二乘法的方法發表於1809年他的著作《天體運動論》中,而法國科學家勒讓德於1806年獨立發現「最小二乘法」,但因不為世人所知而默默無聞。1829年,高斯提供了最小二乘法的優化效果強於其他方法的證明,見高斯-馬爾可夫定理。
  • 通透 | 最小二乘法的本質是什麼?
    .最小二乘法的一種常見的描述是殘差滿足正態分布的最大似然估計模型具有如下形式:(用愛因斯坦的話來說就是空間曲率為0)為什麼最小二乘法好使?因為我們處於空間曲率近似為0的空間,多數的物理量和物理定理都滿足歐氏空間的特性。實際上,高斯對於最小二乘法的認識,很有欽定的意味:假定最小二乘法最優,那麼如何如何。至於為什麼它最優,抱歉,高斯本人也不知道。第一個真正證明最小二乘法最優的是Maxwell。他的證明主要基於空間對稱性,而這正是歐氏空間的特點。
  • 最小二乘法的數學公式
    之前在德輝學堂介紹過最小二乘法,但是有很多好學的小夥伴總是追問,最小二乘法的數學公式究竟是怎麼樣的?      本期的這一篇文章,我們將介紹一個簡潔的最小二乘法數學公式,慢慢剖析它,爭取讓好學的小夥伴們能認識它,然後再結合Excel利用它來做一些計算。
  • 線性回歸與最小二乘法
    其中e表示通過回歸方程計算出的擬合值與實際觀測值的差,通過維基百科上的例子來看下實際的計算過程對於上述函數,包含了兩個自變量,為了求解其最小值,可以藉助偏導數來實現。通過偏導數和函數極值的關係可以知道,在函數的最小值處,偏導數肯定為0,所以可以推導出如下公式
  • 最小二乘法的計算原理
    高斯使用的方法就是最小二乘法,該方法發表於1809年他的著作《天體運動論》中。最小二乘法(又稱最小平方法)是一種數學優化技術。它通過最小化誤差的平方和尋找數據的最佳函數匹配。利用最小二乘法可以簡便地求得未知的數據,並使得這些求得的數據與實際數據之間誤差的平方和為最小。其中,
  • 來認識一下傳說中的最小二乘法
    最小二乘法在三坐標測量時常常被提起,那什麼是最小二乘法呢?它具備什麼樣的特點?根據標準,哪些要求必須採用最小二乘法呢?
  • 最小二乘法(1)——線性問題
    最小二乘法  常規的方法無法回答小明的問題,幸好高斯老爺子發現了最小二乘法。最小二乘法(又稱最小平方法)是一種通過最小化誤差的平方和,尋找數據最佳函數匹配的優化策略。  上式就是最小二乘法的公式,其中ai 和 bi是已知的,表示約等方程組中第 個方程的相關係數。
  • 最小二乘法(附MATLAB代碼)
    前幾天有一些小夥伴需要小編講一下最小二乘法,小編依稀記得當年數值計算這門課學習過這個知識點,但無奈小編忘得一乾二淨,於是在知乎上看到這位大神對最小二乘法的講解,各位小夥伴如果想直接看這位大神講解的話,可以點擊下方閱讀原文直接進行學習。
  • GD&T乾貨|最小二乘法的數學公式詳解
    (GZHl:智慧汽車供應鏈)之前在德輝學堂介紹過最小二乘法,但是有很多好學的小夥伴總是追問,最小二乘法的數學公式究竟是怎麼樣的?本期的這一篇文章,我們將介紹一個簡潔的最小二乘法數學公式,慢慢剖析它,爭取讓好學的小夥伴們能認識它,然後再結合Excel利用它來做一些計算。
  • Python實現最小二乘法
    上一篇文章講了最小二乘算法的原理。這篇文章通過一個簡單的例子來看如何通過Python實現最小乘法的線性回歸模型的參數估計。王松桂老師《線性統計模型——線性回歸與方差分析》一書中例3.1.3。回歸模型的參數估計一元線性模型的一般公式為一元線性回歸模型我們使用最小二乘法估算出α、β即可求出經驗回歸方程。
  • 催眠前世今生_啊漫老師:揭示你的夫妻關係
    前世今生,輪迴轉世,你是怎樣看呢?前世今生,有人信,有人不信。催眠中的前世今生,怎麼看?如果你相信前世輪迴之說,那這就是今生轉世之緣。如果你不是特別確定,催眠中的前世今生,實質上可以看成是發生在很久之前的事情(可能都忘記了),或者深埋潛意識的感受、記憶,以意象畫面的形式呈現出來。
  • 最小二乘法之加權最小二乘的應用
    因此我們迫切需要對每個點都定義一個權重,這就是今天我要介紹的加權最小二乘法。在介紹這個算法之前,先回答一個問題,上篇文章中,有網友私信問我為什麼那個參數方程要選取較小的特徵值與特徵向量:(矩陣乘法為什麼滿足結合律請參考我另外一篇文章「深入淺出線性代數的理解及應用」),容易得知:
  • 線上直播 | 偏最小二乘法是個什麼鬼?
    偏最小二乘法剛看到這個名稱學長也是...
  • 廖閱鵬:前世今生催眠曲,帶你夢回前世,總結今生!
    最近在最右上,看到了一則消息,許多人聽了廖閱鵬的前世今生催眠曲,都看到了自己的前世,我覺得很神奇,便趁著月黑風高之夜,孤身一人躲在被窩裡,悄悄的打開了喜馬拉雅收音機,點開了前世今生催眠曲,帶上耳機,準備一場穿越之旅。
  • 催眠:貪得無厭的前世,苦苦掙扎的今生
    ~01~今生她是一個18歲的小女孩,正面臨高考,發現自己內心有很多的悲苦擾亂她的心神無法安心讀書。所以她就突發奇想,想去看看她自己的前世,她認為或許看過了自己的前世,可以對今生的很多事情釋懷。我催眠前世的價格對於一個學生來說並不便宜,但是可能內心強烈的渴望,她自己湊齊了錢後就立即給我下單了。她說她來於一個大家庭,叔伯姑姑們都很有成就,最差的就是自己的爸爸了,所以從小受盡家族中人的白眼,而作為家中獨女,父母對她寄於厚望。她讀書的學校一直是重點,即使考不到,父母也會千方百計地花錢讓她去讀。除了學習,不允許她有朋友,她的生活就是學校、家裡兩點一線。