最小二乘法的前世今生,及其與平均值的關係

2020-12-10 數學原來如此

張三同學近5次月考的數學成績分別為: 98,114,103,108,99。如果只能使用一個數據來描述張三的成績,我猜你會使用算術平均數: (98+114+103+108+99)/5=104.4。

算術平均數在我們生活中如此的常用,以至於我們沒有去思考它的合理性和適用範圍?僅僅依據經驗做事,我們的確少了很多思維上的折磨,但有時也會做出錯誤的判斷。比如,這裡我們將張三第5次月考的成績改為13分,直接使用算術平均數來描述張三的成績就不合理了。

算術平均值是統計學中最基本、最常用的一種平均指標。18世紀中葉,人們就在天文和航海領域熟練運用算術平均數來減少相同條件下的數據測量誤差了。英國著名數學家科茨在1750年也在減少誤差使用到了加權平均( The weighted average)。但是我們很難確保他們是否真的懂得使用平均值減少數據誤差的數學原理。

Let p be the place of some object defined by observation, q, r, s the places of the same object from subsequent observations. Let there also be weights P,Q, R, S reciprocaly proportional to the displacements which may arise from the errors in the single observation, and which are given from the given limits of error; and the weights P, Q, R, S are conceived as being placed at p, q, r, s, and their centre of gravity z is found: I say the point Z is the most probable place of the object, and may be most safely had for its true place.(科茨作品中關於加權平均的記載)

以上面的5次月考成績為例,我們先跳出平均數這個圈,來看看一般性原理。為了能夠直觀理解,我們先來作一個簡圖。

現在我們要找到一個合適的y值,使得它能替代這5次成績。一個好的想法是讓y到這五個點的豎直距離之和最小。

記這5個點到y的豎直距離之和為Z,則

Z=|y-98|+|y-114|+|y-103|+|y-108|+|y-99|

絕對值不利於後續計算,因為只需求當Z取最小時的y值,因此可以使用等價形式:

很容易看出這是一個二次函數,在對稱軸y=y』處取得最小值。其中

y』=( 98+114+103+108+99)/5 ,且y』恰好是這5次月考成績的算術平均值。

總結一下,為了找出最能代表5次月考成績的真值y,我們使用了到y值的「距離平方的和」最小的原理。用今天我們熟悉的稱呼叫做「最小二乘法(least square method)」,這裡的二乘就是平方的意思。

從上面的分析,我們已經知道最小二乘法的發現與平均值密切相關,並且可以牽強的追溯到科茨的時代。但是真正的清晰闡述這個原理的是,18世紀法國著名數學家勒讓德(Legendre,1752-1833)。當然,與上面的成績分析也沒有一點關係,最初都是用於解決測量數據誤差的問題。

闢謠:此圖不是數學家勒讓德

勒讓德的思路是這樣的:在實際問題中,一個數據受到多個因素的制約,因此可以根據數據得到多個下面這樣的方程:

E=a+bx+cy+...(其中,a,b,c為已知數,x,y為未知數)

這裡的E指的誤差。根據方程組知識,如果這樣的(含有n個未知數的)方程恰好有n個,則E為0,沒有誤差。但是如果這樣的方程多於n個,那麼誤差E必然存在。

勒讓德與最小二乘法

那如何使得誤差最小呢?勒讓德的做法是讓所有方程的誤差平方和最小。

勒讓德使用的求和符號與現在不同,他的符號是現在通用的積分符號

勒讓德的處理方式很巧妙,一直到現在我們都很少有改動,最後讓我們一起來看看最小二乘法「二維的情況」,以及勒讓德之前和之後的數學家們的一些工作。

勒讓德(只有這張抽象的圖了)

(一).最小二乘法「二維的情況」

比如,人體脂肪與年齡的關係(高中教材人教A版必修三85頁):

畫出散點圖,可以觀察得到這些點在直線f(x)=ax+b的周圍。為了敘述方便,記原始數據中的年齡為xi,脂肪百分比為yi。

使用最小二乘法原理,誤差的平方的和z要最小:

帶入數據接出a≈0.557,b≈-0.448.即,這條擬合直線方程為:f(x)=0.557x-0.448

(二).其他數學家的工作

首先,作為第一次的有效嘗試,梅耶(Mayer)將得到的27個方程E=a+bx+cy+...分成了3組(如下圖一),並進行了簡單的各自求和運算,得到3個方程(如下圖二)。3個方程3個未知數可以解出唯一的一組值。

圖一:梅耶的分組

圖二:求解

這樣的做法與求平均值類似,它也能較好的較少誤差。但是與我們的最小二乘法還有相當大的距離。

接著,著名的法國數學家拉普拉斯( Laplace,1749-1827)在梅耶的方法上做了較大的改進,他不再對數據進行分組,而是將得到的所有24個方程進行加減運算(第一個就是將所有方程相加,這已經相當於是求平均值了),得到4個方程,再進行計算。拉普拉斯這樣的處理方式,把數據作為整體來看待(而非梅耶一樣的分組處理),並進行不同的數據組合,能夠將所有的未知數綜合來考慮,能進一步的減小誤差。這或許在一定程度上對勒讓德關於最小二乘法有了一定的啟發作用。

然後,是高斯的工作。高斯(Gauss,1777-1855)是一個平時默默無聲,關鍵時候出來嚇人的頂級數學家。與他同時代的很多數學家都吃過他的苦頭,多年嘔心瀝血公布於世的研究成果,卻被高斯告知他多年前便已研究好,只是沒有公開而已,勒讓德也不例外。1805年,勒讓德正式對外公布了他關於最小二乘法的研究成果。但是年輕高斯卻不屑一顧,因為他說早在1795年他就用到了這個方法。

事情經過大致是這樣的,1801年,義大利天文學家皮亞齊發現了第一顆小行星——穀神星。經過40天的跟蹤觀測後,因為某些原因,皮亞齊失去了穀神星的位置,而此後各類計算方法都沒有得到該行星的運行軌跡。

高斯決定試一試,通過短時間的計算,他得到了穀神星的運行軌道,據此,奧地利天文學家奧爾伯斯重新發現了穀神星。這是一個他一生都引以為傲的傳奇經歷。據他後來回憶,在此過程中他運用了最小二乘法。

由於當時他並沒有公布計算方法,因此圍繞最小二乘法,高斯與勒讓德展開了一場激烈的優先權之爭。此處略去爭論的具體內容,但值得我們注意的是,撇開優先權不論,高斯老爺子的確比勒讓德走得遠得多。

勒讓德說,誤差的平方和最小是合理的,但為什麼會合理?或者什麼時候是合理的?勒讓德並沒有說明白。但高斯做到了,高斯第一次的將最小二乘法與概率論結合在一起,並由此開發出一個新工具——「正態分布」。

設一次測量得到了n個數據:a,b,c,...。 它們與真實值這間的誤差x分別為:x-a,x-b,x-c,...。高斯引入了下面的概率密度函數:

1822年,高斯證明了,在誤差的平均值為0,且方差相等的線性模型中,最小二乘法進行回歸分析是最佳的。高斯為最小二乘法的合理性做了最重要的論述。

最小二乘法,始於算術平均數,最終與正態分布強強結合,成為了數據處理與分析必不可少的工具。感謝勒讓德,感謝高斯,以及所有對之有貢獻的數學家們!

參考文獻:

1.The Measurement of Uncertainty before 1900 .Stephen M. Stigler

2.維基百科

相關焦點

  • 最小二乘法
    最小二乘法原理  在我們研究兩個變量(x, y)之間的相互關係時,通常可以得到一系列成對的數據(x1, y1、x2, y2... xm , ym);將這些數據描繪在x -y直角坐標系中(如圖1), 若發現這些點在一條直線附近,可以令這條直線方程如(式1-1)。
  • 手把手教你最小二乘法
    今天這期推送的主題是介紹最小二乘法以及如何利用最小二乘法對已有數據進行擬合。之所以會想到這個主題,是因為前段時間在準備美賽時看到很多最小二乘法的應用,但多數關於其原理的帖子要麼晦澀難懂要麼不夠清楚,就像下面這樣,於是乎萌生出這個想法。        (全文共2479字,我也不知道什麼時候能看完。
  • 最小二乘法的本質是什麼?
    .最小二乘法的一種常見的描述是殘差滿足正態分布的最大似然估計模型具有如下形式:(用愛因斯坦的話來說就是空間曲率為0)為什麼最小二乘法好使?因為我們處於空間曲率近似為0的空間,多數的物理量和物理定理都滿足歐氏空間的特性。實際上,高斯對於最小二乘法的認識,很有欽定的意味:假定最小二乘法最優,那麼如何如何。至於為什麼它最優,抱歉,高斯本人也不知道。第一個真正證明最小二乘法最優的是Maxwell。他的證明主要基於空間對稱性,而這正是歐氏空間的特點。
  • 偏最小二乘法到底是什麼?
    今天就給大家推薦一種量化研究神兵利器——偏最小二乘法(PLS)偏最小二乘法發展較SEM稍晚,最早是由 Wold (1975) 基於經濟計量分析需求所提出,但卻在化學計量領域獲得重視與普及,目前在經管、營銷、商學領域普遍通行。
  • 最小二乘法的數學公式
    之前在德輝學堂介紹過最小二乘法,但是有很多好學的小夥伴總是追問,最小二乘法的數學公式究竟是怎麼樣的?      本期的這一篇文章,我們將介紹一個簡潔的最小二乘法數學公式,慢慢剖析它,爭取讓好學的小夥伴們能認識它,然後再結合Excel利用它來做一些計算。
  • 如何理解最小二乘法?
    文章同步在個人博客網站:https://changshuitaotao.github.io/歡迎訪問無論是傳統的統計學,還是時下火熱的機器學習,線性回歸都是最基礎但又十分重要的模型之一。線性回歸使用了最小二乘法來估計模型參數,如何理解最小二乘法將成為掌握線性回歸的關鍵。
  • 最小二乘法(附MATLAB代碼)
    前幾天有一些小夥伴需要小編講一下最小二乘法,小編依稀記得當年數值計算這門課學習過這個知識點,但無奈小編忘得一乾二淨,於是在知乎上看到這位大神對最小二乘法的講解,各位小夥伴如果想直接看這位大神講解的話,可以點擊下方閱讀原文直接進行學習。
  • GD&T乾貨|最小二乘法的數學公式詳解
    (GZHl:智慧汽車供應鏈)之前在德輝學堂介紹過最小二乘法,但是有很多好學的小夥伴總是追問,最小二乘法的數學公式究竟是怎麼樣的?本期的這一篇文章,我們將介紹一個簡潔的最小二乘法數學公式,慢慢剖析它,爭取讓好學的小夥伴們能認識它,然後再結合Excel利用它來做一些計算。
  • Python實現最小二乘法
    上一篇文章講了最小二乘算法的原理。這篇文章通過一個簡單的例子來看如何通過Python實現最小乘法的線性回歸模型的參數估計。王松桂老師《線性統計模型——線性回歸與方差分析》一書中例3.1.3。回歸模型的參數估計一元線性模型的一般公式為一元線性回歸模型我們使用最小二乘法估算出α、β即可求出經驗回歸方程。
  • 利用最小二乘法實現曲線擬合
    簡介在工程問題的計算中,我們經常需要處理一些離散數據的擬合問題,而最小二乘法是處理曲線擬合問題的常用方法。目前,許多軟體都提供有基於最小二乘法進行曲線擬合的功能,例如在Origin和Excel中均可直接利用離散數據進行曲線擬合。然而,這些軟體只能處理一些簡單函數的擬合問題,當需要擬合的函數較為複雜時,或者無法用簡單的表達式來表述時,則往往無法直接進行擬合。
  • 偏最小二乘法是什麼?全新SmartPLS 3.3X統計方法來了!
    你也許了解最小二乘法,但是你聽過偏最小二乘法嗎?它到底是個什麼東西?又是幹嘛用的呢?它和最小二乘法僅一字之差,卻大不相同!隨著社會科學的發展,在經濟管理、教育學、社會科學、醫學中,多元線性回歸分析已經成為一種普遍應用的統計分析和預測方法。
  • 這六段代碼隱藏著深度學習的前世今生!
    雷鋒網AI科技評論按:本文作者Emil Wallner用六段代碼解釋了深度學習的前世今生,這六段代碼覆蓋了深度學習幾十年來的重大創新和突破,作者將所有代碼示例都上傳了FloydHub 和 GitHub,想要在FloydHub上運行代碼示例的讀者,請確保已經安裝了floyd command line tool,並將作者提供的代碼示例拷貝到本地。
  • 最小二乘法原理(中):似然函數求權重參數
    似然估計本質本質便是根據已有的大量樣本(實際上就是利用已知的條件)來推斷事件本身的一些屬性參數的方法,最大估計更是最能反映這些出現的樣本的,所以這個參數值也是最可靠和讓人信任的,得到這個參數值後,等來了一個新樣本 X(i+1) 後,我們可以預測它的標籤值。
  • 輪迴的實證:貝滿中學老師的前世今生
    終於,最最關鍵的細節找到了,我們學校帶的十字架是沒有耶穌的,這證明了我們是基督教會學校,不是天主教會學校。基督教會學校到是不多,很快我們鎖定了最後的目標,居然是享譽海內外的一所女中--貝滿女子學校!左邊是前世照片,曾經女校的訓導主任,據說訓學生很厲害,這輩子也是得理不饒人;右邊是今生照片,與我單位有密切關係的一個朋友。
  • 童子、元神、魂魄、靈識、神識、阿賴耶識、前世今生的關係(五)
    在前世今生和來世流轉的生命裡,雖然人有「隔陰之迷」,因此不知道前世、來生,但生命的業力流轉是絲毫不差的。  唐代時期著名的玄奘大師形容阿賴耶識是「去後來先做主翁」。大意是說,人來到這個世間,阿賴耶識比眼耳鼻舌身意先進入母胎。而人在死之後,阿賴耶識卻是最後離開的識,它是我們生命的主體。
  • 人人值得一看——談前世 | 贈書《前世今生》
    緣很複雜,最重要的有四大類;這四類就是佛在經上講的報恩、報怨、討債、還債。如果沒有這四種關係,不會來的,對面遇到也不相干,也不認識。所以人與人之間這四種緣,我們要清楚。 如果是報恩來的,就是很乖的小孩,將來長大是孝子賢孫,不要教他,他就孝順。可見得他與前世有關係,這是先天的,後天的教育能夠彌補先天。
  • 學習回歸——最小二乘法
    我們將訓練數據中的廣告費代入函數,把得到的點擊量與訓練數據中的點擊量相比較,找出使二者得差最小的θ。這麼做就是為了找到使E(θ)的值最小的θ/這樣的問題稱之為最優化問題;為什麼要計算誤差的平方?最小二乘法:https://zh.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95
  • 今生的夫妻是前世情人,今生的情人是前世夫妻:善待每一份相遇!
    作者:胡楊映月情人之所以對你柔情似水,之所以是浪漫溫柔的代名詞,之所以讓你感覺愛得百轉柔腸,之所以讓你刻骨銘心,是因為你們是前世的夫妻。今生之所以尋你而來,只因為前世的一份緣還沒有盡,所以今生來續前緣,是來還債的。
  • 前世今生因果輪迴
    世界如此之大無奇不有,我們生活在這美好的世界裡,人生在世是否真的會有前世與今生。每一個人都在猜想,都在找答案。如果真的有前世,就會想到有沒有來世。前世與今生如果真的還有今生,那麼今生無法報答的恩情等到來世再報 。人世間是如此美好,今生修來的福分是前世的因果。好人必有好報。前世的因果,決定了今生的命運。
  • 古代奇聞:前世今生的因果關係
    不久,在一天夜裡,他夢見觀世音菩薩對他講:「你前世在湖北做官,辦事雖然公道,但是心性十分刻薄;雖然你沒有私心,還是要削減你的福祿。再加上你又殺過許多生命,今生應當受到短命的報應;你的被貶,你的病痛,都是業報。幸虧你現在發願,心地極誠,冥府可以為你加壽,還加福祿。你應勉力做好事,按你所發的誓言,努力做好!」