我們知道統計是分為描述性統計與推斷性統計,而描述性統計主要就是以比如均值、方差、中位數、眾數等來描述數據;而而推斷性統計指的是用樣本推斷總體,如假設檢驗和線性回歸等,是相對比較難以理解的。而中心極限定理從一方面來說為推斷性統計提供了一個非常好的方法。
我們可以用幾句話來簡單的概括中心極限定理:樣本均值服從正態分布,期望等於總體均值。
這裡需要解釋下什麼是樣本均值,樣本是一個相對有限的量,比如我們想知道全國人口的平均身高(稱作總體),鑑於量特別大,無法計算。但注意雖然無法計算,但是全國人口的平均身高是客觀存在的,只是我們不知道而已。
我們可以抽取1萬人來進行一個估計,這裡的1萬人就是一個樣本。通過算這1萬人的平均身高來估算全國人口的平均身高,肯定不準確的,畢竟只是估算而已。這裡的1萬人的平均身高就是樣本均值,那麼我們是不是可以多抽幾次比如N次,每次抽1萬人。這樣我們就可以算出N個樣本均值也就是N個平均身高。
然後可以吧這N個平均身高求一次平均值,結論就是這N個平均身高服從正態分布,而且只要M夠大,最終算出來的N個值的平均值就等於全國人口的平均身高。
簡單來講,中心極限定理指的就是樣本均值可以估算總體均值而且服從正態分布。雖然說這個中心極限定理聽上去很難,但是我們一定要摸透本質,看透本質才能更深刻的理解後續的東西。而數學是一塊一塊的,我們在前面學習的就是後面的基礎,所以只有把基礎知識打牢,才可以比較輕鬆的學習後面的比較困難的知識點。