跟我學-大數據的統計學基礎07 統計學的哲學基礎:大數定律、中心極限定理與抽樣分布

2022-01-14 中雲大數據分析

跟我學-大數據的統計學基礎07 統計學的哲學基礎:大數定律、中心極限定理與抽樣分布

回復「大數據基礎」得到大數據的統計學基礎

回復「大數據」得到大數據學習資料

回復「經典」下載經典影音

回復「關注」得到更多資料的下載索引

統計學的哲學基礎:大數定律、中心極限定理與抽樣分布

定理定義

編輯

大數定律有若干個表現形式。這裡僅介紹高等數學概率論要求的常用的三個重要定律:

  

,....是一列相互獨立的隨機變量(或者兩兩不相關)[2]  ,他們分別存在期望

  

和方差

  

。若存在常數C使得:

 

則對任意小的正數 ε,滿足公式一:

將該公式應用於抽樣調查,就會有如下結論:隨著樣本容量n的增加,樣本平均數將接近於總體平均數。從而為統計推斷中依據樣本平均數估計總體平均數提供了理論依據。

特別需要注意的是,切比雪夫大數定理並未要求

  

同分布,相較於後面介紹的伯努利大數定律和辛欽大數定律更具一般性。

設μ是n次獨立試驗中事件A發生的次數,且事件A在每次試驗中發生的概率為P,則對任意正數ε,有公式二:

該定律是切比雪夫大數定律的特例,其含義是,當n足夠大時,事件A出現的頻率將幾乎接近於其發生的概率,即頻率的穩定性。

在抽樣調查中,用樣本成數去估計總體成數,其理論依據即在於此。

辛欽大數定律:常用的大數定律

  

為獨立同分布的隨機變量序列,若

  

的數學期望存在,則服從大數定律:

即對任意的ε>0,有公式三:

大數定律的四種證法

對於一般人來說,大數定律的非嚴格表述是這樣的:

  

是獨立同分布隨機變量序列,期望為

  

,則

  

收斂到u.

如果說「弱大數定律」,上述收斂是指依概率收斂(in probability),如果說「強大數定律」,上述收斂是指幾乎必然收斂(almost surely/with probability one)。

大數定律通俗一點來講,就是樣本數量很大的時候,樣本均值和真實均值充分接近。這一結論與中心極限定理一起,成為現代概率論、統計學、理論科學和社會科學的基石。(有趣的是,雖然大數定律的表述和證明都依賴現代數學知識,但其結論最早出現在微積分出現之前。而且在生活中,即使沒有微積分的知識也可以應用。例如,沒有學過微積分的學生也可以輕鬆利用excel或計算器計算樣本均值等統計量,從而應用於社會科學。)

最早的大數定律的表述可以追溯到公元1500年左右的義大利數學家Cardano。1713年,著名數學家James (Jacob) Bernouli正式提出並證明了最初的大數定律。不過當時現代概率論還沒有建立起來,測度論、實分析的工具還沒有出現,因此當時的大數定律是以「獨立事件的概率」作為對象的。後來,歷代數學家如Poisson(「大數定律」的名字來自於他)、Chebyshev、Markov、Khinchin(「強大數定律」的名字來自於他)、Borel、Cantelli等都對大數定律的發展做出了貢獻。直到1930年,現代概率論奠基人、數學大師Kolmogorov才真正證明了最後的強大數定律。

下面均假設

  

是獨立同分布隨機變量序列,數學期望為u。獨立同分布隨機變量和的大數定律常有的表現形式有以下幾種。

初等概率

(1) 帶方差的弱大數定律:若

  

小於無窮,則

  

依概率收斂到0。

證明方法:Chebyshev不等式即可得到。這個證明是Chebyshev給出的。

(2) 帶均值的弱大數定律:若u存在,則

  

依概率收斂到0。

證明方法:用Taylor展開特徵函數,證明其收斂到常數,得到依分布收斂,然後再用依分布收斂到常數等價於依概率收斂。

相關焦點

  • 大數據的統計學基礎
    我們推出大數據系列(包括Hadoop,NoSQL,Mahout等)和數據分析系列(包括R,SAS等)課程後,觀察學員(特別是IT工作者和業務人員)的學習狀況,發現他們中的大多數嚴重缺乏進一步挖掘數據價值所需的數學素養。本門課程的目標,正是要打破這種鴻溝,為大家鞏固基礎,為進一步在數據領域前進提供更強動力。
  • 大數定律與中心極限定理
    在概率統計的學習或使用過程中,經常有人會提到大數定律和中心極限定理,它們也恰恰是概率論、統計學和理論科學的基石。
  • 愛上統計學----生活中的大數定律
    如果不是為了AP學分,你會學統計學嗎?恐怕大部分的同學的答案是No.
  • 抽樣分布之中心極限定理(Central Limit Theorem)
    雖然在數理統計的教科書中,在講完隨機變量的分布和數字特徵後才開始講中心極限定理,但實際中心極限定理的提出和應用卻早於正態分布,而正態分布恰恰是運用中心極限定理證明出來的。現代的課本都是按照數學內在的邏輯編排出來的,而科學家很少按照課本的安排順序推進問題的研究進程。請允許我多囉嗦幾句,按中心極限定理的發展順序來說。
  • 數據分析必備——統計學入門基礎知識
    數據之路,與你同行!——數據說·夢想季 導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用範圍幾乎覆蓋了社會科學和自然科學的各個領域,而在數據量極大的網際網路領域也不例外,因此紮實的統計學基礎是一個優秀的數據人必備的技能。
  • 統計學公開課大盤點
    2.1 可汗學院公開課:概率 可汗學院的概率課程通過各種生動的例子,由最基本的概率問題講起,逐步深入講解了概率中的一系列概念及問題,主要內容包括獨立事件,相依事件,隨機變量,排列,組合,概率密度函數,二項分布,期望值,大數定律以及大量的實例。
  • 大數定律與中心極限定理的理解(筆記)
    在以下文章中,多次提到隨機過程、中心極限定理等概念,即使反覆的推敲,似乎仍然沒有達到深入理解的程度,所以,繼續學習和增加理論基礎。
  • 中南財大乾貨分享:432統計學專業解析,了解多少?
    統計學部分包括:統計學的基本概念,統計數據的收集、整理,數據的圖表展示及數據分布特徵的描述;統計量與抽樣分布,參數估計與假設檢驗;分類數據分析;方差分析,相關與回歸分析(一元和多元回歸分析);時間序列分析與預測;統計指數。概率論部分包括:概率的概念與計算;隨機變量及其分布、數字特徵;大數定律及中心極限定理。
  • 徵服統計學 | 什麼是中心極限定理?
    文章轉自 |  pythonic生物人(本文僅作學術分享,版權歸原作者所有)「中心極限定理」(The Central Limit Theorem)是很多統計學的基礎,本文介紹中心極限定理的概念及其重要性。
  • 【入門】數據分析必備——統計學入門基礎知識
    數據之路,與你同行!——數據說·夢想季導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用範圍幾乎覆蓋了社會科學和自然科學的各個領域,而在數據量極大的網際網路領域也不例外,因此紮實的統計學基礎是一個優秀的數據人必備的技能。
  • 素描經濟學:大數定律
    大數定律是一種自然規律,因而通常不稱為定理而是大數「定律」,相當於數學領域的概率論中討論隨機變量序列的算術平均值向隨機變量各數學期望的算術平均值收斂的定律。而通常所講的大數定理則是經數學家證明並以數學家名字命名的大數定理,如伯努利大數定理。
  • 大數定律和中心極限定理的區別和聯繫
    閱讀大概需要5分鐘昨天看了中心極限定理,今天寫本科論文期間,又抽業餘時間看了看大數定律,剛開始差點把本小博主給看蒙了O.O
  • 數據分析必備——統計學入門基礎知識 - 人人都是產品經理
    編輯導語:不論在什麼崗位,都要懂得本崗位的基礎知識,打牢基礎後面才能穩步發展;數據分析也是如此,數據分析必須要掌握統計學的基礎知識;本文是作者分享的關於統計學入門基礎的知識,我們一起來學習一下吧。要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!
  • 半個月學完概率論與數理統計(第四章),大數定律與中心極限定理
    大家好,我是小木頭。今天我們接著學習概率論與數理統計,第四章大數定律與中心極限定理。先說重點,好像平時考試、考研數學裡這一章不是重點。①理解三種大數定律,努利大數定律、切比雪夫大數定律、辛欽大數定律。②兩種中心極限定理,林德伯格-萊維中心極限定理、棣莫弗-拉普拉斯中心極限定理。 (名字有點長啊)
  • 大數定律一
    因此概率論歷史上第一個有關大數定律的極限定理是屬於伯努利的,它是概率論和數理統計學的基本定律,屬於弱大數定律的範疇。當大量重複某一實驗時,最後的頻率無限接近事件概率。而伯努利成功地通過數學語言將現實生活中這種現象表達出來,賦予其確切的數學含義。他讓人們對於這一類問題有了新的認識,有了更深刻的理解,為後來的人們研究大數定律問題指明了方向,起到了引領作用,其為大數定律的發展奠定了基礎。
  • 不要再問統計學了!
    昨天在知乎看到一個問題:從零開始學數據分析,什麼程度可以找工作,如何計劃學習方案?提問者背景是:在coursera 上面學data science 中的R programming,本碩均為化學工程,過去很少接觸過 統計、計算機 這兩個學科,現在很想轉行做數據。
  • 什麼是中心極限定理?這裡有一份可視化解釋
    編者按:中心極限定理是概率論中的一組重要定理,它的中心思想是無論是什麼分布的數據,當我們從中抽取相互獨立的隨機樣本,且採集的樣本足夠多時,樣本均值的分布將收斂於正態分布
  • 統計計量 :統計學公開課大盤點(附下載)
    可汗學院的概率課程通過各種生動的例子,由最基本的概率問題講起,逐步深入講解了概率中的一系列概念及問題,主要內容包括獨立事件,相依事件,隨機變量,排列,組合,概率密度函數,二項分布,期望值,大數定律以及大量的實例。
  • 2021考研概率論與數理統計衝刺:大數定律和中心極限定理考試要求...
    考研數學基礎打堅實,衝刺複習要複習到位!概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。
  • 一文看懂中心極限定理
    作者 | Indhumathy Chelliah編譯 | VK來源 | Towards Data Science中心極限定理是推理統計中的一個重要概念