碩博學術專欄——中央極限定理

2021-01-12 講李學術

也就是說,當樣本越大(n越大),平均數抽樣分配的變異數或標準差越小,變異數(又稱變異誤)與樣本數大小成反比,或是說標準差(又稱標準誤)與樣本數大小的平方根成反比。最後,不論原始母體的形狀是否為常態分配,當樣本人數夠大時,抽樣分配會趨近於一個常態分配。正因為抽樣分配為常態分配這個基本假設的存在,樣本統計量的機率分配可以利用常態分配來表述,並據此來進行假設考驗。

基於上述幾個特徵,樣本統計量可以根據抽樣分配的機率原理來推估母數,並估計抽樣誤差的大小,稱為中央極限定理(Central Limit Theorem)。完整定義為:對於任何一個母體(μ,σ²),樣本大小為n的樣本平均數所形成的分配,當樣本大小n趨近無限大時,亦趨近於常態分配(μ,σ²/n)。

1920年,G.Polya以這個定理在統計學中的核心與重要性,取central一詞來命名。國內的中文翻譯成中央極限,亦有抽樣分配的平均數逼近母體平均數的意義,也十分傳神。

由於樣本來自母體,因此抽樣分配的分布特徵受到母體分配的影響。抽樣分配與母體分配的關係有兩個特性,第一,抽樣分配的標準差最小是0(當樣本人數等於母體人數時),最大等於母體標準差σ(當樣本人數為1時),在一般情形下,抽樣分配的標準差會小於母體標準差,而以母體標準差σ為極大值。

第二,抽樣分配的常態性受到母體常態性的影響。如果母體為常態分配,無論樣本人數多少,抽樣分配則必定是常態分配,但是如果母體不是常態分配,則抽樣分配隨著樣本數越大,越接近常態分配,明顯受限於母體分配特徵,抽樣分配有可能不是常態分配,而需以樣本數增加的方法來確保抽樣分配的常態性。

母體的偏誤與抽樣分配的關係可以用圖1表示,圖1(a)顯示母體是一個呈現正偏態(例如臺灣大學生中具有一些高IQ者),平均數為125(μ=125)。圖1(b)為一個樣本數為200的樣本分配,其形狀也呈現正偏態,平均數為127.5。這兩個分配都是IQ隨機變數的原始次數分配,也就說,分配中的每一個數值是IQ觀察值(以Xi表示),而非樣本統計量。而樣本的分配的形狀,反映了母體分配的形狀。

圖1(c)與(d)則為抽樣分配的圖示。其中圖1(c)為100個n=200的樣本的平均數所形成的抽樣分配,平均數為126.4,圖中每一個黑色小方實體表示一個n=200的樣本,總共有100個方塊。由於個別樣本的人數為200,已經遠大於30這一個統計分配是否常態的判斷指標,其形狀趨近於常態分配。

圖1(d)為無限個n=200樣本的平均數所形成的抽樣分配,也就是理論上的抽樣分配,此時分配的平均數即等於母體平均數的125,其形狀為一標準常態分配,圖1(a)與(d)為樣本統計量的次數分配,也就是抽樣分配,X軸上為樣本統計量(X的平均數),其標準差遠遠小於母體標準差。

由四個圖形的關係可以看出,理論抽樣分配的平均數才能反映母體平均數,即是母體本身沒有呈現常態,只要樣本數夠大,抽樣分配也會趨近於常態分配,此時套用常態分配的機率分布符合理論統計理論。

相關焦點

  • 中心極限定理
    第四步、結果我們讓中心極限定理髮揮作用。現在我們抽取1000組,每組50個。我們把每組的平均值都算出來。這一共1000個平均值大概是這樣的:[3.44, 3.42, 3.22, 3.2, 2.94 … 4.08, 3.74],用直方圖表示(如下),很明顯是一個正態分布。
  • 極限套路之夾逼定理
    農村土氣叫法:夾擠定理。而像小編這樣的數學流氓最喜歡叫它夾逼定理!!!我承認我是流氓   你們呢?? 我的想法當然和純(wei)潔(suo)的你們不一樣。我叫他夾逼定理的原因是:這樣比較有氣勢,在做題的時候可以配合著大喊一聲:哪裡跑!(定理性質就是去夾,去逼式子的極限)。 下面簡單介紹一下夾逼定理!!
  • CLT - 中心極限定理
    在樣本對總體的統計推論過程當中,中心極限定理就是理論基礎。我們通過下面這個小練習來了解該定理吧,我們用MiniTAB生成9列數據,每列100個,要求: 步驟一:生成數據。Stacked樣本量n平均值xbarμ方差s2σ2 從這裡我們可以看到樣本均值分布(Row_Mean)和總體分布(Stacked)間的平均值與方差存在關係: 這個也就是我們學習六西格瑪時所說的中心極限定理
  • 碩博學術專欄——常態分配
    當x=μ時,函數值f(x)達到最高點,當x接近無限大時,函數值f(x)則接近為0,因此常態曲線並沒有兩端點極限值,但是分配內絕大多數的機率(99.7%)落於正負3個標準差之內,因此一般來說,常態化的分配全距約為6個標準差。而且在距離平均數負一個標準差位置上,切線斜率由漸增轉為漸減,在距離平均數正一個標準差位置上,切線斜率由漸減轉為漸增,因此各有一個反曲點(inflection points)。
  • 大數定律與中心極限定理
    在概率統計的學習或使用過程中,經常有人會提到大數定律和中心極限定理,它們也恰恰是概率論、統計學和理論科學的基石。
  • 考研數學:中心極限定理
    中心極限定理是研究獨立隨機變量和的極限分布為正態分布的問題。它是概率論中最重要的一類定理,有廣泛的實際應用背景。中心極限定理(central limit theorem)是概率論中討論隨機變量序列部分和分布漸近於正態分布的一類定理。
  • 講講中心極限定理
    總第202篇/張俊紅今天我們來聊聊統計學裡面比較重要的一個定理:中心極限定理,中心極限定理是指:現在有一個總體數據,如果從該總體數據中隨機抽取若干樣本
  • 中心極限定理通俗介紹
    本文將通過實際模擬數據的形式,形象地展示中心極限定理是什麼,是如何發揮作用的。什麼是中心極限定理(Central Limit Theorem)中心極限定理指的是給定一個任意分布的總體。我每次從這些總體中隨機抽取 n 個抽樣,一共抽 m 次。 然後把這 m 組抽樣分別求出平均值。
  • 徹底理解中心極限定理——最重要的統計定理之一
    中心極限定理(CLT)是統計學中的一個基本定理,它是一個非常簡單的概念。當你進一步閱讀時就會發現,這也是一個很重要的概念。在閱讀任何其他正態分布之前,必須了解一個先決條件概念,請閱讀我關於正態分布的文章
  • 碩博學術專欄——主要的抽樣分配(二)
    非中央F分配如同非中央卡方分配的概念,F統計量亦有非中央F分配(non-central F distribution)的變化。F分配是兩個卡方分配的比值,因此當卡方分配具有非中央特質時,所計算出來的F統計量既是一個非中央分配。但是非中央F分配並不需要分子與分母的卡方分配均為非中央卡方分配,而僅發生在分子項而非分母項。
  • 碩博論文必備神器:百度學術推出開題助手
    . · 2015-11-26 15:44:44 ·產經 開題報告是指為闡述、審核和確定畢業論文題目而做的專題書面報告,是碩博研究生學術生涯的重要部分,也是學位論文研究寫作的先導和基礎。
  • 中心極限定理:從高爾頓板到麥克斯韋分布
    百年之後,拉普拉斯試圖挽救這個定理的人氣,依然沒有成功。為了紀念這對「難兄難弟」,現在人們把這個定理稱為棣莫弗-拉普拉斯定理。這種逼近的本質究竟是什麼呢?我們看到,不管是高爾頓板,還是多次賭博,二項分布拆成每一步都是簡單的概率事件。那麼就可以說,二項分布是這樣的一步一步「加」起來的。
  • 數列極限專題:Stolz定理及在數列未定式極限中的應用典型題分析
    ,一般用於 "*/∞" 型的極限(即分母趨於正無窮大的分式極限,分子趨不趨於無窮大無所謂)、0/0型極限(此時要求分子分母都以0為極限)。該定理可以認為是函數極限洛必達法則的離散版本.  例1:證明以下結論成立:  【參考證明】:問題轉換:兩端取對數,則  由於  記上面得到的數列的分子為  記 ,則 嚴格單調遞增且  從而有  所以,由Stolz定理的結論,有  即有  【注2】:使用Stolz定理的結論證明或者求數列的極限
  • 數據科學家必須了解的事:中心極限定理
    來源:Pexels數據科學家必須了解的事:中心極限定理。你了解嗎?編碼之前,快速回顧今天,我想重構中心極限定理(CentralLimit Theorem),以及該定理與數據科學家的大量工作之間的關係。回顧直方圖首先,對於任何數據科學家來說,核心工具都是直方圖——一種非常簡單的圖表。雖然我們肯定會看到許多直方圖,但經常會忽略它的重要性。直方圖的核心目的是了解給定數據集的分布。
  • |學術|教學|知網|論文|本碩博_網易訂閱
    學術公開課  ID:academic_times  推薦理由:學術公開課服務數百萬碩博生和科研工作者,內容豐富,包括前沿的科研資訊、優質的科研學習課程、勁爆碩博就業信息等等,只要你需要的,我們都會努力提供服務,幫助你變身科研達人
  • 最重要的統計定理:詳解強大的中心極限定理
    圖源:unsplash中心極限定理(CLT)是指,給定足夠大的樣本量,無論變量在總體中的分布如何,變量均值的抽樣分布都將近似於正態分布。這是統計學中的一個基本定理,也是最重要的統計定理之一,是學習統計學繞不過的坎兒。不過好在這個概念實際上不難理解,看過下面這些例子,你也會覺得它其實蠻簡單的。這些例子從反方面著手,我們很容易就能清楚地理解CLT了。例1取一個均勻分布(從0到1,稱為均勻分布,因為在0和1之間選擇值的概率相等,因此它的概率密度函數(PDF)就是水平的黑色直線)。
  • 考研數學大數定律和中心極限定理題型解析
    原標題:考研數學的大數定律和中心極限定理題型解析 隨著2014年考研日期的日趨臨近,莘莘學子們正忙碌而緊張地進行著各考試科目的最後總複習,在各門考試科目中,數學作為一門公共科目,常常令一些考生感到頭疼、沒有把握,這一方面是因為數學本身的邏輯性、連貫性很強、公式多、計算量大,要學好它有一定難度,另一方面是因為某些考生以前對數學的重視程度不夠
  • 遞推數列存在極限的證明與極限值求解思路與典型題分析(三)——拉鏈定理
    【注】:公式顯示不全時請在公式上左右滑動完整顯示拉鏈定理:數列繼續以遞推數列存在極限的證明與極限值思路與典型題分析(三)——夾逼定理(定義法)中的例題為例,分析基於拉鏈定理的遞推數列極限存在性證明思路與步驟:例:驗證數列逼近方程
  • 2021考研數學高數衝刺備考:重要定理之函數與極限
    ►函數與極限1、函數的有界性在定義域內有f(x)&geK1則函數f(x)在定義域上有下界,K1為下界如果有f(x)&leK2,則有上界,K2稱為上界。函數f(x)在定義域內有界的充分要條件是在定義域內既有上界又有下界。2、數列的極限定理(極限的性)數列xn不能同時收斂於兩個不同的極限。
  • 大數定律和中心極限定理的區別和聯繫
    閱讀大概需要5分鐘昨天看了中心極限定理,今天寫本科論文期間,又抽業餘時間看了看大數定律,剛開始差點把本小博主給看蒙了O.O