AP統計沒煩惱:解析最經典的三種概率分布|統計概率

2021-01-08 TestDaily

首先對看到這篇文章的同學們提一個問題:從小到大你們有沒有因為某幾次考試考得不好而懷疑自己不是學習的料?

今天我們來科普一下在概率論當中非常典型的三種概率分布:分別叫做伯努利分布、二項分布以及正態分布。通過這三種分布的關係來跟大家分析一下考試好壞到底何天賦有何關係。這三種分布同樣也會出現在AP統計的考試當中,但是作為科普文,今天只重點討論三種分布之間的關係,而不會涉及到過多的計算和證明。(此文章可放心食用)

伯努利分布

我們先來從伯努利實驗談起。如果一次實驗只有2種結果:成功或者失敗,每次實驗成功的概率都是p,且每次實驗的結果之間互相不影響,我們就稱作這種實驗為伯努利實驗。

舉個例子,一個什麼都不會的學生去做五選一的選擇題就屬於伯努利實驗。因為猜對答案就相當於成功,成功概率為1/5. 並且第一題是否蒙對和第二題是否蒙對互相不影響。

那麼什麼叫做分布呢?用大家熟知的直方圖來去表示一下。假設一道題目做對得1分,做錯得0分。就可以畫出一個這樣的直方圖,橫坐標為得分,縱坐標為得分對應的概率。這個就叫做分布

二項分布

剛才我們說到了伯努利實驗,那麼

二項分布其實就是重複多次伯努利實驗之後的結果分布了

。我們依舊以做單選題來去舉例子,假設一套卷子有100道題,那麼猜對100道題的概率就是

如果猜對2道題呢?是

麼?

顯然不是,因為100道題中我可以猜對第一題第二題或者第二題第四題。那麼到底有多少種100道題中猜對2道的情況呢?一共有

種(這個叫做binomial coefficient,今天的重點不是這個,因此我們不過多做討論)。

我們需要把剛才的

在乘以

種可能才可以得到答案。

所以二項分布的概率見下圖:

再給大家舉個例子。假設小明同學參加考試,10道題全都不會做。那麼他究竟能猜對幾道題在考試成績下來之前我們不得而知。因此統計學上把他能夠做對的題目數量也稱作隨機變量。通過我們剛才的概率計算下來,小明同學可能得到的分數已經對應的概率分布見下圖:

正態分布

正態分布(normal distribution),也稱作「常態分布」,是一種極為常見的連續性概率分布,也是一種極為常見常用的概率分布模型。如果隨機變量X服從正態分布均值為μ,標準差為σ,那麼隨機變量X的概率密度曲線將會呈現鐘形(中間高兩邊低),如下圖:

老師個人認為,正態與常態兩種稱呼都不太能夠直觀的顯示出這個分布的特點,不如從當中各取一個字稱作「正常分布」就很白話了,這正是正態分布的本質含義。

因為在生活當中,它太常見了。有非常多的數據分布形狀會接近正態分布的鐘形(即中間高,兩邊低的對稱形態)。比如:正常人群的身高、體重、考試成績等等。

到現在一定會有同學納悶:明明老師剛才說的成績分布服從二項分布,怎麼到了這一段就變成成績服從正態分布了?這要從一個裝置說起:

高爾頓釘版

18世紀英國著名科學家弗朗西斯·高爾頓發明了一個機械裝置,可以很好的展現正態分布產生的過程(如下圖):

當小球撞到柱子的時候,會隨機的選擇向左走還是向右走,碰到下一個柱子繼續隨機選擇左右。有多少層柱子就相當於多少小球隨機進行了多少次選擇,連續的執行了多次獨立重複的實驗。這就相當於重複多次伯努利實驗產生的二項分布了。

當小球的數量非常多的時候,人們驚奇的發現這個二項分布的形狀簡直跟正態分布一模一樣。

所以我們繼續以考試為例,如果都是選擇題,大家什麼都不會全靠蒙,那麼考試成績一定會呈現一種正態分布。然而一定有同學會問:大家考試畢竟是靠真本事答題的,肯定不可能全部都蒙。那麼這樣成績也會呈現正態分布嗎?而且小球隨機向左向右走的概率都是0.5,但是蒙五選一選擇題時,蒙對的概率是0.2、四選一的選擇題概率是0.25呀?

答案是:大致是這樣的。因為同一道題,有的同學覺得簡單,就一定會有同學覺得難。那放眼全部考生,就會涉及到一個概率問題了,比如說有60%的同學覺得簡單,40%的同學覺得難。

假設覺得簡單的同學一定能夠做對題,統計學上就會認為這道題的正確率大致為60%,也就相當於每次實驗成功(做對題)的概率為0.6,連續的執行了多次獨立重複的實驗(做了很多道題)。

但如果考生人數足夠多,最後的分布形狀也會近似於一個正態分布。因為統計學認為如果樣本量(考生人數)滿足一個叫做large count condition的條件的話,那麼樣本將會近似於一個正態分布。

large count condition是由前人的經驗得來的,不存在證明的過程。先來看一下這個定義:

這個定義說到:如果樣本量n非常大,那麼只要二項分布實驗成功的概率p滿足np與n(1-p)都大於等於10,這個二項分布的分布形狀就會近似於正態分布了。

當然,如果題目過於簡單,比如某題99.999%的考生都能夠做對的話,就會使得np或者n(1-p)中某一項不夠10。那這時候就需要一些人為的幹預手段(例如curve),來去進行調整了。

我們希望一場考試當中大部分人的成績都在平均成績附近,考超高分和超級低分的學生數量非常少。(考過SAT的同學應該知道數學部分的curve特別大,原因就在於此,因為本身知識點會比較簡單,只能通過curve的形式讓所有考生的成績大致服從這樣的分布。)

同樣對於特別難的考試,也會通過curve來去平衡分數,使得總體成績大致服從正態分布。這樣的話才不會出現所有人都考不上大學或者所有人都去上藤校的情況。

總結

看完了今天這篇科普文章,同學們一定了解了伯努利分布、二項分布以及正態分布的關係。簡單來講就是n次伯努利實驗的結果會呈現二項分布,當實驗次數n足夠大,二項分布會近似於正態分布。

世界上大多數的事情都會服從正態分布,如果情況太極端,也會通過人為的某些手段來平衡整體使之達到正態分布。

往大的方面講,社會的平衡也是如此。從我們身邊的小事上來說,比如考試,稍顯極端的情況可能是考試過於簡單,但考試的形式可能會有所不同(比如線上考試,答案提交不成功,你懂的)。

大多數的我們,都是平凡的一顆小星星,希望同學們不要因為一次考試的結果就妄自菲薄或者氣滿志驕,調整好心態不斷努力,才能夠在每次考試當中取得優於別人的優秀成績。

文章作者

TD福利&領取方式

最後,TD君為大家送福利啦!為幫助同學們更高效地備考,我們為大家準備了AP統計近10年FRQ真題,免費送給大家!歡迎大家後臺回復「概率」免費獲取,還能進入備考交流群與大家一起備考~

相關焦點

  • 2018年概率論與數理統計考研大綱解析
    摘要:2018考研數學大綱於9月15日發布,關注大綱解析,獲取大綱變化,考研幫為你持續關注。   2018年考試大綱重磅來襲,為了保證各位考生能夠正確解讀大綱要求,中公考研數學團隊帶你以最快的速度,最有效的方式解讀概率論與數理統計的大綱內容。   首先,通過與往年考研大綱對比不難發現,概率概率論與數理統計這一科目秉承往年的穩定性,考查知識點沒有發生任何變化。
  • 056統計基礎中的概率、概率分布及A/B測試
    你好,感謝打開產品Desginer今天是2020年2月16日星期日,農曆正月廿三今天,與你分享的是統計基礎:概率、概率分布與AB測試什麼是概率?前置學習:隨機事件在一個隨機事件裡,我們知道可能的結果是什麼,但是不知道哪一個特定的結果會發生概率是統計的一個基本概念,它是一個0到1之間的數字,是對隨機事件發生可能性的測量P(A)=事件A發生的概率可能性(0 ≤ P(A) ≤ 1)如何理解概率:如我們可以觀察同樣的隨機事件發生無數次,這個隨機事件某一個結果發生的概率,就是這個特定結果在所有結果中所佔的比
  • 概率統計之《指數分布》相關基本概念、性質與典型例題分析
    一、指數分布  在概率論和統計學中,指數分布(Exponential distribution)是一種連續概率分布,可以用來表示獨立隨機事件發生的時間間隔,比如旅客進機場的時間間隔、中文維基百科新條目出現的時間間隔等等。
  • 2021年高考數學總複習——概率與統計專題,易錯點解析
    「概率與統計」是高中數學體系中的重要內容,也是近幾年來全國卷高考數學的常考考點,並且出題題型和規律相對穩定。這部分知識並不是很難,想要快速提分的同學,認真看這篇文章,輕鬆拿下知識點。從全國卷Ⅰ、Ⅱ、Ⅲ中「」概率與統計試題從知識單元、知識點、考察題型和數學能力,四個維度進行梳理,可以發現考點內容以及分布特點:概率與統計考查次數大體相等,每道題考查的知識點數量呈遞增趨勢;統計知識點主要在解答題中考查,概率知識點在3中題型當中分布大體相當。今天給大家帶來的是《概率與統計專題,易錯知識點解析》,零基礎的同學也能聽懂。
  • 2021考研數學(三)概率論與數理統計部分大綱原文解析
    2021考研數學三概率論與數理統計部分大綱原文解析 2021年考研數學大綱已經發布,概率論與數理統計大綱原文如下: 一、隨機事件和概率 考試內容 隨機事件與樣本空間 事件的關係與運算 完備事件組 概率的概念 概率的基本性質 古典型概率 幾何型概率
  • 2010考研數學大綱解析:概率論與數理統計內容
    考研數學一中概率統計佔22%,數學二不考概率,數學三中概率統計佔22%,概率統計在數一和數三中仍然佔有很重要的地位,所以考生要想取得高分,學好概率統計也是必要的,下面就將概率統計中重點內容和典型題型做了總結,希望對大家學習有幫助。
  • 條件概率與貝葉斯統計
    這是最常用的一種推理框架,已經發展成為一種非常成熟的理論,主要內容包括本書前面介紹過的假設檢驗和置信區間。從原則上說,這種方法的優點是無偏性,結論僅僅建立在觀測到的數據之上。但是,某些情況更適合使用另外一種統計方法:貝葉斯統計。圖1 太陽爆炸了嗎?圖 1 中畫的是什麼情況呢?
  • 概率和統計有什麼不一樣?
    聯繫是很顯然的,它們都處理隨機問題,說的是同一種語言(概率,分布,隨機變量,期望,方差等等)。那區別是什麼呢?一圖解千問,一圖勝萬言。那我們先來十張。統計:根據手中的信息,猜測桶裡的。概率:根據桶裡的信息,猜測手裡的。概率課上最常見的題目。
  • 管理心理學之統計(7)概率
    概率的定義概率是一個極其龐大的主題,在初級統計學中我們可以將概率問題理解成簡單的比例問題,用符號p表示。我們知道推論統計的目的在於通過樣本數據回答關於總體的問題。樣本和總體之間的關係通常是根據概率來定義的。在總體已知的情況下,我們可以通過概率來描述可能獲得的樣本。
  • 2019中國科學院大學碩士研究生《概率論與數理統計》考試大綱
    歡迎關注,歡迎轉載,希望對你有用2019中國科學院大學碩士研究生入學考試 《概率論與數理統計》考試大綱本《概率論與數理統計》考試大綱適用於中國科學院大學非數學類的碩士研究生入學考試。概率統計是現代數學的重要分支,在物理、化學、生物、計算機科學等學科有著廣泛的應用。
  • 一道題目重新認識概率與統計
    概率論如圖,在透明圓柱形容器內,有三個紅球,兩個藍球,一個黑球。現從透明圓柱形容器中摸出兩個小球,手中的兩個球都是紅球的可能性有多大?例題剖析概率論研究的是:一個透明容器,你能知道容器的構造(裡面有幾個紅球、幾個藍球,也就是所謂的分布函數),然後計算下一次摸出來的球是紅球的概率。統計學研究的是:一個黑箱子,你能看得到每次摸出來的是紅球還是藍球,然後需要猜測這個黑箱子的內部結構。例如紅球和藍球的比例是多少?
  • 2016考研數學大綱解析——概率之數理統計
    在本文中,跨考教育數學教研室為考生講解概率論和數理統計的橋梁——大數定律和中心極限定理,大數定律和中心極限定理在歷年考試中出題的次數並不多,但其難度也並不大,很多同學認為難度大是因為這塊接觸的少,練習的少,對於定律和定理沒有很好的理解和掌握。
  • 貝葉斯及概率統計角度
    2、算出最靠譜的猜測是什麼。第一個就是計算特定猜測的後驗概率(Posterior),對於連續的猜測空間則是計算猜測的概率密度函數。第二個則是所謂的模型比較,模型比較如果不考慮先驗概率(Prior)的話就是最大似然方法。
  • scipy 常見統計檢驗與概率分布
    常用函數cdf:隨機變量的累積分布函數,是概率密度函數的積分,即概率值pfit:對一組隨機取樣進行擬合,找出最適合取樣數據的概率密度函數的係數二項分布伯努利試驗(Bernoulli experiment)是在同樣的條件下重複地、相互獨立地進行的一種隨機試驗,其特點是該隨機試驗只有兩種可能結果:發生或者不發生。
  • 2011年福建師範大學《概率論與數理統計》考研大綱
    《概率論與數理統計》是數學與應用數學本科專業的基礎課程,是進一步學習隨機數學理論的前提和基礎。概率論是一門從數量角度研究隨機現象內在規律性的學科,數理統計學是一門研究如何有效地收集數據,如何利用概率論思想對數據進行統計推斷或預測,從而為決策提供科學依據和建議。
  • 2021年中考數學知識點:概率與統計
    中考網整理了關於2021年中考數學知識點:概率與統計,希望對同學們有所幫助,僅供參考。   《概率與統計》   【考點要求聚焦】   ◆知識講解   1.統計初步的有關概念   總體:所要考查對象的全體叫總體;個體:總體中每一個考查對象.
  • 概率論與數理統計之事件與概率
    CDA數據分析師 出品摘要本文作為學習概率論的前導知識,主要是為了幫助大家了解以下知識點:什麼是隨機事件和隨機變量?什麼是頻率和概率?事件之間有哪些基本關係?事件之間有哪些基本運算?隨機現象概率論是研究隨機現象的數量規律的數學分支,那麼什麼是隨機現象呢?
  • 通俗理解:概率分布函數、概率密度函數
    概率分布函數和概率密度函數之前,我們先來看看概率函數和概率分布是咋回事。為什麼我們花這麼大的力氣去研究這個概念。因為它實在太重要了,為什麼呢?在這裡,直接引用陳希孺老師在他所著的《概率論與數理統計》這本書中說的:研究一個隨機變量,不只是要看它能取哪些值,更重要的是它取各種值的概率如何!
  • 考研數學知識點解析:概率論與數理統計(五)
    考研數學知識點解析:概率論與數理統計(五) http://kaoyan.eol.cn    萬學海文  2011-07-18  大 中 小 免責聲明: ① 凡本站註明
  • 考研數學攻堅戰:概率與數理統計暑期複習全規劃
    暑期是考研學子複習的黃金期,抓住了暑期,就抓住了考研複習的關鍵期,為考研成功奠定了堅實的基礎,那麼暑期概率與數理統計該如何複習呢?以下是跨考教育數學教研室牛秀燕老師為廣大考生制定的概率與數理統計複習規劃: 周數 學習章節 學習知識點 重難點 第一周 模塊一 隨機事件與概率 隨機事件的關係與運算;簡單概型;概率的公理化定義