數理統計與概率論及Python實現——概率論中基本概念

2021-02-08 數據森麟

公眾號後臺回復「圖書「,了解更多號主新書內容

作者:Keivan Chan

來源:97年陳伯伯


其實從中學就開始學習統計學了,畫直方圖,求平均值,找中位數等;大學也集中學過概率論和數理統計;

到了工作中,統計作為數據科學的基礎,想要從事這方面的工作,這始終是一個繞不過去的檻;

這次主要寫連載,一是主要為了鞏固數理統計的知識,二也是嘗試用簡單易懂系統的文字向感興趣的朋友介紹相關內容;


導讀:

基礎中的基礎隨機事件試驗與樣本空間:頻率與概率


基礎中的基礎

    在所有可觀察的現象中,可以從大的方面分為兩類——必然現象和隨機現象。

    物理學中各種定律描述的基本上都是必然現象,比如物體會因為重力而從高處下落,某一時刻地球位於太陽系中的位置。這些現象的發生都是確定無疑的,如果我們完全認識了它們的內在規律,那麼在發生之前就是可以完全準確的預測出結果。

    但是還有一類現象是不確定的。它的不確定性表現在,事先無法準確的預測其結果。唯一可以獲得這類現象的結果的辦法是等到它們發生之後。最典型的例子就是拋硬幣。拋一枚均勻的硬幣之前,已知結果只有正面和反面兩種,但是無法知道到底會是哪一面。比如說,跟喜歡的人表白;明天是否會下雨等。可以看到,這些現象單次發生的時候,是毫無規律可循的。

    

    也正是有了這兩種現象,才讓這個世界既可以被認識,又不至於完全可以被預測。


    但當我們在相同的條件下,大量重複(如果可以的話)做某件不確定的事,然後統計實驗結果,就有可能發現某種規律。還是拿拋硬幣來舉例,每次拋硬幣都不知道會得到正面還是反面,但如果有耐心將一枚均勻的硬幣拋20,000次(已經有多位著名的統計學家這麼做過了),然後統計一下正反面分別出現了多少次,就可以發現它們差不多都是10,000次,也就是差不多各佔50%。上面的拋硬幣的例子中,隨機現象(拋硬幣)在相同的條件下,大量重複試驗中呈現的規律性就叫做統計規律性。

    

    《概率論與數量統計》就是研究隨機現象的統計規律的一門學科。

    

    概率論研究的是隨機現象的模型(即概率分布);

    數理統計是研究隨機現象的數據收集和處理;即包括數據的收集、整理、分析和建模,從而對隨機現象的某些規律進行預測或決策。


    怎麼學習概率論與數量統計:

學思想:如何看待和處理隨機規律性;

學方法:建立統計模型;

學應用:模型的實際應用,也可以自己收集、尋找各種實例;

學軟體:掌握統計軟體的使用和結果分析。


隨機事件試驗與樣本空間:

隨機事件:在一定條件下,並不總是出現相同結果的現象成為隨機現象,三個特點:

可以在相同條件下重複進行;

事先知道所有可能出現的結果;

進行試驗前不知道哪個試驗結果會發生。


隨機實驗:對在相同條件下可以重複的隨機現象的觀測、記錄、實驗稱為隨機實驗;例如常出現的擲骰子,摸球,射擊,拋硬幣等。


樣本空間:隨機現象的一切可能基本結果組成的集合稱為樣本空間,一般即為S(大寫的S);S中的元素e稱為樣本點;

           將樣本點的個數為有限個或可列個的情況歸為一類,稱為離散樣本空間;

           將樣本點的個數為不可列個的情況歸為一類,稱為連續樣本空間;


隨機事件:隨機現象的某些樣本點組成的集合稱為隨機事件;簡稱事件;即事件是樣本空間的子集;

            由樣本空間單個元素組成的子集稱為基本事件;

            由樣本空間最大子集構成的事件稱為必然事件;

            由樣本空間最小自己(即空集)構成的事件稱為不可能事件;


事件的相互關係:

事件的包含:A⊆B

事件的相等:A=B

事件的積(交):A∩B,AB

互斥事件(互不相容事件):不能同時出現

事件的和(並):A∪B

事件的差:A-B,A發生,B不發生

對立事件(逆事件):互斥,必需出現其中一個

          事件的運算性質就是集合的性質


頻率與概率

頻率:

    頻率是0~1之間的一個實數,在大量重複試驗的基礎上給出了隨機事件發生可能性的估計。

    頻率的穩定性:在充分多次試驗中,事件的頻率總在一個定值附近擺動,而且,試驗次數越多擺動越小。這個性質叫做頻率的穩定性。


    

概率:

    概率的統計性定義:當試驗次數增加時,隨機事件A發生的頻率的穩定值p就稱為概率。記為P(A)=p

    概率的公理化定義:設隨機試驗對於的樣本空間為S。對每一個事件A,定義P(A),滿足:

非負性:P(A) ≥ 0;

規範性:P(S) = 1;

可列可加性:A1, A2, ...兩兩互斥,及AiAj = ∅, i≠j, 則P(∪Ai) = ∑P(Ai)

(看不懂的調過即可)(從統計學定義理解即可)


條件概率:

    P(A|B)表示在事件B發生的條件下,事件A發生的概率,相當於A在B中所佔的比例。此時,樣本空間從原來的完整樣本空間S縮小到了B

    由於有了條件的約束(事件B),使得原來的樣本空間減小了。

                   

圖1:a.條件概率的樣本空間;b.條件概率的計算公式

 

例:一個家庭中有兩個小孩,已知至少一個是女孩,問兩個都是女孩的概率是多少?

(假定生男生女是等可能的)

解:由題意,樣本空間為

S = {(兄, 弟), (兄, 妹), (姐, 弟), (姐, 妹)}

B = {(兄, 妹), (姐, 弟), (姐, 妹)}

A = {(姐, 妹)}

由於事件B已經發生,所以這時試驗的所有可能只有三種,而事件A包含的基本事件只佔其中的一種,所以有:

P(A|B) = 1/3,

即在已知至少一個是女孩的情況下,兩個都是女孩的概率為1/3。

在這個例子中,如果不知道事件B發生,則事件A發生的概率為P(A) = 1/4

這裡P(A) ≠ P(A|B),其原因在於事件B的發生改變了樣本空間,使它由原來的S縮減為新的樣本空間SB = B。


今天就這樣,白了個白~

數據森麟公眾號的交流群已經建立,許多小夥伴已經加入其中,感謝大家的支持。大家可以在群裡交流關於數據分析&數據挖掘的相關內容,還沒有加入的小夥伴可以掃描下方管理員二維碼,進群前一定要關注公眾號奧,關注後讓管理員幫忙拉進群,期待大家的加入。


管理員二維碼:

相關焦點

  • 數理統計與概率論及Python實現(3)——隨機變量概述
    前面兩篇文章,我們講到了概論論中的基本概念和隨機變量的初步認識;對隨機變量及其取值規律的研究是概率論的核心內容
  • 2021考研概率論與數理統計衝刺:數理統計的基本概念考試要求_北京...
    概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。數理統計的基本概念考試要求1.理解總體、簡單隨機樣本、統計量、樣本均值、樣本方差及樣本矩的概念,其中樣本方差定義為2.了解分布、分布和分布的概念及性質
  • 概率論與數理統計
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。我們總結各個部分考察的主要內容及對考生的要求,最後總結此門科目經常考的題型及容易犯的錯誤,供大家參考。
  • 概率論與數理統計初步
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。  要求考生理解基本概念,會分析事件的結構,正確運用公式,掌握一些技巧,熟練地計算概率。
  • 2018考研數學概率論重點總結:數理統計的基本概念
    概率與數理統計這門課程從試卷本身的難度的話,在三門課程中應該算最低的,但是從每年得分的角度來說,這門課程是三門課中得分率最低的。這主要是由兩方面造成的。一方面是時間不充裕,概率解答題位於試卷的最後,學生即使會,也來不及解答;另一方面是概率本身學科的特點,導致很多學生覺得概率非常難。
  • 概率論與數理統計複習攻略
    在概率9講中有明確提到,學習概率的核心就是要明白概率統計的研究思想、並且能熟練使用微積分工具來研究概率。 因此大家在學習概率論與數理統計的時候應該注意以下幾點: 在概率論中存在許多容易混淆的概念,如果不能認真區分,仔細加以甄別,就不能正確理解這些重要概念,在應用時就會產生各種各樣的錯誤。互不相容事件與相互獨立事件是最容易混淆的一對概念。
  • 概率論與數理統計第四版
    概率論與數理統計是描述「隨機現象」並研究其數量規律的一門學科。通過本課程的教學,使學員掌握概率的定義和計算,能用隨機變量概率分布及數字特徵研究「隨機現象」的規律,了解數理統計的基本理論與思想,並掌握常用的包括點估計、區間估計和假設檢驗等基本統計推斷方法。該課程的系統學習,可以培養學員提高認識問題、研究問題與處理相關實際問題的能力。
  • 2020年考研數學複習之概率論與數理統計的基礎基本概念
    小編整理了概率論與數理統計基本概念這一部分的總結,希望能夠給準備考研的同學一點點幫助。概率論與數理統計這一部分內容是研究生考試中,廣大考生感到困難同時又是非常重要的一部分。數理統計部分在考研真題形式和所佔比重相對固定,題型一般都是兩個選擇題,一個填空題和兩個解答題總共是34分。縱觀近十年來的考研真題,每年考研數學一的第23題(最後一道壓軸題)都是數理統計的題目。
  • 淺說數理統計與概率論
    數理統計            數理統計是伴隨著概率論的發展而發展起來的一個數學分支,研究如何有效的收集、整理和分析受隨機因素影響的數據,並對所考慮的問題作出推斷或預測,為採取某種決策和行動提供依據或建議。       根據上面描述,數理統計可分為描述統計和推斷統計。
  • 概率論與數理統計課件
    ‍點擊上方高數君可加關注 帶你一起學習高數,複習考研數學 概率論與數理統計課件百度雲下載連結
  • 2017考研數學概率論與數理統計考情分析
    一、以基礎為綱  從近十年考研數學真題來看,試卷中80%的題目都是基礎計算題目,所謂的難題只是少數。概率論與數理統計這門學科是數一數三的公共考查科目,這部分知識在整張試卷中佔22%的分值,其相對高數知識體系要簡單。
  • 2013考研概率論與數理統計考查焦點總結
    2013考研概率論與數理統計考查焦點總結 http://kaoyan.eol.cn    文都教育  2012-12-19  大 中 小   2013考研在即,相比考研高等數學和線性代數,概率論與數理統計對於同學們來說記憶量更大
  • 2021考研數學概率複習:數理統計的基本概念
    2021考研數學概率複習:數理統計的基本概念  摘要:大家一起來進行2021考研數學概率複習:數理統計的基本概念,每天積累一點點,積少成多,我們也會成為數學做題小能手噠~~2021考研考數學的同學,記得每天做題哦,數學比較考查我們的思維能力,小腦袋瓜越用才越靈光!
  • 2014考研數學:概率論與數理統計必備考點
    概率論與數理統計這門課的最大特點是,題型比較單一,解題手法也比較單一,比如大題基本上就圍繞在隨機變量函數的分布,隨機變量的數字特徵,參數的矩估計和最大似然估計這幾塊,在考研中應付這門課程是最簡單的。
  • 2018年概率論與數理統計考研大綱解析
    2018年考試大綱重磅來襲,為了保證各位考生能夠正確解讀大綱要求,中公考研數學團隊帶你以最快的速度,最有效的方式解讀概率論與數理統計的大綱內容。   首先,通過與往年考研大綱對比不難發現,概率概率論與數理統計這一科目秉承往年的穩定性,考查知識點沒有發生任何變化。
  • 2021考研概率論與數理統計衝刺:隨機事件和概率考試要求_北京中公...
    概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。隨機事件和概率考試要求1.了解樣本空間(基本事件空間)的概念,理解隨機事件的概念,掌握事件的關係及運算。
  • 大連理工大學概率論與數理統計2016考研專業目錄
    新東方網>大學教育>考研>考研資訊>招生信息>正文大連理工大學概率論與數理統計2016考研專業目錄 2015-10-13 14:40 來源:新東方網整理
  • 《概率論與數理統計》課後答案
    前言:        為方便各位同學期末複習《概率論與數理統計》,現特意為各位同學送上符合廣東財經大學的課後答案一份
  • 概率論與數理統計的第一講
    概率的第一講,主要講清楚歷史發展背景、學習方法、概率統計的專業應用背景等,提高學生的認知能力。
  • 2012考研數學:概率論與數理統計初步
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。  隨機事件和概率考查的主要內容有:  (1)事件之間的關係與運算,以及利用它們進行概率計算;    (2)概率的定義及性質,利用概率的性質計算一些事件的概率;  (3)古典概型與幾何概型;  (4)利用加法公式、條件概率公式、乘法公式、全概率公式和貝葉斯公式計算概率;  (5)事件獨立性的概念,利用獨立性計算事件的概率