數理統計與概率論及Python實現(3)——隨機變量概述

2021-03-02 97年陳伯伯


前面兩篇文章,我們講到了概論論中的基本概念和隨機變量的初步認識;

對隨機變量及其取值規律的研究是概率論的核心內容。在上一個小結中,總結了隨機變量的概念以及隨機變量與事件的聯繫。這個小結會更加深入的討論隨機變量。

可以先把文章看完:再回來理解這句話:隨機變量最主要的性質是其所有可能取到的這些值的取值規律,即取到的概率大小。

數理統計與概率論及Python實現(1)——概率論中基本概念

數理統計與概率論及Python實現(2)——隨機變量

隨機變量與事件

隨機變量的本質是一種函數(映射關係),在古典概率模型中,「事件和事件的概率」是核心概念;但是在現代概率論中,「隨機變量及其取值規律」是核心概念。

 

隨機變量與事件的聯繫與區別

文章1和2中對這兩個概念的聯繫進行了非常詳細的描述。隨機變量實際上只是事件的另一種表達方式,這種表達方式更加形式化和符號化,也更加便於理解以及進行邏輯運算。不同的事件,其實就是隨機變量不同取值的組合。舉一個很好的例子來說明兩者之間的差別:

對於隨機試驗,我們所關心的往往是與所研究的特定問題有關的某個或某些量,而這些量就是隨機變量。當然,有時我們所關心的是某個或某些特定的隨機事件。例如,在特定一群人中,年收入在萬元以上的高收入者,以及年收入在3000元以下的低收入者,各自的比率如何?這看上去像是兩個孤立的事件。可是,若我們引入一個隨機變量XX:

X=隨機抽出一個人其年收入X=隨機抽出一個人其年收入

則X是我們關心的隨機變量。上述兩個事件可分別表示為{X>10000}{X>10000}或{X<3000}{X<3000}。這就看出:隨機事件這個概念實際上包容在隨機變量這個更廣的概念之內。也可以說,隨機事件是從靜態的觀點來研究隨機現象,而隨機變量則是一種動態的觀點,一如數學分析中的常量與變量的區分那樣,變量概念是高等數學有別於初等數學的基礎概念。同樣,概率論能從計算一些孤立事件的概率發展為一個更高的理論體系,其基本概念就是隨機變量。

一下子引用了一大段話,這段話非常清楚的解釋了隨機變量與事件的區別:就像變量與常量之間的差別那樣,這樣的差別比起我自己看到的要大得多。做這樣的比較也有利於自己更好的理解「隨機變量」這個多少有點抽象的概念。

 

隨機變量的分類

隨機變量從其可能取的值全體的性質可以分為兩大類:離散型隨機變量和連續型隨機變量。

 

離散型隨機變量

離散型隨機變量的取值在整個實數軸上是間隔的,要麼只有有限個取值,要麼是無限可數的。

 

圖1:離散型隨機變量的概率質量分布函數

 

常見的離散型隨機變量包括以下幾種:

0-1分布(也叫兩點分布或伯努利分布)

二項分布

幾何分布

泊松分布

超幾何分布

 

連續型隨機變量

連續型隨機變量的取值要麼包括整個實數集(−∞,+∞)(−∞,+∞),要麼在一個區間內連續,總之這類隨機變量的可能取值要比離散型隨機變量的取值多得多,它們的個數是無限不可數的。

圖2:連續型隨機變量的概率密度分布函數

 

常見的連續型隨機變量包括以下幾種:

 

概率密度函數的性質

所有的概率密度函數f(x)都滿足下面的兩條性質; 所有滿足下面兩條性質的一元函數也都可以作為概率密度函數。


f(x)≥0 ; 以及 ∫+∞−∞f(x)dx=1


隨機變量的基本性質

隨機變量最主要的性質是其所有可能取到的這些值的取值規律,即取到的概率大小。

如果我們把一個隨機變量的所有可能的取值的規律都研究透徹了,那麼這個隨機變量也就研究透徹了。

隨機變量的性質主要有兩類:

一類是大而全的性質,這類性質可以詳細描述所有可能取值的概率,例如累積分布函數和概率密度函數;

另一類是找到該隨機變量的一些特徵或是代表值,例如隨機變量的方差或期望等數字特徵。常見的隨機變量的性質見下表:

縮寫中文名解釋CDF累計分布函數 連續型和離散型隨機變量都有,一般用F(X)F(X)表示PDF概率密度分布函數連續型隨機變量在各點的取值規律,用f(x)f(x)或fX(x)fX(x)表示PMF概率質量分布函數離散隨機變量在各特定取值上的概率IQR四分位數間距25%分位數與75%分位數之差SD標準差用於描述隨機變量取值的集中程度

概率質量函數 vs 概率密度函數

概率質量函數和概率密度函數不同之處在於:

概率質量函數是對離散隨機變量定義的,本身代表該值的概率;

概率密度函數是對連續隨機變量定義的,本身不是概率,只有對連續隨機變量的概率密度函數在某區間內進行積分後才是概率。

更多內容,歡迎相互學習

更有數據分析學習群


相關焦點

  • 數理統計與概率論及Python實現——概率論中基本概念
    ;到了工作中,統計作為數據科學的基礎,想要從事這方面的工作,這始終是一個繞不過去的檻;這次主要寫連載,一是主要為了鞏固數理統計的知識,二也是嘗試用簡單易懂系統的文字向感興趣的朋友介紹相關內容;導讀:基礎中的基礎隨機事件試驗與樣本空間:頻率與概率基礎中的基礎
  • 2021考研概率論與數理統計衝刺:多維隨機變量及其分布考試要求...
    概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。多維隨機變量及其分布考試要求1.理解多維隨機變量的概念,理解多維隨機變量的分布的概念和性質,理解二維離散型隨機變量的概率分布
  • 2021考研概率論與數理統計衝刺:隨機變量的數字特徵考試要求_北京...
    概率論與數理統計是考研數學中尤其重要的一門,在這個階段大家一定不要放鬆,持續備戰方可戰勝困難,下面中公考研小編為大家整理概率論與數理統計相關內容,希望對各位考生有所幫助。隨機變量的數字特徵考試要求1.理解隨機變量數字特徵(數學期望、方差、標準差、矩、協方差、相關係數)的概念,會運用數字特徵的基本性質,並掌握常用分布的數字特徵。
  • 概率論與數理統計
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。我們總結各個部分考察的主要內容及對考生的要求,最後總結此門科目經常考的題型及容易犯的錯誤,供大家參考。
  • 概率論與數理統計初步
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。  隨機變量及概率分布考查的主要內容有:  (1)利用分布函數、概率分布或概率密度的定義和性質進行計算;  (2)掌握一些重要的隨機變量的分布及性質,主要的有:(0-1)分布、二項分布、泊松分布、幾何分布、超幾何分布、均勻分布、指數分布和正態分布,會進行有關事件概率的計算;  (3)會求隨機變量的函數的分布。
  • 概率論和數理統計:必然性的因果關係,遇見多種可能的隨機事件
    說到隨機現象的研究,還有一個與概率論密切聯繫的同類學科——數理統計。但概率論、數理統計、統計方法又有各自不同的內容。【概率論】基於大量同類隨機現象的統計規律,對隨機現象的結果可能性作出科學客觀的判斷,並對其可能性大小做出數量上的描述,從而形成一整套的數學理論和方法。
  • 考研數學概率與數理統計學科特點
    一方面是時間不充裕,概率解答題位於試卷的最後,學生即使會,也來不及解答;另一方面是概率本身學科的特點,導致很多學生覺得概率非常難。   概率與數理統計學科的特點:   1、研究對象是隨機現象。高數是研究確定的現象,而概率研究的是不確定的,是隨機現象。對於不確定的,大家感覺比較頭疼。
  • 概率論與數理統計第四版
    概率論與數理統計是描述「隨機現象」並研究其數量規律的一門學科。通過本課程的教學,使學員掌握概率的定義和計算,能用隨機變量概率分布及數字特徵研究「隨機現象」的規律,了解數理統計的基本理論與思想,並掌握常用的包括點估計、區間估計和假設檢驗等基本統計推斷方法。該課程的系統學習,可以培養學員提高認識問題、研究問題與處理相關實際問題的能力。
  • 2013考研概率論與數理統計考查焦點總結
    2013考研概率論與數理統計考查焦點總結 http://kaoyan.eol.cn    文都教育  2012-12-19  大 中 小   2013考研在即,相比考研高等數學和線性代數,概率論與數理統計對於同學們來說記憶量更大
  • 619概率論及數理統計2017年考研初試試卷真題(青島大學)
    新東方網>大學教育>考研>考研試題>歷年真題>專業課>正文619概率論及數理統計2017年考研初試試卷真題(青島大學) 2020-12-02 14:57 來源:青島大學
  • 619概率論及數理統計2016年考研初試試卷真題(青島大學)
    新東方網>大學教育>考研>考研試題>歷年真題>專業課>正文619概率論及數理統計2016年考研初試試卷真題(青島大學) 2020-12-02 14:58 來源:青島大學
  • 概率論與數理統計複習攻略
    而「相互獨立」則是指一個事件發生與否對另一事件發生的概率沒有影響。   隨機變量的獨立性與不相關性是兩個既有區別又有聯繫的概念。兩個隨機變量X,Y可能不相關,但也也不相互獨立。條件概率P(A|B)與乘積概率P(AB) 也是容易混淆的一對概念。
  • 機器學習數學基礎:數理統計與描述性統計
    今天是概率統計基礎的第二篇文章, 基於第一篇隨機變量與隨機事件進行整理, 首先理一理這裡面的邏輯,第一篇的內容蘊涵了大部分概率論的知識(除了大數定律和中心極限定理這種理論性的支持, 後期有機會會補上)。而今天的這篇內容是在概率論的基礎上往前一步, 屬於數理統計的內容。
  • 淺說數理統計與概率論
    數理統計            數理統計是伴隨著概率論的發展而發展起來的一個數學分支,研究如何有效的收集、整理和分析受隨機因素影響的數據,並對所考慮的問題作出推斷或預測,為採取某種決策和行動提供依據或建議。       根據上面描述,數理統計可分為描述統計和推斷統計。
  • 2013年考研概率論與數理統計考查點總結
    2013考研在即,相比考研高等數學和線性代數,概率論與數理統計對於同學們來說記憶量更大,對此結合最新考試大綱總結出概率論和數理統計各部分的考查焦點,幫助同學們查漏補缺,實現完美衝刺。
  • 海文:2014年考研數學大綱 概率與數理統計命題規律
    概率與數理統計這門課程從試卷本身的難度的話,在三門課程中應該算最低的,但是從每年得分的角度來說,這門課程是三門課中得分率最低的。這主要是由兩方面造成的。一方面是時間不充裕,概率解答題位於試卷的最後,學生即使會,也來不及解答;另一方面是概率本身學科的特點,導致很多學生覺得概率非常難。  概率與數理統計學科的特點:  1、研究對象是隨機現象。
  • 數理統計基礎-離散隨機變量
    它將每個試驗可能的結果與一個實數關聯起來, 使我們可以分析結果數集上的概率分布.我們假定隨機變量是離散的.    對於隨機變量X和實數x, 定義事件X=x為{s∈S: X(s)=x},因此P(X=x)=∑P(s),函數 f(x) =P(X=x)稱為隨機變量X的概率密度函數. P(X=x)≥0且∑P(X=x)=1.
  • 2014年考研數學:概率與數理統計的學科特點及命題規律
    研究對象是隨機現象。高數是研究確定的現象,而概率研究的是不確定的,是隨機現象。對於不確定的,大家感覺比較頭疼。  2. 題型比較固定,解法比較單一,計算技巧要求低一些。比如概率的解答題主要考查二維離散型隨機變量、二維連續型隨機變量、隨機變量函數的分布和參數的矩估計、最大似然估計。考生只要掌握了相應的解題方法,計算準確,就可以拿到滿分。  3. 高數和概率相結合。
  • 2012考研數學:概率論與數理統計初步
    概率論與數理統計初步主要考查考生對研究隨機現象規律性的基本概念、基本理論和基本方法的理解,以及運用概率統計方法分析和解決實際問題的能力。  隨機事件和概率考查的主要內容有:  (1)事件之間的關係與運算,以及利用它們進行概率計算;    (2)概率的定義及性質,利用概率的性質計算一些事件的概率;  (3)古典概型與幾何概型;  (4)利用加法公式、條件概率公式、乘法公式、全概率公式和貝葉斯公式計算概率;  (5)事件獨立性的概念,利用獨立性計算事件的概率
  • 2014考研數學:概率論與數理統計必備考點
    概率論與數理統計這門課的最大特點是,題型比較單一,解題手法也比較單一,比如大題基本上就圍繞在隨機變量函數的分布,隨機變量的數字特徵,參數的矩估計和最大似然估計這幾塊,在考研中應付這門課程是最簡單的。