詳解概率分布函數、概率質量函數和概率密度函數

2021-01-12 精神障礙AI診療山西省重點實驗室

首先,請大家記住一句話:統計玩的就是個概率!關於概率的概念,初中高中肯定都學習過了,所以這裡不再贅述,用幾個簡單的例子拋出我們要研究的問題。


例1:商場裡有100個顧客,請你計算有多少男的?多少女的?隨便挑一個人,他是男是女的概率是多少?

例2:商場裡有100個顧客,請你計算他們的年齡情況?隨便挑一個人,他的年齡是21歲的概率是多少?


關於第一個問題,我們用肉眼去辨認即可,無非就是男的或女的,我們肉眼識別後記錄即可。隨便挑一個人,從概率角度來講,非男即女,所以男女的概率各位1/2。但是第二個問題怎麼解決呢?我們肉眼雖然能大概辨認出每位顧客的年齡段,但是具體年齡卻是肉眼看不出來的。所以解決方案只能是一個一個的去問,然後再加以記錄,最終做成統計表或者統計圖。之後我們數出年齡21歲的顧客的個數,然後除以100,才能得到第二個問題的答案。

為什麼同樣是100人,同樣的商場,同樣是計算概率的問題,兩個問題的複雜程度就不一樣了呢?答案要回到兩個重要的概念上:樣本空間和數據類型。簡單解釋一下,第一個問題的樣本空間是2(男和女),數據類型是離散型隨機變量,第二個問題的樣本空間是100,數據類型是連續型隨機變量。這裡不進行具體解釋,自行揣摩。

接下來,我們重點來探討離散型隨機變量和連續型隨機變量的問題。離散型隨機變量可以理解為樣本空間較少,可以逐一進行列舉的變量,再簡單點說就是可以用塊、個、只,組這種量詞來形容的變量。(比如:20個女的,60隻鴨子)。離散型變量往往只能取整數,像1.5個人或者4.8組這樣的描述往往是錯誤的。連續型變量簡單來說大部分用於描述抽象的事物,比如速度、年齡、用藥劑量等這些概念,基本上都是連續型變量。區分兩者的最好辦法就是看變量本身取值能不能取小數,能取小數基本是就是連續型變量了。

為什麼要花這麼多功夫來再次理解離散型隨機變量和連續型隨機變量呢,因為這兩種變量真的是不一樣,涉及到的數學描述方法也不同,所以千萬不能搞混。


相關焦點

  • 通俗理解:概率分布函數、概率密度函數
    概率分布函數和概率密度函數之前,我們先來看看概率函數和概率分布是咋回事。為什麼我們花這麼大的力氣去研究這個概念。因為它實在太重要了,為什麼呢?在這裡,直接引用陳希孺老師在他所著的《概率論與數理統計》這本書中說的:研究一個隨機變量,不只是要看它能取哪些值,更重要的是它取各種值的概率如何!
  • 概率質量函數與累積分布函數()連續) - 圖解概率 05
    概率質量函數與累積分布函數-連續當累積分布函數為連續函數時候, 概率質量函數 PMF 不再適用, 因此就需要用積分(概率密度函數PDF)來計算概率
  • 算法工程師的數學基礎|如何理解概率分布函數和概率密度函數
    離散型隨機變量的概率分布、概率函數和概率分布函數在理解概率分布函數和概率密度函數之前,先來理解下概率分布和概率函數。陳希孺老師在他所著的《概率論與數理統計》這本書中說:研究一個隨機變量,不只是要看它能取哪些值,更重要的是它取各種值的概率如何!
  • 概率質量函數與累積分布函數(離散) - 圖解概率 03
    概率質量函數與累積分布函數-離散隨機變量隨機變量其實就是函數, 將各種事件映射成對應的數字.
  • 概率密度函數如何影響分布函數?
    今天我們來了解一下隨機變量的密度函數與分布函數之間的關係。
  • Z=XY分布的概率密度函數的證明
    在考研中,儘管很少需要用到二維連續型隨機變量函數Z=XY的概率密度公式,但清楚其證明過程有二利:一、有利於了解樣本空間、概率密度、分布函數的本質;二、有利於加強對反常積分的運算技巧。設(X,Y)是二維連續型隨機變量,概率密度為f(x,y),則Z=XY仍為連續型隨機變量,其概率密度為:在證明前,大家首先要牢記一點的是,求解隨機變量函數的概率密度時,大多數情況下,先求分布函數,再求概率密度。首先求分布函數。根據分布函數的定義有Fz(z)=P{Z≤z}=P{XY≤z}。當進行到這一步時,正確理解隨機變量及概率的含義是能夠繼續進行證明的關鍵。
  • 【Excel技巧】F分布概率密度函數圖表的繪製
    利用Excel繪製t分布的概率密度函數的相同方式,可以繪製F分布的概率密度函數圖表。
  • 【統計學入門課堂15】概率密度函數
    在數學中,連續型隨機變量的概率密度函數(在不至於混淆時可以簡稱為密度函數)是一個描述這個隨機變量的輸出值
  • 蒙特卡洛方法-概率密度函數
    在我們《光線追蹤》的課程裡,我們使用的是直接求平均的方式,其實這個地方我們如果採用一些概率學的方法會讓結果變得更好,這樣我們不得不來了解一下概率密度函數。概率密度函數從上面的柱狀圖,我們可以得到這樣的一些信息:高度在60~65之間的樹有:3棵高度在65~70之間的樹有:3棵高度在70~75之間的樹有:8棵高度在75~80之間的樹有:10棵高度在80~85之間的樹有:5棵
  • 概率論和統計學中重要的分布函數
    · 冪律分布(Power Law Distribution)  · 分布函數的使用引言  每當我們遇到任何概率實驗,我們談論的是隨機變量,它只不過是獲取實驗預期結果的變量。高斯/正態分布  高斯/正態分布是一個連續的概率分布函數,隨機變量在均值(μ)和方差(σ)周圍對稱分布。
  • 密度函數、分布函數與生存函數
    數據探索時涉及到的三個函數為密度函數、分布函數與生存函數,其中樣本的分布函數的形態、生存函數的形態基本沒有太大變化,然而樣本的密度函數分布形態卻有著很大的差異,所以一般在進行數據分析領域提到分布時,指的都是直方圖所描述的密度函數。
  • [257]先驗概率、似然函數與後驗概率(1)
    先驗概率僅僅依賴於主觀上的經驗估計,也就是事先根據已有的知識的推斷, 在應用貝葉斯理論時,通常將先驗概率乘以似然函數(likelihoodfunction)再歸一化後,得到後驗概率分布,後驗概率分布即在已知給定的數據後,對不確定性的條件分布。
  • 從貝葉斯定理到概率分布:綜述概率論基本定義
    隨機變量默認用大寫字母表示,我們可以使用 ~ 符號指定一個分布賦給一個變量。上式表示隨機變量 X 服從成功率(正面向上)為 0.6 的伯努利分布。連續和離散概率分布概率分布可分為兩種:離散分布用於處理具有有限值的隨機變量,如投擲硬幣和伯努利分布的情形。離散分布是由所謂的概率質量函數(PMF)定義的,連續分布用於處理連續的(理論上)有無限數量的值的隨機變量。
  • scipy 常見統計檢驗與概率分布
    常用函數cdf:隨機變量的累積分布函數,是概率密度函數的積分,即概率值pfit:對一組隨機取樣進行擬合,找出最適合取樣數據的概率密度函數的係數二項分布伯努利試驗(Bernoulli experiment)是在同樣的條件下重複地、相互獨立地進行的一種隨機試驗,其特點是該隨機試驗只有兩種可能結果:發生或者不發生。
  • 從微積分角度證明「正態分布密度函數」
    沒錯如下和正態分布中概率密度函數很像。但我們僅從積分學的角度來分析正面它。·證明它靈活的數學技巧,你準備好了嗎?因為e^-x^2是關於x的偶函數,所以我們明顯可以想到所以你只需要證明,學過概率論與數理統計的朋友,應該很熟悉這個式子根據泰勒公式我們得到所以當x不等於0時,e^>1+x,將x換成x^2或者-x^2可得,可得
  • 考研數學概率與統計公式大全之隨機變量及其分布
    (2)連續型隨機變量的分布密度 設 是隨機變量  的分布函數,若存在非負函數 ,對任意實數 ,有 ,        則稱 為連續型隨機變量。  稱為 的概率密度函數或密度函數,簡稱概率密度。
  • 概率論概述
    為了更好的研究概率我們在概率空間定義了隨機變量並研究了在這個基礎之上的概率的隨著隨機變量的不同取值的分布情況,所以有了隨機變量(離散)的分布列以及單點取值對應於連續變量是分布函數以及分布密度函數,並對於一些特定的分布的性質做了深入研究,得到了一些結論。
  • 量子力學的世界裡,概率就是一切!揭示原子的「波函數」
    聯合量子研究所(JQI)是美國國家標準與技術研究所(NIST)和馬裡蘭大學的合作研究機構,在聯合量子研究所(JQI)進行的實驗使用了一種光學網格(一種懸掛著數千個原子的雷射網絡)來確定一個原子可能在任何給定位置的概率。由於晶格中的每個原子行為都與其他原子類似,所以對整個原子群的測量揭示了單個原子在空間某一點的可能性。
  • 理解概率密度函數
    ,它們的概率之和必須為1:這些隨機事件不會同時發生,但必須有一件會發生。例如,對於拋硬幣,不是正面朝上就是反面朝上,不會出現其他情況(這裡假設硬幣拋出去後不會立著),因此有:p(正面朝上)+p(反面朝上)=1很多時候,我們假設這些基本的隨機事件發生的概率都是相等的,因此,如果有n個基本的隨機事件,要使得它們發生的概率之和為1,則它們各自發生的概率都為:
  • 統計學入門級:常見概率分布+python繪製分布圖
    概率密度函數因為連續型隨機變量可以取某一區間或整個實數軸上的任意一個值,所以通常用一個函數f(x)來表示連續型隨機變量,而f(x)就稱為概率密度函數。正態分布的分布函數:正態分布的圖形特點:f(x) ≥ 0,所以整個概率密度曲線都在x軸的上方正態分布的概率密度曲線是一條關於x = μ對稱的鐘形曲線,表現為「兩頭小,中間大,左右對稱