隨機變量(random variable)表示隨機試驗各種結果的實值單值函數。隨機事件不論與數量是否直接有關,都可以數量化,即都能用數量化的方式表達!
古典概率古典概率通常又叫事前概率,是指當隨機事件中各種可能發生的結果及其出現的次數都可以由演繹或外推法得知,而無需經過任何統計試驗即可計算各種可能發生結果的概率。
條件概率條件概率是指事件A在另外一個事件B已經發生條件下的發生概率。
離散變量離散變量指變量值可以按一定順序一一列舉,通常以整數位取值的變量。如職工人數、工廠數、機器臺數等。
連續變量在一定區間內可以任意取值的變量叫連續變量,其數值是連續不斷的,相鄰兩個數值可作無限分割,即可取無限個數值
期望值在概率論和統計學中,期望值(或數學期望、或均值,亦簡稱期望,物理學中稱為期待值)是指在一個離散性隨機變量試驗中每次可能結果的概率乘以其結果的總和
離散變量概率分布二項分布二項分布是由伯努利提出的概念,指的是重複n次獨立的伯努利試驗。在每次試驗中只有兩種可能的結果,而且兩種結果發生與否互相對立,並且相互獨立,與其它各次試驗結果無關,事件發生與否的概率在每一次獨立試驗中都保持不變,則這一系列試驗總稱為n重伯努利實驗,當試驗次數為1時,二項分布服從0-1分布。
伯努利分布與二項分布一樣
泊松分布Poisson分布,是一種統計與概率學裡常見到的離散概率分布,由法國數學家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年時發表。
連續變量概率分布均勻分布在概率論和統計學中,均勻分布也叫矩形分布,它是對稱概率分布,在相同長度間隔的分布概率是等可能的。均勻分布由兩個參數a和b定義,它們是數軸上的最小值和最大值,通常縮寫為U(a,b)。
正態分布正態分布(Normal distribution),也稱「常態分布」,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二項分布的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了它。P.S.拉普拉斯和高斯研究了它的性質。是一個在數學、物理及工程等領域都非常重要的概率分布,在統計學的許多方面有著重大的影響力。
指數分布在概率理論和統計學中,指數分布(也稱為負指數分布)是描述泊松過程中的事件之間的時間的概率分布,即事件以恆定平均速率連續且獨立地發生的過程。這是伽馬分布的一個特殊情況。它是幾何分布的連續模擬,它具有無記憶的關鍵性質。除了用於分析泊松過程外,還可以在其他各種環境中找到。
伽瑪分布伽瑪分布(Gamma Distribution)是統計學的一種連續概率函數,是概率統計中一種非常重要的分布。「指數分布」和「χ2分布」都是伽馬分布的特例。
偏態分布偏態分布是與「正態分布」相對,分布曲線左右不對稱的數據次數分布,是連續隨機變量概率分布的一種。可以通過峰度和偏度的計算,衡量偏態的程度。可分為正偏態和負偏態,前者曲線右側偏長,左側偏短;後者曲線左側偏長,右側偏短。
貝塔分布貝塔分布(Beta Distribution) 是一個作為伯努利分布和二項式分布的共軛先驗分布的密度函數,在機器學習和數理統計學中有重要應用。在概率論中,貝塔分布,也稱Β分布,是指一組定義在(0,1) 區間的連續概率分布。
威布爾分布威布爾分布,又稱韋氏分布,是可靠性分析和壽命檢驗的理論基礎。
威布爾分布在可靠性工程中被廣泛應用,尤其適用於機電類產品的磨損累計失效的分布形式。由於它可以利用概率值很容易地推斷出它的分布參數,被廣泛應用於各種壽命試驗的數據處理。
卡方分布若n個相互獨立的隨機變量ξ₁,ξ₂,…,ξn ,均服從標準正態分布(也稱獨立同分布於標準正態分布),則這n個服從標準正態分布的隨機變量的平方和構成一新的隨機變量,其分布規律稱為卡方分布(chi-square distribution)。
F分布F分布是1924年英國統計學家R.A.Fisher提出,並以其姓氏的第一個字母命名的。它是一種非對稱分布,有兩個自由度,且位置不可互換。F分布有著廣泛的應用,如在方差分析、回歸方程的顯著性檢驗中都有著重要的地位。
代碼'''
Created on 2019年8月4日
@author: uYaoQi
'''
from scipy import stats as st
import matplotlib as mpl
import numpy as np
import matplotlib.pyplot as plt
mpl.rcParams['font.sans-serif'] = [u'SimHei']
mpl.rcParams['axes.unicode_minus'] = False
n = 100
p = 0.05
k = np.arange(0,n)
binomial = st.binom.pmf(k,n,p)
plt.plot(k,binomial,'o-')
plt.title('伯努利分布:n=%i,p=%.2f'%(n,p),fontsize=15)
plt.xlabel('實驗成功次數')
plt.ylabel('成功概率',fontsize=15)
plt.grid(True)
plt.show()
x = np.random.poisson(lam=8, size=10000)
pillar = 30
a = plt.hist(x, bins=pillar, density=True, range=[0, pillar], color='g', alpha=0.5)
plt.title('泊松分布',fontsize=15)
plt.xlabel('x柱子個數')
plt.ylabel('概率',fontsize=15)
plt.plot(a[1][0:pillar], a[0], 'r')
plt.grid()
plt.show()
loc = 1
scale = 2.0
x = np.linspace(st.norm.ppf(0.01,loc,scale),st.norm.ppf(0.99,loc,scale),100)
plt.plot(x, st.norm.pdf(x,loc,scale),'b-',label = 'norm')
plt.title(u'正態分布概率密度函數')
plt.show()
lambdaUse = 2
loc = 0
scale = 1.0/lambdaUse
x = np.linspace(st.expon.ppf(0.01,loc,scale),st.expon.ppf(0.99,loc,scale),100)
plt.plot(x, st.expon.pdf(x,loc,scale),'b-',label = 'expon')
plt.title(u'指數分布概率密度函數')
plt.show()
x = np.linspace(0,20,100)
y = st.chi2.pdf(np.linspace(0,20,100),df=4)
plt.plot(x,y)
plt.fill_between(x,y,alpha=0.15)
plt.title(u'卡方分布:自由度為四')
plt.show()
dfn, dfd = 29, 18
x = st.f.rvs(dfn, dfd, size=500)
mu =np.mean(x)
sigma =np.std(x)
num_bins = 30
n, bins, patches = plt.hist(x, num_bins,density=1, facecolor='blue', alpha=0.5)
y = st.norm.pdf(bins, mu, sigma)
plt.plot(bins, y, 'r--')
plt.title(r'F分布')
plt.subplots_adjust(left=0.15)
plt.show()