統計學
從圓柱形容器中,逐個不放回的摸出5個小球。據此推斷:圓柱形容器有幾種顏色的球?每種顏色球的個數與比例?
概率論
如圖,在透明圓柱形容器內,有三個紅球,兩個藍球,一個黑球。
現從透明圓柱形容器中摸出兩個小球,手中的兩個球都是紅球的可能性有多大?
例題剖析
概率論研究的是:一個透明容器,你能知道容器的構造(裡面有幾個紅球、幾個藍球,也就是所謂的分布函數),然後計算下一次摸出來的球是紅球的概率。統計學研究的是:一個黑箱子,你能看得到每次摸出來的是紅球還是藍球,然後需要猜測這個黑箱子的內部結構。例如紅球和藍球的比例是多少?「參數估計」;能不能認為紅球40%,藍球60%?「假設檢驗」概率論是統計學的基礎,統計學是概率論的發展
概率論是給你一個模型,你可以知道這個模型會產生什麼樣的數據;統計學是給你一些數據,你來判斷是由什麼樣的模型產生的。概率論是一套公理化的純數學理論,它有嚴格的公理基礎,裡面的結論都是嚴格推導出來的。統計學就更像一門經驗科學了,它主要是分析現實生活中的數據,並總結規律,然後預測。概率論中的許多定理與結論,如大數定理、中心極限定理等保證了統計推斷的合理性;統計推斷一般都需要對黑箱子做各種各樣的假設,這些假設都是概率模型,統計推斷實際上就是在估計這些模型的參數。統計學是概率論的應用,更加關注數據和模型。模型就是變量與變量之間的關係,比如線性回歸模型。這些模型的範圍是什麼?適用於怎樣的數據類型?各類模型預測的效果怎麼樣?在給出數據以後,這些數據能不能用已經選擇的模型進行分析?這裡就有各種假設檢驗。怎樣用最少的數據達到最精確的預測?