大家或許很多時候在算符合正態分布概率類型的時候,都在查表,
其實,不需要,EXCEL中的一個函數就可以解決這個問題,
在這個函數中間,
我們需要4個參數,
例如下面這個例子:
一組成績排布,當然我只截取了一部分,
均值,你可以使用,平均值函數來做,
標準差,你則可以是STDEV.S函數來做.
那麼,在上述的NORM.DIST函數中,你只需要給出一個X值就可以滿足所有的條件然後查出概率.
最後一個參數,給到1,就行.如果需要製作圖表則會用到0.
好,現在我們做一張圖表.
如封面展示的那樣,
首先我們,假使,均值標準差,以及X目標值,如下,我們就可以算出概率.
需要說明的是,這個地方用到的是目標值的範圍,當目標值<=75的時候,你的圖形應當是這樣的,
那麼橘色部分則是,你的X所在的區域.
基於這樣的情況,我們應該:
這個中間的計算值如下:
X排布=均值-標準差*4
排布的第二個數值=第一個數值+1,把範圍鋪開.
這一段需要解釋的是,其實你也可以手動來給,由於我們必須要給我們的圖形一個區域,所以你可以根據具體的情況來擬定一個範圍,只要是合理的就行.
分布密度=正態分布概率函數,
分布密度=正態分布函數,最後一個參數給到0,
=NORM.DIST(A7,$B$1,$B$2,FALSE)
選擇0通俗的含義是,我們給到圖形中的高度.
這個時候,你可以選擇分布密度的整個系列,插入一個堆積面積圖,則會得到:
然後我們需要在這個面積圖的基礎之上,再給它一個面積堆積,達到自由切換的效果,而上圖藍色的部分則是基於我們的基本數據給出來的底層正態模型,自己切換或者變化的面積也必須要在這個藍色的面積範圍以內.
再看看之前表格中建立好的區間點Z值
Z一定要是標準差的倍數,
於是,你可以這樣來計算,
Z=(A7-$B$1)/$B$2
Z的作用是,形成我們第二段形狀的X系列.
關於標準差的含義,如果大家不太清楚,可以參考一下其他的定義資料.
計算表格中的最後一欄,分布概率=IF(A7<=$B$3,B7,"")
含義就是,當我們的當前目標值小於你設定的目標值,那麼就會顯示第二欄中的分布密度,
如果是這樣,那麼你就可以在滿足條件的情況下,得到一塊面積,這個面積也就是你的概率所在位置.
看不懂沒有關係,等下圖形中會有一個解析,
現在你可以選擇分布概率那一列進行圖形的編輯,
在之前分布密度的正態框架圖形中,添加數據分布概率這一整列的數據.
這個時候你得到的圖形是這樣的,
有可能你的版本和我不一樣,或者其他的情況導致顏色或許也是不一樣的,沒有關係.
然後我們選擇非藍色的部分,將圖形調整到次坐標軸.
這個時候,你再把兩端的Y坐標全部刪除,你的圖形就會變成這樣:
但是這依然讓人很費解,我們的X坐標應該是我們之前表格中的第一欄X排布,
和我們的Z區間點.
這個時候,回到圖表的選擇數據中,將他們水平軸分別改成X排布,和Z區間點,對應到我們的分布密度,和分布概率.
最後的圖形就是這個樣子,
我們再通過圖形反推一下之前表格中的含義:
以上的情況僅僅限於<=75這樣的情況,
如果是>=75的話,那麼在圖形上我們的概率分布這一欄的條件,則需要把IF函數這個系列,換成當前X排布大於目標值,那麼最後做出來的結果是這樣的:
橘色的部分在右邊.
如果你的條件變成你需要找到的目標值區間是75<=X<=80,
那麼你可以同樣以函數的形式在概率分布那一欄進行雙重條件的判斷,
你得到的結果應該長成這個樣子:
關於這個中間概率計算的變化,大家可以參考下面的截圖:
小於目標值區域:
大於目標值區域:
介於區間中的區域:
有的時候,你的一個成套表格中判斷方法,如果需要用到正態分布,你可以在DASHOBARD中插入這樣的圖形.