第三節 正態分布和醫學正常值範圍的估計

2021-01-08 生物谷

第三節 正態分布和醫學正常值範圍的估計

  一、正態分布

  (一)正態分布的圖形

  將表18-1的110名20歲健康男大學生身高頻數分布繪成圖18-1中的(1),可見高峰位於中部,左右兩側大致對稱。可以設想,如果抽樣觀察例數逐漸增多,組段不斷分細,就會逐漸形成一條高峰位於中央(均數所在處)、兩側完全對稱地降低、但永遠不與橫軸相交的鐘型曲線(圖18-1中的(3)),這條曲線近似於數學上的正態分布(normal distribution)曲線。

  統計學家按其變化參數,推導出正態分布密度函數f(X)

  -∞<X<+∞公式(18.16)

  式中μ為均數;σ為標準差;π為圓周率;е為自然對數的底,即2.71828。以上均為常數,僅X為變量。

  為了應用方便,常將式(18.16)進行變量變換—u變換(即u=(X-μ)/σ),u變換後,μ=0,σ=1,使原來的正態分布變換為標準正態分布(standard normal distribution)亦稱u分布,如圖18-2。

圖18-1 頻數分布逐漸接近正態分布示意

圖18-2 正態分布與標準正態分布的面積與縱高

  此時,式( 18.16)化成

  

  - ∞<u<+∞                          公式(18.17)

  式中,φ(u)為標準正態分布的密度函數,即縱軸高度。

  根據X和u的不同取值,分別按式(18.16)和式(18.17)可以繪出正態分布和標準正態分布的圖形(圖18-2)。

  (二)正態分布的特徵

  由式(18.16 )gn (18.17)可看出正態分布有下列特徵:①正態曲線(normal curve)在橫軸上方均數處最高。②正態分布以均數為中心,左右對稱。③正態分布兩個參數(parameter),即均數μ和標準差σ;常用N(μ,σ)表示均數為μ、標準差為σ的正態分布;所以標準正態分布用N(0,1)表示。④正態曲線在±1σ處各有一人拐點。⑤正態曲線下的面積分布有一定的規律。

  二、正態曲線下面積的分布規律

  正態曲線下一定區間的面積可以通過對式(18.16)和式(18.17)積分求得。為了省去計算的麻煩,有人按式(18.17)編成了附表18-1「標準正態分布曲線下的面積」通過查表可求出正態曲線下某區間的面積,進而估計該區間的觀察例數佔總例數的百分數或變量值落在該區間的概率。查表時應注意:①表中曲線下面積為自-∞到u的面積;②當μ,σ已知時,先根據u變換(即u=(X-μ)/σ)求得u值,再查表;③當μ,σ未知且樣本含量n足夠大時,常用樣本均數x和樣本標準差s分別代替μ和σ進行u變換[即u=(X-μ)/S],求得u的估計值,再查表;④曲線下對稱於0的區間面積相等,如區間(-∞,-1.96)與區間(1.96,+∞)的面積相等;⑤曲線下橫軸上的總面積為100%或1。

  下面三個區間的面積應用較多,要求記住,並結合圖18-3理解其意義。①標準正態分布時區間(-1,1)或正態分布時區間(μ-1σ,μ+1σ)的面積佔總面積的68.27%;②標準正態分布時間(-1.96,1.96)或正態分布時區間(μ-1.96,μ+1.96)的面積佔總面積的95.00%;③標準正態分布區間(-2.58,2.58)或正態分布時間區(μ-2.58,μ+2.58)的面積佔總面積的99.00%。

圖18-3 正態與標準正態曲線及其面積分布

  三、醫學正常值範圍的估計

  (一)正常值範圍(normal range)的意義

  正常值是指正常人體或動物體的各種生理常數,正常人體液和排洩物中某種生理、生化指標或某種元素的含量,以及人體對各種試驗的正常反應值等。由於存在變異,各種數據不僅因人而異,而且同一個人還會隨機體內外環境的改變而改變,因而需要確定其波動的範圍,即正常值範圍。

  制定正常值範圍,①首先要確定一批樣本含量足夠在的「正常人」。所謂「正常人」不是指機體任何器官、組織的形態及機能都正常的人,而是指排除了影響所研究指標的疾病的有關因素的同質人群。②根據指標的實際用途確定單側或雙側界值:若某種指標過高或過低均屬異常,需要確定正常值範圍的下限和上限,如白細胞計數;若某指標過高為異常,需確定上限,如尿鉛;若某指標過低為異常,需確定下限,如肺活量。③根據研究目的的和實用要求選定適當的百分界值,常用80%、90%、95%或99%,其中最常用的是95%。④根據資料的分布特點,選用恰當的界值計算方法,如正態分布資料用正態分布法;對數正態分布資料用對數正態分布法;偏態分布資料用百分位數法。

  (二)正常值範圍估計

  計算正常值百分界值的方法甚多,如正態分布法、對數正態分布法、正態概率紙法、百分位數法、曲線擬合法、容許區間法等。現以95%正常值範圍為例,主要介紹以下三種。

  1.正態分布法:適用於正誠或近似正態分布資料。

  雙側界值:x±1.96s

  單側上界:x+1.645s

  單側下界:x-1.645s

  2.對數正態分布法:適用於對數正態分布資料。

  雙側界值:lg-1(xlgx±1.96slgx)

  單側上界:lg-1(xlgx+1.645slgx)

  單側下界:lg-1(xlgx-1.645slgx)

  3.百分位數法:常用於偏態分布資料。

  雙側界值:P2.5和P97.5

  單側上界:P95

  單側下界:P5

  例18.13 試估計表18-1中110名20歲健康男大學生身高的95%正常值範圍。

  該指標計算雙側界值

  x±1.96s=172.73±1.96×4.09

  該指標的95%正常值範圍為 164.71~180.75(cm)

  例18.14 某年某市調查了200例正常成人血鉛含量(μg/100g)如下,試估計該市成人血鉛含量95%正常值範圍單側上界。

3 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 11 11 11 11 11 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 16 16 16 16 16 16 17 17 17 17 17 17 17 17 17 17 17 17 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 20 20 21 21 21 21 21 22 22 22 22 22 22 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 27 27 28 28 29 29 30 30 31 31 31 31 32 32 32 32 32 32 33 33 36 38 38 39 40 41 41 43 47 50 53 60

  該資料為偏態分布,經對數變換(即原始數據取對數)後,整理成頻數表,見表18-5。從頻數分布看,近似正態分布,計算對數形式的均數與標準差,得:

  xlgx=Σflgx/Σf=230.0/200=1.15

  其95%正常值範圍的單側上界為lg-1xlgx+1.645slgx)=lg-11。5942=39(μg/100g)

  即該市正常成人血鉛含量的95%正常值為39μg/100g以下。

  例18.15 試用百分位數法估計例18.14資料的95%正常值的單側上界。

  該資料不經對數轉換時為偏態分布,也可用百分位數法估計。先整理成頻數表,見表18-6。

  P95=L+i/f95(n×95%-ΣfL)=38+5/7(200×95%-189)=38.7(μg/100g)

表18-5 200名血鉛值對數變換後的頻數表及gx slgx計算表

對數組段 頻數f 組中值(lgX) flgX FlgX2 0.45~ 1 0.5 0.5 0.25 0.55~ 5 0.6 3.0 1.80 0.65~ 10 0.7 7.0 4.90 0.75~ 20 0.8 16.0 12.80 0.85~ 11 0.9 9.9 8.91 0.95~ 21 1.0 21.0 21.00 1.05~ 29 1.1 31.9 35.09 1.15~ 25 1.2 30.0 36.00 1.25~ 30 1.3 39.0 50.07 1.35~ 20 1.4 28.0 39.20 1.45~ 16 1.5 24.0 36.00 1.55~ 8 1.6 12.8 20.48 1.65~ 3 1.7 5.1 8.67 1.75~1.84 1 1.8 1.8 3.24 合計 200   230.00 279.04

表18-6 200名血鉛值頻數表及P95計算表

組段 頻數f 累計頻數Σf 累計頻率(%) 3~ 36 36 18.0 8~ 39 75 37.5 13~ 47 122 61.0 18~ 30 152 76.0 23~ 18 170 85.0 28~ 16 186 93.0 33~ 3 189 94.5 38~ 7 196 98.0 43~ 1 197 98.5 48~ 1 198 99.0 53~ 1 199 99.5 58~62 1 200 100.0

附表18-1 標準正態分布曲線下的面積

[本表為自-∞到一u的面積Φ(-u),Φ(u)=1-Φ(-u)]

u .00 .01 .02 .03 .04. .05 .06 .07 .08 .09 -3.0 .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010 -2.9 .0019 .0018 .0018 .0017 .0016 .0016 .0015 .0015 .0014 .0014 -2.8 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019 -2.7 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026 -2.6 .0047 .0045 .0044 .0043 .0041 .0040 .0039 .0038 .0037 .0036 -2.5 .0062 .0060 .0059 .0057 .0055 .0054 .0052 .0051 .0049 .0048 -2.4 .0082 .0080 .0078 .0075 .0073 .0071 .0069 .0068 .0066 .0064 -2.3 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084 -2.2 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110 -2.1 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143 -2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 -1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 -1.8 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294 -1.7 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367 -1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455 -1.5 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559 -1.4 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681 -1.3 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823 -1.2 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985 -1.1 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170 -1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379 -0.9 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 1635 .1611 -0.8 .2119 .2090 .2061 .2033 .2005 .1977 .1949 .1922 .1894 .1867 -0.7 .2420 .2389 .2358 .2327 .2296 .2266 .2236 .2206 .2177 .2148 -0.6 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 -0.5 .3085 .3050 .3015 .2981 .2946 .2912 .2877 .2843 .2810 .2776 -0.4 .3446 .3409 .3372 .3336 .3300 .3264 .3228 .3192 .3156 .3121 -0.3 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483 -0.2 .4207 .4186 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859 -0.1 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247 -0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641

相關焦點

  • 正態分布
    狄莫弗(De Moivre Abraham,1667—1754)中心極限定理就是從數學上證明了這一現象。到了1780年,拉普拉斯(P. S.Laplace,1749-1827)給出了中心極限定理更一般地形式。中心極限定理的出現給予了正態分布一種極限分布的感覺。後來人們不斷發現,在現實世界中,很多東西都符合正態分布,後世的一些學者如魁特奈特、高爾登、埃其渥斯諸君更是以正態主義者自居。但是真正使正態分布登上王座的的卻不是因為這個,而是因為誤差!
  • 正態分布及其應用
    圖 2並且,如果進一步增加釘子的層數和小球個數,球槽中小球分布形成的曲線就會越來越光滑,最終趨向於圖3「中間高,兩邊低」的「鍾型」曲線,我們將這條曲線稱為正態分布密度曲線,簡稱正態曲線假設這兩條曲線分別代表了兩個班學生成績的分布情況。兩個班的平均成績相差較小,但虛線對應的班級學生成績更集中於平均成績附近,它的σ小,而實線對應的班級學生成績相對分散,它的σ大,可能出現兩極分化的情況。所以,σ反映了數據的離散程度,它代表了數據的標準差。知道了μ和σ這兩個參數,我們就能畫出正態曲線。
  • 正態分布的常用數據 - CSDN
    #尋找真知派#如上一篇文章所述,樣本所屬總體服從正態分布是數據分析和數據挖掘等數據處理的重要前提。如果我們採集的樣本並不能確認其總體是否服從正態分布,那麼數據處理的結果就是不可靠的。因此,對樣本數據進行正態分布檢驗十分必要。
  • 測量值不服從正態分布該怎麼辦?
    在統計過程控制中,為什麼數值不服從正態分布,如果不服從正態分析,我們又該怎麼處理?問:在統計過程控制的活動中,計量型特徵值不服從正態分布是怎麼回事?對於統計過程控制的數據,通常是按照時間次序抽取的樣本測量得到的數值,通常可以用單值運行圖,去觀察數據,查找為什麼數據不符從正態分布,往往能得到更多信息。
  • 偏度與峰度的正態性分布判斷
    T檢驗、方差分析、相關分析以及線性回歸等等,都要求數據服從正態分布或近似正態分布,正態分布在機器學習的重要性後期會講述。上一篇文章用Q-Q圖來驗證數據集是否符合正態分布,本文首先介紹了偏度與峰度的定義,然後用偏度與峰度檢測數據集是否符合正態分布,最後分析該檢測算法的適用條件以及SPSS的結果分析。
  • 【教育統計答疑】如何理解正態分布、均值分布、χ^2分布、t分布和F分布
    正態分布的特徵表明被測事物處於穩定的狀態下,測量數據的波動是由於偶然因素引起的,所以在實踐中有廣泛的應用。在穩定的系統環境(如自然、人類社會等),許多事物和現象都會服從正態分布,例如人的身高、體重和智商;各種商品的尺寸和質量;自然環境的溫度、溼度和降雨量;考試的成績等。
  • 醫學統計與R語言:標準Z值一定服從標準正態分布?
    將原始分數轉換成對應的Z分數不會改變其分布狀況,也不會改變其相對位置,所改變的只是分數值。對於任何形狀分布都可以計算Z值,所得的Z分數將會呈現原始分數的形狀。若原始數據為非正態分布,標準正態分布表不再適用。
  • 概率|無處不在的高斯分布(1)——標準正態分布
    萬事開頭難,今天的第一講,我們來談一談無處不在的「高斯分布」(又叫「正態分布」,Normal Distribution)。在我看來,所有的統計分布裡最容易理解的是「均勻分布」(Uniform Distribution),但是最常用的分布,一定是高斯分布。
  • 關於正態分布和貝塔分布的案例介紹
    打開APP 關於正態分布和貝塔分布的案例介紹 賈恩東 發表於 2020-10-12 11:25:57 本文通過案例介紹了正態分布和貝塔分布的概念。
  • 徹底理解正態分布——強大的數學分析工具
    現在,參考上面的圖像,並了解一個正常變量的值是如何分布的。這是一個對稱分布,其中大多數觀測值聚集在具有最高發生概率的中心峰(均值/平均值)附近,並且當我們在兩個方向上都偏離中心峰時,我們看到曲線尾部出現值的可能性越來越小。
  • 正態分布圖
    】正態分布,也稱「常態分布」或「高斯分布」,是連續隨機變量概率分布的一種,常常應用於質量管理控制:為了控制實驗中的測量或實際誤差,常以作為上、下警戒值,以作為上、下控制值,這樣做的依據是:正常情況下測量或實驗誤差服從正態分布。
  • 正態分布圖形的編輯
    基於這樣的情況,我們應該:這個中間的計算值如下:X排布=均值-標準差*4排布的第二個數值=第一個數值+1,把範圍鋪開.這個時候,你可以選擇分布密度的整個系列,插入一個堆積面積圖,則會得到:然後我們需要在這個面積圖的基礎之上,再給它一個面積堆積,達到自由切換的效果,而上圖藍色的部分則是基於我們的基本數據給出來的底層正態模型,自己切換或者變化的面積也必須要在這個藍色的面積範圍以內.
  • python 生成正態分布數據,並繪圖和解析
    這篇文章主要介紹了python 生成正態分布數據,並繪圖和解析,幫助大家更好的利用python進行數據分析,感興趣的朋友可以了解下
  • 終於搞清楚正態分布、指數分布到底是啥了!
    標準正態分布正態分布是一個鐘形曲線,曲線對稱,中央部分的概率密度最大,越往兩邊,概率密度越小。如何求正態分布的概率?正態分布的概率密度函數滿足:連續型隨機變量的理想模型就是正態分布,求正態分布的概率同樣是求概率密度曲線下的面積,曲線的面積如何求?
  • 神說,要有正態分布,於是高斯就創造了正態分布 - 徐曉亞然
    最大似然估計這裡的估計值稱作最大似然估計,高斯天才般地認為這裡的最大似然估計就可以取到算術平均值!一般正態分布正態分布的密度函數N(0,σ2)就是上述的表現形式。那麼前面說的最小二乘法跟正態分布又有啥關係呢?
  • [道贏·科技] | 鋰電生產製程數據不服從正態分布,正常嗎?
    在日常工作中,正態分布是我們最為常見的數據分布類型。但很多時候,我們會發現自己的數據分布樣式 」千奇百怪「 ,與正態分布相比相去甚遠。那麼,一組數據不服從正態分布,正常嗎?如果不服從正態分布的數據暗示著某些異常的話,發生的又是什麼問題呢?為了回答這些問題,先要從正態分布的產生原理說起......正態分布是如何產生的?
  • 一文搞懂「正態分布」所有重要知識點
    本篇文章主要來自於我們微信公眾號「丁點幫你」的SPSS與統計思維的系列課程的第七講 二項分布和正態分布,在這裡形成文字是為了不方便看視頻的同學學習和回顧。1.從名字說起為什麼叫「正態分布」,也有地方叫「常態分布」,這兩個名字都不太直觀,但如果我們各取一字變為「正常分布」,就很白話了,而這正是「正態分布」的本質含義,Normal Distribution。它太常見了,基本上能描述所有常見的事物和現象:正常人群的身高、體重、考試成績、家庭收入等等。這裡的描述是什麼意思呢?
  • 智商有正態分布效應很正常,不正常的是學習成績也有正態分布效應
    智商有正態分布效應,這很正常,但不正常的是學習成績也有正態分布效應。所謂的正態分布,意思就是普通人佔據了絕大多數,傻子和天才都是極少數。作為天生的因素,正態分布是可以理解的,但是後天的教育導致的成績,仍然呈正態分布,這就讓人無法容忍了。我個人親身的體會,在當時我們縣有兩所中學A和B,A的分數線高出了B很多,基本只收中考前500名的學生,B只收剩下的。
  • 如果數據分布是非正態的怎麼辦?用切比雪夫不等式呀!
    >正態分布(高斯分布)是最廣為人知的概率分布。因為無論是正態分布的性質還是表達式都非常的簡潔:它的均值(mean)、中值(median)和眾數(mode)都相同只需要用兩個參數就可以確定整個分布問題是通常是,你可能會找到特定的數據集分布,這些分布可能不滿足正態性,即正態分布的性質。但由於過度依賴於常態假設,大多數業務分析框架都是為處理正態分布數據集而量身定做的。
  • 思維模型17 - Normal distribution | 正態分布
    正態分布正態分布又稱高斯分布,是一個常見的連續概率分布,它的樣子類似於寺廟裡的大鐘,因此人們又經常稱之為鐘形曲線。正態分布曲線的樣子就像下圖,說名字可能不清楚,但很多同學一看到圖就恍然大悟,原來這就是正態分布啊。