一、醫學統計學的主要內容:
1、統計設計:統計設計包括調查設計和實驗設計。統計設計是保證統計描述和推斷正確的基礎。
2、統計描述:對原始數據進行歸納整理,用相應的統計指標,如率、均數等,表示出研究對象最鮮明的數量特徵,必要時選擇統計表或統計圖。
3、統計推斷:在統計描述的基礎上,對統計指標的差距和關聯性進行分析和推斷。
二、醫學統計資料的類型:
1、計量資料:亦稱數值變量,為定量測量的結果,通常用專用儀器測量,並有計量單位,如身高(cm)、體重(kg)等。
2、計數資料:計數資料是定性觀察的結果。有二分類多分類兩種情況。
3、等級資料:介於定量測量和定性觀察之間的半定性觀察結果,通常有兩個以上等級,如陰性、陽性、強陽性、治癒、好轉、有效、無效等。等級資料雖然也是多分類資料,但各個類別間還存在大小或程度上的差別。
三、醫學統計工作的基本步驟:
1、研究設計:
(1)調查設計:不加幹預。
(2)實驗設計:加幹預,分動物實驗和臨床試驗。
2、收集資料:獲得準確可靠的原始數據。
3、整理資料:
(1)原始數據的檢查與核對:
①統計數據的常規檢查。
②數據的取值範圍檢查。
③數據間的邏輯關係檢錯。
(2)數據的分組設計和歸納匯總:
①質量分組:比如按性別、病情輕重、治癒、好轉和無效等。
②數量分組:比如按年齡、身高、體重等。
4、分析資料:闡明事物的內在聯繫和規律。
四、統計學的幾個重要概念:
1、同質與變異:
①同質:研究對象具有相同的背景、條件、屬性稱為同質。
②變異:同一性質的事物,其個體觀察值(變量值)之間的差異。
③舉例:調查1998年所有20歲健康男大學生的身高,它的同質基礎是同一地區、同一年份、同為20歲健康男大學生;這些同學的身高各有差異,就是變異。
2、總體與樣本:
①總體是同質觀察單位的全體。
②樣本是從總體中隨機抽取的有代表性的一部分觀察單位。
3、參數與統計量:
①參數指總體指標,統計量指樣本指標。
②參數是未知的,需要用統計量去估計。
4、誤差:
①系統誤差應該通過周密的研究設計和調查(或測量)過程中的嚴格質量控制措施予以解決。
②隨機測量誤差及抽樣誤差都屬於隨機誤差,隨機測量誤差是不可避免的,但應儘量的小。
③抽樣誤差是抽樣機遇所致,是客觀存在,不可避免的。這種誤差可以通過統計方法估計,也可通過增大樣本含量使其減小。
5、概率與頻率:
概率對總體而言,頻率是對樣本而言。
五、統計表和統計圖:
1、統計表:
(1)統計表的結構包括:
①標題、標目、線條、數字等部分,有些統計表還有備註。
②標目包括橫標目和縱標目。橫標目說明橫行數字的屬性,位於表格的左側;縱標目說明每一列數字的屬性,位於表格的第一橫行。
(2)制表原則和要求:
①制表原則:重點突出,簡單明了。一張表只有一個中心內容,明確顯示需要說明的問題。主謂分明,層次清楚。合理安排橫縱標目,使人一目了然。
②制表的基本要求:
A:標題:概括說明表的內容,位於表的上方,內容簡潔扼要。
B:標目:用於指明表內數字含義,橫標目為主語,表示被研究事物;縱標目為謂語,表示被研究事物的各項統計指標。
C:線條:除必須的頂線、底線、標目線以外,應儘量減少其他不必要的線條,不使用豎線、斜線。
D:數字:一律使用阿拉伯數字,應準確無誤;同一指標的數字的小數位應一致,位次對齊。
2、統計圖:
(1)製圖的基本要求:縱橫軸的比例以5:7為宜。
(2)常用的統計圖的類型:
①直方圖:
主要用於表示連續變量的頻數分布情況。圖中直條連續排布,各直條寬度代表各組段組距,直條高度代表相應組段頻數或頻率。
②折線圖:
用於描述一個變量隨另一個變量的變化而變化的趨勢和幅度,通常是變量隨時間的變化情況。
③誤差條圖:
常用於比較多組連續變量的均值和標準差,直條的高度表示均值,直條頂端用「T」形圖標或「工」形圖標表示標準差,圖標中豎線長度表示標準差的大小。
④箱式圖:
當連續變量為偏態分布時,用誤差條圖展示多組間比較不夠恰當,可使用箱式圖比較多組間的平均水平和變異程度。
⑤直條圖:
常用於比較統計指標數值大小和對比關係。
⑥圓圖:
用於表示構成比,圓的總面積為100%。
⑦百分條圖:
當要同時比較多組構成比時,採用百分條圖比圓圖更為直觀便捷。
六、統計推斷:
1、統計推斷是用樣本信息推斷總體特徵,包括總體參數的估計和假設檢驗,是統計學的核心內容。
2、數值變量資料的統計推斷主要包括總體均數估計、t檢驗、方差分析以及數值變量資料的秩和檢驗。
3、分類變量資料的統計推斷包括總體率的估計以及分類變量的z檢驗、X2檢驗和秩和檢驗。