我們一般會在文獻的統計方法部分看到這樣的描述:
對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
大家對於四分位數間距可能會比較陌生,一般遇到數據不符合正態分布時,手足無措。
今天,我們一起來看看。
1
四分位數(Quartile)是統計學中分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。
第三四分位數與第一四分位數的差值稱為四分位數間距(InterQuartile Range, IQR),簡稱四分位距。
四分位距(interquartile range, IQR)是描述統計學中的一種方法,但由於四分位距不受極大值或極小值的影響,常用於描述非正態分布資料的離散程度,其數值越大,變異度越大,反之,變異度越小。
2
1、複製數據:在Excel中,Ctrl+A全選數據集,Ctrl+C複製
2、數據導入到SPSS中
選中最左上角的單元格-右鍵-與變量名稱一起粘貼
3、變量設置
進行簡單的變量設置,分類變量group設為測量,小數位數為0,其他數值變量設置為標度。
4、計算中位數(四分位數間距)
分析-描述統計-探索
數值變量-選入因變量列表
分組變量-選入因子列表
進一步點擊-統計-勾選描述-勾選百分位數(P)-繼續(C)
5、查看統計結果
根據紅框中的內容,整理後的統計結果為:組1年齡的中位數(四分位數間距)為53.5(29.5),組2年齡的中位數(四分位數間距)為55.0(20.0)。
其實,統計結果表中也給出了均數(標準差)的數值。
思考題:
相信如何獲取中位數(四分位數間距),大家都學會了,那麼問題來了:如果有的雜誌要求寫成中位數(第三四分位數-第一四分位數)呢?
又該如何計算,請在留言處留言。
END
本文作者:劉老師,北大公衛碩士,就職於某醫學中心,發表SCI和北大核心期刊論文10餘篇,具有豐富的統計分析與文章投稿經驗。
如你有如下問題:數據清洗、數據整理、統計分析、樣本量計算、診斷試驗、ROC曲線、臨床預測模型、統計圖、R語言、研究設計等問題,均可向劉老師諮詢(需收取一定費用)。
以下是劉老師個人微信,添加時請註明:統計諮詢。