科研經驗 | 文獻 | 實驗 | 工具 | SCI寫作 | 國自然
作者:麥子(轉載請註:解螺旋·醫生科研助手)
統計方法辣麼多,怎麼知道自己要用哪一個?要是有個導航就好啦~這裡就給大家找了兩表一圖,媽麻再也不用擔心我在統計的世界裡迷路了~
選擇統計方法,是從了解自己的數據特徵開始的。先要決定做什麼類型的分析,是描述還是推論;其次判斷數據類型;再次看變量多少,以及各變量的設計特徵,就可以做出決策了。
在進入導航之前,咱們先複習一下數據類型。統計學中的數據分為4類:
定類數據(Nominal):最低級數據,表示個體的分類或屬性,沒有大小次序關係,例如對性別、民族等進行編號。
定序數據(Ordinal):中間級數據,表示個體在某個有序排列中所處的狀態,例如按受試者入組時的TNM腫瘤分期(I~IV)分為四個組,編碼1~4。
定距數據(Internal):數據具有間距特徵,有單位,但沒有絕對零點,如體溫。
定比數據(Ratio):最高級數據,有單位,也有絕對零點,比如身高。
不過後兩者在一般的統計決策選擇中區分不大,知道就好了~
(點擊看大圖)
註:二分類變量是指,只有2個值的變量,例如性別只有男、女(聽說Facebook的性別選項有50+個呃~。~);非真二分類變量是指,本來是連續變量,但被人為劃分成二分類,比如血壓本來是連續值,但可能在特定的實驗設計中只劃分為高、正常兩個分類。
得到了結果,在論文中用什麼形式來表現更合適呢?用哪種圖、哪種表?
(點擊看大圖)
註:原圖來自美國心理學會的教學講義(詳見參考資料1),跟據實際應用情況略有調整。(點擊看大圖)
就解釋下圖中的組間設計吧,它可以理解為獨立樣本,即同一個變量下不同水平的數據來自不同個體,與其相對的是組內設計,同一個變量下不同水平的數據來同一個體。
舉個例子,治療措施是一個變量,其下有治療和未治療2個水平,如果治療和未治療的數據分別來自不同的受試者,就是組間設計(這時我們常常會把兩組分別命名為「治療組」和「對照組」),如果治療和未治療的數據來自同一批受試者,就是組內設計(我們常常命名為「治療前」和「治療後」)。
最後那些花樣繁複的統計學方法名稱,已經不用管了,順著這條路走,就能在各種統計軟體的菜單中找到它們了。
參考資料:
1.http://teachpsych.org/resources/Documents/otrp/resources/grosofsky09.pdf
2.Comparing groups for statistical differences: how to choose the right statistical test? | Biochemia Medica