如今已沒有幾個行業可以完全不涉及統計學思維的,絕大多數學科都多少需要使用統計學, 統計學已經從我們日常思維的一個方面發展為無處不在的系統性研究工具。統計學思維承認: 我們對世界的觀察總存在某些不確定性,永不可能完全準確。
Rowntree D (1981). Statistics without tears. A primer for non-mathematicians. Penguin Books Ltd., London, England.
統計是指收集、處理和解釋數據的方法。由於統計方法是科學探索的固有內容,因此我們的博客已經在研究設計、方法、結果、圖表等數處提及統計。但考慮到統計在多數科學研究中的重要性,有必要專門講解其使用和表達。
在開始研究之前,在初步的研究設計中就應該考慮統計。首先,要考慮你需要收集哪些信息來檢驗你的假設或解答你的研究問題。研究有個正確的開始非常重要;雖然數據檢驗錯誤相對容易彌補,要用另外的樣本組重新收集數據或者從同一樣本中追加獲取變量可就費時費力得多。如果你想檢驗某種療法對普通人群的效果,你的樣本要能夠代表這個群體。如果比較的是分別有兩種疾病或行為的兩個群體,那這兩個群體的其他變量如年齡、性別、種族需要儘可能一致。這些涉及的都是數據收集;如果在這一步就犯了錯,你就有可能遇到嚴重的問題,甚至可能會在數個月後在同行審稿階段遭到嚴重質疑而推翻重來。
其次,你要考慮要採用何種統計檢驗才能從數據中提煉出有意義的結論。這取決於數據類型。是用來表達某種標誌物存在與否的分類數據嗎?還是有具體數值的定量數據?如果是定量數據,是連續數據(測量所得)還是離散數據(計數所得)?例如,年齡、體重、時間和溫度都是連續數據因為他們的值是在連續,無限可分的尺度上測量出來的;相反,人和細胞的數目都是離散數據,他們不是無限可分的,他們的值是通過計數得到的。你也需要知道你數據的分布:是正態(高斯)分布還是偏態分布?這也關係到你該採取何種檢驗。你一定要知道你收集的是何種類型的數據,這樣才能用適宜的統計檢驗來分析和恰當的方式來表示。下面這個網址提供了選擇適宜檢驗方法的指南,可能會有所幫助:http://www.graphpad.com/www/Book/Choose.htm
最後,需要知道如何解讀統計檢驗的結果。P值(或 t、 χ2等)代表什麼意思?這是統計檢驗的關鍵:確定結果到底意味著什麼,你能下什麼結論?統計能告訴我們某一數據集的集中趨勢(如平均值和中位數)和離散趨勢(標準差、標準誤和百分位間距),從而明確該數據集的分布情況。統計學可以比較(如用t檢驗、方差分析和χ2檢驗)兩個或多個樣本組之間是否有非偶然的系統性差別。如果檢驗表明無效假設可能性很小,則差別具有顯著性。一定要記住,用概率簡化差別的「真實性」造成了兩種風險,兩種都取決於所選取顯著性的閾值。第一個是第1類錯誤,是指本沒有顯著性差異之處檢出了顯著性差異。另一個是第2類錯誤,是指本有顯著性差異但由於差別不夠大而不能撿出。降低第1類錯誤的風險就會增加第2類錯誤的風險;不過這也比下不存在的結論要好。統計學也能給出關聯的強度,從而允許從樣本組中推斷出適用於更廣群體的結論。統計學賦予了本身價值有限的結果更多意義,並允許我們用概率下結論,雖然總是存在錯誤的可能。
實例
節選自《The Journal of Clinical Investigation》 (doi:10.1172/JCI38289; 經同意轉載)。
清單
1.在列舉數據時,說明使用的是何種參數,如「均值±標準差」。
2.說明數據分析所採用的統計檢驗方法。
3.百分比給出分子分母,如「40% (100/250)」。
4.正態分布數據用均值和標準差表示。
5.非正態分布數據用中位數和 百分位數表示。
6.給出具體的P 值, 如 寫出 「P=0.0035」,而不要只寫 「P<0.05」。
7.「significant」這個詞僅用於描述統計學上的顯著差異。