統計學在醫學科研工作中發揮著重要的作用,統計學方法種類繁多,各自的適用範圍以及所需的前提條件又不盡相同,容易發生誤用,導致論文質量不高,甚至結論錯誤而引起誤導。為能有效促進統計學方法的正確使用,保證科研的科學性、可靠性,提高醫學科研論文質量,賽恩斯編譯對醫學科研論文中常見的統計學問題進行梳理和總結如下:
一、實驗組與對照組沒有可比性。實驗組與對照組必須遵循均衡化的原則,即實驗組與對照組除處理因素不同外,其他可控制的非處理因素要儘可能保持一致,從而儘量排除非處理因素對結果的影響。各組間均衡程度越高,可比性越強。如果分組時未注意到對照組與實驗組的均衡性,兩組之間就會出現差異,不具備可比性,結論有可能不準確,甚至相反。
二、樣本量過小。樣本量的大小影響結論的可靠性。樣本量過小,抽樣誤差大,結果可靠性差,且經不起驗證;反之,若盲目加大樣本量,不但會造成人、財、物的浪費,而且會造成非抽樣誤差增大。應在保證研究結果精確可靠的前提下,確定最小的樣本量。
三、混淆標準差與標準誤的作用。實驗數據一般綜合表示為「均數±標準差」的形式,標準差表示數據相對於均數的離散程度,而標準誤是表示抽樣誤差大小的指標,二者含義完全不同。有些作者誤將標準差用於可信區間的表述,將標準誤用於正常值範圍的表述。
四、假設檢驗方法運用不當。每一種假設檢驗方法都有其特定的適用條件和嚴格的適用範圍。所研究變量的類型不同、設計類型不同、大樣本還是小樣本等,所用假設檢驗的方法也不同。對於同一組資料,採用不同的假設檢驗方法可能得出截然相反的結論。同為數值變量資料,如將配對設計的資料按成組設計資料的方法進行假設檢驗,不但損失樣本提供的信息、降低檢驗效率,而且可能使原本有統計學意義的結果表現為無統計學意義。
五、未註明假設檢驗方法或不具體。有些論文對收集到的資料進行了統計學分析,但未說明使用的是什麼方法。表現為論文中只有假設檢驗的結論,未註明檢驗方法、現有樣本算得的檢驗統計量、檢驗水準、採用的是雙側檢驗還是單側檢驗、P值的確切範圍。這樣讀者就無法得出論文中統計學方法選擇是否合理,無法核對結果是否準確。在論文寫作時,不但要註明選用的是什麼統計學方法,而且要儘可能詳細、具體。
六、錯誤理解假設檢驗中P值的含義。統計學上,根據假設檢驗原理推算出來的P值,表示拒絕無效假設犯假陽性錯誤的概率,P值越小,越有理由認為兩種處理方法效果不同。P值不能反映相比較的兩組或多組參數之間差異的大小,參數差異的大小只能根據專業知識來確定。
七、只關心統計結論,忽視差異有無臨床意義。評價一項醫學研究結果,要看其是否具有臨床意義和統計學意義。如果差異本身沒有臨床意義,可以不必進行假設檢驗,因為當樣本含量足夠大時,基本都會取得差異有統計學意義的結論。醫學論文中,作者常根據假設檢驗有統計學意義,就斷定研究結果有臨床意義。直線相關分析中,只關心相關係數的差異是否有統計學意義,而不關心相關係數的大小有無實際意義。
產生上述問題的原因,大多是由於對統計學在醫學科研工作中的重要性認識不足,少數作者缺乏高度的責任感、科學嚴謹的態度,憑主觀想像,甚至弄虛作假。參加科研設計、統計學、論文寫作方面的培訓較少,也缺少與醫學科研設計專家的溝通。