統計分析:如何解讀實驗結果

2020-12-05 丁香園

如今已沒有幾個行業可以完全不涉及統計學思維的,絕大多數學科都多少需要使用統計學, 統計學已經從我們日常思維的一個方面發展為無處不在的系統性研究工具。統計學思維承認: 我們對世界的觀察總存在某些不確定性,永不可能完全準確。

 

Rowntree D (1981). Statistics without tears. A primer for non-mathematicians. Penguin Books Ltd., London, England.

 

統計是指收集、處理和解釋數據的方法。由於統計方法是科學探索的固有內容,因此我們的博客已經在研究設計、方法、結果、圖表等數處提及統計。但考慮到統計在多數科學研究中的重要性,有必要專門講解其使用和表達。

 

在開始研究之前,在初步的研究設計中就應該考慮統計。首先,要考慮你需要收集哪些信息來檢驗你的假設或解答你的研究問題。研究有個正確的開始非常重要;雖然數據檢驗錯誤相對容易彌補,要用另外的樣本組重新收集數據或者從同一樣本中追加獲取變量可就費時費力得多。如果你想檢驗某種療法對普通人群的效果,你的樣本要能夠代表這個群體。如果比較的是分別有兩種疾病或行為的兩個群體,那這兩個群體的其他變量如年齡、性別、種族需要儘可能一致。這些涉及的都是數據收集;如果在這一步就犯了錯,你就有可能遇到嚴重的問題,甚至可能會在數個月後在同行審稿階段遭到嚴重質疑而推翻重來。

 

其次,你要考慮要採用何種統計檢驗才能從數據中提煉出有意義的結論。這取決於數據類型。是用來表達某種標誌物存在與否的分類數據嗎?還是有具體數值的定量數據?如果是定量數據,是連續數據(測量所得)還是離散數據(計數所得)?例如,年齡、體重、時間和溫度都是連續數據因為他們的值是在連續,無限可分的尺度上測量出來的;相反,人和細胞的數目都是離散數據,他們不是無限可分的,他們的值是通過計數得到的。你也需要知道你數據的分布:是正態(高斯)分布還是偏態分布?這也關係到你該採取何種檢驗。你一定要知道你收集的是何種類型的數據,這樣才能用適宜的統計檢驗來分析和恰當的方式來表示。下面這個網址提供了選擇適宜檢驗方法的指南,可能會有所幫助:http://www.graphpad.com/www/Book/Choose.htm

 

最後,需要知道如何解讀統計檢驗的結果。P值(或 t、 χ2等)代表什麼意思?這是統計檢驗的關鍵:確定結果到底意味著什麼,你能下什麼結論?統計能告訴我們某一數據集的集中趨勢(如平均值和中位數)和離散趨勢(標準差、標準誤和百分位間距),從而明確該數據集的分布情況。統計學可以比較(如用t檢驗、方差分析和χ2檢驗)兩個或多個樣本組之間是否有非偶然的系統性差別。如果檢驗表明無效假設可能性很小,則差別具有顯著性。一定要記住,用概率簡化差別的「真實性」造成了兩種風險,兩種都取決於所選取顯著性的閾值。第一個是第1類錯誤,是指本沒有顯著性差異之處檢出了顯著性差異。另一個是第2類錯誤,是指本有顯著性差異但由於差別不夠大而不能撿出。降低第1類錯誤的風險就會增加第2類錯誤的風險;不過這也比下不存在的結論要好。統計學也能給出關聯的強度,從而允許從樣本組中推斷出適用於更廣群體的結論。統計學賦予了本身價值有限的結果更多意義,並允許我們用概率下結論,雖然總是存在錯誤的可能。

 

實例

 

節選自《The Journal of Clinical Investigation》 (doi:10.1172/JCI38289; 經同意轉載)。

 

清單

1.在列舉數據時,說明使用的是何種參數,如「均值±標準差」。

2.說明數據分析所採用的統計檢驗方法。

3.百分比給出分子分母,如「40% (100/250)」。

4.正態分布數據用均值和標準差表示。

5.非正態分布數據用中位數和 百分位數表示。

6.給出具體的P 值, 如 寫出 「P=0.0035」,而不要只寫 「P<0.05」。

7.「significant」這個詞僅用於描述統計學上的顯著差異。


相關焦點

  • 如何對qPCR數據進行統計分析
    的研究者用過的儀器也無怪乎ABI 7000、7300、7500,7700、7900HT、StepOnePlus、StepOne、PRISM® StepOne系列;BIO-RAD的CFX96、iCycleriQ5®、MyiQ®、MJ Research Chromo4Opticon系列;Stratagene Mx系列;RocheLightCycler®系列;Eppendorf Masercycler®;Corbett
  • 統計分析常用的函數公式實用技巧解讀!
    統計分析,在Excel中是非常常見的,但是如何有效、高效的統計分析,卻是每個夥伴犯難的事情……今天,小編給大家整理了一些常見的統計分析用的函數公式,希望對夥伴們的學習工作有所幫助。一、身份證號碼類。被除數÷除數的結果,即商為Mod函數的結果。3、用Mod函數計算出結果之後,利用IF函數判斷,如果餘數為1,則返回「男」,如果餘數為0,則返回女。
  • 實驗?理論?模擬?統計分析?
    011實驗方向主攻實驗方向的特點是基礎入門快,較強的場地限制,結果客觀性強。客觀性強的優點在於實驗結果很明顯。成功就是成功,失敗就是失敗,參數上升就是上升,下降就是下降,要是改了就有問題了。所以你能做的就是在操作過程中力求每一步嚴謹,才能得到的科學有效的結果。因此做實驗的人失敗是家常便飯。優點是一旦實驗成功且實驗結果可複製,那麼一篇優秀的科技論文已經成功一大半,剩下一半就是寫作技巧了。
  • 這款免費的網頁版工具,輕鬆搞定你的 qPCR 數據統計分析
    眾所周知,qPCR 從來就不是讓人省心的實驗。小心翼翼的提 RNA,寶貝一樣的呵護起來;兢兢業業的摸索最佳溫度梯度,生怕引物探針一言不合就「罷工」;好不容易跋山涉水來到最後一關,拿到了一大堆 Cq 值,可大神級的 SPSS、R 語言聽起來就頭大,更惶論輕鬆掌握了,不擅長統計分析的你是不是欲哭無淚?
  • 如何在Python中進行描述性統計分析?
    在進行數據分析時,一般要先對數據進行描述性統計分析,以發現其內在的規律,再選擇進一步分析的方法。描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布以及一些基本的統計圖形。
  • SEO如何全方位的做好網站的數據統計分析
    進行網站建設,實施網絡推廣,離不開重要的數據統計分析。任何網站的建立,都離不開數據的統計,如果網站不進行充分的數據分析整理,憑著自身的感覺走,那建立起來的網站就是毫無根據的,無法滿足用戶的需求。那麼SEO如何全方位的做好網站的數據統計分析呢?如何利用數據實施網站優化呢?
  • 實驗技術:Real time PCR
    我們致力於科研社區服務,分享最前沿的科技進展,提供生信分析方法,解讀經典分析案例,公眾資料庫的挖掘和臨床數據統計分析。在此我們歡迎各位的加入!由高校、醫院FS公眾號和科研技能公眾號等百家單位聯合創建的科研交流分享平臺;聯盟的宗旨:「公正至上,自由分享,平等共贏」。歡迎您的關注,讓我們共同學習進步。
  • 職場SPSS:最優尺度回歸統計分析案例
    最優尺度回歸就是為了解決類似問題,它擅長將分類變量不同取值進行量化處理,從而將分類變量轉換為數值型進行統計分析。可以說有了最優尺度回歸方法,將大大提高分類變量數據的處理能力,突破分類變量對分析模型選擇的限制,擴大回歸分析的應用能力。2、案例數據:某品牌服裝為了解消費者對本品牌滿意度情況,通過調查問卷收集到消費者的年齡、性別、月收入以及滿意度等數據。
  • 如何選擇基本統計分析方法呢?
    在統計分析過程中,選擇合適的統計學方法,已經是成功了一半。那麼面對得到數據,我們該如何去選擇合適的統計方法呢?
  • 上半年分析儀器中標信息統計分析結果
    《2017年上半年分析儀器中標信息分析報告》統計了2017年1月1日到6月30日公開發布的分析儀器中標信息,統計中未對單標採購金額設限,凡是採購儀器為檢測分析類儀器的中標信息均在統計範圍內,因此統計結果更具有說服力。   同已經發布的2016年同期分析儀器中標信息統計分析相比,2017年上半年中標總金額下降了21.88%。
  • 實驗結果該如何解讀?
    通過查閱資料,小P發現其實GST pull-down實驗和CoIP實驗原理是非常相似的!今天就簡單介紹一下兩者的異同,同時結合文獻案例給大家分享一下CoIP和GST pull-down實驗結果的分析方法。GST,全稱glutathione-S-transferase,即穀胱甘肽-S-轉移酶蛋白,能夠和穀胱甘肽(Glutathione,GSH)穩定結合。
  • 手把手帶你零基礎 7 晚學會 SPSS 統計分析,搞定高分 SCI
    自己絞盡腦汁設計出漂亮的實驗方案,勤勞刻苦的做出實驗結果,一心想要將研究的碩果發表在高分期刊,卻總是跌倒在統計分析的漩渦。輕則自己發現問題繼續學習修改,重則寫完投稿被審稿人質疑拒絕失望而歸。  其實對於一些難理解記憶的統計理論、軟體操作的方法都可以編成口訣記憶。想要運用到文章裡也可以總結適用於論文的模板,數據直接往裡面套發文更快速。
  • 深層解讀電子雙縫幹涉實驗,對實驗的誤解到底為止!
    關於這個實驗的過程,網上有很多的描述,都是科普人為了讓大眾看明白,按照自己的理解做描述,這些摻雜了個人見解的解讀帶來了對該實驗的各種誤讀,本文將去偽存真,帶大家看一下真實的雙狹縫衍射實驗究竟是怎麼做的,告訴您實驗背後的真相。
  • 常用統計分析軟體:SPSS、Stata、Minitab
    一、SPSSSPSS(StatisticalProductandServiceSolutions)是全球領先的統計分析與數據挖掘產品。成立於1968年,是世界上應用非常廣泛的專業統計和數據模型軟體之一。2009年IBM全資收購了SPSS公司,正式更名為「IBMSPSS」。
  • 《新編統計分析報告寫作方法》
    作者:陳志強開本:880×1230mm  1/32    字數:250千字    裝訂形式:平裝書號:ISBN 978-7-5037-5507-1/C•2160       定價:50元出版時間:2008年8月責任編輯:葉禮奇  尹伊內容提要:   寫好統計分析報告
  • EEG/ERP研究中如何獲得穩定可信的結果或效應
    由於ERP實驗的數據很多,其數據分析就比行為實驗要自由得多,發現顯著性假效應的概率就大大增加了。  因此,如何在EEG/ERP研究中避免P-hacking等問題,獲得穩定可信的結果或效應,是值得我們深思的一個重要領域。  第一部分:EEG/ERP研究中喜歡或需要報告哪些內容?
  • 從理論與實驗角度解讀:為什麼光子沒有靜質量?
    本文,將會從理論與實驗兩個角度,去解讀光子與靜質量的關係,以及靜質量的意義與來源。其次,我們從實驗角度來看,並沒有證據表明,光子的靜質量為0。實驗原理是,如果光子有靜質量,靜磁場的行為會有所變化,那麼通過測量星球的磁場,就可以推算出光子靜止質量的上限。
  • 罕見病基因檢測,結果解讀更重要
    然而,在近日舉辦的第四屆中國罕見病高峰論壇上,與會專家指出,僅僅依賴基因檢測等技術手段的進步並不能為罕見病的診治提供全面的解決方案,必須藉助於更多領域、更多學科的配合,特別是臨床遺傳學專業人員對檢測結果的科學解讀,才能真正造福於罕見病患者。
  • 方差分析F檢驗結果如何解讀?
    我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字? 這是本篇文章要解決的問題。
  • 乾貨丨檢測中如何保證結果準確性?
    分析檢測過程一般包括樣品的處理、測量方法和計量標準的選用、測量儀器的校準、測定、數據的統計分析和報告測量結果,其中每個環節都和測量者的操作技術、理論知識和質量意識密切相關。究竟是如何相關的?製作準確而有效的校準曲線是獲得準確可靠測量結果的重要前提。