三個實驗重複夠嗎?再談「error bar「.

2021-02-08 小麥研究聯盟

又快到了研究生的畢業答辯季,相信很多同學的論文中對數據的基本描述會使用柱狀圖、誤差線和差異顯著性。「一伊」小編之前給大家介紹了如何使用R語言添加Error bar等技巧。作為本小編的首次交稿作業,我今天從統計的角度認真地談下Error bar的畫法和統計學顯著性。


(1) 這些問題你遇到過嗎?

設想以下兩個場景:

(A)利用qPCR研究某基因在兩份小麥材料根組織中是否差異表達,你會做幾次實驗重複?用什麼統計學方法?

(B)研究熱脅迫條件和正常條件下,某一小麥材料的葉片的電導率是否發生變化,你會做幾次實驗重複?用什麼統計學方法?

相信絕大部分的答案是:3次實驗重複,t檢驗。


然而,我們常常有疑問:3次實驗重複夠嗎?

「額,應該夠吧,師兄的某某實驗就做了三次。「


於是,我們用3次實驗重複的均值作為柱狀圖中bar的高度。那麼Error bar的高度怎麼得到的?

通過查閱文獻,我們發現有的文章用「標準差「(SD),有的文章用「標準誤差」(SEM)。

「額。。。我該用哪個呢?」


此外,我們還會遇到這樣的問題:為什麼我得到的兩組數據的均值差異很大,但是t檢驗得到的p值並不顯著;而我師兄的兩組數據的均值差異並不大,但是p值確非常顯著?

「我的師兄究竟對數據做了些什麼??」


(2) 讓我們以qPCR場景為例,講個「神(jing)奇(song)的故事」

一天,W老師為了研究 「濟麥22」和「良星99」的根系中基因的差異表達,分別安排王同學研究基因X,黃同學研究基因Y,宋同學研究基因Z。於是三個同學各自取來材料,兩組樣本中根系組織中提取RNA做qPCR,每個樣本做了三次實驗重複。得到的結果是這樣的:

王同學:

黃同學:

宋同學:

於是,三個同學各自的到的結論是如下:

王:基因X的表達在兩組樣本中差異不顯著。

黃:基因Y的表達在兩組樣本中差異不顯著。

宋:基因Z的表達在兩組樣本中差異顯著。


然而,W老師看到這結果後的表情是這樣的:



W老師:「我該相信誰?」

事實上,三個同學都非常非常非常認真地做了三次實驗重複;都使用t檢驗計算了p值;都使用樣本均值作為柱形的高度;都使用標準差(SD)作為Error bar的高度。

然後,W老師開始懷疑人生了……


經G老師的建議,W老師把三個同學的結果放在了一起:這樣兩組樣本,每組9個實驗重複,重新進行了計算,得到了如下結果:

結果竟然神奇的顯著了(p<0.05)!!!


(3) 「那麼,問題出在哪兒了呢?」

來,讓我們看看用於仿真兩組數據的是什麼鬼分布:



實際上,「兩組樣本」是有差別的,只是它們的「均值的差別」和「標準差」水平相當。


為什麼王同學、黃同學的分析並不顯著;而宋同學和W老師把數據合在一起的分析結論是「顯著差異」?

讓我做下這個仿真實驗:

兩個分布,分別取N(重複數)從2到1000,看看樣本均值的估計(藍線);其中灰線是真實均值。

雖然Estimated mean整體圍繞在真實均值附近,但是很明顯,當N比較小時,estimated mean的波動非常大。

所以宋同學比王同學和黃同學「幸運」一些;而增加樣本數據量以後,對均值的估計的波動就降低了。

所以,對於這樣的方差很大的分布來說,只做3個實驗重複,那麼結果。。。。。(你懂的)。。。。


我們發現,上圖的「波動幅度」會隨著N的增加而減小;那麼這個「波動幅度」是什麼?

——「和方差有關吧?」

——「不對,SD是分布中定義好的,應該是不變的啊」

——「那是?」

——「還記得我們前面說error bar有兩種畫法嗎?」

——「標!準!誤!差!」


那麼,讓我們把 「對均值的估計」、「對標準差的估計」和「標準誤差」一起畫在圖上就知道了。

實際上,SE和SD的關係是:

好了,那麼柱狀圖中的error bar的高度,你覺得是用SD還是SEM呢?

歡迎留言討論。

往期連結:

一個簡單易用的標記顯著性的R畫圖包


題外話:向大家交代下,我們「小麥研究聯盟」主編團隊近日迎來一位新主編。他是來自中國農大小麥組的郭偉龍副教授,今天的分享就是來自於他。細心的小夥伴可能不會感到陌生,我們以前推送過一篇關於DNA甲基化分析方面的推送」中國春DNA甲基化數據「,就是在郭偉龍老師的指導和幫助下進行的。

前段時間我們聯盟幾位主編去中國農大學習和交流。這次交流讓我們受益匪淺,更是認識了很多有活力有想法並且有趣的新朋友。以前是只聞其名,不識其人,見面一聊,倍感親切。北京之行,回來已久,今天借這個機會,感謝中國農大小麥組組織了這樣一個難得的交流會,也感謝各位老師和同學們的盛情款待。

考慮到未來包括DNA甲基化等表觀組學在小麥中一定會快速發展,並且隨著參考基因組等各種數據的釋放,生信分析在小麥研究中會越來越重要,正好借這次交流機會,我們邀請郭老師加入主編隊伍,可以給大家帶來很多表觀組學、生物信息學和統計學等方面的內容。郭老師的信息如下圖所示,更詳細的信息請參考 http://cab.cau.edu.cn/art/2017/6/9/art_27218_51.html


相關焦點

  • 零基礎Origin教程4:Error Bar其實一點也不Error
    大家在投稿的時候是否被審稿人要求過在圖中加上Error bar?或者是對 Error bar 的使用提出疑問呢?本期內容告訴你如何正確的使用 Error bar。按照慣例,從最簡單的內容開始。1.設置 Error bar 數據列:選中某一列,右擊,選擇 Set as,選擇 X Error 或者 Y Error,如圖8.1。
  • 計算個「P值」,咱也不太懂,咱也不敢信
    在我們之前的推送中,展示過一個「P值可能具有誤導性」的例子:三位同學對同一基因在兩組樣本中的表達量的差異進行測定分析;其中,兩位同學的結論是差異不顯著,另一位同學的結論與它們相反(三個實驗重複夠嗎?再談「error bar「。)。當增加了樣本數量後,t檢驗計算的到的P值具有顯著性。
  • 100bar的水壓洗車夠嗎
    【太平洋汽車網】100bar的水壓洗車是夠的,不過可能用水量比較多一些, -般洗車水壓力在60-80公斤左右可以有效清洗掉汙泥,並且不會傷到車漆。原理:洗車用的水槍:水通過水泵吸入經壓縮後流經水管,最後經水槍射出,水槍通過控制出水嘴的流量來控制水的分散大小,這樣就夠成的水的噴射。洗車用的不超過8Mpa壓力,一般在5Mpa~6Mpa之間。 空氣壓縮機原理:空氣壓縮機通過吸氣端吸入新鮮空氣進入氣室(一級氣室),經壓縮排入到二級氣室壓縮,送入到儲氣室儲存,最後經管理輸送到使用工具上供使用作業。它的動力來源於柴油機或者電動機橋接或者直接帶動工作。
  • 一分鐘學個詞|Margin of error
    ↑點擊上面綠標在線試聽今天的音頻,音頻播放器已經支持暫停、快進、後退功能了)今天我們要學的詞是 Margin of errorMargin of error 誤差幅度。最近民調顯示,愛奧華州黨團會議召開前夕,Hillary Clinton has a three percentage-point lead over Bernie Sanders, within the poll's margin of error of 4 percent.
  • 《自然》社論談重複實驗:研究者要配合公開數據—新聞—科學網
    但由於種種原因,研究者們似乎不太樂意對別人的研究成果進行重複實驗,重複實驗者和原文作者缺乏良性的互動,期刊對重複實驗的相關文章也拒而不收。 圍繞著重複性實驗,當地時間8月24日,英國頂級期刊《自然》雜誌在最新的一期中發表了名為《去重複實驗吧!》的社論。
  • 心理學實驗為什麼很難重複,真是因為你我差距太大了嗎?
    (有耳/編譯)最近,心理學界遭受了一點小震動:又有一些著名實驗沒能重複。發表這些重複結果的,是一項名為Many Labs 2的大規模國際合作項目。過去幾年間,該項目背後的200多名心理學家試圖重複28項高引用和轟動性的研究,最終發現只有一半的重複實驗能得出和原始研究一致的結論。如果這發生在六年前,或許是震撼學術界的大新聞。而現在,結果已然在預料之中 。
  • 標準誤(Standard Error)
    舉個例子,對一個總體12次抽樣,生成12個樣本,每個樣本大小都為5。那麼每個樣本都有自己的平均值,這些平均值的標準差叫做標準誤差。這裡就是對表格最後一行數組計算標準差(100,101,99,114,10393),最後算出來標準誤結果為6.33。
  • 如果做個實驗需要重複100萬次?科學家們應該如何解決它?
    做個實驗要重複100萬次?科學家們是怎麼解決的說起做實驗,讀者們一定會想起中學的物理實驗。"簡單嗎!測三組數據,求個平均值就完事了!"但是呢,實際遇到的問題也許會複雜的多。如果每個因素變化10次,其他5個因素不變,那麼總共需要一百萬次實驗。這是多麼恐怖的數據量,且不說實驗所需的時間,想要分析這麼龐大的數據都不是一見容易的事。那麼科研工作者怎麼處理這麼龐大的數據呢?
  • bar=ban?99%的人不懂使用bar這樣的高級表達!
    本期英語主播:小逗 bar和ban可以表達同個意思嗎,答案是yes, 這兩個詞都可以表示「禁止」的意思! 一起來看同一個報導裡面的ban和bar的用法:
  • bar = ban ? 99%的人不懂使用bar這樣的高級表達!
    bar和ban可以表達同個意思嗎,答案是yes, 這兩個詞都可以表示「禁止」的意思! 一起來看同一個報導裡面的ban和bar的用法:川普禁止美國與包括支付寶在內的八個中國應用進行交易。bar : 禁止U.S.
  • Python 程式設計師最常犯的十個錯誤
    return barPython程式設計師常犯的一個錯誤,就是想當然地認為:在每次調用函數時,如果沒有為可選參數傳入值,那麼這個可選參數就會被設置為指定的默認值。在上面的代碼中,你們可能覺得重複調用foo()函數應該會一直返回'baz',因為你們默認每次foo()函數執行時(沒有指定bar變量的值),bar變量都被設置為[](也就是,一個新的空列表)。
  • 心理學的危機:為什麼超六成的實驗無法重複?
    這個因果關係如下所示:IV (自變量) → DV(因變量)如果我們想要證明的確是喝咖啡(自變量)影響到任務表現(因變量),必須先行滿足以下三個條件:(1)自變量和因變量存在著時間序列上的關係,自變量的發生應該在因變量之前 (時序定律)(2)自變量和因變量之間存在相關,即自變量的變化也伴隨著因變量的變化(相關定律)(3
  • 再談PHP錯誤與異常處理
    本文章分5個部分介紹我的異常處理的理解:一、異常與錯誤的概述二、ERROR的級別三、PHP異常處理中的黑科技四、巧妙的捕獲錯誤和異常五、自定義異常處理和異常嵌套六、PHP7中的異常處理一、異常與錯誤的概述  PHP中什麼是異常:  程序在運行中出現不符合預期的情況,允許發生
  • 探索基於重複的實驗設計
    明確重複的目的和意義20世紀80年代在科學哲學中興起的新實驗主義,將傳統上理論優位的研究視角轉向了具有生命力的實驗活動。實驗不再被簡單地視作一件用於驗證理論的經驗工具,而是具有豐富的形式和認知意義。基於此立場,我們可以將重複實驗按照目的區分為兩大類:檢驗經驗現象存在性的重複實驗、擴充實驗結果穩健性(robustness)的重複實驗。
  • 「重複實驗在生命科學中並不一定可靠」
    看到標題的第一個單詞Five,和第五個單詞sufficient了吧?簡單來說就是生物界一直認為7層才能發揮作用,裴鋼的這篇文章卻報導說五層就夠。PNAS作為美國科學院院刊,在學術圈的影響力不可小覷。但二十多年過去了,這篇文章的重大發現卻一直沒有被復現出來,包括裴鋼本人也沒有任何跟進,這也是饒毅懷疑其結論真實性的主要依據。
  • 他們試圖重複心理學的多個經典實驗,竟然只有一半成功了
    可重複性再遭審視其實,「可重複性危機」已經困擾心理學界好幾年。在人們通過各種實驗知曉一系列消耗意志力的事項後,重複實驗卻發現,自我耗竭效應並不明顯,很難找到支持它的證據。為了嘗試重複更多經典實驗,開放科學中心於2013年成立。但他們的首次結果並不足夠樂觀:在100項已發表的心理學實驗中,只有不到40%成功重複。而作為該中心的新項目,Many Labs 2的結果表明,在更嚴格的統計學標準下,重複成功率僅為50%。
  • GraphPad Prism 統計教程 - 如何使實驗可重複?
    在本文中,我們提供了一些建議,以增加結果可重複的可能性。什麼是可重複性(replicability)?如果可以重複進行並得到相同的分析結果,則科學實驗是可重複的。由於各種因素,像隨機變量,可重複性並不像某些人想像的那麼普遍。
  • 重複,重複,再重複
    今天來談一個比較輕鬆的話題:重複。這個詞其實大家都不願意面對,我也是。如:重複的文章,重複的事情,重複的知識,重複的上下班 等等,看到這些"一成不變"的東西,心裡產生了極大的抗拒與厭倦。在日常中,我們也都刻意的在迴避這些一成不變的東西,去做一些更新奇的事情。但重複就真的這麼讓人討厭嗎? 先來說說,大家為什麼討厭,厭倦重複。
  • 翻譯:《實用的Python編程》03_03_Error_checking
    def foo():    try:         bar()    except RuntimeError as e:     # Exception does NOT arrive here       ...
  • 韓春雨的實驗結果能否重複?數據說話
    NgAgo基因編輯」(「Failure to detect DNA-guided genome editing using Natronobacterium gregoryi Argonaute」)的論文,作者分別來自於韓國、德國、以及美國的三個具有豐富基因編輯研究經驗的研究組。