又快到了研究生的畢業答辯季,相信很多同學的論文中對數據的基本描述會使用柱狀圖、誤差線和差異顯著性。「一伊」小編之前給大家介紹了如何使用R語言添加Error bar等技巧。作為本小編的首次交稿作業,我今天從統計的角度認真地談下Error bar的畫法和統計學顯著性。
(1) 這些問題你遇到過嗎?
設想以下兩個場景:
(A)利用qPCR研究某基因在兩份小麥材料根組織中是否差異表達,你會做幾次實驗重複?用什麼統計學方法?
(B)研究熱脅迫條件和正常條件下,某一小麥材料的葉片的電導率是否發生變化,你會做幾次實驗重複?用什麼統計學方法?
相信絕大部分的答案是:3次實驗重複,t檢驗。
然而,我們常常有疑問:3次實驗重複夠嗎?
「額,應該夠吧,師兄的某某實驗就做了三次。「
於是,我們用3次實驗重複的均值作為柱狀圖中bar的高度。那麼Error bar的高度怎麼得到的?
通過查閱文獻,我們發現有的文章用「標準差「(SD),有的文章用「標準誤差」(SEM)。
「額。。。我該用哪個呢?」
此外,我們還會遇到這樣的問題:為什麼我得到的兩組數據的均值差異很大,但是t檢驗得到的p值並不顯著;而我師兄的兩組數據的均值差異並不大,但是p值確非常顯著?
「我的師兄究竟對數據做了些什麼??」
(2) 讓我們以qPCR場景為例,講個「神(jing)奇(song)的故事」
一天,W老師為了研究 「濟麥22」和「良星99」的根系中基因的差異表達,分別安排王同學研究基因X,黃同學研究基因Y,宋同學研究基因Z。於是三個同學各自取來材料,兩組樣本中根系組織中提取RNA做qPCR,每個樣本做了三次實驗重複。得到的結果是這樣的:
王同學:
黃同學:
宋同學:
於是,三個同學各自的到的結論是如下:
王:基因X的表達在兩組樣本中差異不顯著。
黃:基因Y的表達在兩組樣本中差異不顯著。
宋:基因Z的表達在兩組樣本中差異顯著。
然而,W老師看到這結果後的表情是這樣的:
W老師:「我該相信誰?」
事實上,三個同學都非常非常非常認真地做了三次實驗重複;都使用t檢驗計算了p值;都使用樣本均值作為柱形的高度;都使用標準差(SD)作為Error bar的高度。
然後,W老師開始懷疑人生了……
經G老師的建議,W老師把三個同學的結果放在了一起:這樣兩組樣本,每組9個實驗重複,重新進行了計算,得到了如下結果:
結果竟然神奇的顯著了(p<0.05)!!!
(3) 「那麼,問題出在哪兒了呢?」
來,讓我們看看用於仿真兩組數據的是什麼鬼分布:
實際上,「兩組樣本」是有差別的,只是它們的「均值的差別」和「標準差」水平相當。
為什麼王同學、黃同學的分析並不顯著;而宋同學和W老師把數據合在一起的分析結論是「顯著差異」?
讓我做下這個仿真實驗:
兩個分布,分別取N(重複數)從2到1000,看看樣本均值的估計(藍線);其中灰線是真實均值。
雖然Estimated mean整體圍繞在真實均值附近,但是很明顯,當N比較小時,estimated mean的波動非常大。
所以宋同學比王同學和黃同學「幸運」一些;而增加樣本數據量以後,對均值的估計的波動就降低了。
所以,對於這樣的方差很大的分布來說,只做3個實驗重複,那麼結果。。。。。(你懂的)。。。。
我們發現,上圖的「波動幅度」會隨著N的增加而減小;那麼這個「波動幅度」是什麼?
——「和方差有關吧?」
——「不對,SD是分布中定義好的,應該是不變的啊」
——「那是?」
——「還記得我們前面說error bar有兩種畫法嗎?」
——「標!準!誤!差!」
那麼,讓我們把 「對均值的估計」、「對標準差的估計」和「標準誤差」一起畫在圖上就知道了。
實際上,SE和SD的關係是:
好了,那麼柱狀圖中的error bar的高度,你覺得是用SD還是SEM呢?
歡迎留言討論。
往期連結:
一個簡單易用的標記顯著性的R畫圖包
題外話:向大家交代下,我們「小麥研究聯盟」主編團隊近日迎來一位新主編。他是來自中國農大小麥組的郭偉龍副教授,今天的分享就是來自於他。細心的小夥伴可能不會感到陌生,我們以前推送過一篇關於DNA甲基化分析方面的推送」中國春DNA甲基化數據「,就是在郭偉龍老師的指導和幫助下進行的。
前段時間我們聯盟幾位主編去中國農大學習和交流。這次交流讓我們受益匪淺,更是認識了很多有活力有想法並且有趣的新朋友。以前是只聞其名,不識其人,見面一聊,倍感親切。北京之行,回來已久,今天借這個機會,感謝中國農大小麥組組織了這樣一個難得的交流會,也感謝各位老師和同學們的盛情款待。
考慮到未來包括DNA甲基化等表觀組學在小麥中一定會快速發展,並且隨著參考基因組等各種數據的釋放,生信分析在小麥研究中會越來越重要,正好借這次交流機會,我們邀請郭老師加入主編隊伍,可以給大家帶來很多表觀組學、生物信息學和統計學等方面的內容。郭老師的信息如下圖所示,更詳細的信息請參考 http://cab.cau.edu.cn/art/2017/6/9/art_27218_51.html。