p.value和FDR

2022-01-06 生信技能樹

最近用limma作差異分析,接觸p.value和adj.p.value比較多,今天就重點解釋下p.value和FDR吧:

在topTable函數的結果裡,我們都會看到p.value和adj.p.value:不得不提假設檢驗:

其實上一篇提到了這一part;
這裡不再贅述,只說下對H0和H1的一個較好的解釋:

最終,基於p.value進行H0和H1的抉擇,那麼它真的很重要,這意味著,得p值者得天下嗎?不不不topTable裡有adjust.method參數,而這個參數就是針對p.value的:
如此重要的p.value也是需要校正的,我們看下,究竟是如何校正的:

p.adjust(p, method = p.adjust.methods, n = length(p))
> head(tT)
                       logFC    AveExpr         t      P.Value    adj.P.Val        B
ENSG00000129159.6   5.781884  0.2374425  13.54654 7.193427e-25 6.484393e-21 46.00225
ENSG00000139445.13  6.651408 -1.2961424  13.51254 8.523124e-25 6.484393e-21 45.74851
ENSG00000175175.4   4.901581  1.1389013  13.09707 6.834505e-24 3.466461e-20 43.80622
ENSG00000072832.10  4.746913  4.7398309  12.76099 3.726586e-23 1.098270e-19 42.10851
ENSG00000224621.1  -4.624916 -2.9418765 -12.79910 3.072963e-23 1.098270e-19 41.98058
ENSG00000267746.1   5.580776 -4.9319911  12.73131 4.330718e-23 1.098270e-19 41.74255
> dim(tT)
[1] 15216     6
> head(p.adjust(tT$P.Value,method='BH'))
[1] 6.484393e-21 6.484393e-21 3.466461e-20 1.098270e-19 1.098270e-19 1.098270e-19
> p.adjust(tT$P.Value[1],method='BH')
[1] 7.193427e-25

代碼解釋:綜上:FDR計算方法:

總計m次檢驗的結果按由小到大進行排序,k為其中一次檢驗結果的P值所對應的排名;

找到符合原始閾值α的最大的k值,滿足P(k)<=α*k/m,認為排名從1到k的所有檢驗存在顯著差異,並計算對應的q值公式為q = p*(m/k),q值即FDR;

若後一個FDR小於前一個FDR,則以前一位的計算結果為FDR,所以會在結果中看到相同的數值;
【參考內容】
1.https://scientistseessquirrel.wordpress.com/2015/02/09/in-defence-of-the-p-value/
2.https://zhuanlan.zhihu.com/p/51546651

相關焦點

  • 差異基因分析方法——p-value
    點擊關注基迪奧,立即漲姿勢~上周,我們分享了用RPKM值計算差異基因的方法,這周我們繼續分享另外一種方法p-value
  • 【統計】p值和FDR
    從另一個方向理解,在假設𝐻0成立的前提下,即先假設「兩組沒有差異」,比較兩組的差值,如果差值符合正態分布,p值越小,說明「兩組沒有差異」的概率越小,通常情況下,當p值小於0.05時,認為是小概率事件,即「兩組沒有差異」「幾乎不可能發生。我們接受𝐻1,「兩組有明顯差異」,就是我們經常在論文裡看到的陽性結果。
  • 小孩都看得懂的 p-value
    ,那什麼是 p-value 呢?Well Done, Wikipedia, 這下連大人都徹底不懂 p-value 了。但希望下面極簡的講解能讓小孩懂什麼是 p-value。隨機丟硬幣,看是正面還是反面,如果硬幣的質量是均勻分布,通常稱為公平的硬幣 (fair coin),那麼出現正面和反面的概率是
  • R語言添加p-value和顯著性標記
    "jco", add = "jitter") # 添加p-value, 默認是Wilcoxon testp+stat_compare_means()stat_compare_means(label.y = 50) # Add global p-value
  • 數據挖掘常見的 p-value 解讀
    p-value,那什麼是 p-value 呢?Well Done, Wikipedia, 這下連大人都徹底不懂 p-value 了。但希望下面極簡的講解能讓小孩懂什麼是 p-value。做試驗:p-value牢記:p-value 就是硬幣公平時觀測結果發生的概率。 第一次硬幣是反面,p-value 是多少?你覺得硬幣不公平嗎?絕壁不會啊!
  • P-Value--機器學習筆記
    連續兩次頭朝上的概率和連續兩次尾朝上的概率是一樣一樣的!統計學家發明了P-Value用來計量這些神奇事件概率事件之和。按照一般經驗來說,p-value的值小於5%,算是稀奇。P-Value總是由3部分組成,1. 稀奇事兒本身的概率 2. 一樣稀奇其它事兒的概率 3. 更稀奇事兒的概率。再舉一個例子,你認為一朵花,特別稀奇。
  • 對於P_value的理解
    通常有t檢驗(用於樣本含量較小,倆樣本均數以及兩本均數與總體均數的之間的比較)、z檢驗(用於樣本含量較大,兩個平均數的差異是否顯著)、卡方檢驗(用於倆定類變量,實際觀測值和理論推導值的偏離程度)等~     通常,我們會設定原假設為H0,指兩樣本無差異,Ha為H0的補,指兩者有差異,而所謂P值:「p-value is the probability we get this sample or
  • R語言可視化學習筆記之添加p-value和顯著性標記
    jco", add = "jitter")#添加p-valuep+stat_compare_means()stat_compare_means(label.y = 50) # Add global p-value
  • 想不想體驗手動模擬計算p value的快感!
    最近剛結束生物統計課的助教生涯,想與大家分享一下非常非常非常形象的p value的計算方法,希望能加強大家的理解。無論是從事幹實驗還是溼實驗研究的人大概都知道p value是假設檢驗中進行檢驗決策的一個重要依據,一般以p value是否小於0.05來衡量是否具有統計學差異。
  • 什麼,你算出的P-value看上去像齊天大聖變的廟?
    給定了統計假設,任何極值內的值與研究數據都是兼容的。基於此,作者可以更好的強調數據分析帶來的期望值和不確定性,不再對結果過於自信或悲觀。不過一來統計界以後會怎麼實施未知,二來籤名也未發對p-value的正確使用。那麼怎麼理解P-value的含義?怎麼算是正確使用P-value呢?怎麼評估算出的P-value是否正常呢?就是我們下面要說的。
  • 【中津學術講堂】英國帝國理工學院博士吳希昆講述p-value
    主題顯著還是不顯著,這是個問題 - p-value漫談在大數據的時代,海量的信息給各行各業帶來了前所未有的機遇,然而數據收集、存儲、查詢和分析等各個環節也都面臨新的挑戰。例如傳統的統計學方法如果直接應用於大數據的假設檢驗的話,就會得出所有的結果都具有統計顯著性的結論。假設檢驗和基於p-value的差異顯著性判斷長期以來在實踐中被大多數學者視為是統計學中的金科玉律,對p-value的過分依賴和誤解也是一個非常普遍的問題。在統計學內部關於p-value的討論也一直都是熱點。
  • 在追逐 p-value 的道路上狂奔,卻在科學的道路上漸行漸遠~~~
    如此,人們習慣把「p-value 越低」和「因子 A 在解釋超額收益上越有效」等價起來了。這就是為什麼我們都喜歡低的 p-value。但它們倆真的等價嗎?別急,看完本文你自會有答案。低的 p-value 僅僅是某個因子有效的必要條件;但是它遠不是充分條件。
  • Pingouin - 基於基於Pandas和NumPy的Python3統計軟體包
    Pingouin是一個用Python3編寫的開源統計包,主要基於Pandas和NumPy。下面列出了它的一些主要特性。
  • 技術貼 | R語言:組學關聯分析和pheatmap可視化
    =data.frame(print(corr.test(other, metabo, use="pairwise", method="spearman", adjust="fdr", alpha=.05, ci=TRUE, minlength=50), short=FALSE, digits=5))    # 整理結果    pair=rownames(result)  #
  • 差異表達基因時的Log2FC和FDR值的含義?
    轉錄組分析差異表達基因時,結果中會出現Log2FC和FDR值,這兩個是什麼意思呢?
  • RNA-seq中的P value與Q value怎麼用?
    不同情況的P value估算是最常見的分析了。例如:差異表達分析下的P value,GWAS下的P value。由於檢驗次數的增加,多重檢驗校正又成為數據分析的必要步驟,於是Q value,adjusted P value,FDR等這些名詞又冒了出來。有時候,大家都覺得暈了啊!
  • [小工具] Wilcoxon-tk小工具計算分組數值的秩和檢驗p-value
    Wilcoxon-tk 主要解決的問題是根據不同分組信息計算不同顯著性差異 p-value, 使用wilcoxon-command-line的C程序函數,簡單封裝,完成直接讀數值表,然後批處理計算P values。
  • 差異表達基因分析:差異倍數(fold change), 差異的顯著性(P-value) | 火山圖
    Furthermore, when the denominator is close to zero, the ratio is not stable, and the fold change value can be disproportionately affected by measurement noise.