PICRUSt不靈啦?別慌,它一直都不咋靈~

2021-01-19 Listenlii



PICRUSt作為利用16S進行功能預測的方法,使用非常廣泛。但是其利用Greengene作為參考資料庫,由於Greengene更新緩慢,在如今測序技術發展一日千裡、成本不斷下降、新序列的出現日新月異的條件下,其準確性一直都受到質疑(沒有文獻參考,起碼受到我的質疑0.0)。

另外這種基於系統發育關係判定功能的方法本身也是一種近似,其本身就存在很多的偏差。


前幾天看到一篇文章:

PICRUSt功能預測又被爆出新的問題啦!

介紹了bipRxiv上一項研究,說PICRUSt存在很大的問題。

文章中指出PICRUSt主要的問題在於其預測的準確性和宏基因組相差太多,人類腸道樣本效果還稍微好一點,環境樣本,尤其是土壤樣本效果很差。如下圖所示(記為A)。

巧的是,在PICRUSt方法發表的文章中也有一張圖,用的恰好也是土壤樣本。其結論是說在低測序深度條件下PICRUSt更準確,高測序深度宏基因組更準確。如下圖所示(記為B)。

這就讓我對bipRxiv的結論很有興趣。我沒有看bipRxiv的原文,只是找了他們用到的樣本信息,如下表所示。

事先聲明,以下結論全為自己推論,沒有證實,只是一時發散思維的想法,切莫當」真」。。。



樣本LWM對應的表中的第7行,樣本AAN對應表中的第8行。仔細看他們的16S序列數和宏基因序列數。LWM的16S序列遠高於AAN,而其宏基因組序列數遠低於AAN。兩樣本的序列數都高於20,000,測序深度較高,在圖B中表明宏基因組的結果都要好於16S+PICRUSt,比較吻合。

那麼再回到bipRxiv中的那張圖A,LWM由於16S很多,PICRUSt準確性也較高,和宏基因組重合比例較高。AAN的16S序列很少,而宏基因組數據特別多,因此PICRUSt預測效果很差,和宏基因組重合比例很低,這也完全解釋的通。

所以bipRxiv說土壤樣本不準,可能是因為測序深度比較深,也可能是因為宏基因組數據太多而16S數據太少,使得兩者差異較大。


為了進一步驗證我的猜想,繼續看其他類型的樣本。如第5行的mouse和第6行的chicken,兩者由於16S序列很少,小於10,000,根據圖B表明PICRUSt應該比宏基因組準確性更高。隨著宏基因組序列數的大幅增加(mouse到chicken),PICRUSt和宏基因組的重疊果然也大幅增加(圖A)。



綜合上述瞎猜,可以得出參考基因組;測序深度;以及16S和宏基因組相對數據量會影響PICRUSt準確性。

測序深度在以後只可能更深,因此PICRUSt準確性不如宏基因組已成事實。bipRxiv的研究在樣本的選擇上存在很多問題,只憑一篇文章並不能把PICRUSt一巴掌拍死。


近期出了PICRUSt2,可參考:

PICRUSt2:OTU/ASV等16S序列隨意預測宏基因組,參考資料庫增大10倍


以及PICRUSt2 Tutorial (v2.1.4 beta)

https://github.com/PICRUSt/PICRUSt2/wiki/PICRUSt2-Tutorial-(v2.1.4-beta)#place-reads-into-reference-tree

(閱讀原文直達)


PICRUSt2 裡的Key Limitations也說了,預測主要受限於現有參考基因組的基因。



對於16S,其基因序列通常不能分辨一個物種內的菌株變異。原核物種菌株的基因含量差異很大,在親緣關係較遠的類群之間經常發生水平基因轉移,因此對預測結果應小心。

另外,參考基因組的選擇也會影響結果。如與牛瘤胃相比,PICRUSt2在人類腸道的16S序列上表現得更好,即使實際的16S序列本身非常相似。其原因是許多重要的瘤胃特異性酶在默認的參考基因組中缺失。這個問題的一個潛在解決方案是創建一個特定的基因組參考資料庫,該資料庫只針對感興趣的環境進行預測。



Reference

Shan Sun, RoshondaB. Jones, Anthony A. Inference based PICRUSt accuracy varies across sampletypes and functional categories. FodorbioRxiv 655746; doi: https://doi.org/10.1101/655746

Langille M GI, Zaneveld J, Caporaso J G, et al. Predictive functional profiling ofmicrobial communities using 16S rRNA marker gene sequences[J]. Naturebiotechnology, 2013, 31(9): 814.


一個環境工程專業卻做生信分析的深井冰博士,深受拖延症的困擾。想給自己一點壓力,爭取能夠不定期分享學到的生信小技能,亦或看文獻過程中的一些筆記與小收穫,記錄生活中的雜七雜八。

目前能力有限,尚不能創造知識,只是知識的搬運工。

歡迎大家掃描下方二維碼關注我的公眾號,若有問題也可直接加我的微信:水岸風堤(lii32703)。請備註姓名及單位,否則自動忽略。

歡迎分享,轉載請聯繫我。

相關焦點

  • PICRUSt功能預測又被爆出新的問題啦!
    預測的基因同宏基因組數據進行分析發現除了人類數據重合度很高之外,其他都只有一部分可以重合基於不同功能的基因在功能預測和宏基因之間相關性不同歡迎加入微生信生物討論群,掃描下方二維碼添加小編微信,小編帶你入夥啦,大牛如雲,讓交流變得簡單。
  • 【生信篇】基因功能預測之PICRUSt
    它是最早被開發的基於16S rRNA基因序列預測微生物群落功能的工具,包括在線版(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)和基於MacOS X或Linux系統的下載安裝版(http://picrust.github.io/picrust/install.html#install)。
  • 民間故事:好的不靈壞的靈!都說是烏鴉嘴,可你知道烏鴉嘴的由來嗎...
    大兒子一聽也高興啊,不自主的放慢了速度和老二說道:「我這不孝之子一直在外,還要勞您兄弟二人照顧家父,不過也借您吉言,多謝!」正說著,老大從院門裡轉了出來,一邊跑還一邊大叫著:「大兄弟你還在這裡磨蹭啥呢?你這一慢興許老爺子就咽氣了,見不著你最後一面了!」
  • PICRUSt2 使用指南
    我們可以通過 conda 或從源碼安裝 PICRUSt2( 這兩種方法都需要先安裝 conda )。從源碼安裝wget https://github.com/picrust/picrust2/archive/v2.2.0-b.tar.gztar xvzf  v2.2.0-b.tar.gzcd picrust2-2.2.0-b/創建並激活環境,然後使用 pip 安裝 PICRUSt2。
  • 請患者不要死在走廊上:圖不靈醫院,究竟有多靈?
    今年的三產是:圖不靈醫院!什麼是圖不靈醫院?圖不靈醫院是一家應用人工智慧(AI)對人類精神、情感等方面的疾病進行治療的正規專科醫院,現有常駐人類值班醫生一名。醫院現開設路盲測試中心、成名妄想症診室、智商保健中心、家長治療室等科室,另設有限量飲水處、保衛處、放風處等便民設施。
  • 和合術咒語靈不靈?普通人可以學來自己用嗎
    作為一個歷史悠久的文化大國,我們中華傳統文化不論是在哪一個時代都是備受重視的。那麼和合術咒語究竟靈不靈?我們身為普通人能不能夠學來自己用呢?接下來就請大家來和我們一起看看吧。很多人在自己的感情出現了無法挽回的大問題的時候,都會本能地去尋求外界力量的幫助,這是一種很正常的心理現象。像和合術咒語這種存在就是搜索率最高的那一類高頻詞。
  • 現在只看一前輩不傳之秘靈不靈
    現在只看一前輩不傳之秘靈不靈 本月初,大聖貝爾腿筋受傷休息一個月,註定缺席威爾斯國家隊最後兩場世界盃預選賽。這兩場比賽將決定威爾斯是擠開塞爾維亞順利晉級 2018 年俄羅斯世界盃,還是被愛爾蘭趕盡殺絕,以至失去附加賽資格。
  • 叫天不應?叫地不靈?野外探險這些脫困技能必須知道!
    相比城市,野外探險更容易遇到突發事件,一旦陷入叫天天不應,叫地地不靈的困境,我們該怎麼辦?如果聯繫不上救援,千萬別慌,做好打持久戰的準備,合理分配攜帶的食物和水,同時積極尋找水源。山谷底部、綠色植被下、草食性動物足跡頻繁處都很可能有水;實在不行,在樹木嫩葉上套上塑膠袋,植物蒸騰作用會在塑膠袋內產生凝結水。
  • 新手媽媽別慌 常見護理問題的權威解答來啦
    別慌!訓練要慢慢地來,不要著急,寶寶做對的時候給予鼓勵, 寶寶沒有成功的時候忽略它,有一天就會發現驚喜。當然也要看藥上面的有效期和劑型,使用過程中,開瓶日期要標註,及時更換,不建議長期服用。但不管準備什麼樣的藥物,都不建議讓寶寶長期使用,要對症處理。
  • 夏季旅遊遇見「洋辣子」,被蟄後也千萬別慌,它身上就有「解藥」
    夏季旅遊遇見「洋辣子」,被蟄後也千萬別慌,它身上就有「解藥」夏日裡,不少人會帶著自己的一家子到鄉下去避暑旅遊,體驗一下難得的鄉村生活,也不失為一種簡便的休閒。但是鄉下地區的蟲類特別多,難免就會遭到叮咬,尤其是孩子,皮膚細嫩,遭到叮咬後更是難受。
  • 別慌,看看專家怎麼說
    別慌,看看專家怎麼說 郭玉琴主任表示中醫認為,身體虧虛是導致肺結節的原因。不同患者的病情不同,治療方式也不一樣,所用中藥方也有區別。並不是所有的結節都適合中藥治療,中藥主要針對的是良性的,且體積較小的結節。
  • 小國別電影,怎麼說不靈就不靈
    2017年,小國別電影以黑馬之勢在國產電影與好萊塢大片中撕開一道口子。阿米爾汗主演的《摔跤吧爸爸》在中國勇奪12.95億票房,為印度電影入華打開局面;事先宣發不多,但以驚悚、燒腦內容取勝的《看不見的客人》以1.7億票房創下西語影片在內地的最好成績。 於是便有了2018年多達10部印度電影進入中國。
  • 頭上動土能咋地!
    老話常說,太歲頭上坐,無災也有禍,就凡事要破土動工之前,對於動工的時間地點方位一定得要在風水先生仔細地察看過後才能決定,如若,動土非良辰吉日或是地點方位不對,輕則招來不幸。重則禍及後代會死人的,其實老輩兒傳下來的這些話屬於迷信的範疇,咱們可不能相信,要相信科學。
  • 別當一個會買的土炮兒
    哪個女孩的梳妝檯上還沒點兒楊樹林咋地?   Hermès   大名鼎鼎的愛馬仕鉑金包大家應該都認識啦,不過愛馬仕的讀音很多人都會讀錯,很多人都會將Hermès開頭的H發音讀成/her:mes/,但是其實呢,在法語中大部分H都是不發音的,因此在Hermes這個單詞中,英語讀音為/ɛərˈmɛz/。
  • 別慌,還有這幾種可能!
    人乳頭瘤病毒, 聽名字就像是個狠角色,也確實有點兒狡猾, 它從不進入血液, 抽血這個方式根本別想找到它[2]; 但它也有個很大的優點 :專情!
  • 別再只用蛋黃補鐵啦,它補鐵是雞蛋的10倍,不給寶寶吃就虧啦
    別再只用蛋黃補鐵啦,它補鐵是雞蛋的10倍,不給寶寶吃就虧啦今天咱們來聊聊補鐵界的「假網紅」——蛋黃。雞蛋一直是個特別有營養的食材,尤其是蛋黃,但關於它的謠言也是數不勝數。特別是蛋黃補鐵的謠言,時不時的會在家族群出現,讓不少媽媽蒙在鼓中。可謂是「造謠一張嘴,闢謠跑斷腿」媽媽們注意,用蛋黃補鐵,補的可能是塊「廢鐵」。
  • 姿態:遇劍魔別慌,拿出這個英雄穩穩地吊打他!9分鐘領先60刀
    姿態:遇劍魔別慌,拿出這個英雄穩穩地吊打他!9分鐘領先60刀我就是我,不一樣的煙火,我瞅自己都上火!你們熟悉的帥氣小編渣渣灰又來啦!改版前劍魔的團戰容錯率很低,雖然暴力但是在職業賽場上的出場率不是很高,在路人局裡也沒有多少玩家玩!
  • 墨之濺筆也以靈,筆之運墨也以神,墨非蒙養不靈,筆非生活不神!
    所以,不論是五代兩宋的董源、巨然、範寬、郭熙,南宋的劉松年、李唐,還是「元四家」都是通過遊歷山川河流,從自然生活中收集素材而創作。黃公望畫富春山吳鎮寫江南山,明初王履從華山而得華山圖,都開創了直接對景而作的山水畫先河。以上各個階段的山水畫作品,都是觸景生情、以景寫生,反映現實,加以畫家的主觀情感而成詩情畫意之境。王履《華山圖序》稱:「畫雖狀形主乎意,意不足,謂之非形可也。
  • 印光大師:《準提咒》和《大悲咒》哪個更靈?心若致誠法法皆靈!
    印光大師:《準提咒》和《大悲咒》哪個更靈?心若致誠,法法皆靈!【印光大師開示】念佛之人,亦非不可持咒。但須主助分明,則助亦歸主。若泛泛然無所分別,一目視之,則主亦非主矣。《準提》、《大悲》,豈有優劣?心若至誠,法法皆靈。心不至誠,法法不靈。
  • 歷史上倒黴的八大烏鴉嘴,好的不靈壞的靈!拜託,請少說點話吧!
    所以後來就用來引申描繪某人的嘴特臭, 有時也形容某人的嘴巴特可惡,好事說不靈,壞事一說就靈。歷史上是有很多有名的烏鴉嘴的,今天我們就一起看看他們的傳奇故事吧。一 曹操的烏鴉嘴曹操生性就是一個比較豁達的人,看曹操的詩句就可以知道。但是曹操有時候也挺烏鴉嘴的。當年曹操赤壁慘敗後發出了「三聲大笑」。