原標題:微生物研究必知的6個知識點 | 16S專題
編者按
敲黑板,劃重點啦~今天起,我們將與大家一起徜徉在微生物研究的海洋,希望可以為大家的微生物研究添磚加瓦。從樣品的獲取製備到建庫測序,從常見圖標的說明繪製到解讀16S報告乃至如何撰寫一篇高質量的16S文章……在接下來的一個月裡,小編將一一為大家介紹。今天,我們先來聊一聊微生物研究中常見的熱門問題吧~
微生物測序設置生物學重複的意義是什麼?一般情況下,設置多少個重複合適?
生物學重複是指樣本重複,比如3隻小鼠,同時做同一個處理,就是三個生物學重複。生物學重複對於測序的實驗設計以及後續信息分析都非常重要,設置生物學重複主要有以下幾個作用:
1)能夠消除組內誤差:生物學重複可以測量變異程度;
2)增強結果的可靠性:測序的樣本越多,越能夠降低背景差異,從而增加結果可信度;
3)檢測離群樣本:異常樣本的存在,會嚴重影響測序結果的準確性,通過後續信息分析可以發現異常樣本,將其排除。
一般情況下,自然環境中(比如土壤,根系,植物等)及模式動物(比如大鼠,小鼠等)建議每組至少5個生物學重複,一般推薦10個生物學重複;若是人類腸道,糞便等樣品,由於個體之間差別較大(比如環境,飲食,遺傳條件,健康狀態等影響),建議加大取樣量,每組不少於30個生物學重複(取樣少,可能會導致組內差異大於組間差異則項目無意義)。值得注意的是,如果將多個樣本混在一起建庫測序,多個樣本則變成了一個樣本,仍是無生物學重複的。
Tips:一般建議多做生物學重複,若是遇到個體之間差別較大的情況可以選擇剔除個別樣本,避免後期樣本數量不夠,後期補送重複性不好的情況發生。
16S 測序物種注釋常用的資料庫有哪些?
這些資料庫的特點(或優缺點)是什麼?
微生態研究,是研究微生物之間以及微生物與環境之間相互關係,其主要研究對象包括真菌,細菌,古菌和病毒等。對於獲得的大量16S rRNA測序序列,得到可靠的物種分類結果與全面的資料庫是密不可分的。16S測序物種常用的資料庫有RDP, SILVA ,Greengenes,NT-16S(NT庫提取整理16S序列資料庫)等,這些資料庫的詳細信息見下表:
表:16S注釋常用資料庫一覽表
註:第一列為資料庫名稱;第二列為資料庫最新版本或更新日期;第三列為資料庫16S序列數目;第四列為資料庫網址。
RDP資料庫是目前較常用的比對、注釋的參考資料庫,版本更新比較快,16S序列信息較全。
SILVA 資料庫由於更新比較及時,因此也是目前最常選用的參考資料庫之一。
Greengenes資料庫相對於RDP,SILVA資料庫,長時間未更新,目前較長用於嵌合體去除的參考資料庫,另外16S功能預測-PICRUST軟體是基於Greengenes的gg_13_5研發的,因此想做PICRUST分析也必須依託於Greengenes資料庫進行比對。
NT-16S資料庫是基於NT庫提取整理的16S資料庫,該資料庫是聯川特色資料庫,由於RDP資料庫只能注釋到屬水平,基於RDP注釋結果,進一步對序列進行注釋,獲得種水平的注釋結果。
16S 物種分類學注釋中,常得到 UNCLASSIFIED,NO_RANK,OTHERS 等意義?
雖然理論上所有的微生物序列都應當能在種甚至菌株水平得到鑑定,但由於微生物種類繁多,目前上述常用資料庫還很難包羅萬象。加上二代測序讀長的限制,往往只能選擇16S rRNA 1-3個高變區(目前常用的擴增片段V3-V4區/V4區)作為擴增片段進行測序,分類的精確性受到一定的限制(某些物種高變區也可能十分相近,能夠區分它們的特異性序列片段有可能不在擴增區域內,因此在鑑別的過程中受到測序長度的限制),因此,在實際分析過程中,並非所有OTU代表序列都能獲得屬或種水平的分類學信息(即在對應的分類學水平尚且屬於 「Unclassified」)。另外,也總是有可能遇到某些較為新奇、尚未被充分研究的微生物(在較高分類水平,比如門水平鑑定為「Unclassified」),此為正常現象。
No_Rank表示在某個分類水平上沒有明確的分類信息或分類名稱(與資料庫有關)。
Others一般在作圖時自行定義的,比如做熱圖或柱狀圖分析時,一般選擇豐度較高的物種(比如豐度前20的物種)進行展示,剩下的所有物種以Others定義,且Others的豐度為剩下所有物種豐度的求和。
圖:物種組成柱狀圖示例圖
OTU 是什麼?作用是什麼?
16S 多樣性測序引物該怎麼選擇?
OTU(operational taxonomy unit)操作分類單元,在微生態研究中,為了便於分析,人為給定某一分類單元(品系,種,屬等)設置的同一標誌。簡單的說,OTU類似於種,是根據高變區序列比對得出的,一般將相似度大於97%的序列聚為一類,稱為同一個OTU。
圖:OTU聚類原理
通常情況下,將來自同一環境的所有樣品序列進行合併,將序列之間相似性大於97%(相當於物種分類種水平之間的序列差異)歸類為一個OTU,理論上來說,每個OTU對應於一個不同的16S rDNA序列,也就是每個OTU對應於一個不同的物種。通過OTU聚類分析,不僅可以簡化數據結構還可以得到樣品中的微生物多樣性以及不同微生物的豐度。
ALPHA 多樣性和 BETA 多樣性在微生物檢測中的意義?
對群落多樣性、生態多樣性的研究主要應用多樣性指數來進行比較,常用的指數包括alpha多樣性指數和beta多樣性指數。
alpha多樣性是指一個特定環境或生態系統內的多樣性,主要關注局域均勻生境下的物種數目,因此又稱為生境內的多樣性。alpha多樣性常用的指數有四種:Observed species,Chao1,Shannon,Simpson。
其中Observed species指數是指樣本中實際包含的OTU數目,chao1指數是指估算樣本中OTU的數目,這兩個指數均反映樣本中OTU(物種)數目的高低,這兩個指數越高表明樣本中的物種豐富度越高。Shanon指數是用來描述OTU出現的紊亂和不確定性,不確定性越高,多樣性指數越高,Simpson指數是指從樣品中隨機取兩條序列,這兩條序列屬於不同的OTU的概率,如果樣本中只有一個OTU,Simpson指數為0,多樣性最低。Shannon和Simpson指數不僅反映了樣本中物種的數量(即豐富度)又反映了樣本中各物種的豐度分布情況(即均勻度)。總之,樣品中OTU數目越多,OTU豐度分布越均勻,多樣性指數越高。
beta多樣性指沿環境梯度不同生境群落之間物種組成的相異性或物種沿環境梯度的更替速率,也被稱為生境間的多樣性,主要是衡量群落之間的差別。beta多樣性的意義在於:
1)它可以反映生境變化的程度或指示生境被物種分割的程度;
2)beta多樣性的高低可以用來比較不同生境的多樣性。
總的來說,alpha多樣性主要關注某一個群落中的物種多樣性,而beta多樣性主要關注不同群落之間的物種多樣性差別。
16S 多樣性測序引物該怎麼選擇?
傳統方法中最常用的引物是27F和1492R,幾乎能擴增出完整的16S rRNA基因全長序列,但是由於二代高通量測序讀長的限制,該引物明顯不適用於高通量測序平臺。考慮到讀長的限制,只能對16S rDNA某一段或某兩段可變區進行測序。一般而言,環境微生物組學常用的,也是認可度比較高的測序區域,V3-V4,V4-V5,或者單個V4區。
常用的V3-V4區通用引物是338F/806R,具體序列如下:
好了,16S專題第一期就到此結束了。我們整合了宏基因組測序中的部分熱門問題並以此開篇,下期我們將介紹樣本獲取及製備的相關事宜。
想即時獲取專題更新嗎?
想了解更多精彩資訊嗎?
想擁有更多乾貨嗎?
掃一掃二維碼,
關注「聯川生物」就能實現~
返回搜狐,查看更多
責任編輯: