Microbiome:環境樣品中絕對定量菌群豐度的新方法

2020-11-25 騰訊網

環境樣品中微生物群落豐度的絕對定量

Absolute quantitation of microbiota abundance in environmental samples

Microbiome

Impact Factor 10.465

發表日期：2018-06-19

第一作者：Andrzej Tkacz

合作作者：Marion Hortala

主要單位：

英國牛津大學植物科學系(Department of Plant Sciences, University of Oxford, South Parks Road, Oxford

OX1 3RB, UK)

寫在前面

分享標題：Microbiome：絕對定量菌群豐度的新方法

關鍵字：spike，微生物群落，絕對定量，菌群分析方法，qPCR，相對豐度

點評：菌群相對豐度削弱了不同樣品間的可比性，也難以揭示生物域水平的菌群結構變化。本研究採用人工合成的嵌合體DNA作為內參，可以計算土壤這樣的複雜環境樣品中的細菌絕對豐度，有助於不同樣品間的比較，並且強調了絕對豐度與相對豐度在描述菌群變化中的差異。該成果對優化菌群分析手段、解讀菌群相關的研究成果都具有參考價值，值得專業人士關注。國內中科院白洋團隊和王二濤團隊分別報導了植物樣品中的絕對定量方法，詳見（https://www.mr-gut.cn/papers/read/1082713111）和（https://www.mr-gut.cn/papers/read/1067164721）

摘要

背景

微生物組(microbiota)影響人類和動物的疾病和免疫、地球化學養分循環和植物生產力。我們通過PCR擴增特定的組，包括細菌，古細菌，真核生物或真菌，以評估亞組(例如屬)的相對豐度。然而，既沒有揭示亞組的絕對豐度，也沒有比較不同的擴增子家族(即衍生自一對特定的PCR引物，例如細菌16S，真核生物18S或真菌ITS的OTUs)。這就阻礙了對特定群體絕對豐度的測定，而且微生物群落豐度的域水平的變化可能無法被檢測到。

結果

我們已經開發出了使用合成的嵌合DNA 內參(spikes)對擴增子家族進行絕對定量的方法。將合成的內參直接添加到環境樣品中，共提取並進行PCR擴增，從而可以計算擴增子家族的絕對豐度。(例如每單位質量樣品的原核生物的16S，真核生物的18S和真菌ITS)。

結論

內參可適應任何擴增子特異性群體，包括土壤中的根瘤菌(rhizobia)，人腸道的厚壁菌門(Firmicutes)和雙歧枝菌(Bifidobacteria)或食品樣品中的腸桿菌(Enterobacteriaceae)。重要的是，我們研究表明，通過使用高度複雜的土壤樣本，即使特定群體的相對豐度降低，其絕對豐度也可以保持穩定或增加。因此，如果沒有絕對定量，微生物群的潛在病理學、生理學和生態學可能會被它們的相對豐度所掩蓋。

背景

在過去的十年裡，從人們可以負擔得起的擴增子DNA測序顯示，這種微生物群影響著人類的免疫、消化、心理健康以及植物的生長發育。這些在不同領域的研究揭示了不同微生物群之間的微妙關係，就植物而言，突出了土壤微生物群落對植物健康的重要性。環境微生物群落具有豐富的多種組成成分，通常通過標記基因的PCR擴增進行研究。然而，在大多數研究中，只研究了一個微生物組中某一類別(域)，如細菌。此外，大多數微生物組研究受到使用域特異性引物產生的PCR擴增子(來自單個環境樣品的擴增基因)的限制，進而導致任何兩組或兩組以上PCR擴增子之間的定量比較丟失。然而，為了揭示腸道、土壤和其他環境的真正複雜性，必須確定主要微生物群之間的數量關係。

相互連接的細菌，古細菌，真菌，病毒和單細胞真核生物之間存在複雜的關係，所有這些生物均通過不同組的PCR引物進行不同程度的PCR擴增。目前的DNA技術允許對多個樣本進行平行測序，產生數百萬個短讀長。分析原核生物群落最常見的方法是擴增16S rRNA基因，而真核生物的分析通常是通過18S rRNA的擴增。然而，從使用不同引物對的PCR實驗來看，微生物群的任何跨域比較都是不可能的。當考慮到針對真菌或特定細菌群(如Bifidobacteria，其是腸道菌群的關鍵組成部分)設計的引物時，定量比較的問題變得更加棘手。有一些策略試圖克服這個問題。基因編碼蛋白，如Cpn60，普遍存在於原核生物、真核線粒體和葉綠體中。因此，它們可用於描述原核生物群落，並比較其相對豐度與真核宿主細胞器的豐度。此外，基於基因編碼Cpn60的比較被證明在預測細菌基因組相似性方面是有用的。但是，該方法目前的局限性是參考資料庫相對較小。人們基於原核和真核核糖體基因序列之間的相似性，開發了一套具有生命普遍性的引物。這是該領域的一個有希望的進展，但該引物是為海綿共生體開發的，在更複雜的腸道或土壤環境中可能會失去它們的系統發育相容性。還可以使用管家基因如rpoB、amoA、pmoA、nirS、nirK、nosZ和pufM進行微生物分析。在這些基因中，rpoB被證明在區分親緣關係很近的物種方面非常有效。此外，這些基於編碼Cpn60或通用16S/18S rRNA基因的基因的方法，儘管能夠比較域內的相對豐度，但無法提供樣品中總DNA豐度的估計。qPCR可用於估計微生物的豐度，因為它可以計算每個DNA總量中特定基因的拷貝數。然而，它沒有提供關於環境原位基因豐度的信息。此外，在初始宏基因組測序之後，需要對每一群組進行單獨和複雜的qPCR分析。其它方法包括基於三磷酸豐度(ATP)，流式細胞術(FCM)，磷脂脂肪酸(PLFA)和微生物生物量碳(MBC)的測量。

在一項突破性的研究中，我們使用了一種複雜的流式細胞術方法，確定了微生物組的豐富度是Crohn’s病的關鍵驅動因素。對生物絕對豐度的測量表明，Bacteroides與Prevotella(被認為是腸道健康的重要製造者)的比例，是相對定量的人工產物。雖然這種複雜的方法不容易轉移到其他生物體上，但通過添加某一物種(在給定環境中通常找不到這種物種)已知數量的細菌細胞，有可能『spike』樣品。我們在哺乳動物腸道樣品中摻入了腸道中不存在的極端土壤嗜鹽菌，並且通過比較嗜鹽菌的16S rRNA讀長數量相對於其輸入的豐度來確定所有群組的絕對豐度。這受限於對環境中缺少哪些細菌種類的先驗知識的要求以及將培養物製備至高度受控的細胞密度的必要性。

在基於RNA序列的研究中，通常在RNA分離之前將合成的RNA標準品添加到環境樣品中。然後對環境和合成的RNA進行共純化，轉化為cDNA，並進行測序。根據這些在測序輸出中的標準化比率，可以比較樣品之間的RNA相對豐度。

在這裡，我們顯示了RNA-seq方法的基於DNA的PCR擴增子適應的結果。我們設計了短的嵌合合成DNA片段，其中包含對三個主要微生物區域(原核生物，真核生物和真菌)具有特異性的通用引物結合位點。在PCR期間，由於存在合成填充區，這些合成DNA分子會產生各自的預期擴增子大小。將已知數量的合成DNA spikes直接添加到環境樣本中，並計算它們在測序輸出中的相對豐度，可以在擴增子類別之內和之間確定特定生物群的絕對豐度。在這裡，我們展示了這種方法在純細菌培養和複雜土壤樣品中的優勢。我們首先在一定數量的細菌細胞上測試我們生物spiking方法。之後，我們將展示如何將此方法應用於具有未知微生物結構的樣品。根據不同的估計，土壤微生物群至少比腸道微生物群的多樣性高一個數量級。因此，該方法可適用於分析較簡單的環境，例如食物樣品或人類/動物腸道的環境。令人驚訝的是，我們發現，當比較樣品時，即使樣品的絕對豐度較低，微生物類群的相對豐度也可能較高。

方法

P、E、F合成spikes的設計

Design of P, E and F synthetic spikes

合成spikes的設計包含三個關鍵要素：(i)分別用於鑑定原核生物(P)，真核生物(E)和真菌(F)的常見基因的引物結合位點(PBSs);（ii）與體內靶標相同長度和GC含量的優化合成填充序列及（iii）易於獲得，易於處理的合成spikes的DNA來源(圖. 1)。

圖 1 合成spike設計

Synthetic spike design

利用PBSs序列以及分別來自原核生物(P)，真核生物(E)和真菌(F)的擴增子的長度和GC含量共同分別設計了P、E、F合成spikes。對於P合成spikes，引物結合位點(PBS)以橙色顯示，對於E為綠色，對於F為藍色。

PBS基於選擇用於微生物群擴增的三組PCR引物。對於原核生物(P)，使用原核生物的16S rRNA V4區引物515F和806R，因為它們是土壤研究中常用的引物。對於真核生物，我們使用了18S引物對F1427和R1616，其針對範圍廣泛的真核生物類群，包括藻類，硅藻，動物，挖掘物(原生生物，鞭毛)，真菌和黴菌。第三對引物專門針對真菌(F)，ITS1F和ITS2R，廣泛用於土壤微生物群研究。這些引物針對森林土壤中常見的門Ascomycota和Basidiomycota中可變大小的ITS片段。擴增子長度的變異性會影響PCR擴增效率，因此P (16S rRNA)和E (18S rRNA)的填充序列的長度應與天然PCR產物的長度相匹配。真菌ITS擴增子在長度上表現出更大的可變性，但根據我們先前測序的結果，最常見的大小為272bp；因此，採用272bp的填充序列設計F的合成spike (圖. 1)。在每種情況下，GC含量均設計為與其環境基因對應物相似，其序列使用隨機DNA生成器設計(https://www.faculty.ucr.edu)。通過Geneart(Invitrogen)合成了P，E和F的合成spikes，並將其克隆到質粒pMA-T中，分別形成pSpike-P，pSpike-E和pSpike-F。將質粒轉化到大腸桿菌中，並以質粒＃101172，＃101173和＃101174的形式存儲在https://www.addgene.com上。

土壤樣品的特徵

Characterisation of soil samples

使用的兩種土壤都來自至少20年沒有耕種的休耕土地。Bawburgh土含NO3-3.49 mg kg-1, p-3120.5 mg kg-1, K+168.2 mg kg-1, Mg2+33.55 mg kg-1，有機質含量相對較低為2.92%，以及先前測量的pH7.5。Wytham土壤來自牛津大學Wytham森林，採集自一個位於北緯51°46』14』』和西經1°20』18』』的森林開放地。其化學特徵表明，其含有p-3122.9 mg kg-1, K+483.6 mg kg-1, Mg2+304.9 mg kg-1，有機質含量為16.78%，pH為7.22。Wytham 潛育土的礦物和有機質含量明顯高於Bawburgh的淋溶土；然而，它們的pH值相似。在分析之前，將兩種土壤風乾，以使其重量和體積之間的差異最小。

微生物學技術

Microbiological techniques

Rhizobiumleguminosarumbv.viciae3841培養物(100 ml)在TY（一種豐富的生長培養基）中生長直至OD600為0.54，然後離心分離並重懸於50 ml的最小限度的培養基中以阻止細菌生長。採用連續稀釋法進行細菌計數，以評估細菌數量。

通過光學密度(OD600)和平板計數法測定Rhizobium細胞的豐度。在每個實驗中，每1 ml細菌懸浮液使用1.11* 109個菌落形成單位(cfu)。在添加合成spikes之前先提取DNA時，可對基於色譜柱分離過程中DNA丟失的數據進行校正(預測總DNA量除以混合了合成spikes 的DNA量，用於PCR)。

對於將Rhizobium細胞添加到土壤中的實驗，在提取DNA之前(圖. 2a–c)，每1 mlRhizobium或1 g土壤中使用14至340 pg 的spikes的濃度梯度添加P合成的spike。對於將從Rhizobium中提取的DNA添加到Bawburgh土壤中的實驗(圖.2d–f)，我們將P合成的spike以七個不同的濃度添加到先前提取的DNA中：以每1μg微生物的DNA 2、4、8、20、40、80和200 pg的量。

圖 2 DNA提取前後添加的spikes對微生物定量的影響

Effect of added spikes before and after DNA isolation on microbial quantitation

在分離DNA(a-c)之前，將P合成的spike DNA添加到樣品中，以如下濃度梯度(a-b)：14(圓形)，34(正方形)，70(向上三角形)，140(向下三角形)和340(菱形)pg 每(1毫升)Rhizobium培養物或(1克)土壤，和(c)39(正方形)pg每(1克)土壤，然後與微生物DNA共提取。還以2(圓形)，4(正方形)，8(向上三角形)，20(向下三角形)，40(菱形)，80(六角形)和200(差號)pg每(μg)分離微生物DNA的濃度梯度將spikes添加到純化的微生物DNA(d-f)中。a–c合成的spike質粒DNA在DNA純化過程中可能發生裂解。水平線代表每組樣品的16S rRNA平均數量。整個過程中都使用了Bawburgh土壤。

在比較Bawburgh和Wytham土壤的實驗中，常規使用300 mg土壤。即使土壤充分混合，微生物組成和豐度也會有所變化。對於每種土壤，準備了24個樣品，一式三份地使用了8種水平的PEF合成spikes(表1)。這些水平包含每個P，E和F合成spikes的確定的數量。根據我們以前的工作，我們預計與原核生物16S rRNA相比，真核生物18S rRNA和真菌ITS的豐度會降低，因此，我們使用了不同量的PEF spikes。

表 1 P、E、F合成spikes水平的影響

Effect of the level of P, E and F synthetic spikes

(pg DNA)被添加到Bawburgh和Wytham土壤中(1g)

根據製造商的說明，使用土壤DNA提取試劑盒（D6001，Zymo research，Irvine，US）對樣品進行處理。共提取微生物和合成spike的DNA，通過PCR共擴增並共測序。所有的DNA濃度測量均使用dsDNA BR Qubit試劑盒進行(Invitrogen)。所有讀長均使用基因特異性資料庫進行注釋，並添加P，E和F合成spike的DNA序列。在原核生物門，真核生物域/門或分區水平對讀長進行注釋，在屬和分區水平對真菌ITS讀長進行注釋。將微生物來源的讀長合併後的數量與歸因於每個合成spike的讀長數量進行了比較。為了消除由不同測序深度引起的樣品間差異，我們計算了每1000個總讀長中合成spike讀長的相對豐度。

PCR，測序及qPCR

PCR, sequencing and qPCR

所有引物都列在附加文件1中。

為了進行域特異性PCR，我們將樣品分成三等分並分別用特定的引物對擴增：515F/806R(用於原核生物)，F1427/R1616(用於真核生物)或ITSF1/ITSF2(用於真菌)。如前所述，使用了兩步PCR系統(DI，雙標記)。初始引物沒有條形碼，但在其5』端含有12個bp的已知序列擴增『pads』。第一個PCR擴增靶基因，並在擴增子的兩側添加12bp的pads。PCR條件如下:高保真Phusion(0.2μl),HF緩衝液(4μl)(Thermo Scientific F520 L)，dNTPs(0.4μl),引物(為每一個1μl 10μM),模板DNA(1.5 μl 5 ng/μl)和水(11.9μl)構成反應體系(20μl)。PCR條件如下：98°C持續1分鐘，35個循環98 °C持續15 s，57°C持續15 s和72°C持續30 s，最終延伸步驟為72°C持續7 min。PCR產物經PCR淨化試劑盒(D4014,

Zymo research)純化，作為DNA模板進行第二輪PCR。在這一步，使用靶向DNA模板兩側的12bp pads的雙條形碼引物進行擴增。PCR條件相同，不同之處在於將循環數減少至25，並將退火溫度提高至61°C。這些參數是根據退火溫度梯度PCR試驗確定的。匯集最終的PCR產物，並用PCR淨化試劑盒進行純化。將樣品送至MR DNA實驗室(Molecular Research LP, Texas, UK) ，通過Illumina Miseq 300PE進行測序。測序數據使用定製的Linux和Python腳本進行處理，並輔以FASTX-toolkit的腳本(http://www.hannonlab.cshl.edu)。

使用iQ SYBR Green Supermix(BioRad)，模板DNA(5 ng)和先前使用的細菌16S rRNA和真核18S rRNA基因引物進行定量PCR。將反應體系在thermocycler (CFX96, BioRad)中於95°C孵育5分鐘，然後以94°C 15 s，57°C(16S)或64°C(18S)30s 72°C 30s的條件下進行40個循環。三個技術重複顯示出高重複性(平均SEM

數據分析Data analysis

對於每個實驗，根據PBS和條形碼序列，將約1 M的雙端讀長進行比對和分箱。根據Usearch10 流程使用unoise3算法，通過zero-radius OTUs對Reads進行binned，使用挑選的 SILVA、PR2和ITSone資料庫分別對原核生物16S rRNA、真核生物18S rRNA和真菌ITS進行注釋。將PEF合成spikes的DNA序列添加到資料庫中。

根據注釋，將讀長分配到合成物和微生物（域/門水平）中，剩下的未分配的作為singleton OTUs或大小不正確的讀長，包括嵌合體和測序錯誤。僅對16S rRNA的252-254 bp的讀長(讀長的99.4%)、18S rRNA的210 -212 bp的讀長(讀長的93.4%)和ITS擴增子的250-300 bp的讀長(讀長的98.4%)進行了分析。我們剔除了測序深度較低的樣本(每個樣本群組的平均讀數不到40%)，以及結果與其他生物重複的數量級不同的樣本。由於這些原因，5個原核生物樣本和4個真核生物樣本被移除了。我們假設這可能是由於移液或PCR錯誤引起的，尤其是在這個過程的第一個循環中。此外，由於實驗室E. coli汙染嚴重，還去除了八個原核樣品。為了清楚起見，我們在附加文件3和附加文件4：圖S1和附加文件5：圖S2中展示了使用完整數據集獲得的結果。

在培養對照實驗中，共從78個樣品中移除15個樣品，因為它們顯示出的合成物和微生物的讀長數之比至少比平均值高出2.5倍，(基於三次生物重複的計算)。

多維標度圖(MDS)

Multidimensional scaling plots (MDS)

使用zero-radius OTU(無PEF合成spikes和singletons)的系統發育數據被標準化，通過平方根進行轉換，並使用PRIMER 6軟體(PRIMER-E, Plymouth)基於Bray-Curtis差異矩陣在MDS圖上進行可視化分析。這是為了研究添加PEF合成spike DNA是否對微生物的系統發育結構產生任何影響，並直觀地表示兩種不同土壤微生物群之間的差異。

結果

嵌合spiking可準確估算微生物的豐度

Chimeric spiking gives an accurate estimation of microbial abundance

我們採用一系列已知和未知數量的微生物DNA的採樣策略，對定量宏基因組學的準確性進行了測試(圖. 2)。

將P合成的spikes以不同比例與1.11 × 109個Rhizobium細胞混合，並提取和共擴增其DNA(圖. 2a)。由於該Rhizobium的基因組具有三個拷貝的16S rRNA基因，因此預期結果是每1 ml培養物產生3.33 × 109個16S rRNA的拷貝。在三個最高水平的P spikes下，估計的Rhizobium基因含量(每1 ml培養物3.11 × 109, 3.44 × 109and 3.38 × 109個 16S拷貝)的平均值為實際數量的99.3%(圖. 2a)。較低的spike水平似乎不足，因為它們低估了Rhizobium的豐度(每1 ml培養物2.00 × 109,

1.04 × 109個16S拷貝)。

此外，為了檢查是否可能因土壤的存在而改變，在已經與土壤混合的Rhizobium培養物中添加了P spikes(圖. 2a)。可以看出，對RhizobiumrRNA拷貝數的估計更具可變性：每1 ml培養物1.38 × 109, 1.66 × 109, 9.19 × 108,

2.04 × 109and 3.67 × 109個16S rRNA 拷貝圖. 2b)。然而，它們與從純培養物中得到的結果相似(圖2a)，這表明添加土壤並不會強烈幹擾P合成spike土壤DNA的共提取和PCR共擴增。土壤顆粒可能會吸收一些Rhizobium，其中的腐殖酸可能會干擾PCR中的聚合酶，並引入多樣化的微生物群落，從而使測序更加困難。可能有一些根瘤菌細胞附著在土壤顆粒上，然後它們的DNA沒有完全提取出來。在本實驗中，土壤微生物群估計包含:每克土壤7.6 × 108, 8.7 × 108, 6.3 × 108, 1.7 × 109及 2.2 × 109個16S

rRNA 拷貝。通過單獨的實驗(僅向土壤中添加P spikes)，得出類似的1.1×109個16S拷貝的估計值 (圖. 2c)。因此，spiking方法允許在添加或不添加大量Rhizobium細胞的情況下，重複估算土壤微生物群的豐度。

接下來，將spikes添加到已經提取出的細菌和/或土壤DNA中(圖. 2d–f)。在已經提取出的微生物DNA中添加P合成spike會導致我們對16S rRNA基因拷貝數的估計降低。來自培養的Rhizobium的DNA平均估計為每1毫升培養物有1.16 × 109個16S rRNA拷貝(圖. 2d) ，來自培養的Rhizobium的DNA被添加到土壤中實現每1毫升培養物可以得到9.2 × 108個Rhizobium16S拷貝(圖. 2e)。與Rhizobium培養物混合測定時，土壤DNA的平均16S rRNA基因拷貝數估計為每1 ml培養物1.17 × 109個，單獨測定時，每1 ml培養物中含有平均估計為1.96 × 109個16S拷貝(圖. 2f)。為了獲得這些值，我們測量了提取的DNA的濃度，以便計算Rhizobium和/或土壤微生物群16S rRNA拷貝的豐度。這可能會從DNA數量的估計中引入一個顯著的偏差。此外，雖然16S rRNA的拷貝數在Rhizobium等已確定的物種中已知，但我們只能對總微生物群中未知的OTUs進行近似估算。為了比較起見，我們使用了Rhizobium的值，其基因組量為7.8 Mb，重40億Da，每個基因組有3個rRNA操縱子拷貝，結果是每1 ng DNA有377,155個16S rRNA基因拷貝。根據這些結果，在DNA提取之前將spikes添加到原材料中可獲得最準確的結果。

合成的spikes可以測量原位土壤DNA的豐度和不同土壤中的微生物群的組成

Synthetic spikes allow measurement of in situ soil DNA abundance and microbiota composition in different soils

由於添加spikes可準確估計土壤微生物群的豐度，因此在兩種對比土壤中測定了總原核生物、真核生物和真菌的豐度。為估算土壤微生物群落的豐度，將P(細菌16S rRNA)、E(真核生物18S rRNA)和F合成spikes(真菌ITS)分別添加到Bawburgh和Wytham土壤中(表 1)。使用P，E和F spikes的梯度來測試合成DNA和環境DNA量之間的DNA提取和/或PCR擴增的偏差。正如預期的那樣，添加到土壤樣品中的合成spike數量越多，它們在測序輸出中的回收率就越高，儘管在最高的F合成spike水平上達到了穩定狀態(圖. 3)。為了確定最佳的spike水平，我們建立了一個簡單的模型，顯示了每1000個總序列的期望合成序列數。首先，對微生物基因豐度進行平均(圖3)，並使用以下方程式將該值用於建模。

其中SR1000是測序輸出的每1000個讀長的合成讀長數。NS是每克土壤中增加的P、E或F的 spikes的數量。ENV是每克土壤中原核生物16S rRNA，真核生物18S rRNA或真菌ITS的基因拷貝數。

圖 3 合成spike添加的模型

Model of synthetic spike addition

在添加不同水平的P，E和F合成的spikes到土壤中(x軸)後，16S rRNA，18S rRNA和ITS的每1000個總讀長的合成spike的測序讀長數(y軸)。實驗結果用實線符號表示，而模型數據則用相應顏色的線條表示。該模型顯示了使用特定土壤的平均基因豐度對每個spike水平在測序輸出中預期的spike貢獻(見表 2)。綠色虛線表示該區域每1000個讀長有200-800個合成讀長。x軸上的spike水平對應於表1中的合成spike水平。

表 2 spike水平對rRNA基因估計拷貝數的影響

Effect of spike level on estimated copy number of rRNA genes

顯示了從以添加水平為1-8的合成spikes的樣本(表1)(所有)和對於那些符合每1000個總讀長中含有> 200和

實驗數據(圖 3，符號)與模型集(圖 3，線條)相似，表明儘管spike濃度相差100倍，但仍能準確估計微生物群豐度。在每個合成spikes的水平上，F合成spike(ITS)的每1000個總讀長比E合成spike(18S rRNA)的讀長多，而E合成spike(18S rRNA)的讀長比P合成spike(16S rRNA)的讀長多(圖. 3)。不出所料，在土壤中原核16S rRNA比真核18S rRNA基因豐富，而真核18S rRNA基因比真菌ITS更豐富。此外，添加合成的spikes(水平 1–8,表1)並沒有導致原核生物、真核生物和真菌群落的測量組成發生顯著變化(圖. 4a–c)。為了清晰起見，從圖4中刪除了兩個顯示Annelida DNA過表達的真核生物樣本的數據點。這兩個土壤樣本可能被一條蚯蚓汙染了。但是，組織的大小不足以改變檢測到的16S rRNA和ITS的數量或其系統發育概況。

圖 4 微生物群落結構的MDS圖

MDS plots of microbial community structure

a原核生物b真核生物和c真菌的群落。Bawburgh(暖色)和Wytham(冷色)土壤的微生物群落。每種土壤使用八種不同的顏色，每種顏色代表不同的合成spike水平(1–8,表 1)

測定兩種對比土壤中的域豐度

Determining domain abundance in two contrasting soils

由於已知添加到土壤中的合成spike DNA的量，可以計算出各個基因(16S rRNA，18S rRNA或ITS)在土壤中的原位豐度(圖. 5)。與Bawburgh土壤相比，在Wytham土壤中每個合成的spike水平都有相對更多的16S rRNA，18S rRNA和ITS基因。

圖 5 利用合成的spikes對Bawburgh (B)和Wytham (W)土壤中原位微生物基因的豐度進行了估計

Estimated abundance of in situ microbial genes in Bawburgh (B) and Wytham (W) soils using synthetic spikes

土壤豐度計算方法如下:微生物rRNA豐度=（微生物數量-原始讀長數/原始合成讀長數量對於帶有P合成spike的16S rRNA，帶有E合成spike的18S rRNA和帶有F合成spike的ITS在DNA提取之前添加到樣品中的合成spike的拷貝數。y軸上每克土壤的基因拷貝數被作圖對應於x軸上的合成spike的等級(1–8,*表 1)。

在100倍的spikes濃度情況下，16S rRNA、18S rRNA和ITS的原位總豐度分別出現了4倍、6倍和7倍的變化(圖. 5)。在每種情況下，省略每1000個總讀長中少於200個和大於800個spike讀長的樣品(圖3中的綠色虛線)(即非常低或非常高的合成spike的水平)可將變異降低到大約1.2到1.3倍(圖. 5)。符合這些標準的樣本為16S rRNA的7和8等級;18S rRNA的3、4、5、6等級;以及ITS的1、2等級(表 2)。

僅使用滿足這些標準的樣品(表 2)，Bawburgh土壤的原核生物16S rRNA豐度估計值就從1.9 × 109降低到1.8 × 109，而Wytham土壤的估計值則從4.9 × 109降低到2.5 × 109。對於Bawburgh和Wytham土壤真核18S rRNA基因的豐度幾乎保持不變，分別為1.5–1.7 × 107和2.5–2.3 × 108，而真菌ITS分別從5.8 × 106和8.0 × 106增加到9.8 × 106和1.6 × 107。真菌spike等級3-8被合成的spikes飽和，並且原位微生物ITS的豐度不足(表 2)。根據擴增目標(即16S rRNA、18S rRNA或ITS)調整合成spike水平的需求與這些群組中每組的原位微生物DNA的總豐度相關。我們建議使用濃度大於(預期)環境微生物基因豐度20％的合成spike的濃度水平。合成spikes（> 80％）的過飽和會增加所需的測序深度，也可能會導致結果偏差。在每種情況下，Wytham土壤中的微生物群都比Bawburgh土壤中的微生物群豐富，分別在原核生物，真核生物和真菌中顯示出多25％，29％和40％。這些結果與Wytham土壤中有機質和大量營養素含量高於Bawburgh土壤有關。

我們觀察到基於P和F spike等級增加的微生物群落豐度估計中的梯度。一般情況下，添加的spikes越多，記錄到的微生物區系豐度越低。對於20-80％比率區域內的18S rRNA以及16S rRNA和ITS數據集，我們未觀察到這種關係(圖. 5)。這表明低水平的spikes可能保留在土壤中，因此土壤類型可能會導致微生物群估計產生顯著偏差，而非常高的水平會使DNA庫過飽和。

絕對定量改變了微生物群落的系統發育結構

Phylogenetic structure of the microbiota is altered by absolute quantitation

根據原核生物16S rRNA，真核生物18S rRNA和真菌ITS序列，為來自Bawburgh和Wytham的土壤樣品構建微生物系統發育譜(圖. 5)。與Bawburgh樣本(大約2.5 × 109)相比，Wytham土壤中的原核生物更豐富(大約1.8 × 109)。我們比較了微生物群落結構的相對(圖. 6a, c 和圖. 7a, c)結果和定量結果(圖. 6b, d a和圖. 7b, d)。Proteobacteria，Actinobacteria和Acidobacteria是Bawburgh和Wytham土壤中的優勢門(圖. 6a, b)。這種原核生物的特徵常見於中等pH值的土壤中。使用相對方法（圖6a），這些土壤之間的主要差異是Bawburgh土壤中的Actinobacteria，Chloroflexi和Thaumarchaeota的豐度較高，而Wytham土壤中的Alpha-, Beta-，Delta-proteobacteria，Planctomycetes和Verrucomicrobia的豐度較高。然而，當進行定量校正時(圖6b)，除了Thaumarchaeota與Wytham土壤有關外，Bawburgh土壤中已不再富集任何門，而Wytham土壤則進一步富集了Bacteroidetes。這一致於Wytham土壤比大部分群落更豐富的Bawburgh土壤更肥沃。

圖 6 Bawburgh和Wytham土壤中的原核和真核生物的群落結構

Prokaryotic and eukaryotic community structure in Bawburgh and Wytham soils

a相對原核生物16S rRNA基因豐度。b絕對原核生物16S rRNA基因豐度。c相對真核生物18S rRNA基因豐度於d絕對的真核18S rRNA基因豐度，另外提供了Wytham土壤樣品。』Wytham_43』中存在高比例的大型有機體（Annelida）組織。Bit-score低於300的讀長被歸為low-blast組。』B』和』W』分別表示在Bawburgh或Wytham土壤中的類群更為豐富。

圖 7 Bawburgh和Wytham土壤中的真菌群落結構

Fungal community structure in Bawburgh and Wytham soils

a相對真菌ITS豐度。b在屬水平上顯示的絕對真菌ITS豐度。c分區水平的相對真菌ITS豐度。d分區水平的真菌絕對ITS豐度。e基於18S rRNA或ITS的選定真菌屬絕對豐度的比較分析。Bit-score低於300的讀長被歸為low-blast組。』B』和』W』分別表示在Bawburgh或Wytham土壤中的類群更為豐富。

真菌，尤其是Ascomycota, Basidiomycota 和

Mucoromycota，在Bawburgh和Wytham土壤中均佔據著真核生物群落的主導地位。定量分析表明，在Wytham土壤中，Ascomycota和Chytridiomycota的優勢種更加豐富，而Mucoromycota在Bawburgh土壤中佔優勢(圖. 6c， d)。其中一個土壤樣本(Wytham_43，圖6d)包含一塊Annelida組織，其中超過70％的測序讀長屬於該群組。可以預測，大量動物組織增加了18S rRNA拷貝的豐度，超過了Wytham土壤的平均值。

深入了解引物特異性

Insight into primers specificity

使用18S rRNA和ITS引物獲得的系統發育譜和微生物群定量之間存在明顯差異。真菌分別佔Bawburgh和Wytham土壤中基於18S rRNA的真核生物群落總數的77％(相當於每1 g土壤中有1.3 × 108個基因拷貝)和79％(相當於每1克土壤中有1.8 × 108個基因拷貝)。但是，基於ITS的分析表明，真菌的豐度遠低於18S rRNA分析所表明的結果，這些土壤的真菌豐度分別為8.3 × 106和1.4 × 107。18S rRNA引物過度代表了真菌種類的豐富程度，和/或ITS引物無法捕獲完整的真菌分類，或者這兩種方法均產生一定的偏差。並不奇怪，基於ITS和18S rRNA的分析表明常見真菌屬的絕對和相對豐度有所不同(圖. 7e)。已知18S rRNA引物無法揭示真菌分類學中的細節；但是，這兩種引物對的結果在土壤與土壤的比較上是一致的，其中Wytham土壤中的Ceratocystis，Pleosporales和Aspergillus含量較高，而Bawburgh土壤中的Thelebolus含量較高。

跨域比較

Cross-domain comparison

使用不同引物對的擴增反應可能不會針對所有潛在的微生物類群。使用的16S rRNA引物可能並不針對所有原核生物，而18S rRNA引物可能並非針對所有真核生物。但是，假設這些引物捕獲了大多數群落，則可以確定原核生物與真核生物核糖體含量的比率(圖. 8)。原核生物佔土壤微生物群的91.4％，真核生物佔8.6％。我們方法的局限性在於我們不能輕易地將結果與基於顯微鏡的計數相比較，因為原核細胞通常只有幾個核糖體操縱子，而真核生物可能有數百個拷貝。與Bawburgh土壤相比，Wytham土壤的16S rRNA和18S rRNA含量更高。然而，這兩種土壤的比率是相似的(圖. 8)。這可能代表了一種控制（休耕）土壤中域間關係的生物學機制。

土壤中絕對和相對微生物群落豐度的比較

Comparison of absolute and relative microbiota abundance in soil

a絕對細菌和古菌16S rRNA和真菌和非真菌18S rRNA基因豐度及b其相對豐度

為了證實我們的發現，我們使用qPCR對從Bawburgh土壤中提取的DNA進行了檢測。通過比較16S和18S rRNA基因靶標的相對擴增效率，我們計算出真核生物佔土壤微生物群落的7.6％(最大 17%, 最小 4%)，原核生物佔92.4％(最大 96%, 最小 83%)。這些值與我們基於spike的方法的結果只有1%的差別。

我們的值也可以與一項轉錄組學研究結果進行比較，該結果表明原核16S rRNA和真核18S rRNA分別佔土壤微生物群的91.5和2.8％(檢測到的剩餘6.1％的RNA無法分配)。一項比較土壤中真菌與細菌比例的研究發現，真菌對土壤的貢獻率為0.6-4.2%，這取決於土壤和檢測方法，如脂肪酸分析、RNA-seq和meta-蛋白組學。我們的研究中真菌與細菌的比例更高，在Bawburgh和Wytham土壤中分別為8.0%(真菌佔總菌群的6.6%，細菌佔總菌群的83.3%)和7.7%(真菌佔總菌群的6.8%，細菌佔總菌群的88.6%)(圖. 8)。真菌與細菌的比例升高與高的土壤肥力、高的有機碳含量和缺乏耕作有關。這項研究中使用的休耕土壤確實具有很高的真菌豐度，因為它們的有機物含量很高，而且幾十年來沒有耕種過。

討論

微生物菌群的絕對定量對於微生物生態學的各個方面都是至關重要的，我們的方法準確地估計了細菌培養和土壤微生物菌群的數量。在幾個數量級上添加到土壤中的合成spikes數與獲得的序列讀長數成正比。儘管重複樣本之間的差異通常很小，但有些樣本的誤差較大，這證實了對於非常複雜的樣本(例如土壤)，建議大量重複樣本。例如，以前我們在調查植物-土壤微生物區系的工作中，我們針對每種條件使用了二十四個生物重複樣品。在這項工作中，由於需要測試一個大的合成spike水平梯度，因此對於8個合成spike梯度的每一個水平，我們減少到3個重複的數量。但是，理想情況下，對於土壤微生物群的關鍵分析，重複數量應大於此數量。每克土壤中檢出的原核生物16S rRNA約為109，真核生物18S rRNA約為108拷貝；然而，在對比土壤中可能存在一個數量級的差異。例如，分別對於肥沃的北京土壤和貧瘠的西藏土壤這兩個中國土壤的廣泛研究估算細菌載量其中基於ATP濃度其分別為 8 × 108和1.9 × 108，基於流式細胞儀其為1.7 × 109and 2.5 × 108，基於qPCR其為6.2 × 109and 1.6 × 109，基於磷脂衍生的脂肪酸其為1.3 ×109and 8.1 × 108，而基於最低殺菌濃度其為1.4 × 1010and 1.0 × 1010。利用van Bammelen因子轉換(0.58×土壤有機質=土壤有機碳)，我們可以比較中國和我國土壤的總有機碳含量：以mg / g土壤計；北京 21.5,Wytham 9.73,Tibetan 1.50， Bawburgh 1.69。我們分別從Bawburgh和Wytham的每克土壤獲得的16S和18S基因拷貝數(16s+18s)為1.8×109和2.5×109,與上述針對中國土壤的微生物群落豐度值相似。

富含有機質的Wytham土壤比貧瘠的Bawburgh土壤顯示出更高的微生物核糖體豐度。原核微生物和真核微生物都是如此(圖. 5)。定量分析可以對土壤微生物的豐度進行統計校正。許多微生物種類在Wytham土壤中實際上更為豐富，儘管它們在Bawburgh土壤中的相對存在率更高(圖. 6和7)。我們認為，這對於微生物群研究和生態學的各個方面都至關重要，它適用於從土壤到哺乳動物腸道等所有環境的微生物群。如果沒有對類群進行絕對定量，則特定微生物類群作用的潛在生理學和生態學可能會被其相對豐度所掩蓋。例如，關鍵共生體或病原體絕對豐度的變化可能被未改變的相對豐度所掩蓋，或者相對豐度可能與絕對豐度相反。這可能是因為任何特定種群的相對豐度高度依賴於大多數生物的絕對豐度。

由於實驗設置允許檢測大多數微生物分類，即16S rRNA和18S rRNA引物針對大多數原核生物和真核生物的多樣性，因此我們能夠比較這些生命域的豐度(圖. 8)。這些結果與以前基於RNA的土壤微生物群的估計相一致。添加合成spikes可以準確檢測Rhizobium培養物對照樣品中微生物16S rRNA的存在，將spikes直接添加到環境樣品中而不是分離的DNA上更為有效(圖. 2)。

DNA spiking可以與其他預處理步驟相結合，例如去除殘留DNA(細胞外DNA)。疊氮丙啶染料與未被細胞膜保護的DNA反應並隨後阻斷其PCR擴增。可以將合成的spikes添加到初始樣品的等分試樣中，並去除殘留的DNA。這種方法將揭示哪些類群是活著的，以及它們的絕對存在。

強烈建議使用初始校準曲線來確定給定環境條件下的最佳合成spike水平。儘管所使用的合成spike的水平並沒有改變所測量的微生物群落結構，但與目標菌群相比，spike的添加量過高或過低都可能使定量結果產生偏差(圖. 4，5，和6)。然而，一旦進行了初始校準，spike的水平可以變化超過三個數量級，並且具有很高的重現性。需要注意的是，要確保從不同的環境中有效地提取出DNA及確保其穩定性，因為這可能會使任何定量方法產生偏差。然而，鑑於這一警告，我們的方法很簡單，只需要添加已知數量的合成spike的DNA並在測序後進行單個生物信息學步驟，即可定量微生物群研究中的原核生物，真核生物和真菌的絕對豐度。

結論

活躍的微生物組的量化將有助於更好地了解環境微生物學中的功能類群，並有助於產生更好的微生物組相互作用模型。這種定量方法已廣泛應用於與病害或土壤生產力相關的微生物組/宏基因組的關聯研究。

Reference

Microbiome:環境樣品中絕對定量菌群豐度的新方法

相關焦點

Nature Microbiology:火眼金睛,腸道菌群絕對定量分析擒「真兇」!

9文聚焦：宏基因組學與微生物組分析方法和工具

Rob Knight發NBT：數據降維新方法助力腸道菌群研究

微生物組研究中的前沿新技術

Science Bulletin:絕對豐度的植物根際微生物群落「擴增-選擇」組裝模型

Science Bulletin:上海植生所王二濤組發表基於絕對豐度的植物根際...

Nature重磅：人體菌群研究的25個裡程碑

Review:Microbiota, metagenome, microbiome傻傻分不清

華農團隊ISME發文：既有菌群+合理營養=更強生態

瑞金新知速遞第106期|彭奕冰主任技師揭示腸道菌群在接受腸道營養的病人繼發性艱難梭菌感染中的重要作用

Microbiome:腸道菌群ClpB基因功能與減肥和特徵性微生物群有關

Nature綜述:腸道菌群如何劃分腸型

快速看懂腸道菌群宏基因組測序分析報告

糞便微生物群落樣本收集方法的比較

Nature:絕對蛋白定量分析方法的實際應用

新方法再次提高單細胞蛋白質組學質譜定量準確度

環境領域抗生素抗性基因研究的幾種常用技術

Nature子刊：微生物組療法想要成功，少不了這個方法

腸道菌群改變與糖尿病發生相關

Microbiome:環境樣品中絕對定量菌群豐度的新方法

相關焦點

Nature Microbiology:火眼金睛,腸道菌群絕對定量分析擒「真兇」!

9文聚焦：宏基因組學與微生物組分析方法和工具

Rob Knight發NBT：數據降維新方法助力腸道菌群研究

微生物組研究中的前沿新技術

Science Bulletin:絕對豐度的植物根際微生物群落「擴增-選擇」組裝模型

Science Bulletin:上海植生所王二濤組發表基於絕對豐度的植物根際...

Nature重磅：人體菌群研究的25個裡程碑

Review:Microbiota, metagenome, microbiome傻傻分不清

華農團隊ISME發文：既有菌群+合理營養=更強生態

瑞金新知速遞 第106期|彭奕冰主任技師揭示腸道菌群在接受腸道營養的病人繼發性艱難梭菌感染中的重要作用

Microbiome:腸道菌群ClpB基因功能與減肥和特徵性微生物群有關

Nature綜述:腸道菌群如何劃分腸型

快速看懂腸道菌群宏基因組測序分析報告

糞便微生物群落樣本收集方法的比較

Nature:絕對蛋白定量分析方法的實際應用

新方法再次提高單細胞蛋白質組學質譜定量準確度

環境領域抗生素抗性基因研究的幾種常用技術

Nature子刊：微生物組療法想要成功，少不了這個方法

腸道菌群改變與糖尿病發生相關

瑞金新知速遞第106期|彭奕冰主任技師揭示腸道菌群在接受腸道營養的病人繼發性艱難梭菌感染中的重要作用