16S rDNA測序結果分析

2021-01-15 力基因學堂
1.測序結果文件

一般公司DNA測序結果都提供兩個文檔,一個是序列文檔(後綴為.seq),一個是測序峰圖文檔(後綴.ab1),為鹼基的測序質量信息。
(A).seq – 序列文件,TEXT的序列文檔,可由記事本或BioEdit打開。
(B).ab1-峰圖文件,可由BioEdit或Chromas打開察看。

2.切除兩端低質量鹼基

由於Sanger測序技術限制,每個測序反應一般僅有800bp左右比較準確。
一般測序結果的前端大約50個鹼基的質量會不好(測序引物的原因),此部分測序峰圖通常無法判讀。這是正常現象,需要把此部分鹼基切除。同理,測序後期的鹼基質量也比較差(酶活降低與雜質幹擾較大等原因),也需要把尾部測序峰圖不規則的鹼基切除。因此留下中間鹼基質量相對較好(峰圖規則)的序列用於後續分析。 方法如下:

用 BioEdit 打開正向測序結果峰圖文件( ZB10100433 (yangpin1) 16SS(zidai)_Pw_G12.ab1),通過移動左邊與左上角的比例標尺,調整峰圖的高度與寬度,使DNA每個鹼基的峰圖大小適合觀察。
從下圖看出,前面50多個鹼基的峰較亂,此處選擇55個開始的鹼基。同理,DNA末端由於酶活力下降等原因,測序質量也逐步變差。根據峰圖的形狀,我們也需要切除尾部950bp後的鹼基(約末端100bp),只保留56-950之間約900bp的高質量鹼基。

選擇 BioEdit 顯示DNA序列的子窗口(Window菜單->DNA sequence frome…)

然後在 BioEdit 的Sequence菜單->select positions,在彈出窗口中輸入56與950,點OK按鈕後,就以背景黑的顯示已選擇的序列。

再選edit菜單->Copy(或直接按Ctrl-C鍵),複製序列到一個新的文本文件,保存為16S_rDNA.fas。增加序列的注釋行」>16SF」,代表正向測序序列。

同上步驟,根據峰圖信息,再複製另一個反向測序結果的高質量序列(56-950)到文本文件16S_rDNA.fas,並標記序列為」>16SR」,代表反向測序序列。

DNA測序通常需要兩個方向進行,測序都是從DNA的5』端到3』端進行的,正向和反向測序是指對DNA的兩條互補鏈分別測序。雙向測序結果經校讀後完全一致才能認為得到可靠DNA測序結果。

3.雙向測序序列的合併

通常PCR產物雙向測序,需要合併雙向序列,最終得到全長序列,這樣得到DNA序列比較準確。

Bioedit打開前面保存的16S_rDNA.fas。

由於第二條序列是反向測序得到的DNA反向互補序列,需要通過先得到DNA的反向互補序列:Sequence->Nuleic Acid->Reverse Complement,再進行比對。

利用BioEdit的alignment功能找重疊區域:Accessory application->ClustalW multiple alignment,使用默認設置,比對結果顯示,中間重疊部分的序列大部分相似。

如果重疊區不是大部分相同鹼基,請試著把一條序列反向互補,再比對。

4.鹼基的校準

在上一步的比對結果窗口,先利用BioEdit得到兩條件序列合併後的一致序列:

修改鹼基前,需要先把bioedit的Mode設置為」Edit」與」Insert」,並選中按鈕」view conservation plotting identities […] with a dot」,以點顯示相同的鹼基,便於觀察差異位點。

在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如圖)。

定位到差異鹼基的位置(下圖黑色部分),一般可以在峰圖文件中查找不一致鹼基(正反鏈錯配、缺失或誤增鹼基)及附近的幾個序列(點擊Edit菜單->find,或直接Ctrl-F),如查找GCAtAC。

注意反向測序峰圖的搜索,需要輸入序列的反向互補序列(GTtTGC),小寫字母為不一致鹼基。

查看該鹼基及附近鹼基正反測序峰圖形狀,判斷該鹼基正確的鹼基序列。

然後在序列窗口中分別改正正向16SF、反向16SR及Consensus序列中不一致的鹼基。如有空格(gap)顯示為」-「,需要把三條序列同一位置上的鹼基與」-「都刪除,才能保持後面的鹼基比對結果正常(Backspace可刪除光標前一個鹼基)。


在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如

5.保存序列

保存校正後的consensus序列,即為最終測序結果的合併序列。

選擇concensus序列->滑鼠右鍵:copy sequences

點擊file菜單->新建Aligment

點擊Edit菜單->paste sequence,並點擊concensus的標題改為」16S_rDNA」

然後保存為16S_rDNA.fas(文件類型選擇Fasta格式)

相關焦點

  • 16S rDNA測序
    因此通過分析16S rDNA 可變區的序列即可得到各細菌的分類學特徵,結合高通量測序可研究環境或者臨床樣本中的微生物組成及群落功能。比較測序數據量不同的樣本中物種的豐富度,也可以用來說明樣本的測序數據量是否合理。
  • 16S rDNA測序+代謝組學,讓科研結果更「近」一步
    測序分析和代謝組學聯合研究的必要性生物體內的基因系統調控是一個整體,單一組學看到的只是冰山一角,並不能完整的解釋生物學問題,而且通常文章的影響因子也比較低。目前,越來越多的研究者開始將微生物組學和代謝組學聯合起來,腸道微生物菌群與宿主代謝表型的關係以及微生物群落如何影響代謝功能的研究是代謝組學與16S rDNA測序整合分析非常典型的案例;此外,還有研究表明不同的疾病模型中微生物和代謝物之間具有很高的相關性,可通過代謝組學和16S rDNA測序整合分析的方法研究代謝物-微生物-疾病之間的關係
  • 微生物宏組學通關技能第三關——全長16S rDNA測序
    Illumina MiSeq/HiSeqPacBio Sequel測序數據量≥30,000 Tags≥ 5,000 CCS分析內容微生物群落組成與豐度結果準確性一般準確度高成本低較高經典案例分析和V4 iTags比較③ PhyloTags提高菌群解析度的原因解析(1)模擬群落驗證SMRT測序研究人員使用含有23個細菌參考基因組的模擬群落得到一系列PacBio 16s rRNA基因序列數據,並將SMRT技術產生的全長 16s rRNA基因序列稱為PhyloTags。
  • 16S rDNA擴增子測序研究健康人血液微生物多樣性
    在人們的潛意識當中,健康人的血液應該是無菌狀態的。
  • From 16S rDNA測序 To 宏基因組學研究—技術發展及異同點
    主要內容:1.16S rDNA測序2.宏基因組測序3.宏基因組的由來及發展過程4.16S rDNA測序與宏基因組的優勢和局限性5.16s rDNA測序與宏基因組技術差異—————————————————————1.
  • 宏基因組測序和16S rDNA測序有啥區別?
    編者按 16S rDNA測序及宏基因組測序都是微生物研究和應用的重要方法,那麼問題來了:兩者到底有什麼區別呢?什麼情況下需要做16S測序?什麼情況下需要做宏基因組測序?什麼情況下需要二者結合使用呢?那麼在開始宏基因組測序專題前,小編需要給大家解決一個非常重要的問題——16S測序和宏基因組測序的主要區別是什麼?
  • 16S rDNA測序如何鑑定微生物到種 | 16S專題
    上期給大家講了微生物實驗樣本製備及提取需要注意的事項,那麼下一步就進入到測序了,二代測序在微生物研究中使用的頻率越來越高了,通過16S rDNA
  • 小明上課記--16S rDNA測序
    【研究方法】研究員對992名來自西非、東非、東南亞低收入國家的兒童的腸道菌落進行研究,採用16S rRNA基因高通量測序,分別採集5歲以下確診為和未感染中度至重度腹瀉(moderate to severe diarrhea,MSD)的兒童的糞便,提取其中的菌群組成進行比較。
  • 16S rDNA你知道多少?
    16S rDNA是細菌的系統分類研究中最有用的和最常用的分子鐘,其種類少、含量高(約佔細菌DNA含量的80%)、分子大小適中,存在於所有的生物中
  • From 16S rDNA測序 To 宏基因組學研究—應用的策略和主要流程
    主要內容1.實驗設計和研究目的定製策略2.統計分析內容的事先計劃3.樣品的採集、保存、提取(良好結果的前提)4.測序平臺的選擇5.數據的存儲、分析、發布——————————————————————————————————
  • 肝上皮細胞的單細胞測序分析結果出爐
    肝上皮細胞的單細胞測序分析結果出爐 作者:小柯機器人 發布時間:2019/7/29 16:36:51 近日,美國波士頓兒童醫院 的Fernando D.
  • 16s rRNA分析流程和工具的介紹
    本文轉載自肖斌科學網博客16s rRNA早期的分析策略,如FISH(fluorescent in
  • 微生物群落多樣性測序與功能分析
    對微生物群落進行測序包括兩類,一類是通過16s rDNA,18s rDNA,ITS區域進行擴增測序分析微生物的群體構成和多樣性;還有一類是宏基因組測序,是不經過分離培養微生物,而對所有微生物DNA進行測序,從而分析微生物群落構成,基因構成,挖掘有應用價值的基因資源。
  • 細菌16s rDNA微生物多樣性研究中可變區的選擇
    rRNA基因可變區進行特異性引物設計,採用不同標籤序列區分不同樣品,利用高通量測序平臺進行不同樣品的高通量測序,進而獲得測序數據,針對環境中細菌進行分析的技術。  illumina測序產生單條reads長度為75bp~300bp(不同測序平臺),還沒有建立可靠的操作流程對環境樣本中微生物16s rrna基因不同可變區進行拼接獲得單一物種16s rRNA基因全長。雖然現在三代picbio測序可以達到數幾十K的長度,雖然一條序列可以通過滾環方式增加覆蓋度提高鹼基讀取的檢測率,但是穩定性和價格兩個方面還是有待觀望的。
  • 6篇16S rRNA基因測序+代謝組學聯合項目文章助力您快速發文
    編者按:16S rRNA基因測序是目前主要的高通量測序依賴的腸道微生物研究的方法之一,16S rRNA基因測序測序可以對腸道微生物中的所有菌種進行精確定量,可以回答「樣本當中有哪些微生物,他們具有哪些功能」。然而蛋白質組學和代謝組學等下遊組學研究可以回答「這些功能是否真的發生了,發生的程度是什麼樣的」。
  • 快速看懂腸道菌群宏基因組測序分析報告
    - 常見問題- 相關名詞解釋- 參考文獻16S rDNA擴增子測序(16S rDNA amplicons sequencing)和鳥槍法宏基因組測序(whole metageome shotgun sequencing)都是研究微生物組的重要方法
  • 16S/18S/ITS 擴增子測序
    在原核微生物核糖體中的16S rRNA基因長度約為1500 bp,因其結構與功能上的高度保守性,常用於菌種鑑定和系統發育分析。與16S rRNA類似,真核微生物18S rRNA基因長度1500-2000 bp,常用於研究環境樣本中真核微生物群落結構多樣性,其中,真菌rRNA基因的非轉錄區還包含一段隱秘的內轉錄間隔區(Internal Transcribed Spacer,ITS),長度為400-900bp,由於種內保守,種間差異明顯,也非常適於種類鑑定和群落分析。
  • 16srDNA測序在汙水處理領域的研究
    高通量測序技術的發展,極大地降低了測序成本。除了分離微生物的全基因組測序研究,宏基因組學和宏轉錄組學方法也已經被應用於揭示汙水處理系統整體微生物群落基因組潛能和轉錄本信息。其中微生物群落結構研究,即 16srDNA 研究,通過抓取微生物基因保守片段即可反映出微生物基本的群落組成信息,與測全基因組相比,大大節省了成本和時間。
  • TiM:rDNA拷貝數的種內變化影響微生物群落分析嗎?
    (A)在微生物生態學中,典型的下一代測序(NGS)分析從DNA的提取和測序開始,得到屬於不同物種的精確序列變異(ESVs)或操作分類單元(OTUs)的名錄,並可根據rDNA序列進行物種的鑑定解析。歷史上使用rDNA測序數據來解決系統發育關係和鑑定物種的一個重要必然結果是產生許多、大型和整理的rDNA序列參考資料庫,為微生物ESVs/OTUs注釋提供了標準化方法。環境驅動的種內rDNA拷貝數變化的潛力並不會使該位點對群落組成的評估變得冗餘,但它強調了有必要更深入地考慮群落對環境的響應:種群統計學、基因組學或兩者的結合(圖2)。