一般公司DNA測序結果都提供兩個文檔,一個是序列文檔(後綴為.seq),一個是測序峰圖文檔(後綴.ab1),為鹼基的測序質量信息。
(A).seq – 序列文件,TEXT的序列文檔,可由記事本或BioEdit打開。
(B).ab1-峰圖文件,可由BioEdit或Chromas打開察看。
由於Sanger測序技術限制,每個測序反應一般僅有800bp左右比較準確。
一般測序結果的前端大約50個鹼基的質量會不好(測序引物的原因),此部分測序峰圖通常無法判讀。這是正常現象,需要把此部分鹼基切除。同理,測序後期的鹼基質量也比較差(酶活降低與雜質幹擾較大等原因),也需要把尾部測序峰圖不規則的鹼基切除。因此留下中間鹼基質量相對較好(峰圖規則)的序列用於後續分析。 方法如下:
用 BioEdit 打開正向測序結果峰圖文件( ZB10100433 (yangpin1) 16SS(zidai)_Pw_G12.ab1),通過移動左邊與左上角的比例標尺,調整峰圖的高度與寬度,使DNA每個鹼基的峰圖大小適合觀察。
從下圖看出,前面50多個鹼基的峰較亂,此處選擇55個開始的鹼基。同理,DNA末端由於酶活力下降等原因,測序質量也逐步變差。根據峰圖的形狀,我們也需要切除尾部950bp後的鹼基(約末端100bp),只保留56-950之間約900bp的高質量鹼基。
選擇 BioEdit 顯示DNA序列的子窗口(Window菜單->DNA sequence frome…)
然後在 BioEdit 的Sequence菜單->select positions,在彈出窗口中輸入56與950,點OK按鈕後,就以背景黑的顯示已選擇的序列。
再選edit菜單->Copy(或直接按Ctrl-C鍵),複製序列到一個新的文本文件,保存為16S_rDNA.fas。增加序列的注釋行」>16SF」,代表正向測序序列。
同上步驟,根據峰圖信息,再複製另一個反向測序結果的高質量序列(56-950)到文本文件16S_rDNA.fas,並標記序列為」>16SR」,代表反向測序序列。
DNA測序通常需要兩個方向進行,測序都是從DNA的5』端到3』端進行的,正向和反向測序是指對DNA的兩條互補鏈分別測序。雙向測序結果經校讀後完全一致才能認為得到可靠DNA測序結果。
3.雙向測序序列的合併通常PCR產物雙向測序,需要合併雙向序列,最終得到全長序列,這樣得到DNA序列比較準確。
Bioedit打開前面保存的16S_rDNA.fas。
由於第二條序列是反向測序得到的DNA反向互補序列,需要通過先得到DNA的反向互補序列:Sequence->Nuleic Acid->Reverse Complement,再進行比對。
利用BioEdit的alignment功能找重疊區域:Accessory application->ClustalW multiple alignment,使用默認設置,比對結果顯示,中間重疊部分的序列大部分相似。
如果重疊區不是大部分相同鹼基,請試著把一條序列反向互補,再比對。
4.鹼基的校準在上一步的比對結果窗口,先利用BioEdit得到兩條件序列合併後的一致序列:
修改鹼基前,需要先把bioedit的Mode設置為」Edit」與」Insert」,並選中按鈕」view conservation plotting identities […] with a dot」,以點顯示相同的鹼基,便於觀察差異位點。
在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如圖)。
定位到差異鹼基的位置(下圖黑色部分),一般可以在峰圖文件中查找不一致鹼基(正反鏈錯配、缺失或誤增鹼基)及附近的幾個序列(點擊Edit菜單->find,或直接Ctrl-F),如查找GCAtAC。
注意反向測序峰圖的搜索,需要輸入序列的反向互補序列(GTtTGC),小寫字母為不一致鹼基。
查看該鹼基及附近鹼基正反測序峰圖形狀,判斷該鹼基正確的鹼基序列。
然後在序列窗口中分別改正正向16SF、反向16SR及Consensus序列中不一致的鹼基。如有空格(gap)顯示為」-「,需要把三條序列同一位置上的鹼基與」-「都刪除,才能保持後面的鹼基比對結果正常(Backspace可刪除光標前一個鹼基)。
在BioEdit中打開正向和反向測序結果的AB1文件和上面比對結果放同一窗戶(如
保存校正後的consensus序列,即為最終測序結果的合併序列。
選擇concensus序列->滑鼠右鍵:copy sequences
點擊file菜單->新建Aligment
點擊Edit菜單->paste sequence,並點擊concensus的標題改為」16S_rDNA」
然後保存為16S_rDNA.fas(文件類型選擇Fasta格式)