生物信息學是當前生物醫學領域的熱門研究方向,其理論知識和方法學已經滲透到各個領域。其中對於從事病原微生物分子流行病學調查研究的學者,往往就要利用分離到的微生物分離株,從基因水平分析其特徵並和已知流行分離株基因信息進行比對分析,特別是利用相關生物信息學分析軟體來進行比對基因組信息,以及分析該基因組與其他已有的參考序列之間的遺傳進化關係非常重要;進而有效指導研究者判斷該病原微生物的流行特點和趨勢,能更好地指導該流行病的防控。
筆者在此通過美捷登平臺向大家簡要展示:以病原微生物基因組序列遺傳進化樹分析為例介紹如何進行多序列的比對和進化樹繪製。
進行多序列比對分析和進化樹繪製常常需要用到DNAstar和MEGA兩個軟體,目前兩個軟體均可免費下載,具體的安裝方法不再贅述。
首先用戶進入NCBI資料庫根據序列號下載擬加入分析分目標參考序列(具體的獲取方法可參考網上教程),具體的保存方法是找到每條序列的CDS編碼區,複製後打開DNAstar軟體包Editseq,粘貼後保存為.seq後綴的文件。隨後用Editseq將所有序列打開(這裡打開20條seq後綴的文件),如圖1所示。
點擊File下的Exportall as one選項,保存為fas後綴名的文件,如圖2所示。
打開DNAstar軟體包MegAlign,將之前保存的fas後綴名的文件拖進軟體,即可打開,如下圖3所示。
打開.fas文件後點擊Align中byclustal W method分析進行多序列的比對,如圖4所示。
分析完成後即可拖動下滑按鈕,觀察和參考序列基因組中有無發生突變、插入和缺失等信息,如圖5所示。分析完成後保存為.meg後綴的文件,方便下次分析。
繪製遺傳進化樹常用MEGA軟體,用戶可自行下載安裝該軟體。首先將Editseq軟體保存的.fas文件拖入MEGA軟體,如圖6所示。
點擊Align,選擇工具欄中W分析比對方法,彈出窗口默認即可,如圖7所示。分析完成後保存在.mas後綴的文件,將.mas文件用MEGA打開,選擇Analyze
選擇Analysis選項中Phylogeny/Maximum likelihood tree,彈出窗口選擇「Yes」,如圖8所示。
彈出窗口Phylogeny Test選擇bootstrap method,單位為1000,選擇compute進入下一步自動計算步驟,如圖9所示。
計算完畢後則會顯示出此次分析後的進化樹,還可以利用工具欄對進化樹進行修飾美化編輯。可以看到目標序列與參考序列的遺傳進化關係,從而判斷目標序列與參考序列之間有無親緣關係甚至重組。當然類似的軟體還有很多,同時也可以有不同的分析方法,在此只列舉其中的這一種,也是筆者曾經用過的方法,並且也運用該分析方法將文章發表在病毒學官方雜誌JOURNALOF VIROLOGY上。希望能對大家有所幫助。