https://www.megasoftware.net/
MEGA的全稱為Molecular Evolutionary Genetics Analysis,也就是專門用於分子進化遺傳分析的一款軟體。軟體是完全免費的,目前已更新到MEGA10,在官網就能直接下載安裝。下載時注意選擇軟體版本,包括Window/Mac/Linux三種,並根據電腦選擇32/64位版本下載安裝。網站也提供了詳細的說明文檔,在右上角菜單→【tutorial】→【walk through】目錄下,有關於MEGA的詳細操作說明。
圖片來源:軟體截圖
MEGA10的界面如下,從工具欄我們也可以看到其強大的功能,如序列比對、進化分析、選擇分析等等。
圖片來源:軟體截圖
https://blast.ncbi.nlm.nih.gov/Blast.cgi
MEGA支持的序列格式為FASTA,一般需要我們自己準備序列文件。通常做進化分析時我們會在NCBI中進行BLAST(對NCBI不熟悉的讀者請參考小編之前的推送(NCBI網站的小彩蛋),搜索目的序列在資料庫中的同源序列。這裡以水稻的綠色革命基因SD1為例,先查詢其蛋白序列,粘貼到NCBI-BLAST網站相應位置,選擇資料庫和物種後,點擊BLAST按鈕。
圖片來源:軟體截圖
(1) 考慮到密碼子的簡併性,BLAST通常優先用蛋白序列比對,沒有蛋白序列的情況下再考慮用核酸序列比對,這樣能最大限度減少假陽性;(2) 在比對時應該注意合理選擇資料庫和物種信息,比如核酸序列比對時通常選擇Nucleotide collection資料庫,如果是人類或者小鼠的序列比對則直接選擇相應物種的資料庫,而蛋白序列比對時通常選擇swisspot資料庫;(3) 關於算法參數,一般用默認參數即可,但某些特定情況下需要修改參數,比如你需要比對的序列在生物中非常少見,默認的參數可能沒有結果,這時候可將期望閾值(Expect threshold)調整為100或者1000,可能會得到較多的比對結果。圖片來源:軟體截圖
2.2 序列下載
BLAST的結果中其實有很多內容,不僅包括具體的序列信息,還包括序列比對的圖形展示和進化樹。這裡先不做進一步介紹,下載序列的方式如下圖所示,選擇FASTA (complete sequence) 。
圖片來源:軟體截圖
打開MEGA,單擊工具欄【ALIGN】→【File】→【Edit/Build Alignment】→【Creat a new Alignment】→【Protein】,在Alignment Explorer窗口直接將上述下載的序列粘貼進來。(注意下圖中的序列全是紅色表示都選中了,如果沒有選中序列可以按【Ctrl+A】)
圖片來源:軟體截圖
單擊菜單【Alignment】→【Alignment by ClustalW】,調整參數(一般用默認參數即可)後點擊【OK】,即可完成序列比對。最後單擊菜單【Data】→【Save Session】→【MEGA Format】,保存序列比對的結果。
圖片來源:軟體截圖
圖片來源:軟體截圖
常用生物學軟體的安裝與應用(二)
常用生物學軟體的安裝與應用(三)
NCBI網站的小彩蛋
此外,如果大家覺得有用,歡迎隨手分享,讓更多有需要的小夥伴看到。同時投必得學術 建有多個學術交流群和期刊投稿交流群,歡迎大家加入「投必得學術交流群」和「iJournal期刊交流群」。掃描下方二維碼,添加「投必得學術小編」微信(topedit2021),即可入群。