手把手教你用 Fast Tree 快速構建序列進化樹

2021-02-24 生物學霸


常見的建樹方法有:

貝葉斯法(Bayesian),最大似然法(Maximum likelihood,ML),最大簡約法(Maximum parsimony,MP),鄰接法(Neighbor-Joining,NJ),最小進化法(Minimum Evolution,ME),類平均法(UPGMA)。

一般來講,如果模型合適,最大似然法的效果較好。對於近緣序列,最大簡約法用的假設最少,各種方法結果相似。而對於遠緣序列,一般使用最大似然法或鄰接法。對相似度很低的序列,鄰接法往往出現 Long-branch attraction(LBA,長枝吸引現象),嚴重幹擾進化樹的構建。對於各種方法構建分子進化樹的準確性,Hall 認為貝葉斯的方法最好,其次是最大似然法,然後是最大簡約法。其實如果序列的相似性較高,各種方法結果差別不大。

最大似然法和鄰接法需要選擇模型。對於蛋白質序列,一般選擇 Poisson Correction(泊松修正)模型。而對於核酸序列,一般選擇 Kimura 2-parameter(Kimura-2 參數)模型。

表 1. 構建進化樹的常用軟體


軟體名稱

簡介

Clustal X

圖形化的序列比對工具

GeneDoc

多序列比對結果美化工具

BioEdit

序列分析綜合工具

MEGA

圖形化比對,進化分析綜合工具

PAUP

進化分析工具

Phylip

進化分析工具

PhyML

最大似然法建樹工具

PAML

最大似然法建樹工具

MrBayes

貝葉斯法建樹工具

FastTree

最大似然法建樹工具(速度快)

TreeView

進化樹顯示工具

本文主要講 FastTree 使用方法:


1. 在默認參數下,FastTree 比 PhyML 更準確,比 PhyML 快 100~1000 倍;

2. FastTree 使用模型為:核酸進化模型:Jukes-Cantor 或者 GTR(generalized time-reversible);蛋白進化模型:JTT (Jones-Taylor-Thornton 1992), WAG (Whelan & Goldman 2001) 或者 LG (Le and Gascuel 2008)

FastTree 提供以下幾個版本:

Linux 64-bit executable (+SSE) 

Multi-threaded executable (+SSE +OpenMP) (see usage guide)

Windows 32-bit command-line executable (no SSE)

C code

下載 Windows 32-bit command-line executable (no SSE) 後,是一個 FastTree.exe 文件,可以直接在 cmd 命令行程序中調用運行。

新建一個文件夾:比如在 D 盤目錄下新建一個 FastTree 文件夾,將 FastTree.exe 程序放在 D:FastTree 目錄下。

開始菜單—搜索—cmd

切換目錄到 D:FastTree

最大似然樹構建:FastTree protein alignment file > tree

在目錄 D:FastTree 生成.tree 文件,可以使用 TreeView 或 MEGA 打開。

構建進化樹時,可以選擇不同的模型:
命令行:D:FastTree>FastTree -lg CIPK.phy >CIPK.tree

alignment file 格式如上圖。

可以首先使用 Clustal X 比對序列:Alignment—Output Format Options—Phylip format

比對後,在比對目錄下生成幾個文件,其中.phy 後綴名文件是 FastTree 要使用的。

參考文獻:

Hall B G. Comparison of the accuracies of several phylogenetic methods using protein and DNA sequences[J]. Molecular Biology and Evolution, 2005, 22(3): 792-802.

Price, M.N., Dehal, P.S., and Arkin, A.P. (2009) FastTree: Computing Large Minimum-Evolution Trees with Profiles instead of a Distance Matrix. Molecular Biology and Evolution 26:1641-1650.

Price, M.N., Dehal, P.S., and Arkin, A.P. (2010) FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490.

Jones D T, Taylor W R, Thornton J M. The rapid generation of mutation data matrices from protein sequences[J]. Computer applications in the biosciences: CABIOS, 1992, 8(3): 275-282.

Whelan S, Goldman N. A general empirical model of protein evolution derived from multiple protein families using a maximum-likelihood approach[J]. Molecular biology and evolution, 2001, 18(5): 691-699.

Le S Q, Gascuel O. An improved general amino acid replacement matrix[J]. Molecular biology and evolution, 2008, 25(7): 1307-1320.

作者:muminwangzi

圖片來源:muminwangzi

題圖來源:丁香通

相關 Protocol

進化樹分析及其軟體使用如何做系統進化樹MEGA4.1 建進化樹步驟

進化樹搜索

請戳閱讀原文查看

相關焦點

  • MEGA構建進化樹之傻瓜教程
    首先,要明確什麼是系統進化樹。在進化樹上每個葉子結點代表一個物種、群體、蛋白質、DNA、RNA,如果每一條邊都被賦予一個適當的權值 ,那麼兩個葉子結點之間的最短距離就可以表示相應的兩個物種之間的差異程度。其次,構建系統進化樹的軟體有多種,但最常用的是MEGA,下面我們用MEGA6.0進行系統進化樹的構建。
  • 昆明動物所等發布超大規模進化樹構建軟體
    近日,中國科學院昆明動物研究所馬佔山團隊與天津大學教授鄒權、廈門大學科研人員聯合發布了為千兆(GB)級基因序列數據構建進化樹的軟體HPTree。  進化樹,也稱生物系統發育樹或生命樹。這一概念最早發源於19世紀中葉的古生物學研究,達爾文在《物種起源》中勾畫了最早的進化樹之一。對進化樹廣泛研究和構建則始於20世紀90年代,特別是在最近20年間,基因測序技術以及分子進化研究使得構建進化樹成為進化生物學研究不可或缺的技術。達爾文進化論核心思想之一是地球上生命「同根」,即所有物種都有共同起源,並能在生命進化樹上找到自己的位置。
  • MPB:中科院微生物所蔡磊組-​基於擴增子數據的系統發育樹的構建和展示
    基於擴增子的微生物組數據集,往往能獲得數千至上萬個OTUs (可操作分類單元),我們需要從中篩選獲得高豐度及核心微生物類群進行系統發育樹的構建和展示。系統發育樹又名分子進化樹,是生物信息學中描述不同生物或者不同基因之間進化關係的方法。通過系統學分類分析,可以幫助研究者推測生物的進化歷程和親緣關係。
  • NCBI教程|如何從NCBI批量下載序列並用MEGA畫進化樹
    今天我們繼續分享NCBI教程,喜歡就分享給你的小夥伴吧~我們都知道,要從NCBI上下載一條兩條序列很簡單,就是登陸NCBI
  • 手把手教你用DNAMAN進行多序列比對
    今天,小白君繼續給大家講解前天分享的SCI文章(可點擊公眾號-查看歷史消息,閱讀此文章)中所用到的另一個入門級生物信息學技能——用DNAMAN進行多序列比對
  • 使用ggtree實現進化樹的可視化和注釋
    進化樹看起來和層次聚類很像。有必要解釋一下兩者的一些區別。層次聚類的側重點在於分類,把距離近的聚在一起。而進化樹的構建雖然也可以說是一個聚類過程,但側重點在於推測進化關係和進化距離(evolutionary distance)。層次聚類的輸入是距離,比如euclidean或manhattan距離。把距離近的聚在一起。
  • 系統進化樹軟體—MEGA介紹
    背景系統進化樹(Phylogenetic tree)又稱為演化樹,是表明被認為具有共同祖先的各種物種間演化關係的樹
  • 乾貨 師兄,我想用MEGA建個樹,咋整?
    你家的family tree啊?師妹:師兄,你不要調戲我,我就建一個簡單的進化樹!這個怎麼做啊? 簡單呀,你可以用MEGA,先去MEGA官網(http://www.megasoftware.net/)下載這個軟體,免費的啊。
  • 如何比對不同序列同源性,畫出高顏值的進化樹?
    比如↓↓↓如果我們也能畫出這麼漂亮的進化樹,那麼升職加薪,迎娶白富美,當上CEO,走上人生巔峰,都不是事兒啊。(扯的有點遠,不過加油吧!!!預備知識:在生物信息學中,進化樹被用來表示物種之間的進化關係。生物分類學家和進化論者根據各類生物間的親緣關係的遠近,把各類生物安置在有分枝的樹狀圖表上,簡明地表示生物的進化歷程和親緣關係。葉子節點之間的距離表示相應的兩個物種之間的差異程度。
  • 圖文詳解MEGA構建系統發育樹
    準備序列文件準備fasta格式序列文件(fasta格式:大於號>後緊跟序列名,換行後是序列。舉例如下)。每條序列可以單獨為一個文件,也可以把所有序列放在同一文件內。構建系統進化樹多序列比對窗口,點擊Data,選擇Phylogenetic Analysis,彈出窗口詢問:所用序列是否編碼蛋白質,根據實際情況選擇Yes或No。此時,多序列比對文件就激活了,可以返回MEGA 5主界面建樹了。
  • 基因家族分析(2)-利用MEGA進行進化樹分析和美化
    構建進化樹有兩種方式,一種是利用蛋白質的全長序列,另一種是利用結構域序列進行構建進化樹。1、利用基因家族分析(1)裡面得到的WRKY_pep_confirmed.fa或WRKY_domain_confirmed.fa來構建進化樹都可以。這裡選用WRKY_domain_confirmed.fa。
  • 如何給進化樹「美顏」
    無論是在基因組文章,還是在群體研究中,進化樹都必不可少。小編諮詢度娘得知,大家的提問通常是關於兩個方面,進化樹的構建和進化樹的美化。關於進化樹的構建問題需要更為專業和系統的闡述,小編在這裡只想介紹下進化樹的美化。
  • 進化樹作圖專題:進化樹的幾種分類
    本期承接上期進化樹作圖專題1的內容,和大家分享一下關於進化樹圖的幾種分類。 依據不同規則,樹的分類可以有很多種。由於本專題主要針對於作圖,所以這裡主要的原則就是——樹的外形。所謂「根」,就是一棵樹上的所有基因或物種的最近共同祖先(most recent common ancestor,MRCA)。
  • 用R語言ggtree做圓形進化樹
    什麼是系統發育樹?系統發育樹,也叫作聚類樹或者進化樹是一種類似樹狀分支的圖形,用樹形結構表示各個節點的進化關係,枝點可以是物種、同一物種的樣本、基因等單元。根 (Root)有根樹:上面的圖就是有根樹,可以從樹中找到共同的祖先。
  • 剪映素材庫在哪裡 手把手教你剪映素材庫怎麼用
    剪映素材庫在哪裡 手把手教你剪映素材庫怎麼用時間:2020-07-01 17:09   來源:騰牛網    責任編輯:沫朵 川北在線核心提示:原標題:剪映素材庫在哪裡 手把手教你剪映素材庫怎麼用 剪映是非常好用的剪輯工具,現在很多人都愛用,裡面有很多功能,可以製作出很好的視頻。
  • win7放大鏡怎麼用? 手把手教你使用win7電腦放大鏡
    win7放大鏡怎麼用? 手把手教你使用win7電腦放大鏡時間:2018-03-27 08:25   來源:系統天堂   責任編輯:沫朵 川北在線核心提示:原標題:win7放大鏡怎麼用? 手把手教你使用win7電腦放大鏡 win7放大鏡怎麼用?
  • 進化樹+基因結構+motif—1張圖全顯示!
    MEGA可以基於序列構建進化樹,並顯示進化樹,藉助GSDS可以把基因結構和進化樹合併顯示。