如何比對不同序列同源性,畫出高顏值的進化樹?

2021-02-21 獸醫veterinarian

中糧肉食中心實驗室團隊

   編輯:劉建城    審核:龍進學博士

                                          

       如何畫出高顏值的進化樹?

                   比如↓↓↓

如果我們也能畫出這麼漂亮的進化樹,那麼升職加薪,迎娶白富美,當上CEO,走上人生巔峰,都不是事兒啊。(扯的有點遠,不過加油吧!!!)


Are you ready?


預備知識:

在生物信息學中,進化樹被用來表示物種之間的進化關係。生物分類學家和進化論者根據各類生物間的親緣關係的遠近,把各類生物安置在有分枝的樹狀圖表上,簡明地表示生物的進化歷程和親緣關係。葉子節點之間的距離表示相應的兩個物種之間的差異程度。

教程如下:

步驟1:雙擊打開MegAlign 軟體,將參考序列庫拉入其中

步驟2:將新得到(拼接後)的序列拉入其中

步驟3:新拉入的序列在最下面

點擊Align選擇By clustal W Method開始比對

步驟4:記住加入最新得到的序列中與參考序列相齊的鹼基位置

如第一個起始密碼子 28-終止密碼子 630

步驟5:

1.雙擊序列名稱出現對話框,輸入上述這兩個位置

2.點擊ok,然後觀察新序列與序列庫是否對齊

驟6:

1.使用EditSeq軟體先刪除後面630個鹼基後的所有序列

2.再刪除前面1-27個鹼基序列

步驟7:點擊File,選擇save as....保存在自己新建的文件夾下

步驟8:

1.在MegAlign中把之前的原始數據刪除

2.把剪貼後的序列拉入

3.點擊A另,選擇By clustal W Method開始比對

4.點擊file,save as...保存自己新建的文件夾中形成新的序列庫

(文件名包括,時間,區域,項目等)

保存文件格式為fas


步驟9:

1.在view中查看sequence distance(進化距離及相似度)

2.相似度大於90%說明兩者相似度較高,大於95%相似度極高,基本認定為同一毒株。

點擊Edit,,copy-報告中選擇性粘貼(圖片格式)

步驟10:

1.用MEGA7(桌面軟體)做進化樹

雙擊MEGA7→左上Align→點擊Edit/BuildAlignment→出現對話框,點擊Creat,ok→新對話框中選擇DNA→左上Edit→點擊Insert Sequence from file

2.找出保存的更新的序列文庫並打開(拖入)

3.因為會出現名字重複,把重複的名字選中刪除→點擊W圖標→AlignDNA,ok→ok→點擊左上Date中phylogeneticanalysis→No

4.打開該軟體另外一個界面→在phylogeny找第二個Neighor-Joiningtree→yes→點擊compute得到進化樹(下步可選擇自己需要的樹型和字體)


步驟11:

編輯報告

找出以往模板改成新序列名字,把上述分析的進化樹(MEGA7中copy進化樹)和進化距離(在Meglign中Edit→copy)copy到報告中,把報告中需改的部分改成新序列信息簡單做分析,屬於經典株還是高致病性株.

相關焦點

  • 多序列比對——Clustal
    多序列比對是對3個以上生物序列(蛋白質、DNA、RNA等)進行比對,分析序列的同源性,根據比對的結果來構建系統進化樹。
  • 如何獲取蛋白序列並進行序列比對?
    很多情況下,我們為了研究一個蛋白的重要性,需要查看這個蛋白在多個物種,以及與這個蛋白家族中其它蛋白的相似性,並構建進化樹。
  • 序列比對及Blast的應用
    序列比對的理論基礎是進化學說,如果兩個序列之間具有足夠的相似性,就推測二者可能有共同的進化祖先,經過序列內殘基的替換、殘基或序列片段的缺失、以及序列重組等遺傳變異過程分別演化而來
  • NCBI教程|如何從NCBI批量下載序列並用MEGA畫進化樹
    下載好的序列就可以用於後續的進化樹的繪製了。--繪製進化樹教程---建樹之前先將目標基因序列(蛋白序列也可以)都分別保存為txt文本文件中(或者把所有序列保存在同一個txt文本中,可以用「>基因名稱」作為第一行,然後重起一行編輯基因序列),序列只包含序列字母(ATCG或胺基酸簡寫字母)。文件名名稱可以按照你想要的名稱即可。
  • 將序列比對的結果保存為漂亮的圖片
    多序列比對在分子生物學中是一個基本方法,用來發現特徵序列,進行蛋白分類,證明序列間的同源性,幫助預測新序列二級結構與三級結構,確定PCR引物,以及在分子進化分析方面均有很大幫助
  • 手把手教你用 Fast Tree 快速構建序列進化樹
    對於近緣序列,最大簡約法用的假設最少,各種方法結果相似。而對於遠緣序列,一般使用最大似然法或鄰接法。對相似度很低的序列,鄰接法往往出現 Long-branch attraction(LBA,長枝吸引現象),嚴重幹擾進化樹的構建。對於各種方法構建分子進化樹的準確性,Hall 認為貝葉斯的方法最好,其次是最大似然法,然後是最大簡約法。其實如果序列的相似性較高,各種方法結果差別不大。
  • 乾貨時間 | 序列比對,科研必備的幾款軟體!
    Graphics可以連結到基於圖形序列的匹配顯示(如下圖) Distance tree of results可以以距離樹的形式顯示比對結果(如下圖),如果比對的是蛋白序列的話還會有一個Multiple alignment用於系統發育分析。
  • 多重序列比對(MSA)分析工具怎麼選,看這一篇就夠了
    多序列比對(multiple sequences alignment,MSA)是開展進化生物學研究的前提,後續可以進行選擇壓力分析以及推斷物種系統發育歷史。多序列比對表示不同序列中的胺基酸/核苷酸的位點同源性。
  • 常用在線序列比對工具
    多序列比對工具當然也支持配對序列比對,不過更多的是用來比對3條及以上序列,研究序列之間是否同源以及序列間的進化關係。序列相似性搜索工具主要是在一個序列資料庫中查找一條序列,找出與查詢序列最相似的序列。Needle比對工具以Needle工具為例進行一下簡單的演示,其提供了核酸及蛋白比對兩個版本,比對不同類型的序列需要選擇不同的工具。Needle是全局比對工具,將兩條序列全部內部進行比對並展示。1.
  • 手把手教你用DNAMAN進行多序列比對
    首先準備好序列文件,DNA或Protein。DNAMAN做多序列比對所用到的序列並不需要FASTA格式。但每一條序列都需要放在一個單獨的文件中。準備好序列之後,便可進行多序列比對了。打開DNAMAN軟體。點擊序列-比對-多序列比對。
  • 序列比對軟體
    今天小編特意給大家整理分享了有關序列比對綜合分析的軟體,聰明的你們快來試試有沒有心儀的軟體工具。Geneious         序列綜合分析軟體(https://www.geneious.com/)ClustalW  2.1用來對核酸與蛋白序列進行多序列比對(multiple sequence alignment
  • MEGA構建進化樹之傻瓜教程
    看文獻時,我們經常可以看到一些漂亮的大圖,類似於下面這種,心生感嘆:要是我也能畫出這樣的圖該多好啊!
  • 【陪你學·生信】九、多序列比對-Multiple Sequence Alignment(MSA)
    有一些工具可以幫助我們進行多序列比對,但是最好再根據結構、進化、功能、序列相似性人工矯正一下比對結果。二、選擇合適的序列1. 選擇序列時要注意的問題選擇要比對的序列很重要,不然結果沒有意義。序列之間高度相似,一定會有很好的比對結果。但是提供的新信息會少);(6)很多工具善於比對總長度類似的序列,對長短不一的分析結果不好,如果可以,需要提前剪輯;(7)一般工具對有重複片段的多序列進行比對時存在問題,尤其序列間重複的次數不同時問題更大,需要人工提取這部分,進行分析。2.
  • 新手上路,一文秒懂Blast結果圖(附序列比對網址)
    轉載請註明:解螺旋·臨床醫生科研成長平臺 眾所周知,同源性是預測基因和蛋白質功能的主要線索,而序列同源性的判斷則離不開兩個或多個序列之間相似性的檢測一般來說,序列間的相似度越高,它們是同源序列的可能性就越高。 其中,序列比對無疑是評估序列相似性的最簡單方法。顯然,Blast就是序列比對檢測的中堅力量。Blast自1990年首次亮相以來,憑藉從各大資料庫(EST、PDB資料庫等)獲取信息的能力,迅速成為序列比對界的領頭羊。
  • 如何進行基因組序列比對?
    、比對軟體、SAM文件拿到人基因組全外顯子illumina下機數據fastq文件之後,如何進行後續的變異檢測呢?>是FLAG,Combination of bitwise FLAGs為標識的加和,各種比對情況分別以不同的數字表示,每一個數字代表一種比對情況。
  • 多序列比對分析-Dnaman很好用!
    軟體主要功能匯總1、DNA序列轉化、翻譯2、多序列比對分析3、系統進化樹分析4、DNA序列組裝和編輯5、BLAST通過網絡界面在Intranet / Internet Server上進行搜索6、SiRNA選擇器7、限制性內切酶酶切分析8、翻譯和密碼子使用分析9、蛋白質疏水性/
  • 使用ggtree實現進化樹的可視化和注釋
    而進化樹推斷是從生物序列(DNA或胺基酸)的比對開始。最簡單的方法是計算一下序列中不匹配的數目,稱之為hamming distance(通常用序列長度做歸一化),使用距離當然也可以應用層次聚類的方法。真正做進化的人,基本不用這些基於距離的方法。現在主流的方法是最大似然法(Maximum likelihood, ML),通過進化模型(evolutionary model)估計拓樸結構和分支長度,估計的結果具有最高的概率能夠產生觀測數據(多序列比對)。另外還有最大簡約法和貝葉斯推斷等方法用於構建進化樹。
  • 新算法助力大規模多序列比對
    新算法助力大規模多序列比對 作者:小柯機器人 發布時間:2019/12/3 12:33:22 近日,西班牙巴塞隆納科學技術學院Cedric Notredame、Evan Floden等研究人員合作開發了可用於大規模多序列比對(
  • 一文秒懂Blast結果圖(附序列比對網址)!教你快速上手,絕對實用!
    眾所周知,同源性是預測基因和蛋白質功能的主要線索,而序列同源性的判斷則離不開兩個或多個序列之間相似性的檢測。
  • 樹鼩KLF基因家族特點及進化分析
    昆明動物所在2013年解析出樹鼩基因組以後,近年來陸續建立了樹鼩乳腺癌、非酒精性脂肪肝、2型糖尿病、皰疹病毒感染的腦炎和肌膜炎、抑鬱症等疾病模型。KLF基因家族是一類含有三個高度保守的串聯鋅指結構的轉錄因子家族,KLF因子調控基因的表達,在動物細胞的增殖,分化,衰老,死亡以及癌變中起著重要作用。前期研究發現KLF5在基底型乳腺癌幹細胞維持中起著關鍵的作用。