一文秒懂Blast結果圖(附序列比對網址)!教你快速上手,絕對實用!

2021-01-14 挑圈聯靠

眾所周知,同源性是預測基因和蛋白質功能的主要線索,而序列同源性的判斷則離不開兩個或多個序列之間相似性的檢測。一般來說,序列間的相似度越高,它們是同源序列的可能性就越高。


其中,序列比對無疑是評估序列相似性的最簡單方法。顯然,Blast就是序列比對檢測的中堅力量。Blast自1990年首次亮相以來,憑藉從各大資料庫(EST、PDB資料庫等)獲取信息的能力,迅速成為序列比對界的領頭羊。



老實說,Blast的界面非常友好,點擊相應模塊後,大家只需在序列框中丟上自己的靶序列,勾選好物種基因組,點擊搜索即可!



可看著結果界面湧現出的幾十個、數百個甚至數千個候選匹配序列,不少選擇困難症的童鞋表示頭疼不已:結果辣麼多,究竟哪個才是最優解?本文以NM_001206932為例,分解BLAST結果頁面,讓大家迅速擺脫Blast新手身份。



首先會看到一個表頭,即本次比對的基本信息,如比對類型、序列長度、所選的資料庫等等。如果所選的資料庫不合適,請及時迷途知返哦。



接下來就是Blast的結果顯示圖(Graphic Summary):顏色比例尺,其中相似度從高到低排列分別為:紅、紫、綠、藍、黑,紅色區域越多則表示有較好的比對結果。



而在Blast結果的描述區域,兩個衡量標準最為重要:Max Score和E值(E value),前者匹配片段越長,相似性越高則Score值越大;後者是得到上述Score值的概率的大小。E值越小表示隨機情況下得到該Score值的可能性越低。



而點擊相應注釋名稱,又或者在結果顯示圖(Graphic Summary)中點擊對應的線條,均可以查看比對結果的詳細信息。


其中,Expect(E值)、Identities(一致性)、Gaps(缺失或插入)三項是評價blast結果的標準。E值接近零或者為零時,具體上就是完全匹配了;一致性:匹配上的鹼基數佔總序列長的百分數。



如此,就可對Blast結果做到了如指掌,然而有些急性子的科研者卻對Blast的運行速度有些瞧不上眼,因而又挖掘出了序列比對的新神器Blat,不僅讓序列比對速度翻倍增長,而且其共線性輸出結果更加簡單易讀。詳情請查看文章《Blast太慢?可以試試Blat》。



功能:多序列比對相似性展示

網址:http://cotton.hzau.edu.cn/EN/tools/BioERCP/simitrix.php


  

功能:運行速度比較快的多序列比對

網址:http://www.ebi.ac.uk/Tools/msa/muscle/#




功能:DNA、RNA、蛋白的多序列比對

網址:http://www.ebi.ac.uk/Tools/msa/clustalo/




功能:應用較廣泛的多序列比對

網址:http://www.ebi.ac.uk/Tools/msa/clustalw2/




功能:準確度高,速度慢的多序列比對

網址:http://www.ebi.ac.uk/Tools/msa/tcoffee/



參考文獻:https://bitesizebio.com/37866/crash-course-blast-searching/

相關焦點

  • 新手上路,一文秒懂Blast結果圖(附序列比對網址)
    原標題:新手上路,一文秒懂Blast結果圖(附序列比對網址) 一般來說,序列間的相似度越高,它們是同源序列的可能性就越高。 其中,序列比對無疑是評估序列相似性的最簡單方法。顯然,Blast就是序列比對檢測的中堅力量。Blast自1990年首次亮相以來,憑藉從各大資料庫(EST、PDB資料庫等)獲取信息的能力,迅速成為序列比對界的領頭羊。
  • 序列比對及Blast的應用
    用一組BLAST程序聯配可以快速進行核酸和蛋白質序列庫的相似性檢索。採用BLAST的基本算法編成了若干各不同的程序,分別使用特定的序列庫和用於特定類型的輸入序列。BLASTN是在核苷酸序列庫搜索核苷酸序列。BLASTP是在蛋白質序列庫中搜索胺基酸序列。TBLASTN則可以在核酸序列庫中搜索胺基酸序列,此時序列庫在搜索之前要按所有6種讀框即時翻譯。
  • 常用在線序列比對工具
    配對序列比對工具工具集網址:https://www.ebi.ac.uk/Tools/psa/這些可能是史前比對工具了,現在估計沒有什麼人在用了,可能也沒人聽過還有這樣的工具存在。>MAFFT是2002年開發的一款快速的局部/全局多序列比對工具,與之相對的是2004年開發的MUSCLE多序列比對工具,在網頁使用過程中,兩者差異不明顯,但是MUSCLE在比對數百條、數千條序列時,速度較慢,這時候使用MAFFT效果會好一點。
  • 序列比對在biopython中的處理
    序列比對是生物信息學分析中的常見任務,包含局部比對和全局比對兩大算法,局部比對最經典的代表是blast, 全局比對則用於多序列比對。在biopython中,支持對序列比對的結果進行讀寫,解析,以及運行序列比對的程序。
  • 序列比對軟體
    今天小編特意給大家整理分享了有關序列比對綜合分析的軟體,聰明的你們快來試試有沒有心儀的軟體工具。Geneious         序列綜合分析軟體(https://www.geneious.com/)ClustalW  2.1用來對核酸與蛋白序列進行多序列比對(multiple sequence alignment
  • Igblast的安裝與使用
    Blast程序也可以進行IG或TR比對,但是由於IG或TR序列的特殊性,如不同的基因特徵長度,D基因至多10bp而V基因可達290bp,因此一個IG或TR其實需要多種不同參數的Blast程序進行比對,最後手工合成比對結果,不但繁瑣而且易出錯,但是使用IgBlast就可以快速高效的完成序列比對。
  • 序列比對綜合分析軟體
    BLAST+ 2.2.28分成五個不同的程序,分別為:blastp(提交蛋白質序列,在蛋白質序列資料庫中查序列)、blastn(提交核酸序列,在核酸序列資料庫中查找同源序列) blastx(提交核酸序列,在蛋白質序列資料庫中查找同源序列)、tblastn (提交蛋白質序列,在核酸序列資料庫中查找同源序列)、tblastx(提交核酸序列,在核酸序列資料庫中查找同源序列)。
  • 【陪你學·生信】九、多序列比對-Multiple Sequence Alignment(MSA)
    一、多序列比對能幹嘛?
  • 為什麼 Biopython 的在線 BLAST 這麼慢?
    用過網頁版本 BLAST 的童鞋都會發現,提交的序列比對往往在幾分鐘,甚至幾十秒就可以得到比對的結果;而通過調用 API 卻要花費幾十分鐘或者更長的時間!這到底是為什麼呢?對象進行讀取,然後僅提供序列本身進行比對:僅提供序列意味著 BLAST 將自動為您的序列分配一個標識符。
  • 實驗專欄 | Blast,有種,有料,有用!
    ,並非浪得虛名的,他多才多藝(功能多樣),博學多識(比對面面俱到),還廣交天下名人雅士(可獲得各大資料庫的信息,他就是有種!)。   BLAST Assembled Genomes:就是讓你選擇你要對比的物種,點擊物種之後即可進入對比頁面。
  • 手把手教你用DNAMAN進行多序列比對
    首先準備好序列文件,DNA或Protein。DNAMAN做多序列比對所用到的序列並不需要FASTA格式。但每一條序列都需要放在一個單獨的文件中。準備好序列之後,便可進行多序列比對了。打開DNAMAN軟體。點擊序列-比對-多序列比對。
  • 乾貨 | 一款超好用的 DNA 序列比對軟體
    對於每一個進入生物領域的人,基本都避免不了分子克隆,當然就需要一個稱手的 DNA 比對軟體
  • 多序列比對分析-Dnaman很好用!
    親水性分析10、蛋白質表徵:等電點的序列組成和預測11、蛋白質二級結構預測12、PCR和測序引物的設計Dnaman功能繁多,限於篇幅,今天先給大家簡單介紹下利用Dnaman進行多重序列比對分析。多重序列比對裝載完序列後,選擇Sequence—Aligment—Multiple aligment sequence進行多序列比較,也可以直接點擊工具欄多序列比對工具圖標。
  • 新算法助力大規模多序列比對
    新算法助力大規模多序列比對 作者:小柯機器人 發布時間:2019/12/3 12:33:22 近日,西班牙巴塞隆納科學技術學院Cedric Notredame、Evan Floden等研究人員合作開發了可用於大規模多序列比對(
  • 將序列比對的結果保存為漂亮的圖片
    多序列比對在分子生物學中是一個基本方法,用來發現特徵序列,進行蛋白分類,證明序列間的同源性,幫助預測新序列二級結構與三級結構,確定PCR引物,以及在分子進化分析方面均有很大幫助
  • 如何進行基因組序列比對?
    、詳細信息及下載地址已經知道啦,那麼我們來看看利用什麼軟體或算法來將測序數據比對到31億鹼基序列上呢? SAM文件格式是Heng Li於2009年提出的用於存儲比對結果信息的文本文件(以tab鍵分割),並同時發布了一款用於處理SAM文件的軟體SAMtools(PMID:19505943)。
  • 多重序列比對(MSA)分析工具怎麼選,看這一篇就夠了
    原本以為可以快速地進行下一步的選擇壓力分析,沒想到卻在多序列比對這一環節出現了棘手的問題。以前,我都是經過PRANK軟體進行多序列比對,然後再使用Gblocks軟體對數據進行過濾的。現在,由於師弟師妹在拼接CDS序列時,有些鹼基並不是保留3的倍數,造成很多編碼序列出現移碼突變,甚至變成了偽假基因(幾百個基因)。
  • 多序列比對——Clustal
    多序列比對是對3個以上生物序列(蛋白質、DNA、RNA等)進行比對,分析序列的同源性,根據比對的結果來構建系統進化樹。
  • 如何獲取蛋白序列並進行序列比對?
    今天我們就來說一下具體的方法,先介紹蛋白序列的獲取和序列比對。以Sox家族的蛋白為例,我們首先通過Uniprot資料庫(http://www.uniprot.org/)獲取蛋白序列:這是打開後是序列,我們看到包括了Sox9,Sox2,Sox11等蛋白的序列,這樣我們就拿到Sox家族的各條序列了,接來下我們進行序列比對。