BBRC:章張等開發出編碼蛋白質DNA序列並行比對工具ParaAT

2020-11-29 生物谷

近日,國際雜誌Biochemical and Biophysical Research Communications在線刊登了中國科學院北京基因組研究所基因組科學與信息重點實驗室「百人計劃」章張研究員團隊的最新研究成果,研究者成功開發出「編碼蛋白質DNA序列並行比對工具—ParaAT(Parallel Alignment and back-Translation)」。

同源序列比對是生物信息學最普遍使用的分析方法之一,其中,編碼蛋白質DNA序列比對最為常見,對比較基因組學、分子進化學、系統發育等領域具有重要的基礎意義。為獲取相應的比對結果,通常採用的方法是將蛋白序列的比對結果「回譯」(back-translate)成DNA比對序列,這樣的比對結果比直接進行DNA序列比對更可靠、準確。為此,科學家提出了多個不同的工具,採用的策略都是先進行蛋白質序列比對,然後將比對結果回譯成DNA比對。然而,這些工具每次只能處理一組同源數據,無法實現多組同源序列的對比工作。

鑑於傳統工具所產生的弊端,基因組所科研人員開發了ParaAT,成功解決了此項科研難題。ParaAT可實現多組同源編碼蛋白質DNA序列的並行比對,不僅解決了大規模、多組同源序列的比對工作,同時也大大降低了運行時間,獲得了較好的並行加速比(speedup),適合海量數據的分析工作。ParaAT可在不同作業系統下運行,支持多種不同的輸出格式,方便後續相關的生物信息學分析(如用於檢測自然選擇壓力的KaKs_Calculator)。(生物谷Bioon.com)

ParaAT: A parallel tool for constructing multiple protein-coding DNA alignments

Zhang Zhanga, , , Jingfa Xiaoa, Jiayan Wua, Haiyan Zhangb, Guiming Liua, Xumin Wanga, Lin Daic, a,

Constructing multiple homologous alignments for protein-coding DNA sequences is crucial for a variety of bioinformatic analyses but remains computationally challenging. With the growing amount of sequence data available and the ongoing efforts largely dependent on protein-coding DNA alignments, there is an increasing demand for a tool that can process a large number of homologous groups and generate multiple protein-coding DNA alignments. Here we present a parallel tool – ParaAT that is capable of parallelly constructing multiple protein-coding DNA alignments for a large number of homologs. As testified on empirical datasets, ParaAT is well suited for large-scale data analysis in the high-throughput era, providing good scalability and exhibiting high parallel efficiency for computationally demanding tasks. ParaAT is freely available for academic use only at http://cbb.big.ac.cn/software.

相關焦點

  • BBRC:章張團隊研究開發出DNA序列並行比對新工具
    最近,中國科學院北京基因組研究所基因組科學與信息重點實驗室「百人計劃」章張研究員,帶領其團隊成功開發出「編碼蛋白質DNA序列並行比對工具—ParaAT(Parallel Alignment and back-Translation)」。
  • 多序列比對分析-Dnaman很好用!
    軟體主要功能匯總1、DNA序列轉化、翻譯2、多序列比對分析3、系統進化樹分析4、DNA序列組裝和編輯5、BLAST通過網絡界面在Intranet / Internet Server上進行搜索6、SiRNA選擇器7、限制性內切酶酶切分析8、翻譯和密碼子使用分析9、蛋白質疏水性/
  • 【科研工具】做序列比對,這個工具最好用!
    在做基因分析的實驗室裡,經常要做序列比對(sequence alignment),多數人都會選擇用NCBI上的BLAST工具。其實,用一個名叫BLAT的工具,有時可以體驗到更好的比對效果。如果序列中包含內含子,可以一目了然看到內含子序列及其在染色體上的位置。另外,BLAT也同樣可以處理DNA,RNA和蛋白質序列的比對。線上BLAT工具在genome.ucsc.edu上,當然也可以下載這個工具的安裝版,在線下做比對分析。
  • 序列比對及Blast的應用
    早期的序列比對是全局的序列比較,但由於蛋白質具有的模塊性質,可能由於外顯子的交換而產生新蛋白質,因此局部比對會更加合理。通常用打分矩陣描述序列兩兩比對,兩條序列分別作為矩陣的兩維,矩陣點是兩維上對應兩個殘基的相似性分數,分數越高則說明兩個殘基越相似。
  • 常用在線序列比對工具
    EMBL-EBI提供大量的對比工具在線服務,並不代表其擁有這些工具的所有權。 按工具功能大致可以分為3類:配對序列比對工具,多序列比對工具以及序列相似性搜索工具。Needle比對工具以Needle工具為例進行一下簡單的演示,其提供了核酸及蛋白比對兩個版本,比對不同類型的序列需要選擇不同的工具。Needle是全局比對工具,將兩條序列全部內部進行比對並展示。1.
  • 序列比對軟體
    今天小編特意給大家整理分享了有關序列比對綜合分析的軟體,聰明的你們快來試試有沒有心儀的軟體工具。Geneious         序列綜合分析軟體(https://www.geneious.com/)ClustalW  2.1用來對核酸與蛋白序列進行多序列比對(multiple sequence alignment
  • 科學家發明蛋白序列比對新工具
    來自德國慕尼黑大學的研究人員發表了題為「HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment」的文章,介紹一種能提高蛋白序列比對分析的新工具
  • 序列比對綜合分析軟體
    BLAST+ 2.2.28分成五個不同的程序,分別為:blastp(提交蛋白質序列,在蛋白質序列資料庫中查序列)、blastn(提交核酸序列,在核酸序列資料庫中查找同源序列) blastx(提交核酸序列,在蛋白質序列資料庫中查找同源序列)、tblastn (提交蛋白質序列,在核酸序列資料庫中查找同源序列)、tblastx(提交核酸序列,在核酸序列資料庫中查找同源序列)。
  • 多重序列比對(MSA)分析工具怎麼選,看這一篇就夠了
    原本以為可以快速地進行下一步的選擇壓力分析,沒想到卻在多序列比對這一環節出現了棘手的問題。以前,我都是經過PRANK軟體進行多序列比對,然後再使用Gblocks軟體對數據進行過濾的。現在,由於師弟師妹在拼接CDS序列時,有些鹼基並不是保留3的倍數,造成很多編碼序列出現移碼突變,甚至變成了偽假基因(幾百個基因)。
  • 把蛋白質序列編碼成樂譜,會奏出怎樣的音樂?
    它有一套能將蛋白質的胺基酸序列轉換成音樂序列的系統方法,利用分子的物理特性來確定聲音。為了讓這些聲音落入人類可以聽到的聽覺範圍內,研究人員對它們進行了變調轉換,但這些音調是完全基於每個胺基酸分子本身的實際振動頻率發出的,而振動頻率又是根據量子化學理論計算出來的。這項研究被發表在了ACS Nano雜誌上。
  • 基因組序列太深奧?用這套工具能讀懂
    原標題:基因組序列太深奧?用這套工具能讀懂 基因組測序工作完成後,哪些基因能翻譯蛋白、能翻譯哪些蛋白,一直是生命科學研究的熱點和難點。近日,中國科學院水生生物研究所葛峰學科組在這一問題上取得突破性進展,相關研究成果於近日在線發表於國際期刊《分子植物》上。
  • Nat Methods:蛋白序列比對新工具HHblits更快更準
    近日,來自德國慕尼黑大學的研究人員在Nature Methods雜誌上發表論文"HHblits: lightning-fast iterative protein sequence searching by HMM-HMM alignment"介紹一種能提高蛋白序列比對分析的新工具:HHblits,這是一種能極大增加蛋白功能性分析技術的軟體,能通過新穎的序列尋找方法
  • Methods:德發明蛋白序列比對新工具——HHblits
    近日,德國慕尼黑大學的研究人員發表論文介紹一種能提高蛋白序列比對分析的新工具:HHblits。相關成果公布在《自然—方法學》(Nature Methods)雜誌上。所以蛋白結構分析是蛋白研究的一個重要方面,蛋白結構比對也成為了常規手段之一,研究人員常常在公眾資料庫中比對蛋白結構,通過分析這些相似的已知結構來分析蛋白的功能,S?ding博士說,「這種序列分析方法是生物信息學領域的一種基礎研究手段。」序列尋找程序能通過計算配對方式來評估序列相似性——兩個胺基酸序列被按照先後順序排列,這是根據常見識別,或者同樣方式的胺基酸配對。
  • 手把手教你用DNAMAN進行多序列比對
    首先準備好序列文件,DNA或Protein。DNAMAN做多序列比對所用到的序列並不需要FASTA格式。但每一條序列都需要放在一個單獨的文件中。準備好序列之後,便可進行多序列比對了。打開DNAMAN軟體。點擊序列-比對-多序列比對。
  • 多序列比對——Clustal
    多序列比對是對3個以上生物序列(蛋白質、DNA、RNA等)進行比對,分析序列的同源性,根據比對的結果來構建系統進化樹。
  • 【陪你學·生信】九、多序列比對-Multiple Sequence Alignment(MSA)
    下面是多序列比對的主要應用:1. 推測——Extrapolation可以推測一條未知的aa序列屬於某個已知的蛋白質家族或者擁有相似蛋白質結構域甚至相似的蛋白質3D結構等。2.就是將目標序列與資料庫中多條同源序列的相似部分擺放在同一欄,同一位置。有一些工具可以幫助我們進行多序列比對,但是最好再根據結構、進化、功能、序列相似性人工矯正一下比對結果。二、選擇合適的序列1.
  • 乾貨時間 | 序列比對,科研必備的幾款軟體!
    BLAST(Basic Local Alignment Search Tool)可以說是短序列比對中最常用的比對工具了,它不僅支持核酸和蛋白的雙序列比對,而且可以在蛋白質資料庫或DNA資料庫中進行相似性比較,找到與查詢序列相似的序列。
  • 乾貨 | 一款超好用的 DNA 序列比對軟體
    對於每一個進入生物領域的人,基本都避免不了分子克隆,當然就需要一個稱手的 DNA 比對軟體
  • 通過轉錄組技術而測序的dna序列被稱為「dna受體」
    後面的dna受體可通過做dna晶片credit-sweep來獲得,後面的dna受體包括mirna,smallmrna,circrna和ae等。根據技術的不同,dna晶片可以分為三類:測mirna:測定mirna。測dna受體的全雙工轉錄信號的兩轉錄本等等。測vxrna:測vxrna。
  • MIT新研究:用AI把胺基酸序列編碼成曲子,還能「創造」新蛋白質
    先來聽聽由蛋白質生成的神奇樂曲吧將蛋白質的胺基酸序列翻譯成這種打擊和節奏聲音的序列讓AI學習蛋白質的語言,並「翻譯」成樂曲胺基酸是蛋白質鏈的組成部分,因此,胺基酸所構成的蛋白質長序列被轉化為一系列的音符