BBRC:章張團隊研究開發出DNA序列並行比對新工具

2020-11-23 生物谷

最近,中國科學院北京基因組研究所基因組科學與信息重點實驗室「百人計劃」章張研究員,帶領其團隊成功開發出「編碼蛋白質DNA序列並行比對工具—ParaAT(Parallel Alignment and back-Translation)」。該研究成果發表在《生物醫藥與生物物理研究通訊》(Biochemical and Biophysical Research Communications,BBRC)期刊上。

同源序列比對是生物信息學最普遍使用的分析方法之一,其中,編碼蛋白質DNA序列比對最為常見,對比較基因組學、分子進化學、系統發育等領域具有重要的基礎意義。為獲取相應的比對結果,通常採用的方法是將蛋白序列的比對結果「回譯」(back-translate)成DNA比對序列,這樣的比對結果比直接進行DNA序列比對更可靠、準確。為此,科學家提出了多個不同的工具,採用的策略都是先進行蛋白質序列比對,然後將比對結果回譯成DNA比對。然而,這些工具每次只能處理一組同源數據,無法實現多組同源序列的對比工作。

鑑於傳統工具所產生的弊端,基因組所科研人員開發了ParaAT,成功解決了此項科研難題。ParaAT可實現多組同源編碼蛋白質DNA序列的並行比對,不僅解決了大規模、多組同源序列的比對工作,同時也大大降低了運行時間,獲得了較好的並行加速比(speedup),適合海量數據的分析工作。

ParaAT可在不同作業系統下運行,支持多種不同的輸出格式,方便後續相關的生物信息學分析(如用於檢測自然選擇壓力的KaKs_Calculator)。(生物谷Bioon.com)

A parallel tool for constructing multiple protein-coding DNA alignments

Zhang Zhanga, Jingfa Xiaoa, Jiayan Wua, Haiyan Zhangb, Guiming Liua, Xumin Wanga, Lin Dais

Constructing multiple homologous alignments for protein-coding DNA sequences is crucial for a variety of bioinformatic analyses but remains computationally challenging. With the growing amount of sequence data available and the ongoing efforts largely dependent on protein-coding DNA alignments, there is an increasing demand for a tool that can process a large number of homologous groups and generate multiple protein-coding DNA alignments. Here we present a parallel tool – ParaAT that is capable of parallelly constructing multiple protein-coding DNA alignments for a large number of homologs. As testified on empirical datasets, ParaAT is well suited for large-scale data analysis in the high-throughput era, providing good scalability and exhibiting high parallel efficiency for computationally demanding tasks. ParaAT is freely available for academic use only at http://cbb.big.ac.cn/software

相關焦點

  • BBRC:章張等開發出編碼蛋白質DNA序列並行比對工具ParaAT
    近日,國際雜誌Biochemical and Biophysical Research Communications在線刊登了中國科學院北京基因組研究所基因組科學與信息重點實驗室「百人計劃」章張研究員團隊的最新研究成果,研究者成功開發出「編碼蛋白質DNA序列並行比對工具—ParaAT(Parallel Alignment and back-Translation
  • 常用在線序列比對工具
    常用的在線序列比對工具主要由EMBL-EBI提供,包括但不限於Needle, Water, Clustal Omega, Muscle, Mafft, T-coffee等,以及NCBI提供的blast2seq工具;常用的序列相似性搜索工具有NCBI提供的BLAST、UCSC提供的BLAT等。EMBL-EBI與NCBI同時期也開發了一套序列相似性搜索工具FASTA,然後最終沒能流行起來。
  • 科學家發明蛋白序列比對新工具
    by HMM-HMM alignment」的文章,介紹一種能提高蛋白序列比對分析的新工具:HHblits,這是一種能極大增加蛋白功能性分析技術的軟體,能通過新穎的序列尋找方法,更快更準確的識別資料庫中具有相似序列的蛋白,比現有的方法能快2500倍!
  • Nat Methods:蛋白序列比對新工具HHblits更快更準
    蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。因此對於序列相似的蛋白來說,生物信息學方法能預測出其進化相關性,從而預測出相似的結構和功能。
  • Methods:德發明蛋白序列比對新工具——HHblits
    蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。因此對於序列相似的蛋白來說,生物信息學方法能預測出其進化相關性,從而預測出相似的結構和功能。
  • 【科研工具】做序列比對,這個工具最好用!
    在做基因分析的實驗室裡,經常要做序列比對(sequence alignment),多數人都會選擇用NCBI上的BLAST工具。其實,用一個名叫BLAT的工具,有時可以體驗到更好的比對效果。如果序列中包含內含子,可以一目了然看到內含子序列及其在染色體上的位置。另外,BLAT也同樣可以處理DNA,RNA和蛋白質序列的比對。線上BLAT工具在genome.ucsc.edu上,當然也可以下載這個工具的安裝版,在線下做比對分析。
  • 多重序列比對(MSA)分析工具怎麼選,看這一篇就夠了
    多序列比對(multiple sequences alignment,MSA)是開展進化生物學研究的前提,後續可以進行選擇壓力分析以及推斷物種系統發育歷史。多序列比對表示不同序列中的胺基酸/核苷酸的位點同源性。
  • 序列比對綜合分析軟體
    Jellyfish 3.3.1這隻水母不簡單,可以用來進行DNA翻譯,序列比對,限制酶消化,提交序列進行BLAST,研究項目管理等。ProSeq 3.5PROcessor of SEQuences的縮寫,是一個核酸序列編輯與種群遺傳學分析軟體。SMS 2為Sequence Manipulation Suite的縮寫,是DNA與蛋白序列分析與格式化在線工具的集合。
  • 多序列比對分析-Dnaman很好用!
    ,是生物學家必備工具之一。序列載入打開Dnaman軟體,如下圖,第一欄為主菜單欄,有12個常用主菜單;第二欄為工具欄;再下面為瀏覽器欄中可以節約存取序列時間,加快分析速度,序列裝載如下圖所示,也可以點擊工具欄中的File seq圖標進行序列裝載。
  • 序列比對及Blast的應用
    早期的序列比對是全局的序列比較,但由於蛋白質具有的模塊性質,可能由於外顯子的交換而產生新蛋白質,因此局部比對會更加合理。通常用打分矩陣描述序列兩兩比對,兩條序列分別作為矩陣的兩維,矩陣點是兩維上對應兩個殘基的相似性分數,分數越高則說明兩個殘基越相似。
  • 如何獲取蛋白序列並進行序列比對?
    今天我們就來說一下具體的方法,先介紹蛋白序列的獲取和序列比對。以Sox家族的蛋白為例,我們首先通過Uniprot資料庫(http://www.uniprot.org/)獲取蛋白序列:這是打開後是序列,我們看到包括了Sox9,Sox2,Sox11等蛋白的序列,這樣我們就拿到Sox家族的各條序列了,接來下我們進行序列比對。
  • 新算法助力大規模多序列比對
    新算法助力大規模多序列比對 作者:小柯機器人 發布時間:2019/12/3 12:33:22 近日,西班牙巴塞隆納科學技術學院Cedric Notredame、Evan Floden等研究人員合作開發了可用於大規模多序列比對(
  • 乾貨 | 一款超好用的 DNA 序列比對軟體
    今天給大家強烈推薦一款 DNA 比對軟體:APE(a plasmid editor)這款軟體不僅能做 DNA 序列比對,DNA 序列翻譯,還能夠做引物設計,酶切位點設計,質粒圖譜構建(這個還是 snapgene 更好用,不過人家是收費的),ORF
  • 序列比對軟體
    今天小編特意給大家整理分享了有關序列比對綜合分析的軟體,聰明的你們快來試試有沒有心儀的軟體工具。Geneious         序列綜合分析軟體(https://www.geneious.com/)ClustalW  2.1用來對核酸與蛋白序列進行多序列比對(multiple sequence alignment
  • 日本開發出快速解讀DNA鹼基序列新技術
    新華網東京7月6日電(記者錢錚)日本研究人員在6日的英國《自然納米技術》雜誌網絡版上發表論文說,他們開發出只需少量DNA(脫氧核糖核酸)就能快速解讀其鹼基序列的新技術。這將有助於提高基因診斷、犯罪偵破等工作效率。
  • 【陪你學·生信】九、多序列比對-Multiple Sequence Alignment(MSA)
    聽上去都是生物研究中需要分析的基礎項。那麼怎麼做?就是將目標序列與資料庫中多條同源序列的相似部分擺放在同一欄,同一位置。有一些工具可以幫助我們進行多序列比對,但是最好再根據結構、進化、功能、序列相似性人工矯正一下比對結果。
  • 手把手教你用DNAMAN進行多序列比對
    首先準備好序列文件,DNA或Protein。DNAMAN做多序列比對所用到的序列並不需要FASTA格式。但每一條序列都需要放在一個單獨的文件中。準備好序列之後,便可進行多序列比對了。打開DNAMAN軟體。點擊序列-比對-多序列比對。
  • 開發出單鏈DNA/RNA摺紙術
    如今,在一項新的研究中,來自美國亞利桑那州立大學和哈佛大學的研究人員在DNA納米技術上取得一項重大的新進展。他們開發出的一種被稱作單鏈摺紙術(single-stranded origami, ssOrigami)的新策略使用長而細的麵條狀的單鏈DNA或RNA,它們能夠自我摺疊成迄今為止最大最複雜的而且沒有拓撲結的結構。
  • Rad54在同源重組時驅動DNA序列比對
    Rad54在同源重組時驅動DNA序列比對 作者:小柯機器人 發布時間:2020/6/6 21:33:46 2020年6月4日,《細胞》雜誌在線發表了美國哥倫比亞大學Eric C.
  • STAR:轉錄組數據比對工具簡介
    STAR是一款RNA_seq數據專用的比對軟體,比對速度非常快,最大的優勢是靈敏度高,GATK推薦採用STAR比對,然後進行下遊的SNP分析。GCF_000001405.38_GRCh38.p12/GCF_000001405.38_GRCh38.p12_assembly_structure/Primary_Assembly/Ensembl連結如下ftp://ftp.ensembl.org/pub/release-93/fasta/homo_sapiens/dna