推薦2個核酸序列翻譯成胺基酸序列的小工具

2021-01-21 基迪奧生物

之前,生信交流群(群號:154447756)有小夥伴想比較突變後的核酸序列翻譯成蛋白序列與野生型相應序列的差異,問如何把核酸序列翻譯成蛋白序列。

 


這裡為大家推薦2個在線小工具,可查找DNA或RNA序列的開放閱讀框(ORF),同時將其翻譯成胺基酸序列。雖然使用方法非常簡單,但非常有用,比如可分析circRNA、LncRNA是否具有翻譯潛能(是否有ORF)等。

 


打開這個小工具的頁面(如下)

網址:https://web.expasy.org/translate/



大家只需將核酸序列複製粘貼到序列框中,選擇輸出胺基酸序列格式(主要是如何突出起始和終止密碼子),然後點 TRANSLATE SEQUENCE 按鈕即可。

 

至於所用的「密碼錶」,用默認的Standard即可,如果有特殊需求,也可選用其他版本。點Genetic code,會進入所有密碼錶(共有31個)的介紹頁面,如下圖。



下面是默認的標準密碼子表:



光說不練是假把式,這裡用家鼠的AQP1序列(NM_007472.2)做簡單的演示。回到首頁,點New translate tool,進入新版translate tool的頁面,如下,新版的用起來更舒服一點。



把核酸序列粘貼到序列框中,參數保持默認,點TRANSLATE按鈕即可完成翻譯。



在6個大的Frame中,選紅色標記最長(中間無間斷)的ORF作為翻譯序列,如下圖Frame1的第1個ORF。




另一個在線小工具是NCBI的ORFfinder,如下:

網址:https://www.ncbi.nlm.nih.gov/orffinder/



使用方法和ExPASy Translatetool相似,在線版本的可提交的最長序列為50kb,當然也可以下載Linux本地版本,這樣就沒有序列長度的限制啦。這裡仍以家鼠的AQP1序列(NM_007472.2)為例,這裡將最小的ORF長度設為300nt,僅使用「ATG」作為起始密碼,然後點 Submit 按鈕。



結果如下,共找到兩個ORF,其中ORF1 (193~1002)與ExPASy Translate tool得到的序列(269aa)完全一樣。



在NCBI搜索AQP1序列(NM_007472.2),簡單驗證下這兩個在線工具ORF的查找結果。可以看到兩個工具的翻譯結果與NM_007472.2的CDS區域翻譯結果一致。


 

以上就是這兩個在線工具的介紹,今天的內容就到這裡啦~


相關焦點

  • 序列比對及Blast的應用
    用一組BLAST程序聯配可以快速進行核酸和蛋白質序列庫的相似性檢索。採用BLAST的基本算法編成了若干各不同的程序,分別使用特定的序列庫和用於特定類型的輸入序列。BLASTN是在核苷酸序列庫搜索核苷酸序列。BLASTP是在蛋白質序列庫中搜索胺基酸序列。TBLASTN則可以在核酸序列庫中搜索胺基酸序列,此時序列庫在搜索之前要按所有6種讀框即時翻譯。
  • 如何獲得已知DNA序列所編碼的胺基酸序列
    /emboss_transeq/ , 輸入具體鹼基序列。2. DNA序列可能按六種框架閱讀和翻譯(每條鏈三種,對應三種不同的起始位點),所以FRAME 參數可以選擇6 (ALLsix frames),CODON TABLE一般選擇StandardCode。
  • 阿里雲高效基因序列檢索助力新冠肺炎病毒序列快速分析
    圖2:SARS病毒相關論文檢索分類結果單擊上圖幹擾素連結可以查看相關論文,當前系統調用了自動翻譯軟體,抽取中文版文件名關鍵詞作為文件名,方便用戶閱讀。總體而言,AnalyticDB for MySQL基因向量抽取算法分為三步:(1)在胺基酸序列中定義詞。生物信息學中用K-mers來分析胺基酸序列,K-mer是指將核酸序列分成包含K個鹼基的字符串,即從一段連續的核酸序列中迭代選取長度為K個鹼基的序列,若核酸序列長度為L,K-mer長度為K,那麼可以得到L-K+1個K-mers。
  • MIT新研究:用AI把胺基酸序列編碼成曲子,還能「創造」新蛋白質
    研究下載地址:https://pubs.acs.org/doi/pdf/10.1021/acsnano.9b02180它提供了一種將蛋白質的胺基酸序列「翻譯」成音樂序列的系統方法,並且能通過分子的物理特性來確定所屬的聲音。
  • 序列比對軟體
    今天小編特意給大家整理分享了有關序列比對綜合分析的軟體,聰明的你們快來試試有沒有心儀的軟體工具。Geneious         序列綜合分析軟體(https://www.geneious.com/)ClustalW  2.1用來對核酸與蛋白序列進行多序列比對(multiple sequence alignment
  • 科學家腦洞大開,將胺基酸序列轉化為音樂
    最近美國化學學會在介紹一個蛋白質設計中的應用研究時,提出將胺基酸序列轉化為音樂成分的方法,一起來了解一下。研究人員將蛋白質序列翻譯成音樂作品作曲家將不同音高和持續時間的音符串在一起以創作音樂。類似的,細胞將具有不同特徵的胺基酸連接在一起以製備蛋白質。現在研究人員通過將蛋白質序列翻譯成音樂作品,然後使用人工智慧將聲音轉換為全新的蛋白質,彌合了這兩個看似完全不同的過程。
  • 常用在線序列比對工具
    BLAST一家獨大,BLAT依賴UCSC佔據一點小市場,FASTA的親爹同時提供了FASTA及BLAST服務,可能現在說FASTA人們只會想到FASTA文件格式吧。EMBL-EBI提供大量的對比工具在線服務,並不代表其擁有這些工具的所有權。
  • 阿里雲推出高效病毒基因序列檢索功能,它的底層邏輯原來是這樣的
    同時,阿里雲AnalyticDB提供了強大的機器學習分析工具,通過基因轉向量技術,將局部的和疾病相關的關鍵的靶點基因片段轉成特徵向量,用於基因藥物的設計,從而大大加速了基因分析過程。2. 基因檢索應用2.1 基因檢索功能新冠狀病毒的RNA序列可以表達一串核酸序列(又叫鹼基序列)。
  • 多序列比對分析-Dnaman很好用!
    軟體主要功能匯總1、DNA序列轉化、翻譯2、多序列比對分析3、系統進化樹分析4、DNA序列組裝和編輯5、BLAST通過網絡界面在Intranet / Internet Server上進行搜索6、SiRNA選擇器7、限制性內切酶酶切分析8、翻譯和密碼子使用分析9、蛋白質疏水性/
  • 基因組序列太深奧?用這套工具能讀懂
    原標題:基因組序列太深奧?用這套工具能讀懂 基因組測序工作完成後,哪些基因能翻譯蛋白、能翻譯哪些蛋白,一直是生命科學研究的熱點和難點。近日,中國科學院水生生物研究所葛峰學科組在這一問題上取得突破性進展,相關研究成果於近日在線發表於國際期刊《分子植物》上。
  • 啟動子序列提取-EPD真核生物啟動子資料庫!
    起始密碼子和終止密碼子:mRNA的開放閱讀框架中,每3個相鄰的核苷酸編碼一種胺基酸,這種存在於mRNA開放閱讀框架區的三聯體形式的核苷酸序列稱為密碼子(codon);由A、U、C、G四種核苷酸可組成64個密碼子,其中有61個密碼子可編碼胺基酸。
  • 序列比對綜合分析軟體
    BLAST+ 2.2.28分成五個不同的程序,分別為:blastp(提交蛋白質序列,在蛋白質序列資料庫中查序列)、blastn(提交核酸序列,在核酸序列資料庫中查找同源序列) blastx(提交核酸序列,在蛋白質序列資料庫中查找同源序列)、tblastn (提交蛋白質序列,在核酸序列資料庫中查找同源序列)、tblastx(提交核酸序列,在核酸序列資料庫中查找同源序列)。
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    由胺基酸和蛋白質組成的長鏈,將它們自己摺疊成精準3D結構,可以管理分子間活動的複雜問題。因為,蛋白質外形決定了它的功能和疾病中產生的功能紊亂,並影響蛋白質在分子生物學的中心地位,特別是用於治療科學和治病保健等藥物的發展。近些年,蛋白質通過自身的胺基酸序列可以實現被預測,在計算方法上有了巨大進步。
  • 質譜法蛋白質N/C端胺基酸序列分析技術服務
    目前N末端序列分析大多採取Edman降解法,但Edman降解法不能解決N端封閉和蛋白質修飾的測序問題,而質譜法測序則不受限制。蛋白質的C末端分析,並不能採取類似N端胺基酸序列分析的化學分析。無論是國內要求,還是國外藥典,現階段都是採取質譜法對蛋白質樣品的C末端序列分析。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    它們創造並保持細胞和組織的形狀;構成催化維持生命的化學反應的酶;充當分子工廠,運輸工具和電機;用作蜂窩通信的信號和接收器;以及更多。近年來,計算方法在基於其胺基酸序列的知識預測蛋白質如何摺疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和範圍方面受到限制。現在,哈佛醫學院的一位科學家使用了一種稱為深度學習的人工智慧來預測基於其胺基酸序列的任何蛋白質的三維結構。
  • 把蛋白質序列編碼成樂譜,會奏出怎樣的音樂?
    據描述,這個系統將20種胺基酸轉換成20個音調的音階,而胺基酸是蛋白質鏈的組成部分。如此一來,任何蛋白質的胺基酸序列都可以轉變成音符序列。描繪了溶菌酶結構的分子示意圖,這是研究人員在轉化為音樂實驗中所使用的蛋白質之一。
  • 多重序列比對(MSA)分析工具怎麼選,看這一篇就夠了
    它是一種針對DNA、密碼子(codon)和胺基酸序列的概率多重比對程序,基於一種新的算法,能夠確定各序列在與其共同的祖先分化後發生的鹼基替換,插入(insertion)或缺失(deletion)事件。此外,PRANK可以重新構建其祖先序列,有DNA翻譯以及回譯選項( DNA translation/back-translation)。
  • 科學家發明蛋白序列比對新工具
    :HHblits,這是一種能極大增加蛋白功能性分析技術的軟體,能通過新穎的序列尋找方法,更快更準確的識別資料庫中具有相似序列的蛋白,比現有的方法能快2500倍! 領導這一研究的是慕尼黑大學基因中心的Johannes Söding博士,他表示,「我們的方法能延伸序列分析的廣度和力度,從而能方便之後的蛋白結構和功能的解析。」 蛋白存在於生命中幾乎所有生化過程中,一個蛋白的功能很大程度上依賴於其20種胺基酸排列組合的順序,以及胺基酸序列組成的三維空間結構。
  • 如何應用質譜儀進行胺基酸序列測定
    【作者】知行,格羅寧根大學 代謝組學博士在讀【責編】Ryan第一步是蛋白酶切(Digestion) 成肽段
  • 乾貨時間 | 序列比對,科研必備的幾款軟體!
    BLAST(Basic Local Alignment Search Tool)可以說是短序列比對中最常用的比對工具了,它不僅支持核酸和蛋白的雙序列比對,而且可以在蛋白質資料庫或DNA資料庫中進行相似性比較,找到與查詢序列相似的序列。