GeneMark-ES:真核生物編碼基因預測軟體

2020-10-18 生信修煉手冊

GeneMark-ES軟體用於預測真核生物中的蛋白編碼基因,和其他預測基因結構的軟體不同,它採用的是非監督算法,可以不依賴訓練集進行預測。官網如下

http://exon.biology.gatech.edu/GeneMark/gmes_instructions.html

安裝過程如下:

wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_lqacT/gm_key_64.gzwget http://topaz.gatech.edu/GeneMark/tmp/GMtool_lqacT/gm_et_linux_64.tar.gztar xzvf gm_et_linux_64.tar.gzgunzip gm_key_64.gzcp ../../gm_key_64 ~/.gm_key

gm_key文件是軟體的通行證,需要拷貝到家目錄下,軟體本身只需要解壓縮就可以了。

基本用法如下

gmes_petap.pl --ES  --cores 10--sequence genome.fa

gmes_petap.pl本身整合了geneMark-ES和geneMark-ET兩個功能,genemark-ES用於基因組數據的預測,geneMark-ET用於轉錄組數據的預測。

--ES表示採用genemark-ES算法,--cores指定並行的CPU個數,--sequence指定輸入的fasta格式的序列。

對於真菌,有專門的參數,示例如下

gmes_petap.pl --fungus  --cores 10--sequence genome.fa

默認配置下,輸出文件名為genemark.gtf, 保存在軟體的安裝目錄,採用GTF格式來記錄基因的結構信息。

相關焦點

  • 真核基因表達以正性調控為主導
    換言之,真核基因表達以正性調控為主導,真核生物基因大部分是正調節機制的主要原因是染色質內儲存的DNA使大部分啟動子具有不可接觸性,因此,在其他調節作用不在的時候基因總是沉默的。另些採收正調節的原因是真核基因組太大及正調節作用更同單,高效。
  • 啟動子序列提取-EPD真核生物啟動子資料庫!
    5. 5'帽子(cap):真核生物mRNA的5'端有特殊的帽子(cap)結構,它由甲基化鳥苷酸經焦磷酸與mRNA的5'末端核苷酸相連,形成5',5'-三磷酸連接(5',5'-triphosphate linkage);這種結構有抗5'-核酸外切酶的降解作用;在蛋白質合成過程中,它有助於核糖體對mRNA的識別和結合,使翻譯得以正確起始。
  • 人類首次人工合成真核生物染色體
    真核生物雖然也有人工合成的染色體,但由於其大多是原有染色體稍作改裝,常常含有許多的冗餘部分,比如假基因和轉座子,各方面性能都不如synIII。因此,傑夫·伯克認為,這是一項具有裡程碑意義的研究成果,「就像第一個人類基因組被測序完成一樣」。  據陳軍教授介紹,與原核生物不同的是,真核生物的基因組要複雜得多。
  • Nat Microbiol | 真核系統基因迴路的自動化設計
    該文章在發展釀酒酵母轉錄調控元件定量設計的基礎上,首次實現了真核生物中基因迴路的自動化設計,並實現了大規模基因迴路長時間(包含11個轉錄因子,大於兩周時間)的穩定狀態切換和動態過程預測。Voigt團隊將工程與生物相結合,把廣泛應用於工程設計領域的計算機輔助設計軟體(Computer-aided-design,CAD)引入基因迴路設計,構建了第一代Cello平臺。
  • 上海生科院解析真核生物基因表達調控的新機制
    該研究揭示了染色質修飾與mRNA轉錄起始及加工的相互依存關係,兩者協同作用,以提高成熟mRNA及基因表達的水平。  生物體內編碼基因要正確執行其功能,需要經歷DNA的複製、轉錄和翻譯過程,即基因表達過程。真核生物基因表達的轉錄前水平調節是基因表達調控過程中最重要的環節,mRNA前體的轉錄起始在表觀遺傳學水平上受到多種轉錄因子以及染色質修飾與重塑的調控。
  • 這種「阿斯加德古菌」是真核生物的祖先,線粒體竟是「外來者」
    這一成果將有助於對迄今為止最接近真核生物的古細菌進行詳細的新陳代謝和細胞研究。人們認為,當兩種類型的單細胞合併,其中一種吞噬另一種時,真核生物就出現了。來自古菌域的一個細胞被認為吞噬了另一種細菌細胞,後者屬於α-變形菌(alphaproteobacterium)一類,被吞噬的細菌進化成了真核生物的產能細胞器——線粒體。
  • 非編碼RNA預測:rRNA
    在往期文章基因組編碼基因預測中介紹了CDS的預測,今天為大家介紹ncRNA的預測。由於ncRNA種類繁多,特徵各異,缺少編碼蛋白質的基因所具有的典型特徵,現有的ncRNA預測軟體一般專注於搜索單一種類的ncRNA,如tRNAScanSE搜索tRNA、snoScan搜索帶C/D盒的snoRNAs、SnoGps搜索帶H/ACA盒的snoRNAs、mirScan搜索microRNA等等。rRNA是細胞內含量最多的一類RNA,約佔RNA總量的82%。
  • 真核生物的啟動子與轉錄起始
    按照慣例,真核生物的啟動子更加複雜。真核生物有三種RNAP,所以有相應的三類啟動子。RNAP I負責轉錄rRNA,對應的是I類(class I)啟動子,由核心啟動子(-45至+20)和上遊控制元件(-180至-107)構成。
  • 真核生物與原核生物
  • 真核生物核糖體蛋白基因的轉錄調控
    在前基因組時期,構建基因調控網絡是最重要的問題之一然而,一個物種中包含有成千上萬的基因,因此構建基因調控網絡難度不言而喻。基於對核糖體蛋白(RP)基因近50年的研究,所以我們就可以通過這些基因更好地來理解和構建調控網絡。 RP基因的早期研究是在大腸肝菌中開始的,RP基因在原核生物中形成操縱子,一些RP蛋白還能夠結合到翻譯成這些蛋白的mRNA上,引起翻譯的終止,在翻譯水平形成一種RP基因的調控反饋網絡。
  • 真核生物的啟動子與轉錄起始
    按照慣例,真核生物的啟動子更加複雜。真核生物有三種RNAP,所以有相應的三類啟動子。RNAP I負責轉錄rRNA,對應的是I類(class I)啟動子,由核心啟動子(-45至+20)和上遊控制元件(-180至-107)構成。小RNA對應的III類啟動子又有3種類型,其中5 S rRNA基因和tRNA基因的啟動子都屬於下遊啟動子,即位於轉錄起點下遊。
  • 全球研究人員致力於創造首個合成真核生物基因組—新聞—科學網
    「理解一種生物體就應該能夠重新設計它」
  • 厭氧衣原體基因裡藏著真核生物進化的秘密
    它們生活在無氧的海床上,體內的產氫代謝基因使其能在無氧環境中生存。研究人員發現,我們的單細胞祖先從20億年前的衣原體那裡繼承了這些產氫代謝基因,這對現代生命的進化至關重要。現存生命可以分為真核生物(如動物、植物、真菌和變形蟲等)和原核生物(如細菌和古細菌等)兩大類。
  • 高中生物 | 原核生物與真核生物的區別
    原核生物與真核生物都是由細胞構成的,在細胞結構和生命活動等方面存在著許多差異。
  • 海底深處的厭氧衣原體基因裡,藏著真核生物進化的秘密
    它們生活在無氧的海床上,體內的產氫代謝基因使其能在無氧環境中生存。研究人員發現,我們的單細胞祖先從20億年前的衣原體那裡繼承了這些產氫代謝基因,這對現代生命的進化至關重要。現存生命可以分為真核生物(如動物、植物、真菌和變形蟲等)和原核生物(如細菌和古細菌等)兩大類。
  • 新年成長禮2|細菌基因組分析常用軟體整理(含下載連結)
    用途:真菌基因預測優點:從頭預測,能夠偵測在序列資料庫中缺少同源片段的編碼區下載地址:http://augustus.gobics.de/Barrnap用途:rRNA預測下載地址:https://github.com/tseemann/barrnap/archive/0.8.tar.gzBLAST+
  • CPAT:轉錄本蛋白編碼能力預測軟體
    對於轉錄組測序的數據而言,組裝得到轉錄本之後,首先要做的就是區分蛋白編碼和非蛋白編碼的RNA。目前針對這一問題,有多種解決方案,基本可以分為以下兩類alignment-basedalignment-free第一種算法基於序列比對,可以較好的識別保守性較好的蛋白編碼基因, 包括CPC,PhyloCSF等軟體; 第二種算法不需要比對
  • 細菌基因組信息分析與解讀專題系列(二)——細菌基因組注釋Ⅰ(基因預測和ncRNA)
    要解讀隱藏在這些字符和排列中的生命含義,就需要經過一個根據已有知識進行預測的注釋過程。 基因組注釋(Genome annotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點。基因組注釋的研究內容包括基因識別、基因組功能注釋,而基因組功能注釋包括基因預測、ncRNA、重複序列、CRISPR預測、分泌蛋白預測等。
  • 真核生物屬於古細菌嗎
    早在一百多年前,就誕生了一種被稱為內共生學說的生命起源假說,該學說認為,真核細胞中的線粒體和葉綠體等細胞器,起源於共生於真核生物細胞中(之內)的原核生物。線粒體起源於好氧性細菌,而葉綠體源於內共生的光合自養原核生物的藍細菌。新的研究表明,該假說可能進化為一個更激進的解釋。
  • 我國化學家取得真核生物基因組設計與化學合成的重大突破
    在國家自然科學基金創新研究群體項目和重大項目(項目編號:21621004,21390203)等資助下,天津大學元英進團隊在真核生物基因組設計與化學合成方向取得重大突破。該團隊完成了2條真核生物釀酒酵母染色體(synⅤ、synⅩ)的從頭設計與化學合成,相關研究成果分別以「『Perfect』designer chromosome V and behavior of a ring derivative」(完美設計合成五號染色體及其環化表型研究)和「Bug mapping and fitness testing of chemically synthesized chromosome