HaMStR鑑定直系同源基因

2021-01-20 生信百科

直系同源的基因通常具有相似的生物學功能,所以我們在進行一個未知序列的功能的鑑定的時候,本質上是在找功能已知的同源基因。對於兩個或者多個物種的同源基因進行鑑定,是功能基因鑑定、比較基因組、功能基因分類、pathway預測等待的基礎。

       HaMStR是一款主要針對EST或者RNA-seq數據尋找直系同源基因的集成分析軟體(網址:http://www.deep-phylogeny.org/hamstr/)。與Inparanoid和OrthoMCL等同樣功能的軟體相比,由於它自身集成了多種軟體,HaMStR對數據的完整性要求不高,最後分析的結果更加全面可靠。HaMStR除了核心軟體包以外,還提供了一個現有的模式植物的核心直系同源基因資料庫,在大多數場景下使用非常有效。


在安裝HaMStR之前,需要先安裝一下四個集成的軟體:

hmmsearch3:http://hmmer.janelia.org/

blastall:ftp://ftp.ncbi.nih.gov/blast/executables/release/

genewise:ftp://ftp.ebi.ac.uk/pub/software/unix/wise2/

clustalw2 :http://www.clustal.org/download/current/

       這些軟體安裝過程相對簡單,只需要按照說明操作來安裝,並將每個軟體的可執行程序加入到環境變量中。以blastall為例,下載解壓後即可直接執行,執行如下命令就可以加入到環境變量中:(注意將BLASTHOME替換成blastall的實際目錄)

export PATH=$PATH:BLASTHOME /bin

需要額外注意的一點是, genewise軟體需要設置WISECONFIGDIR變量,可以用如下命令:(注意將$genewise2.2_HOME_PATH替換成實際目錄)

export WISECONFIGDIR=$genewise2.2_HOME_PATH/wisecfg

HaMStR軟體直接解壓即可使用,它的可執行程序在bin目錄下。

簡要介紹HaMStR的使用。
調用HaMStR時,直接使用命令:(注意將$HAMSTR_PATH替換成實際目錄)

$HAMSTR_PATH/bin/hamstrsearch_local-hmmer3.v9.pl -sequence_file=testset.fa -est -taxon=test -hmmset=modelorganisms_hmmer3 -refspec=DROME -representative -hmm=317.hmm


各參數的含義:

-sequence_file=要輸入est或蛋白fasta格式文件(即要進行要找同源基因的文件)

-est :表示輸入的文件是est,如果是蛋白則用-protein

-taxon 指定輸入文件序列的物種名

-hmmset:指定的core-ortholog set是一個文件夾的形式,默認在該軟體根目錄下core_orthologs下。如果要生成自定義的core-orholog set文件,可以用Inparanoid和OrthoMCL產生相關的core-ortholog,然後利用相關的軟體產生上述文件夾中的各個文件。

-refspec:與core-ortholog set進行比對時指定core-ortholog set中的參考物種

-representative:比對的結果中僅選取最佳的比對的結果

-hmm=317.hmm:指定要比對的同源基因的家族,如果不指定該參數則和所有的比對

由於hmmset涉及的軟體較多,僅介紹該軟體使用過程中的要點,其他的詳細信息參考該軟體的readme和其他相關軟體的使用。


轉自:https://mp.weixin.qq.com/s/F7Q--JNz4zR9qOOQpQ5mdg


為了便於交流、討論,我們建立了一個QQ群 (575383226),歡迎大家積極加入。

如果喜歡我們的文章,歡迎訂閱我們的公眾號。


相關焦點

  • 中國農大提出同源基因推斷新策略,並構建小麥族同源基因資料庫
    中國農業大學農學院小麥研究中心通過引入基因共線性的信息,開發了同源基因推斷的新算法——GeneTribe,並以此為基礎構建了小麥族同源基因資料庫—— TGT(Triticeae-GeneTribe)。考慮到同源基因分析中「直系同源」、「旁系同源」等經典概念的定義具有不可傳遞性,且應用於遺傳距離較近的基因組間的研究時容易出現「歧義」,該工作提出了包含四類同源基因表格的基礎數據結構方案(圖1)。
  • 一作解讀|Mol Plant中國農大小麥研究中心提出泛基因組時代同源基因推斷新策略並構建小麥族同源基因資料庫
    通過融合序列相似性和基因共線性信息開發了適用於植物泛基因組時代同源基因推斷的新策略(GeneTribe),並構建了以小麥族物種為核心的「小麥族同源基因資料庫」(Triticeae-GeneTribe, http://wheat.cau.edu.cn/TGT/)。
  • 同源重組基因敲除技術
    2、基因敲除(knockout)是用含有一定已知序列的DNA片段與受體細胞基因組中序列相同或相近的基因發生同源重組,整合至受體細胞基因組中並得到表達的一種外源DNA導入技術。它是針對某個序列已知但功能未知的序列,改變生物的遺傳基因,令特定的基因功能喪失作用,從而使部分功能被屏蔽,並可進一步對生物體造成影響,進而推測出該基因的生物學功能。
  • 《鼠年說鼠》第十四期:CRISPR/Cas9條件性基因敲除鼠如何鑑定?
    《鼠年說鼠》系列文章,每周二更新,專門解答大小鼠鏟屎官們在養鼠過程中經常遇到的繁育與鑑定類的問題,同時向大家徵集問題,任何基因編輯鼠飼養繁殖或鑑定的困惑統統可以丟給小賽,小賽會給您回復或統一在後面的內容為大家做出詳細的解答。
  • 如何尋找同源基因---OrthoFinder
    構建物種的系統發育樹,計算kaks值或者比較基因組學和進化的其他分析都少不了需要尋找同源基因。
  • 每日摘要:美洲黑楊雌雄異株的性別決定基因鑑定(bioRxiv)
    除了雙基因系統之外,單基因控制的雌雄異株也存在。在玉米(maize)和甜瓜(melon)中,人為設計出了該系統;而在柿子(persimmon)中則是天然演化出了單基因控制系統,柿子Y染色體上的假基因OGI通過抑制常染色體上的旁系同源基因MeGI來作用於雄花的特化。1.
  • 我國魚類免疫、抗病毒相關基因鑑定闡明分子機理
    中國科學院水生生物研究所最近在魚類抗病毒和免疫的分子研究上取得突破:分離、鑑定了一批參與魚類抗病毒和免疫反應的基因,尤其是魚類幹擾素系統基因。該研究成果對進一步闡明魚類抗病毒免疫的分子機制,以至推動魚類抗病毒藥物的研製和抗病毒育種技術的建立都具有重要的理論指導意義。 魚類病毒性疾病是至今無法解決的世界性難題。
  • 如何快速查找物種間對應的同源基因
    1.基於NCBI HomoloGene資料庫查找物種間對應的同源基因NCBI HomoloGene資料庫收集了部分已經完成基因組測序物種的同源基因數據。資料庫現包含21個物種,共44233組同源基因;HomoloGene的數據是開放的:FTPhomologene.data存放著同源基因的對應關係HID(HomoloGene group id)Taxonomy IDGene IDGene SymbolProtein
  • 出現假陽性結果的另一種可能是樣品中存在有靶基因的同源序列
    出現假陽性結果的另一種可能是樣品中存在有靶基因的同源序列。為了避免因汙染而造成的假陽性,PCR操作時要隔離不同操作區、分裝試劑、簡化操作程序,使用一次性吸頭。PCR擴增DNA片段只是一個重要手段。擴增片段的檢測和分析才是目的,根據研究對象和目的的不同而採用不同的分析法。
  • 尋找同源基因工具OrthoMCL與OrthoFinder的安裝與使用
    通過對不同親緣關係物種的基因組序列比較,能夠鑑定出編碼序列、非編碼序列及給定物種獨有的序列。而基因組範圍內的序列比對,可以了解不同物種核苷酸組成、同/共線性關係和基因順序異同,有助於理解基因分析定位、系統發育關係。其中,比較基因組學的重要一部分正是系統進化關係的研究,由此對基因家族分析,基於單拷貝基因的串聯比對分析構建系統進化樹是其中的一環。
  • 基因家族專題(3):基因家族成員的鑑定
    這裡就需要用到HMMER,來鑑定物種某一基因家族。http://hmmer.org/download.html HMMER3.1 manual:http://eddylab.org/software/hmmer3/3.1b2/Userguide.pdfhmmbuild/hmmsearch/hmmscan/hmmalign 這幾個功能是主要用於蛋白質結構與分析和注釋的hmmer中小工具在鑑定基因家族時
  • biomaRt包實現不同物種之間同源基因轉換
    假如我們研究某藥物的抗腫瘤效果,涉及到機制,最終都會往人上靠的,一般幾個基因,資料庫直接查一下就可以啦。但如果基因很多,人工查就不太現實,一般也是測序後的數據。所以在這裡我給大家介紹一下,不同物種之間的同源基因名稱轉換,這種轉換是基於物種間基因的同源性的。同源基因是由一個共同祖先在不同物種中遺傳的基因。雖然同源基因在序列上是相似的,但相似的序列不一定是同源的。
  • 滴血認親VS DNA鑑定
    「滴血認親」類似於用現代的紅細胞凝集反應檢驗血型,來鑑定親子關係的方法。那麼,在科學技術日趨完善的今天,我們是通過什麼方式來做親子鑑定的呢?想必很多人都有所耳聞,那就是DNA鑑定。「DNA親子鑑定」,又叫做「親權鑑定」,是法醫物證鑑定的一項重要手段。DNA鑑定依託於遺傳學原理,運用現代生物學技術,將被鑑定者的特定DNA片段進行提取和檢測,同時對相應結果進行計算、分析,從而得出準確的鑑定結論。
  • 看懂質粒圖譜,學會同源重組構建質粒
    理想的運載體是質粒(plasmid),在基因工程中,常用人工構建的質粒作為載體。載體構建即是構建含外源DNA的質粒。本文主要為大家介紹質粒圖譜的閱讀及通過同源重組構建質粒的方法:構建質粒,學習閱讀質粒圖譜是必不可少的一環,下圖為實驗室常用的一種質粒:(1)箭頭:大多數質粒都會有箭頭,箭頭有兩種解釋。
  • PNAS發表小麥等異源多倍體物種部分同源重組事件重要進展
    部分同源重組(homoeologous exchange, HE)特指異源多倍體中具有高序列相似度的部分同源染色體之間通過配對交叉(cross-over)而導致的大規模染色體片段交換的現象,影響著基因組的結構變化和基因表達。
  • 基因複製後旁系同源基因未被重新刪除並功能分化的機制
    基因複製是一個新基因的重要來源,大多數基因複製模型假設複製前基因的祖先功能是獨立的,因此後代的旁系之間可以整齊地劃分。然而,許多基因產物,如轉錄調節因子這種蛋白質的複製和分化的一個自然結果可能是同類之間的競爭幹擾。作者認為平行幹擾是基因重複進化的常見約束,解決它會產生額外的調控複雜性,需要穩定基因組中的重複基因。
  • 等位基因只存在於同源染色體上嗎?核基因在染色體的存在位置的幾個誤區
    誤區1.同源染色體的相同位置只存在等位基因        在遺傳學上,把控制相對性狀的基因叫做等位基因。一般位於同源染色體的相同位置。因此,很多學生就認為同源染色體的相同位置只存在等位基因,實際上同源染色體的相同位置上除了等位基因以外,還可以是相同的基因。
  • 華中師大徐文亮團隊鑑定調控棉花纖維次生細胞壁發育的MYB基因
    最近,華中師範大學徐文亮團隊系統分析了四倍體陸地棉基因組中的R2R3類MYB轉錄因子,並發現了可能影響棉花纖維發育的新基因。研究人員通過系統分析棉花基因組,鑑定出了419個R2R3類MYB轉錄因子,結合系統發生、RNA-seq、共表達分析,發現有36個R2R3-MYBs在開花後20天的纖維中表現出具有高表達(或優勢表達)的特徵。
  • 日本科學家團隊利用水稻稻瘟菌開發了同源重組基因編輯系統
    日本科學家團隊利用水稻稻瘟菌開發了同源重組基因編輯系統 微信公眾號「中國農業轉基因管理」 2019-07-02 17:57
  • 一種免費的開源可視化工具 可以對同源基因進行深入比較
    一種免費的開源可視化工具 可以對同源基因進行深入比較 2018-10-26 14:39:13 來源:sciencedaily Aequatus是Earlham Institute(EI)開發的一種新型生物信息學工具,它有助於深入了解不同物種之間的同線信息