2018-10-26 14:39:13 來源:sciencedaily
Aequatus是Earlham Institute(EI)開發的一種新型生物信息學工具,它有助於深入了解不同物種之間的同線信息,提供一個系統,以更好地識別重要的,正向選擇的和進化保守的區域。脫氧核糖核酸。
通常,密切相關的生物顯示出高度的同線性,即它們沿著染色體具有相似的序列,其中假定具有相同功能的密切相關的基因聚集在物種之間的類似組織中。因此,許多人類基因與哺乳動物具有高度的同線性,從黑猩猩到小鼠。
研究生物之間的同線性可以幫助我們確定遺傳區域如何通過進化發生變化,並且具有深遠的應用 - 包括更好地了解進化和我們如何形成,幫助研究人類健康,以及培育更好的作物。
數據基礎設施小組的Anil Thanki說:「我們對Aequatus非常興奮,因為它提供了一種非常直觀的方式來顯示物種間的同源基因.Eequatus使用可用於表示基因組數據的最新網絡技術提供無縫的用戶體驗。生物學家通過在基因組特徵水平上比較它們來深入研究同源基因的細節。我們還將此資源與SMART蛋白質域信息伺服器聯繫起來,讓研究人員無需切換服務即可獲得相關數據。
屢獲殊榮的實際應用程式
除了在GigaScience上發布Aequatus工具外,EI的Davey集團的主要開發商Anil Thanki被提名為ICG-13獎項,該獎項是第13屆中國深圳基因組學國際會議。
Aequatus採用開源技術構建,提供快速,直觀的基於Web的瀏覽體驗,彌合系統發育變化與基因特徵信息之間的差距。
Aequatus的開發產生了一個開源JavaScript庫 - Aequatus.js - 它保留了完整可視化應用程式的功能,但可以與其他Web應用程式集成,例如非常流行的Galaxy生物信息學工作流平臺。
其中一個應用程式是最近發布的GeneSeqToFamily工具,這是一個基於Ensembl Compara GeneTrees管道的Galaxy工作流程,用於查找基因家族。Aequatus插件已在Galaxy中提供,以便可視化從GeneSeqToFamily獲得的基因家族。
一種新穎,更完整的可視化工具
而傳統的系統發育樹(「家譜」中共享祖先的可視化)提供了同線性的概述,而Aequatus也提供了有關基因結構變化的信息,包括其中與表型(外觀)變化相對應的變異。
使用「指導」基因作為參考,基於比對定位其他基因(序列相似性的分析,或基於它們的DNA或蛋白質序列兩個基因彼此相關的接近程度)。從開源資料庫,Ensembl Compara和Ensembl Core中檢索比對,然後Aequatus處理比較和特徵數據,以基於共享的配色方案提供物種之間的系統發育和結構變化的視覺表示。
使用Aequatus工具可視化的典型基因樹。
這有助於可視化同源區域,同時還允許識別基因的變化,例如插入或缺失,黑條表示與「指南」相比特定於給定基因的插入。
總體而言,Aequatus提供了一種獨特的方式來探索各種物種基因之間的複雜關係,這種關係迄今尚未實現。Aequatus不僅適用於包括小鼠和人類在內的高質量參考基因組,而且設計用於難以組裝或非模型生物。
最新版本的Aequatus還支持Ensembl REST API,它可以直接從Ensembl伺服器檢索數據,並且不需要使用本地數據來提高Aequatus的可移植性。
數據基礎設施小組負責人Rob Davey補充說:「很高興看到這項工作在國際會議上發表並確實被選中。這表明基因組數據的可視化仍然是一個活躍而有價值的研究領域,而Aequatus確實可以幫助研究人員獲得有關其基因和感興趣的生物的更細粒度的信息。「