2019年8月5日,Nature Plants雜誌在線發表了來自福建農林大學基因組與生物技術研究中心題為「Assembly of allele-aware, chromosomal-scale autopolyploid genomes based on Hi-C data」的研究論文。該研究公布了ALLHiC算法,解決了同源高倍體組裝難題!
同源多倍體指的是同一物種經過染色體加倍形成的多倍體,在植物界比較常見,農業育種上有重要應用價值。然而,同源多倍體基因組的組裝卻是世界性難題。雖然近期發展的染色質構象捕獲(Hi-C)技術為染色體水平的組裝提供了便利,但組裝同源多倍體或者近期加倍的異源多倍體時,這一技術仍然面臨著很大的挑戰。目前除甘蔗基因組以外,尚沒有其他同源多倍體基因組可以準確組裝到染色體水平,這是由於多倍體基因組內多個單倍型之間存在很高的序列相似性。當用Hi-C技術掛載染色體時,同源染色體之間的Hi-C交聯信號會將序列相似度極高的等位片段連接在一起,導致同源染色體被錯誤地連接到一起,形成大量嵌合的組裝。
此次發表的論文公布了ALLHiC算法,通過修剪同源染色體之間的交聯信號,將等位基因和同源序列分隔在各自的單倍型內獨立組裝,從而減少了大量拼接錯誤。這個方法學上的突破使得一系列重要多倍體基因組直接從頭組裝成為可能,比如苜蓿、土豆等,或可用於修復已公布的多倍體物種基因組組裝序列中的錯誤。
圖為 ALLHiC算法流程和功能模塊
福建農林大學基因組中心明瑞光教授團隊多年來一直致力於複雜基因組和多倍體基因組學研究,並於2018年8月份利用ALLHiC算法成功破譯同源多倍體甘蔗割手密基因組,相關成果已於當年發表在《自然·遺傳學》期刊上。該團隊於2015年提出了ALLMAPS算法整合多張基因組圖譜,提高組裝的準確性和完整性,迄今引用100餘次,並用於破譯高度雜合的菠蘿基因組,相關成果發表在當年的《自然·遺傳學》期刊上。
福建農林大學為文章的第一作者單位和通訊作者單位。基因組中心張興坦副教授為論文第一作者,唐海寶教授為論文通訊作者,基因組中心明瑞光教授、科研助理張晟鋮,植物保護學院趙茜博士參與了該項研究工作。
該文來源福建農林大學
微信加群
iPlants,專注植物最前沿。投稿、商務合作、轉載開白名單等事宜請聯繫微信ID: