近年來,越來越多的研究表明,單一或者少數參考基因組不能涵蓋整個種群全部的遺傳信息,所以,構建物種的泛基因組成了當前基因組學研究的熱點和前沿。本篇文章,小編和大家一起來了解一下泛基因組的構建方式、泛基因組的熱點研究內容。
一、泛基因組的構建策略
泛基因組構建主要分為以下三種方式[1]:
(1)選取一個參考基因組,各個材料的測序reads分別比對,將未比對上的reads進行組裝,通過「比對-組裝」的迭代過程構建;
(2)所有材料進行基因組從頭組裝,通過從頭組裝的基因組進行相互比較來構建泛基因組;
(3)基於變異圖的泛基因組構建;
圖1 構建泛基因的三種策略
當前第一種和第二種策略使用的比較廣泛,例如,番茄的100泛基因就是採用的第一種策略構建的泛基因組[4];27個大豆項目、7個擬南芥,14個果蠅等都是採用第二種策略[3,5,6]。大豆的泛基因組也初步嘗試使用了第三種策略,並進行了GWAS關聯分析[3]。第三種策略是理想的構建策略。它基於圖論的組裝方法,利用有向圖把基因組分成若干部分,很好地展示每部分序列在泛基因組中的位置關係。相對於第一種和第二種策略,構建泛基因組圖的技術和算法尚未成熟,因此目前應用還較少,不過,未來可期。
二、泛基因組的應用與研究
1. 泛基因組揭示遺傳變異與表型變異的關係
泛基因組可以結合GWAS數據,有效提高GWAS 的準確性,捕獲到更加完整的遺傳變異信息。通常,GWAS分析是將個體材料與參考基因組進行比對,然後將得到的 SNP 與表型進行關聯分析,當GWAS 分析參考基因組不存在的功能基因引起的表型時,會出現 GWAS 定位區間與實際功能基因之間較大偏差甚至檢測不到的情況。但以泛基因組為參考基因組,把結構變異作為基因型數據用於 GWAS 分析,可以有效解決這類因單一參考基因組而導致的信息不全問題。例如,油菜以泛基因組鑑定到的 PAV 為基因型進行GWAS 分析,直接鑑定到基因BnaA9.CYP78A9啟動子區存在一段 3.9 kb 的插入,該變異嚴重影響油菜的角果長和粒重[2]。結構變異相關的GWAS研究更具有新意,也是後續研究的熱點。
圖2 油菜角果長和粒重的GWAS分析
2.泛基因組揭示了結構變異影響基因差異表達
結構變異可能會通過改變基因區或基因側翼區的序列影響基因的轉錄調控及表達。如,基因的串聯重複可能會引起基因劑量的變化,外顯子的複製可能會引起可變剪接,順式作用元件區的插入或缺失可能會破壞或者改變轉錄調控因子結合位點。例如,大豆14號染色體上存在一個調控Fe2+/Zn2+轉運蛋白的基因SoyZH13_14G179600,一些品種的基因組中,該基因的啟動子區存在一個1.4kb的缺失,RNA-seq數據分析顯示,該啟動子缺失會使轉運蛋白表達量降低[3]。
圖3 大豆啟動子缺失影響基因表達
3.泛基因組揭示了結構變異在種群馴化中的作用
泛基因組擁有群體完整的基因組多樣性,可以為植物進化與馴化研究提供更完整、更寬泛的支持。如大豆的種皮顏色是大豆馴化過程中的一個重要表型性狀,從野生大豆的黑色種皮演變成栽培大豆的黃色種皮,是因為一個查爾酮合成酶基因發生序列倒置或序列複製後倒置導致了該基因沉默。通過大豆泛基因組單倍體型進化分析,將29份材料分為5個主要的單倍型(H1- H5),並對不同單倍體型馴化時間和順序進行了研究,剖析了大豆種皮顏色馴化的歷史[3]。
圖4 大豆種群馴化
問題和展望
泛基因組是近年來研究的熱點, 然而目前泛基因組領域還需解決以下兩方面的問題。首先,不同泛基因組研究中,樣本量的選擇,基因組的測序、組裝,泛基因組的構建策略,序列注釋,判斷基因有無變異(PAV)的方法等都有很大的差別,這就導致了即使同一種物種,不同實驗室構建的泛基因組序列及基因有無變異結果等也不能直接進行比較。其次,如何更好地利用泛基因組鑑定出的變異數據,將遺傳變異和重要的表型性狀關聯起來, 是泛基因組應用研究的關鍵和挑戰。
泛基因組作為參考基因組,相對傳統的單一參考基因組,能呈現更加全面的種群基因組信息。隨著泛基因組的構建方式和分析策略的逐步完善,未來利用泛基因組,會高效地輔助解決功能基因組學研究的難題,為育種家在尋找合適的育種親本和育種方法上提供支持。
文:LHL
排版:市場部
參考文獻
[1] Philipp E. Bayer, et al. Plant pan-genomes are the new reference. Nature Plants, 2020.
[2] Jia-Ming Song, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus. Nature Plants, 2020.
[3] Yucheng Liu, et al. Pan-Genome of Wild and Cultivated Soybeans.Cell,2020.
[4] Michael Alonge, et al. Major Impacts of Widespread Structural Variation on Gene Expression and Crop Improvement in Tomato. Cell, 2020.
[5] Mahul Chakraborty, et al. Structural variants exhibit widespread allelic heterogeneity and shape variation in complex traits. Nature Communications, 2019.
[6] Wen-Biao Jiao, et al. Chromosome-level assemblies of multiple Arabidopsis genomes reveal hotspots of rearrangements with altered evolutionary dynamics. Nature Communications, 2020.
北京百邁客成立11年來,致力與「精準」基因組組裝,同時在泛基因組研究及組學結合中具有極其豐富的經驗;2015年國內最早引進多臺三代測序平臺,具備了高通量泛基因組測序平臺,成為了國內外眾多科研院校的最佳合作夥伴。
百邁客現提供測序分析+分子試劑一站式解決方案,與分子實驗相關試劑盒如提取試劑盒、反轉試劑盒、qPCR試劑盒、PCR Mix、無縫克隆、建庫試劑盒等試劑盒均有現貨,試劑促銷方案,諮詢駐地銷售。