不同的組織和個體之間的基因表達和調控的差異很大,大部分的常見複雜性狀相關的基因組通過假定表達和剪接機制來發揮作用,如10%的致病突變都具有已知的剪接效應,RNA測序則能夠很好的分析等位基因特異性並解讀遺傳變異。
迄今為止的大多數RNA測序研究都使用短讀長RNA測序技術;由於短讀長容易出現多重定位的情況,因此很難確定異構體的來源,同時會給定量帶來幹擾。相比之下,長讀長測序可以捕獲到全長轉錄本和異構體,這可以使定量過程像讀長序列計數一樣簡單。
研究方法與結論
鑑於RNA測序技術需要大量的高質量起始RNA及測序通量等客觀原因,長讀長RNA測序技術尚未能大規模的應用於人體組織樣本,而基於GTEx聯盟的生物樣本庫的豐富數據和納米孔測序的高通量(單次納米孔測序運行可獲得高達2000萬條cDNA長讀長序列),來自紐約基因組中心的Dafni Glinos博士及團隊對來自43位捐獻者的70個人類組織樣本(涵蓋15種不同的組織)進行納米孔長讀長PCR-cDNA測序,生成了目前規模最大的人類長讀長測序cDNA數據集。
利用現有的已定相全基因組數據,研究團隊開發出一個將讀長序列定位到基因組的工作流程(該流程將在LoRALS工具包中一同發布)。將該流程在全基因組範圍應用於所有樣本,揭示出跨越4217個基因的11000多個ASE(特異性表達)事件,以及跨越187個基因的350個ASTS(特異性轉錄本結構事件)事件。
LoRALS全稱:長讀長等位基因特異性分析,建立於Tuuli Lappalainen實驗室的研究之上,發表於:
《Nature Commnication》(DOI:https://doi.org/10.1038/ncomms12817)
《Genome Biology》(DOI:https://doi.org/10.1186/s13059-015-0762-6)
通過比較ASE和ASTS事件發現,並非所有ASTS事件都會以等位基因特異性表達的形式呈現出來,這表明他們能夠用這種方法發現細微的轉錄本使用差異,同時發現四分之一的表達差異可以用轉錄本結構差異來解釋;影響轉錄本結構的遺傳變異通常也會影響表達水平。
使用GTEx聯盟定位的大型QTL數據集進行的分析顯示,雜合個體的ASE p值比純合個體低得多,而通過正交驗證觀察到的ASTS事件反映出了表達和剪接的遺傳效應(該項研究由Alexis Battle領導完成,成果預印版本已經發布在《bioRxiv》:DOI: 10.1101/786053)。對這些識別到的顯著等位基因特異性轉錄本結構基因進行檢測,發現顯著ASTS基因中富集的剪切異常值(outlier),以及罕見的編碼雜合變異。通過對GTEx成纖維細胞系進行PTBP1基因敲減PTBP1(一種介導外顯子跳躍事件的RNA結合蛋白)來研究ASTS事件,觀察到敲減組和對照組之間基因的差異會表現出顯著的ASTS事件。
最後,研究團隊使用FLAIR分析流程識別到了已知基因的約10萬個假定新轉錄本和大約200個新基因。接下來,在由Michael Snyder實驗室的Lihua Jiang牽頭的一個項目中,他們計劃通過GTEx聯盟中同一群個體的質譜數據來驗證其中一些新的轉錄本。初步數據表明,數以千計的轉錄本在8種主要組織中有表達和使用差異,研究成果發布在bioRxiv(DOI:10.1101/797373)。(生物谷Bioon.com)
【直播預告】納米孔測序在人類遺傳學和罕見病研究中的應用
【日期】2020/11/19 15:00
http://count.medsci.cn/link/redirect/199d0462698595ba