組織內的轉錄本表達豐度在不同個體之間存在著差異。目前,研究者們對這種個體差異的遺傳基礎進行了分析。
研究者們在過去的幾年裡開展了大量的基因組分析,並從中獲得了諸多經驗,其中一條經驗是:如果由大型研究團隊開展一系列設計嚴謹、目標宏大、分析周全的遺傳學研究的話,將會推動該研究領域取得巨大的飛躍。這些遺傳學研究既能夠為研究者提供新的見解,也能夠生成大量可供所有研究人員廣泛利用的基因數據集,從而實現遺傳學研究領域的飛躍。因此值得注意的是,雖然我們現在已經知道絕大多數常見的、與疾病風險有關的遺傳多態性位點(即特定DNA序列上的變異)都是通過調控基因表達來發揮作用的,但是我們一直都未開展過「大科學(big science)」轉錄分析。最近,基因型-組織表達(Genotype-Tissue Expression, GTEx)研究聯盟(GTEx Consortium)分別在本期期刊的第648頁、第660頁和第666頁上發表了第一批轉錄研究的結果(其中包括Melé等人和Rivas等人的研究成果),從而填補了此類研究的空白。
多種組織內的轉錄本表達豐度在不同的個體之間存在著差異。為了了解導致這種個體差異的遺傳基礎,GTEx研究聯盟在美國國家人類基因組研究所(National Human Genome Research Institute)的協調下開展了GTEx研究工作。迄今為止,我們主要是通過血液淋巴母細胞系的研究以及容易獲取的組織(例如脂肪或皮膚)的離體研究,來了解人類基因表達的遺傳學機制。GTEx項目計劃在大約1000具由近親屬同意捐贈的屍體中獲取50多種組織類型,並在這些組織中研究全基因組範圍內的序列變異與RNA測序結果之間的關聯。全基因組關聯研究(genome-wide association study, GWAS)已經發現了數千個與疾病風險相關的遺傳變異。如果我們了解這些遺傳變異與RNA測序結果之間的關聯的話,將會提供直接的證據來證明這些遺傳變異的功能,並且闡明導致健康人疾病易感性差異的機制。GTEx項目在試點階段獲得的研究結果主要來自於237名首批捐贈者的屍體:他們分析了其中大約100具屍體體內9種組織的RNA樣本,此外還分析了少部分捐贈者體內33種其它組織的RNA樣本。GTEx研究聯盟的論文報導了基因表達的遺傳學調控機制,而Melé等人則系統地比較了不同組織和不同個體之間「轉錄組(transcriptome)」的差異,即所有RNA分子的差異,包括信使RNA(messenger RNA)、核糖體RNA(ribosomal RNA)、轉移RNA(transfer RNA)和其它的長鏈非編碼RNA(long noncoding RNA)。Rivas等人報導了蛋白質截短變異(protein-truncating variant)對人類轉錄過程的影響,並且生成了一個定量模型,來分析無義介導的RNA降解(nonsense-mediated decay,即清除含有提前終止密碼子(premature stop codon)的轉錄本)在不同組織之間的差異及其可能的遺傳學調控機制。
以往針對多種生物的研究已經證實,位於某一基因數十萬個鹼基範圍內的常見調控性多態位點——即表達數量性狀基因座(expression quantitative trait loci, cis-eQTL)能夠顯著影響該組織或其它組織內的、至少一半的基因的表達水平。這些基因座會在局部範圍內影響其附近基因的表達,這就可能解釋了為什麼特定轉錄本的豐度在不同個體之間存在著差異——少則相差百分之幾,多則相差一半以上。由於eQTL位點對基因表達的影響遠遠強於疾病相關性多態位點,因此即便研究所用到的樣本量只有100人,我們也能夠檢測到最顯著的eQTL效應。儘管罕見變異的探索性研究目前還處於起步階段,但是研究者們預測這類變異也是引發疾病的一個重要因素。表觀遺傳因素的影響(例如染色質修飾和microRNA調控)當然也能夠很大程度地解釋轉錄本豐度的個體差異性。轉錄變異的一個重要特徵是:存在著非常強的共調節作用,有時候會共同調節成千上萬個基因。這可以歸因於多種調控性反式作用因子(即轉錄因子、激素、環境因素)所產生的累積效應;此外,組織內不同類型的細胞的數量不同,也是導致轉錄變異共調節作用的一個重要原因。
首批GTEx論文的主要貢獻之一是:量化了不同組織內cis-eQTL的相對貢獻,從而表明在甲狀腺和脛神經中,鄰近多態位點所調控的基因數量是血液或心臟中的兩倍。然而,血液中的等位基因特異性表達(allele-specific expression,即主要由兩條同源染色體中的一條進行轉錄)水平似乎較高,而大腦組織中卻不存在等位基因特異性表達。有趣的是,與轉錄本總豐度相比,不同組織之間的等位基因特異性表達水平似乎更加保守。
在不同組織之間到底存在有多少個相同的基因表達調控性遺傳變異呢?關於這一問題還存在著很大的爭議。我們在比較不同的數據集時,如果採用不同的分析方法,就會產生完全不同的結論。GTEx研究聯盟採用兩種不同的分析方法(即雙向線性模型和Bayesian聯合分析法)對同一個普通人群數據集進行了研究,從而解決了這一問題。GTEx研究聯盟獲得了令人驚嘆的研究結論:大約一半的cis-eQTL(尤其是位於啟動子附近的cis-eQTL)在絕大多數組織中處於激活狀態,而另一半cis-eQTL則傾向於在一種或兩種組織中特異性地活化。影響RNA剪接的變異(即剪接變異)可以導致細胞產生替代性的轉錄本異構體,這些變異在不同的組織中也是保守的,我們可以在多種組織內檢測到80%以上的剪接變異,但是在進行組織間的兩兩比較時,剪接變異的相似度又千差萬別:在全血中,只有不到10%的剪接QTL與陽光暴露後的皮膚中的相同,而有大約50%的剪接QTL與左心室的相同。
GTEx研究聯盟發表的論文給人們帶來了一個大大的驚喜——發現了模塊QTL(module QTL,modQTL),它是一類可以影響基因表達共調節作用的調控性變異。modQTL的理念是:大多數基因被組織成一個個的表達模塊。即便它們位於不同的染色體上,但是它們卻具有相近的表達水平。同一模塊中的諸多基因通常都具有相同的功能,例如控制細胞分裂周期。GTEx研究聯盟發表的研究共發現了117個模塊,每個模塊包含有25至414個轉錄本。我們可以在多種組織中觀察到相同的模塊,但是卻不一定能夠在這些組織中觀察到相同的表達模式。原來在不同個體之間,有很多基因會轉移到其它的模塊「陣營」中去(如圖)。這種轉換與該基因區域內的調控性變異(即modQTL)有關,而在相關的組織中,大約只有一半的modQTL會被檢測為cis-eQTL。由於模塊內的基因通常都具有相同的調控性模體,用於結合一些常見的轉錄因子,而且這些模體都含有一些調控性多態位點,因此這就暗示我們,整個GTEx項目將會發現一些新的原理,來說明基因表達的共調節作用為什麼會在組織內和組織間存在差異。
模塊化的轉換
這些研究發現對個性化醫療有什麼蘊涵的意義呢?我們雖然幾乎無法從GTEx研究中找到一些暗示,但是當我們對GWAS數據和DNA元件百科全書(Encyclopedia of DNA Elements, ENCODE)計劃(該計劃確定了人類基因組序列中的功能性元件)所獲得的信息進行生物信息學處理,並根據處理的結果進行推論時,GTEx研究就能夠驗證這些推論的真實性,這也是GTEx研究所帶來的最顯著的意義。如果我們對那些用於標註增強子和其它調控性元件的染色質特徵進行測量的話,就會意識到疾病相關性變異往往會富集在一些特殊基因附近的區域中,而這些特殊的基因在疾病相關性組織(例如自身免疫性疾病中的淋巴細胞或精神疾病中的神經細胞)中更有可能處於活化狀態。GTEx項目提供了直接的證據來證明事實的確如此,而該項目所附帶產生的資料庫可以供所有研究者查閱,以便了解疾病相關性變異會在哪類組織中對其鄰近基因的表達情況產生特定方向的影響。值得注意的是,這裡的「鄰近區域」通常並不是指最靠近的區域。此外,需要申明的一個關鍵問題是:研究者們在分析了50種組織的基因表達譜之後證實,蛋白質截短變異體的編碼基因實際上在大多數疾病相關性組織中並未進行表達。研究者們曾經根據DNA序列的情況,預測這些蛋白質截短變異會產生有害效應,然而GTEx研究的以上發現則提示我們,這些變異實際上不太可能引發疾病。
在未來的兩年內,研究者們應當會獲得所有的GTEx數據。毫無疑問,如果GTEx研究獲得更多數據的話,它的意義將遠遠不只是驗證了初步研究所報導的發現。我們還會發現更多的cis-eQTL,弄清楚等位基因特異性表達和RNA剪接的複雜網絡,並且推測出模塊化轉換的潛在機制。我們也能夠大膽地預測未來:利用一些目前尚未構想出來的統計學方法,就能夠更完善地整合GTEx數據和ENCODE分析;ENCODE組織表達(ENCODE Tissue Expression, EnTEx)試點項目將會報導某些GTEx樣本的染色質譜系。諸如此類的分析使我們能夠從眾多具有提示作用的GWAS研究結果中篩選出有意義的發現,從而更多地解釋疾病易感性的個體差異,並且將疾病的發生歸因於特定類型的細胞。然而,如果有基金資助研究者們對慢性疾病患者或具有不同生活方式或環境暴露(例如毒素或嚴重社會經濟壓力的暴露)的個體開展基因型-組織表達研究的話,那麼我們就需要設計出更宏偉的GTEx項目,來評價基因調控效應在疾病中的變化情況(「GTEx-D」)及其在不同環境中的差異(「GTEx-E」)。
或許最重要的一點就是:我們可以開始策劃一項改進的、基因組推動下的精準醫學研究項目。DNA測序技術的功能非常強大,能夠確定引起先天性畸形的原因,預測腫瘤的進展情況,並且為患者制定個性化的用藥方法。儘管研究者們還在沾沾自喜於DNA測序技術的強大功能,但是靜止狀態下的基因組仍然存在其局限性。如果在20年以後,基因表達譜分析與基因型分析被整合成為醫學診斷領域中的一種標準方法的話,人們就會看到GTEx項目是如何讓我們更接近於目標的實現的。(生物谷Bioon.com)
原文檢索:
Greg Gibson. (2015) GTEx detects genetic effects. Science, 348(6235):640-641.
Dee/編譯