《科學》封面重磅:人類遺傳學研究迎來又一重大裡程碑!GTEx計劃終極一劍,人類基因調控圖譜徐徐展開丨科學大發現

2020-09-15 奇點網

2001年,人類基因組工作草圖發布,人類史上繼曼哈頓計劃、人類登月計劃之後的第三大科學計劃宣告基本完成。至此,人類染色體中所包含的六十億對核苷酸序列不再是黑箱,人類遺傳學密卷徐徐展開。

但這就是人類基因的全部秘密了嗎?

圖源 | Science

我們知道,基因與疾病和健康息息相關,全基因組關聯研究已經發現了無數與疾病有關的突變位點;同時我們也知道,基因組中編碼蛋白質的基因其實只有1%-2%。這意味著大量疾病有關的突變其實並不直接產生致病蛋白,而是在調控其他基因的過程中起作用。

對這部分基因如何運作,我們近乎一無所知。

為了解決這個問題,2010年,一項名為基因型組織表達(GTEx)的項目啟動了。該項目收集了來自近1000個個體的54個組織的未患病樣品,試圖通過分子測定闡明基因組表達調控和遺傳變異之間的秘密。

就在今天,GTEx計劃公布了第三階段、也是最後一階段的分析成果,數據以系列論文的形式發表,獲得了《科學》雜誌的封面報導。今天我們選擇了其中較為重要的6篇作簡單介紹,以饗讀者。

本期《科學》封面

GTEx基因調控圖集

GTEx數據集已經更新至第八版,其中包括來自838個供體、52個組織、兩個細胞系的17382份樣品。《科學》發表的第一篇論文中[1],使用了其中49個組織或細胞系、共計15201個樣本,並獲得了基因型數據和RNA測序數據。

所有的838個捐助者中,85.3%為歐洲裔美國人,12.3%為非洲裔美國人,1.4%為亞裔美國人,1.9%為西班牙裔或拉丁美洲裔。男性佔比66.4%。

通過全基因組測序(中值測序深度32x),研究團隊共檢測到43066422個單核苷酸變體,並對這些遺傳變異與基因調控之間的關係進行了分析,包括對基因表達、剪切、長非編碼RNA、順/反式調節等過程的影響。

下面我們來看一些主要的發現。

首先,性別對基因調控存在明顯的影響,在44個男女均有的組織中,研究者鑑定出了369種男女有別的調控基因,它們的分布與組織特異性存在關聯,大部分發現於乳房,肌肉、皮膚、脂肪組織中也比較常見。

分析涉及的組織類型

特別值得注意的是,有些差異信號似乎只在單個性別中存在。比如說在骨骼肌中鑑定到的rs2273535突變與癌基因AURKA調控有關,但是這種關聯僅存在於男性當中。

對來自不同種族供體樣本的分析也顯示,基因變體對不同族群的表達調控影響是不同的。

其次,研究者對比了不同組織之間的差異,發現表達調控效應並不一致,大腦、睪丸、淋巴母細胞系、血液以及肝臟尤為特殊,其他大多數組織器官則比較相似。這意味著,在對遺傳調控的研究上,血液並不能很好地代表其他組織,皮膚反而可能是更好的選擇

研究者也分析了不同細胞類型中的差異,表明組織間共享的細胞類型可能是組織間相同遺傳調控作用的基礎。

最後,研究者還對單一變異表現出的多種調節效應進行了分析,提出遺傳效應的複雜多效性機制,單個突變可以表現出對多個組織的調節作用,並轉化為不同的生理特徵。

更詳細的信息我們在下面的幾篇論文中進行介紹。

不同組織基因表達「男女有別」

男性與女性之間的差異,不僅僅是性染色體組成上XX和XY這一條。在芝加哥大學科學家研究檢測的44類組織中,幾乎都有基因在兩性之間,存在表達水平的不同[2]。

總體來看,人類有37%的基因在某一類組織中的表達水平,會因為性別不同而出現區別,比如在女性中表達水平與性別關係比較明顯的,是一種與乳腺癌發病有關的基因——CCDC88C,以及孕期調節血糖,影響後代出生體重的HKDC1基因。

而在男性當中,表達水平與性別關係比較明顯的,則是與男性出生體重有關的CLDN7基因,以及與體脂比有關的DPYSL4基因。另一個男性表達較多的C9orf66基因,則是在本次研究中被首次發現與萬惡的脫髮模式有關。

男女之間的差異

研究總共發現了58項此前未報告過的男女性別差異導致的基因表達水平不同,涵蓋的範圍也非常廣泛。把這些基因對應的特徵,與流行病學或臨床研究中發現的男女差異結合起來,就可以針對性地去開發診斷、治療和評估預後的手段了。

最簡單的例子,像上面的CCDC88C既然在女性乳腺中才高表達,就可以專門用來評估女性的乳腺癌風險和疾病進展。而像女性比男性更長壽,系統性紅斑狼瘡(SLE)等自身免疫疾病發病率高之類的男女差異,也可以被利用起來。

有了這些基因表達層面的發現,就能幫助科學家們理解許多疾病發病傾向和生理特徵的性別差異,從而更個體化地了解人體,調節疾病和健康。

不容忽視的罕見變異

很多人可能會覺得,罕見基因變異是遠在天邊的東西,但其實真要把基因組過一遍,也許每個人身上都有成千上萬的罕見變異。

不管是相對最簡單的單個核苷酸改變、插入或缺失突變,還是更複雜一些的染色體片段甚至結構變異,只要這些改變在全人群中的發生率不到1%,都可以被列入罕見範疇。而在這些變異中,就會有一些對人體的生理特徵或疾病有所影響。

正因為罕見基因變異可能的數字會非常巨大,GTEx研究也只分析了49種組織中「可能產生較大影響」的變異。研究發現,可能對基因表達產生明顯影響的罕見基因變異,在一部分捐贈者的組織樣本中竟然能超過50種![3]

確定罕見變異的過程

研究團隊把產生影響的罕見變異劃分為了三類:導致極端狀態的基因表達型(eOutliers)、影響等位基因表達型(aseOutliers)和導致選擇性剪接型(sOutliers),

這其中的一些罕見變異,可能是與癌症等疾病存在直接關聯的

舉個例子來說,研究發現的一種罕見變異,可能會導致SPTBN1EML6兩種基因發生融合,而NTRKROS1等很多融合突變都可能發揮促癌作用。針對它們的靶向治療策略,這幾年可是癌症研究中最熱門的課題之一。

對這樣的罕見基因變異有更深入的了解,才能對它們影響的生理特徵和疾病發生,有更進一步的認知,接下來才談得上調節和治療。

我們對人類不同類型細胞基因表達的調節所知非常有限

人類基因組計劃的完成讓我們對人類最底層的遺傳信息有了一定的認知,我們知道了一些基因變異與疾病之間的關係。至於基因突變是如何導致疾病的,咱們可以藉助轉錄組數據,從mRNA的表達上分析。

不過,基因變異又是如何影響基因的表達,也就是mRNA水平的呢?這就要藉助於表達型數量性狀位點(expression quantitative trait locus,eQTLs)和剪接型數量性狀位點(splicing Quantitative Trait Locus,sQTLs)。

研究流程示意圖

從名字上不難看出,eQTLs主要是控制基因的表達水平,sQTLs主要控制基因的可變剪接水平,它倆都直接地影響著mRNA的水平,影響蛋白的功能實現,最終決定咱們健康還是生病。

實際上科學家已經確定了大多數基因的eQTLs和sQTLs。然而,這些研究主要是通過混合組織樣本的基因表達測量來進行的,掩蓋了基因調控效應的細胞特異性,這就限制了對它們功能的解釋。我們都知道,不同類型細胞的基因表達在時空上都是存在差異的;因此,搞清楚不同細胞類型的eQTLs和sQTLs,對理解複雜的性狀非常重要。

由德國馬克斯·普朗克精神病研究所的Sarah Kim-Hellmuth,和紐約基因組研究中心的Tuuli Lappalainen聯合領銜的研究團隊[4],對來自GTEx項目的35種組織的7種細胞類型(脂肪細胞、上皮細胞、肝細胞、角質細胞、肌細胞、神經元和中性粒細胞)的數據做了富集和評估,以繪製至少一種細胞類型特異性的QTLs。然後通過測試基因型和細胞類型富集之間的相互作用,繪製了細胞類型相互作用的eQTLs和sQTLs(分別為ieQTLs和isQTLs)。

主要研究結果

最終他們發現發現3347個蛋白編碼基因和基因間長鏈非編碼RNA(lincRNA)基因具有ieQTLs,987個基因具有isQTLs。而且ieQTLs主要富集在那些具有組織特異性的eQTLs裡,不同的組織之間不共享,這意味著組織特異性eQTLs來源於組織特異性細胞類型。也就是說有很多基因的變異只影響特定細胞類型的基因表達,在其他組織中就不起作用

此外,研究人員還發現絕大多數細胞類型特異性QTLs還有待發現

Kim-Hellmuth和Lappalainen團隊的研究不僅讓我們認識到基因表達調控的複雜性,還讓我們意識到從特定細胞層面來講,基因表達的調控還存在太多的未知需要探索。

不同組織端粒長度不一樣,隨年齡的變化趨勢也不盡相同

說起端粒,對衰老這個研究領域稍有了解的朋友一定不會陌生。

端粒是位於染色體末端的DNA蛋白複合物,它的職能是保護染色體末端不被降解和融合,有利於染色體的穩定。

科學家很早就注意到一個現象:端粒的DNA成分會隨著細胞的每次分裂而縮短,最終引發細胞衰老。因此,坊間有傳言說,「你端粒的長度決定了你的壽命」。

實際上,雖然血細胞的端粒長度(TL)作為人類衰老的生物標誌物和年齡相關疾病的危險因素已被廣泛研究,但是血細胞的端粒長度在多大程度上影響衰老和疾病,目前還沒有定論。另外,人類不同組織細胞的端粒長度究竟是如何變化的,目前也缺少研究。這都在一定程度上阻礙了我們對疾病和衰老的認知。

主要研究內容

由美國芝加哥大學Brandon L. Pierce領銜的研究團隊,基於952名GTEx捐獻者的超過25種組織類型,使用Luminex檢測法測量了6391個獨特的組織樣本相對於標準樣本的相對端粒長度(RTL),生成了迄今最大的公開多組織端粒長度數據集[5]。

通過分析,研究人員發現,端粒長度的變異可歸因於組織類型、捐贈者和年齡,其次是種族或民族、吸菸和已知影響白細胞端粒長度的遺傳變異

不同組織類型的相對端粒長度不同,全血的相對端粒長度最短,睪丸的相對端粒長度最長。在大多數組織中,相對端粒長度與年齡成反比,這種關係在平均相對端粒長度較短的組織中最強。但睪丸、卵巢、小腦、陰道、骨骼肌、和甲狀腺等組織的相對端粒長度,不隨年齡增長而縮短

不同組織的端粒長度

儘管如此,大腦和腎臟等大多數組織的端粒長度與全血細胞的端粒長度呈現出明顯的正相關關係,這說明測量血細胞的端粒長度能反應大部分組織的端粒狀況。而且,根據已知影響白細胞端粒長度遺傳變異設計的多基因評分,與所有組織的相對端粒長度相關。

此外,在所有組織或特定組織類型中,非洲血統與較長的相對端粒長度有關。端粒長度維持酶在睪丸中的水平比在任何其他組織都高

以上研究結果對以白細胞為代表,研究端粒長度變化與疾病之間的關係提供了基礎。

比起基因,更要看蛋白質

蛋白質可以說是生命活動的直接參與者,對蛋白質的研究能夠幫助我們從分子上理解複雜的生理活動。目前我們對蛋白質的研究主要通過RNA進行,但是很多研究表明,蛋白質的水平其實和轉錄水平並不相關。

發表於《細胞》雜誌的這項研究對組織中的蛋白質水平進行了定量分析,並與RNA水平進行了對比,得到來自32個組織的12000餘個蛋白質的數據,其中包括一組新的蛋白質[6]。分析結果展現了許多未曾被發現的組織特異性蛋白質表達,以及很多無法單純從轉錄組數據中得知的生物學奧秘。

論文首頁截圖

分析結果中尤其值得關注的,是蛋白質與RNA在組織富集模式的差異。比如說在大腦中,豐富的神經遞質功能和細胞信號需要大量囊泡運輸蛋白的參與,但是大腦內卻並不表現出相關的RNA富集;反之,在沒有相應蛋白的組織中卻能夠發現特異的RNA轉錄。

這樣的差異與多種因素有關,比如蛋白的轉錄後或翻譯後調控,或是RNA及蛋白本身周轉率的不同,當然,也可能與檢測技術的極限有關。

對蛋白質和RNA組織特異性分布的分析結果顯示,蛋白質向其他組織的結構性分泌是二者水平差異的主要原因之一。通過蛋白質與RNA的協同分析,GTEx給出了豐富的有關結構蛋白和分泌蛋白的信息,資料庫也可以作為對分泌蛋白合成位點、潛在作用的分析工具。

此外,研究者還集中分析了不同組織中的酶對代謝調控的作用,以及致病蛋白的富集這將有助於我們理解編碼基因突變引起的遺傳疾病,是如何通過蛋白質影響特定組織並引起疾病症狀的

對組織特異性酶調控的分析

小結

GTEx至此基本完成,但這遠不是結束。從相關信息我們可以看出,GTEx納入的樣本特徵還遠遠不能滿足不同研究者的需求。

對納入族群的進一步擴大,對組織和細胞更詳細的分析,以及未來相關科研工具的進步將會給我們帶來更加難以想像的廣闊認知。

帶我們走近生命的全貌。

編輯神叨叨

雖然2020年的ASCO已經結束了,但是它對未來幾年癌症治療領域的影響才剛剛開始。為了幫助大家快速抓住今年ASCO的重點,高效獲取前沿進展的全景認知,我們又全力打造了《ASCO2020趨勢解讀》。

全面梳理了9大癌種,300個口頭報告中的關鍵學術研究,幫你用90分鐘全面縱覽ASCO盛會的重磅進展。

長按識別下面的二維碼就可以購買,原價59元,認證用戶只需39元。如果你之前在購買奇點其他課程的時候已經認證了,那麼就直接購買吧!

參考資料:

[1] https://science.sciencemag.org/content/369/6509/1318

[2]https://science.sciencemag.org/content/369/6509/eaba3066

[3]https://science.sciencemag.org/content/369/6509/eaaz5900

[4]https://science.sciencemag.org/content/369/6509/eaaz8528

[5]https://science.sciencemag.org/content/369/6509/eaaz6876

[2]https://www.cell.com/cell/fulltext/S0092-8674(20)31078-3#%20

本文作者 | 代絲雨 & 譚碩 & BioTalker

一個大項目🐘

相關焦點

  • 《科學》封面重磅:人類遺傳學研究迎來又一重大裡程碑
    原創 奇點糕 奇點網2001年,人類基因組工作草圖發布,人類史上繼曼哈頓計劃、人類登月計劃之後的第三大科學計劃宣告基本完成。至此,人類染色體中所包含的六十億對核苷酸序列不再是黑箱,人類遺傳學密卷徐徐展開。但這就是人類基因的全部秘密了嗎?
  • 大科學計劃概述:人類基因組計劃
    這一重大成就立刻受到全世界的矚目,各國均給予了高度評價,人們認為人類基因組計劃是斷曼哈頓原子計劃,阿波羅登月計劃之後的第三大科學計劃,它對人類認識自身,提高健康水平,推動生命科學、醫學、生物技、製藥業、農業等的發展具有極其重要的意義,人類基因組工作草圖的完成是該計劃實施的一個裡程碑,標誌著人類在研究自身的過程中邁出其不意關鍵的一步。
  • 《科學》封面報導人類遺傳學新紀元
    而在今日,這項十年磨一劍的工作,終於迎來了裡程碑式的爆發——來自多個科研團隊本周在《科學》、《細胞》等雜誌上發表了15篇論文,介紹他們的發現。《科學》雜誌也以封面報導的形式,對此進行了介紹。 這個項目是怎麼做的?
  • 《科學》封面報導人類遺傳學新紀元
    Altounian/Science, in collaboration with Christian Stolte; (Data) GTEx Consortium為此在10年前,科學家們啟動了一個叫做「基因型-組織表達」(簡稱GTEx)的大型研究項目,斥資1.5億美元,想要一舉搞清基因調控的遺傳學。
  • 2018中國生命科學領域重大研究進展
    近年來,現代生命科學與生物技術取得一系列重要進展和重大突破,並正在加速向應用領域滲透,在解決人類發展面臨的環境、資源和健康等重大問題方面展現出廣闊的應用前景。   隨著大數據技術的快速發展,生命科學研究正向基於數據的科學發現範式轉變。
  • 歷時17年ENCODE計劃三期完工,近百萬人類基因組調控元件被發現
    1990年,被譽為生命科學「阿波羅登月計劃」的國際人類基因組計劃啟動。歷經十年,耗資30億美金,在美國、日本、英國、法國、德國和中國科學家的共同合作努力下,人類基因組序列草圖繪製完成,並於2000年發布,成為人類科學史上的一次重大突破。然而,此時的人類基因組草圖猶如一個「空殼」,僅佔人類基因組不到2%的編碼區域遠不足以解釋複雜的生命調控現象。
  • 人類基因組計劃
    其宗旨在於測定組成人類染色體(指單倍體)中所包含的30億個鹼基對組成的核苷酸序列,從而繪製人類基因組圖譜,並且辨識其載有的基因及其序列,達到破譯人類遺傳信息的最終目的。「人類基因組計劃」在研究人類過程中建立起來的策略、思想與技術,構成了生命科學領域新的學科——基因組學,可以用於研究微生物、植物及其他動物。
  • 「千人基因組計劃」獲得迄今最詳盡的人類基因多態性圖譜
    由中美英等國科研機構發起的大型國際科研合作項目「千人基因組計劃」28日在英國《自然》雜誌上,以封面文章形式發布了迄今最詳盡的人類基因多態性圖譜,同時也在美國《科學》雜誌上報告了在基因研究技術手段上的收穫
  • 人類基因組計劃(HDP)現狀與展望
    1998年9月14日美國國家人類基因組計劃研究所(NHGRI)和美國能源部基因組研究計劃的負責人在一次諮詢會議上宣布,美國政府資助的人類基因組計劃將於2001年完成大部分蛋白質編碼區的測序,約佔基因組的三分之一,測序的差錯率不超過萬分之一。同時還要完成一幅「工作草圖」,至少覆蓋基因組的90%,差錯率為百分之一。2003年完成基因組測序,差錯率為萬分之一。
  • 中國參與人類基因組計劃
    至此,人類基因組計劃距離正式啟動過去了14年,比原計劃提前了兩年多。1990年,人類基因組計劃在美國正式啟動。9年後,中國獲準加入了人類基因組計劃,成為參與這一計劃的惟一發展中國家。「如果說人體的基因就像一部包裝精美的天書,記載著生命的奧秘,那麼,DNA雙螺旋模型的發現,則是我們翻開了本書的第一頁。」而人類基因組完成圖譜的公布,則將這本書完整地呈現在了人類的面前。
  • 基於人類基因組計劃「大科學」的六大經驗
    經驗一:擁抱合作關係HGP成功將超過2000名來自不同國家、科學領域和資歷的研究者凝聚在一起——儘管各小組得到不同資助機構的支持。計劃的成功源於資助者強有力的領導、共享任務重要性的責任感、研究人員為集體利益放棄個人成就的意願。
  • 長篇回顧|蛋白質組學的發展:生命科學的裡程碑
    隨著分子生物學技術的發展,蛋白質的諸多功能不斷被研究和報導,如蛋白質可以作為離子通道參與信號轉導等,人們愈發重視對蛋白質的研究。21世紀初,生命科學領域迎來了一個重要的裡程碑——人類基因組草圖的繪製完成。
  • 解碼生命:從多視角看生命|遺傳|人類基因組計劃|解碼生命|基因組|...
    20 年過去了,在完成人類染色體DNA 測序的基礎上,功能基因組、表觀基因組、蛋白質組等研究進展迅速,與疾病相關的基因及其致病機制不斷被發現,眾多基因靶向藥物以及臨床基因檢測和治療方案研發成功,基因編輯、定量計算、冷凍電鏡等生物學技術日臻完善,新方法、新知識、新技術、新思想層出不窮,人類正以前所未有的速度從各個維度,特別是從分子水平揭示生命的奧秘。
  • Cell:重大突破!首次構建出人類大腦皮層神經發生的基因調控圖譜
    2018年1月14日/生物谷BIOON/---在一項新的研究中,來自美國加州大學洛杉磯分校等研究機構的研究人員首次構建出人類神經發生(neurogenesis)的基因調控圖譜,其中在神經發生中,神經幹細胞轉化為腦細胞並且大腦皮層在尺寸上擴大。他們鑑定出調控我們的大腦生長並且在某些情形下為在生命後期出現的幾種大腦疾病奠定基礎的因子。
  • 最詳盡人類基因多態性圖譜發布
    《科學》雜誌上報告了在基因研究技術手段上的收穫,相關成果標誌著人類基因研究進入了一個劃時代的新階段。 「千人基因組計劃」由中國深圳華大基因研究院、美國國立人類基因組研究所、英國桑格研究所等機構於2008年啟動,旨在繪製迄今最詳盡、最有醫學應用價值的人類基因多態性圖譜。現在報告的是該計劃第一階段的分析成果。
  • 表觀遺傳學:後基因組時代的領舞者
    從一個單個受精卵發展成人體中200多種不同類型細胞過程中DNA的序列也是不變的,這一過程被認為主要受「表觀遺傳密碼」的調控,這一密碼是什麼?而對這些問題的回答,從根本上說,將推動人類對生命進化理論的認識的深化和革新。    《科學時報》:談起我國在表觀遺傳學領域的研究現狀,大多評論為「與發達國家相比起步稍晚,但差距不大」。請您介紹一下國內外的研究狀況。
  • 人類基因組計劃25年:給大科學六大啟示
    Library & Archives 25年前,新創建的美國人類基因組研究國家中心(NHGRI,現在的國家人類基因組研究所)和美國及國際合作夥伴聯手,發起了「人類基因組計劃」(HGP)。接下來發生的事情,代表了最具歷史意義的科學努力之一:歷經13年,對人類基因組全部30億個鹼基對進行測序。
  • 人類基因組計劃是我的生命
    1993年,於軍參與「人類基因組計劃」這一裡程碑式的偉大科學計劃,也成為早期參與計劃的唯一華人,他在導師Maynard V.Olson的全力支持下,促成了中國科學家參與「人類基因組計劃」。  日前,證券時報記者獲得了獨家專訪於軍的機會。從下鄉知青到參與人類基因組計劃,從回國推動中國基因組學研究到參與組建華大基因公司,於軍首次向媒體披露往事。
  • 於軍:人類基因組計劃是我的生命
    1993年,於軍參與「人類基因組計劃」這一裡程碑式的偉大科學計劃,也成為早期參與計劃的唯一華人,他在導師Maynard V.Olson的全力支持下,促成了中國科學家參與「人類基因組計劃」。   日前,記者獲得了獨家專訪於軍的機會。從下鄉知青到參與人類基因組計劃,從回國推動中國基因組學研究到參與組建華大基因公司,於軍首次向媒體披露往事。
  • Cell發表關於人類原始生殖細胞中基因表達網絡的表觀遺傳調控機制...
    2015年6月4日,國際知名學術期刊CELL以封面文章的形式發表了北京大學生命科學學院生物動態光學成像中心湯富酬研究組和北京大學第三醫院喬傑研究組的最新研究成果——人類原始生殖細胞的轉錄組和DNA甲基化組概觀(The Transcriptome and DNA Methylome Landscapes of Human Primordial