專家點評Cell|利用基因組圖揭示癌症複雜結構變異特徵

2020-12-09 BioArt生物藝術

癌症基因組在多種突變機制的作用下,會產生豐富的結構變異(structural variation)。簡單的結構變異模式如刪除(deletion)、串聯重複(tandem duplication)只由一個或兩個位點斷裂-融合組成新的連結(junction),而複雜的結構變異則會引起多個連結且組合成各種複雜的序列,通常還會伴隨拷貝數變異(copy number aberration),例如染色體碎裂(chromothripsis)、複雜染色體重排(chromoplexy)、斷裂-融合-橋染色體循環(breakage-fusion-bridge cycle)。雖然通過全基因組測序(whole genome sequencing),人們已經可以識別變異後的DNA連結和拷貝數變異,但仍沒有一套統一的方法來建立重排後的DNA模型用來發掘所有的變異模式。

近日,康奈爾醫學院和紐約基因組中心的Marcin Imielinski實驗室在Cell上發表了文章Distinct Classes of Complex Structural Variation Uncovered across Thousands of CancerGenomeGraphs基於一個關於DNA的簡單事實設計了連結平衡算法(Junction Balance Analysis,JaBbA),來把癌症基因組中的連結和拷貝數統一起來,重建出量化的基因組圖(genome graph),用於識別任何複雜度的結構變異。由於DNA的線性化學結構,除末端外每個片段都只且必有一個上遊的相鄰片段和一個下遊的相鄰片段,即每個獨特片段的總拷貝數必須與上遊的的連結拷貝數之和、下遊的的連結拷貝數之和相等。在此限制條件下,通過混合整數規劃,得到全基因組尺度上的最優整數解,用一個統一的模型同時推斷了DNA片段以及相鄰DNA片段之間的連結拷貝數(junction copy number)。在全面的基準測試證明JaBbA的DNA片段和連結拷貝數的準確性後,作者在2778個泛癌種全基因組數據上重建了基因組圖模型,並從低(1或2)和高拷貝數連結(大於7)兩個極端對連結簇的組成模式進行挖掘。

作者首先發現,在全部由低拷貝連結組成的連結簇中,富集了兩大類別,其一幾乎全部是刪除連結組成,二是幾乎全部由串聯重複組成。用伽馬-泊松回歸估計每一個基因組中每個固定長度區段上的刪除連結的分布後,得到一系列過量富集刪除連結的區段。這樣的區段中多個刪除連結作用於同一位點,導致拷貝數斷崖式下降,象形取名為基因組斷層(rigma)。基因組斷層在食道腺癌、巴雷特食道症(Barrett's esophagus)、胃癌、大腸癌等多種消化道病變中最為常見,在較晚複製的基因組區域中富集,並且特別集中於長基因(大於1兆鹼基對)中。有趣的是,最常重複出現基因組斷層的區域與已知的人類基因組的脆性位點(fragile site)高度重合,包括FHIT、MACROD2、LSAMP等基因,但也包含許多還未被標記為脆性位點的區域。由於已知的脆性位點大多是通過細胞實驗或胚系突變模式推斷的,所以只局限在最突出的位置上,而癌症的高突變率則可能給我們指向了更多還未被發現的脆性位點。

用同樣的方法觀察串聯重複連結,作者發現廣泛存在的多個串聯重複連結簇,在同一位點上多次複製,狀似金字塔,故名為基因組塔(pyrgo)。這類結構變異在子宮內膜癌、卵巢癌、乳腺癌和食道腺癌中最常出現,且過量富集於超增強子(superenhancer)所在的區域。與基因組斷層相反,基因組塔更偏好較早複製的區域。MYC基因位點是基因組塔最頻繁發生的位置之一,而其中MYC上遊的超級增強子比之基因本身更經常被擴增,作者認為這與串聯重複調控元件來刺激靶基因的假說不謀而合。

另一方面,在高拷貝數即擴增的區域中,作者對所有含有高拷貝數連結的連結簇根據三個特徵進行了聚類分析,除了發現了已知的二重微小染色體(double minute)和斷裂-融合-橋循環兩種模式之外,還觀察到了一類新的具有大量高拷貝連結、大量折返式連結(fold-back)的擴增模式。其影響範圍可多達數個染色體,被擴增的DNA總量能達到100~200百萬鹼基對,命名為基因組颱風(tyfonas)。這種模式在近50%的肢端黑色素瘤和近80%的脂肪肉瘤中存在,而在其他類型的黑色素瘤與軟組織肉瘤中則非常罕見。與TCGA樣本中通過RNA-seq發現的融合基因轉錄本比對,發現基因組颱風比其他複雜突變能更高效的產生融合基因,這也和肢端黑色素瘤患者通常缺乏小突變新抗原卻對免疫檢查點抑制劑敏感產生了聯繫。另外,結構變異連結端附近的單鹼基突變頻率也局部升高,在基因組颱風的連接周圍尤其明顯。結合這些觀察,作者進一步通過染色質構象和光學位點比對的數據提出了一種可能造成基因組颱風的機制,即早期的染色體碎裂形成的短片段被隨機修復並進行了線性和環狀的折返式擴增,最終通過與其他染色體的結合重新獲得了端粒與中心粒並穩定存在於癌細胞中。

把共13中從簡單到複雜的結構變異模式整合,對全部的病人進行聚類,總結出了14大類結構變異模式的組和,每一類富集的腫瘤類型和既往觀測到的現象相吻合。比如前列腺癌在碎裂組和複雜染色體重排組富集,遺傳性BRCA1缺陷的乳腺癌、卵巢癌在串聯重複最多的組合中富集(DDT)。與缺乏結構變異的大類(QUIET)相比,有六類病人的總生存期顯著縮短,標誌著結構變異的歸類在臨床預後中的應用潛力。

作者們表示,這項研究成果證明基因組圖數據結構是分析腫瘤結構變異的強有力的工具,隨著數據量進一步增大還會有更多的突變模式被發現,並與背後的的病因聯繫更緊密,最終進一步推動全基因組測序走向臨床應用。

專家點評

葉凱(西安交通大學)

基因組變異包括單鹼基替換變異(SNV)、短插入缺失變異(indel)和結構變異。短插入缺失變異通常定義為小於50個剪輯對的簡單類型插入或者缺失變異,而廣義結構變異指SNV和indel以外的所有變異。在基因組二代測序發展的早期,只有讀長較短的單端測序數據,我們只能通過分析測序數據在基因組上覆蓋度的差異,即read-depth方法來理解拷貝數變異;隨著雙端測序技術發展,我們開發出了基於測序數據兩端在參考基因組上比對距離和方向的read-pair方法,發現基因組中廣泛存在的各種類型結構變異。當前,世界各國高質量的二代甚至是三代測序數據大量湧現,進一步揭示了結構變異在種群差異、驅動物種性狀演化、疾病發生發展中的重要作用。最近人群隊列和腫瘤基因組研究揭示了複雜結構變異的存在,學界仍然在探索如何更好地發現、表徵複雜類型結構變異,統一複雜結構變異的數學描述。

本文作者提出了JaBaA(Junction Balance Analysis)的分析方法,基於參考基因組以及全基因組測序數據利用初步獲取片段(segmentation)的測序深度(read depth)信息以及連結(junction)信息,以片段作為節點,連結作為邊構建JBGG(junction-balanced genome graph)基因組圖模型。首先,假設片段內小區間(bins)的拷貝數符合高斯分布建立似然函數。然後考慮到圖模型中部分loose end的邊可能受低比對率、測序深度或者純度等因素影響,對loose end節點的拷貝數做出假設,建立先驗分布。作者基於貝葉斯理論推導將片段內信息(每個節點拷貝數分布的殘差)與片段間的連接信息(先驗中的loose end節點的出度以及入度)共同作為目標函數進行最小化,在此過程中,作者巧妙的基於一個簡單的事實作為約束,即圖中每個節點的拷貝數應該與它們的入度以及出度數量一致,將目標函數中兩部分聯繫起來,使得它們可以共同作用得到最優的估計拷貝數(junction copy number)。作者在全面的基準測試證明了估計拷貝數的準確性,並在2778個泛癌症全基因組數據上重建圖模型進行模式挖掘,定義了pyrgo,rigma和tyfonas等全新的複雜重排現象。由此證明了該方法在分析腫瘤結構變異中的重大作用,隨著未來數據量的增加會進一步推動測序技術向臨床應用的轉變。

本文創新性地搭建基於基因組圖數據結構的腫瘤複雜結構變異解析方法,將基於二代測序數據的變異檢測提升到一個新的高度,隨著該方法在大量腫瘤測序數據廣泛運用,我們將發現更多以前未知的複雜結構變異,探索其發生機理、變異率、位點偏好性等表徵,揭示新的腫瘤發生發展機理,為腫瘤早診、個體化治療方案、伴隨診斷等醫療應用提供關鍵技術支撐,面向人民生命健康。

原文連結:

https://doi.org/10.1016/j.cell.2020.08.006

相關焦點

  • 【學術前沿】專家點評Cell Research | 汪源/陳路/張燕組揭示惡性...
    隨後利用基因編輯在iCas9 hNSC中引入不同的GBM驅動突變組合和譜系追蹤標記mCherry,再進行原位移植,構建了多種原位原發的惡性膠質瘤新模型。此類模型基因編輯效率很高,可以一次性引入多個驅動突變,不需要進行單克隆篩選即可形成腫瘤。其中,TP53/NF1雙突變組合(TN組)惡性成瘤率94%,TP53/NF1/PTEN突變組合(TNP組)惡性成瘤率100%。
  • 張忠華教授在《The Plant Cell》發表論文揭示黃瓜全雌基因分子...
    張忠華教授在《The Plant Cell》發表論文揭示黃瓜全雌基因分子作用機制 近日,青島農業大學園藝學院院長張忠華教授與中國農業科學院蔬菜花卉研究所孫進京副研究員進行合作,聯合中國農業科學院深圳農業基因組研究所,首次發現黃瓜中全雌基因(Female)是獲得新功能的基因ACS1G
  • Cell:構建出人類免疫細胞圖譜,可確定遺傳變異對基因表達的影響
    為了確定遺傳變異對免疫系統的影響,Vijayanand及其同事們產生了15種類型免疫細胞的基因活性譜,其中這15種類型的免疫細胞發表著在91名健康供者中每個人的血液中發現的最為豐富的細胞類型。他們的研究結果揭示了遺傳變異對免疫系統中基因活性的深遠影響。
  • 研究揭示癌症患者感染SARS-CoV-2後的急性免疫特徵與長期影響
    研究揭示癌症患者感染SARS-CoV-2後的急性免疫特徵與長期影響 作者:小柯機器人 發布時間:2021/1/6 16:38:45 英國倫敦大學國王學院Sultan Abdul-Jawad等研究人員合作揭示癌症患者感染SARS-CoV
  • Nat Commun:使用基因表達數據來比較實驗室癌症模型和真實腫瘤
    2021年1月9日訊/生物谷BIOON/---從腫瘤細胞中生長出來並在實驗室條件下培養的癌細胞系是癌症研究的支柱。它們為癌症基因組學和生物學提供了寶貴的見解,但由於一些原因,科學家們往往難以將基於癌細胞系的實驗數據與其互補腫瘤的數據進行比較,也難以選擇最佳的癌細胞系來模擬特定的腫瘤類型。
  • Stem Cell Rep:新研究揭示人海馬區神經元特徵
    該研究發表在最近的《Stem cell Reports》雜誌上。在阿爾茨海默氏病中,調節動機,情感,學習和記憶的海馬結構受到嚴重影響。但是,由於無法獲得海馬組織,除非進行驗屍,否則研究人員不可能了解導致細胞功能障礙和隨後神經元損傷的原始事件是什麼。然而,如果能夠在阿爾茨海默氏病發生早期了解哪些細胞途徑會發生改變,就可以開發出可以減慢疾病速度的療法。
  • 專家點評Cell|虛擬實境範式揭示多巴胺信號的生理意義
    然而,早期研究使用的行為範式相對較為簡單,因此,這一假說是否適用於更複雜的行為範式還需進一步驗證。另外,也有其他實驗室報導了多巴胺的伏隔核釋放可獨立於中腦胞體的活動【2】,因此,複雜環境下的多巴胺環路水平的信號記錄具有重要意義。
  • 多個小麥基因組揭示現代育種的全球變異
    多個小麥基因組揭示現代育種的全球變異 作者:小柯機器人 發布時間:2020/11/27 13:55:57 加拿大薩斯喀徹溫大學Curt A.
  • Cell:線蟲中全腦神經元鑑定的多色圖譜
    標記有NeuroPAL的神經元在綠色、青色或黃色發射通道中不發射螢光,從而使這個轉基因可與基因表達或神經元動力學的許多已報導分子一起使用。研究人員利用NeuroPAL進行了神經系統範圍內神經元鑑定的三種應用。首先,研究人員確定了乙醯膽鹼、GABA和穀氨酸的所有代謝型受體的全腦表達模式,從而完成了該交流網絡的圖譜。其次,研究人員發現了轉錄因子突變引起的細胞命運變化。
  • 科學家揭示英國生物庫中49960名個體的外顯子組測序數據和特徵
    科學家揭示英國生物庫中49960名個體的外顯子組測序數據和特徵 作者:小柯機器人 發布時間:2020/10/24 22:13:32 美國再生元遺傳學中心Aris Baras、Cristopher V.
  • 科學家利用高通量測序揭示和表徵人轉錄效應因子
    科學家利用高通量測序揭示和表徵人轉錄效應因子 作者:小柯機器人 發布時間:2020/12/16 15:34:28 美國史丹福大學Lacramioara Bintu和Michael C.
  • Cell綜述深度解讀!幹細胞在皮膚損傷修復、癌症和皮膚穩態中扮演的...
    Cell, doi:10.1016/j.cell.2020.03.019在過去15年裡,研究者Elaine Fuchs及其同事利用毛囊幹細胞(HFSCs,hair follicle stem cells)的分子基因表達,發現並闡明了多個轉錄、表觀遺傳學和生境因子在HFSCs形成和再生過程中的重要功能,他們發現,毛囊中的兩層幹細胞能通過生長因子BMP6和FGF18來互相交流
  • Cell:研究揭示大腦工作記憶新圖譜
    文章作者,洛克菲勒大學的神經科學家Priya Rajasethupathy說:「事實上,早期研究表明,大腦的某種結構與工作記憶有關。」 「我們的新發現使我們對這些領域是什麼以及它們如何發揮作用提供了更切實的見解。」
  • Cell|利用單分子成像揭示應激顆粒中mRNAs翻譯過程
    近年來,在活細胞中使用單分子成像技術的研究已逐步揭示SGs的mRNA募集動力學,但是仍不清楚將mRNA隔離到SGs是否對基因表達有任何影響【2,3】。由於SGs的形成往往與翻譯沉默相吻合,人們推測SGs直接導致應激下的翻譯抑制,且普遍認為SGs中只包含非翻譯mRNA。然而,卻很少有直接證據支持這一猜想。
  • Nat Genet:新研究揭示癌症基因突變規律
    2020年10月7日訊/生物谷BIOON/---德克薩斯大學MD安德森癌症中心研究人員的一項新研究發現,癌症中發現的突變並非隨機積累,而是以不同的模式發現。其中基因組的三維結構是導致突變的潛在因素。研究發現,由外部因素(例如紫外線或菸草煙霧)引起的突變以及內部因素(例如DNA損傷修復或校對機制的缺陷)引起的突變實際上位於基因組的不同區域。
  • Science:利用基因相互作用圖譜確定蛋白複合物的整體結構
    這在以前是不可能達到如此規模的,它應該會大大加快確定蛋白複合物結構的過程,包括那些用傳統方法難以解決的蛋白複合物結構。」 這種方法建立在Krogan開創的一種名為基因相互作用圖譜(genetic interaction mapping)的技術之上。它在活細胞中篩選數以千計的基因突變組合,並且在相對較短的時間內,揭示基因的蛋白產物在常見的細胞過程中所起的作用。
  • Science|識別基因功能的新技術Perturb-Seq並揭示自閉症風險基因
    自閉症與基因研究背景人類遺傳學研究發現了成千上萬個基因的遺傳變異與複雜人類疾病之間的關聯,尤其是全外顯子測序(Whole-exome Sequencing, WES)揭示了與神經系統疾病有關的功能缺失變異,如自閉症譜系障礙和神經發育延遲(Autism Spectrum Disorders and Neurodevelopmental disorder, ASD/ND)。
  • Nature子刊:最新研究有望預測哪些人更容易患癌症
    當然,即使大家都暴露於致癌環境中,每個人患癌症的機率也是不同的。醫學專家經過多年研究發現,有些人群患癌症的風險明顯高於其它人,比如有癌症家族史的人一些癌症患者,其子女患癌症的風險明顯高出一般人群。近年來,隨著分子生物學研究的突飛猛進,科學家們已經意識到人類的許多疾病原來都與基因有關,癌症就是其中之一。腫瘤易感性是指不同人群、不同個體由於遺傳結構不同,在外界環境影響的條件下呈現出號患某種惡性腫瘤的傾向。
  • 專家點評|轉錄調控複合物INTAC結構功能更新對磷酸酶PP2A的認知
    Science上發表研究長文揭示人源BAF複合物的染色質重塑機制(詳見BioArt報導:Science丨徐彥輝團隊揭示人源BAF複合物的染色質重塑機制)之後,在轉錄調控相關結構功能研究中收穫的又一次重量級成果。
  • David Liu《Cell》再取新突破:不做實驗,就能知道基因編輯結果...
    研究人員以≥90%的準確度糾正了3388個與疾病相關的SNV,其中包括675個等位基因,其「旁觀者」核苷酸被BE-Hive正確預測,因此無法編輯。該研究發現了以前無法預測的C-to-G或C-to-A編輯的決定因素,並利用這些發現以≥90%的準確性糾正了174個病原性SNV的編碼序列。最後,該研究利用BE-Hive的見識來設計新穎的CBE變體,以調節編輯結果。