重磅!PCAWG聯盟6篇Nature、15篇Nature子刊以前所未有的規模揭示...

2020-11-25 生物谷

2020年2月6日訊/生物谷BIOON/---一項大規模的國際努力對來自38個人體組織的2600多個腫瘤基因組進行了多方面研究,從而對癌症的遺傳基礎產生了豐富的見解。

早在2001年對首個人類基因組進行測序後,腫瘤的全面基因組表徵就成為癌症研究人員的一個主要目標。從那時起,測序技術和分析工具取得的進展使得這個研究領域蓬勃發展。在發表在最新一期Nature期刊的6篇論文中,全基因組泛癌分析(Pan-Cancer Analysis of Whole Genomes, PCAWG)聯盟進行了迄今為止最全面、最雄心勃勃的癌症基因組薈萃分析。與以前的研究工作主要集中於癌症基因組的蛋白編碼區域不同,PCAWG聯盟分析了整個基因組。在這6篇Nature論文中,每篇論文都仔細研究了癌症遺傳學的一個重要方面---總之,他們的發現對於理解癌症的完整遺傳複雜性至關重要。

在討論這些分析的影響之前,至關重要的是要強調支持PCAWG聯盟努力的大量數據和複雜的組織框架。該項目涉及一個來自4大洲的744個附屬機構的跨學科科學家小組,該小組必須克服主要的技術、法律和倫理挑戰,才能在保護患者數據的同時進行分布式分析。研究人員分為16個工作組,每個工作組專注於癌症基因組學的不同方面---比如,評估突變的復發或推斷腫瘤的發生。

總體來說,PCAWG聯盟總共對38種腫瘤類型進行了綜合分析。這些研究人員對2658個全癌基因組進行了測序,同時對來自同一癌症患者的相匹配的非癌細胞基因組進行測序。這些數據得到1188個轉錄組---腫瘤中RNA轉錄本的序列和豐度---的補充。

圖片來自Nature, 2020, doi:10.1038/d41586-020-00213-2。

這些研究工作涉及廣泛的質量控制和協調的數據處理,以及對用於檢測突變的計算流程的大規模系統性實驗驗證。使用了許多計算算法和流程,並進行了比較。這需要數百TB的數據,這些數據分布在多個數據中心中,並且很可能需要數百萬個處理小時---所有這些處理都由雲計算實現。值得注意的是,PCAWG聯盟的努力為雲計算如何使得國際合作成為可能並有助於推進數據密集型領域發展提供了一個很好的例子。

第一篇Nature論文概述了PCAWG數據集的廣度和深度。PCAWG聯盟報導平均而言,每個癌症基因組均攜帶4或5個驅動突變,這就為癌細胞提供了選擇性優勢。在研究的腫瘤中,僅5%沒有發現驅動突變。相比之下,許多癌症表現出基因組災難---複雜染色體重排(chromoplexy, 存在於17.8%的腫瘤)和染色體碎裂(chromothripsis , 存在於22.3%的腫瘤)---的特徵,從而導致基因組發生重大的結構變化。

其他5篇Nature論文更詳細地探討了這個數據集的不同方面。比如,在第二篇Nature論文中,Rheinbay等人著手鑑定出非編碼DNA中的遺傳驅動因子。這是一項雄心勃勃的研究工作,這是因為要準確地檢測非編碼區中的突變比編碼區中的突變要困難得多,更不用說評估非編碼區中的突變。這些作者使用仔細的建模來排除偽影(artefacts),並系統地識別非編碼驅動突變。

他們的結果使得以前報導的非編碼驅動因子(比如長鏈非編碼RNA NEAT1和MALAT1)受到質疑,但也揭示了新的非編碼驅動因子。比如,這些作者報導了至關重要的腫瘤抑制基因TP53非編碼區中發生的復發突變。他們還發現端粒酶基因TERT的非編碼區中相對頻繁發生的突變導致端粒酶的過度表達(這有助於腫瘤細胞不受控制地分裂),這與以前的一項針對晚期(轉移性)腫瘤的泛癌研究中發現的較高端粒酶突變發生率(12%)相一致。儘管該研究不能排除存在其他非編碼驅動因子,但它明確地表明這種類型的突變並不常見。

在第三篇和第四篇Nature論文中,Alexandrov等人和Li等人著重研究了稱為標籤(signature,也譯為籤名,指的是獨特性的DNA序列或單核苷酸位點)的基因組畸變(genomic aberrations)。不同的過程,比如缺陷性的DNA修復機制,或者暴露於環境誘變劑,會產生特徵性的DNA畸變模式。如果我們要完善已知的突變標籤並發現新的突變標籤,那麼更大規模的基因組數據集至關重要。令人印象深刻的是,Alexandrov等人和Li等人鑑定出97個標籤序列。他們對先前研究工作的擴展不僅包括常規的單核苷酸標籤,而且還包括涉及多核苷酸變異(multi-nucleotide variant)、小片段DNA插入或缺失的標籤。

值得注意的是,Li及其同事們是最早發現涉及結構變異(structural variant)---基因組的大部分發生重排---的可重現標籤的人之一。由於結構變異的多樣性和複雜性,識別結構變異的過程比識別突變標籤的過程更為複雜。

通過一系列的突變分組(mutation-subgrouping)步驟,這些研究人員確定了16個結構變異標籤,比如揭示了兩個結構變異標籤---缺失和相互倒位(reciprocal inversion)---之間存在推定的機理聯繫。他們還了解所有16個標籤在癌症中的作用。某些DNA修復基因中的突變顯示與特徵性的癌症標籤相關。比如,PCAWG聯盟發現基因CDK12中的突變與重複DNA的串聯片段相關,並且DNA修復酶MBD4的截短變異與涉及稱為CpG位點的DNA序列的獨特突變標籤同時出現。總而言之,這些新的標籤為理解癌症產生機制以及誘變暴露在這個過程中的作用奠定了基礎。

1976年,科學家們首次提出了癌症通過進化過程產生的想法。此後,人們就根據隨機突變和自然選擇來描述癌症進化。具有賦予高適應性的突變的癌細胞迅速增殖,成為細胞群體中最突出的細胞克隆。這種現象稱為克隆清除(clonal sweep),在癌症生長過程中反覆出現。通過隨時間推移對多個區域進行測序,可以最有效地研究癌症進化,但是也可以通過一次活檢來重建癌症進化---這是Gerstung等人在第五篇Nature論文中採用的方法。

這些作者引入了「分子時間(molecular time)」的概念,以對克隆和亞克隆突變進行分類。他們認為,僅存在於一部分腫瘤細胞中的亞克隆突變一定是在癌症進化的晚期才出現的。他們將存在於所有腫瘤細胞中的克隆突變歸類為早期克隆突變或晚期克隆突變,這取決於克隆突變是在克隆經歷拷貝數增加(copy-number gain, 一個基因或染色體區域的拷貝數增加)之前或之後發生的。這些研究人員匯總了來自多種腫瘤的進化數據,這使得他們能夠確定常見的突變軌跡,比如描述了結直腸癌中突變出現的典型順序的APC-KRAS-TP53進展。

Gerstung等人發現,在給定癌症中最常見的驅動突變也往往最早出現。同樣,如果在某種特定的癌症類型中拷貝數增加非常頻繁地出現,那麼它們往往會較早發生。比如,在透明細胞腎癌中,一部分染色體中的拷貝數增加很常見,傾向於在這種疾病產生的早期出現。相反,全基因組重複(whole-genome duplication)是這種癌症中相對較晚的事件。最後,這些研究人員發現至少40%的腫瘤中的突變標籤會隨時間變化。這些變化反映了環境暴露在疾病進展中的作用逐漸減弱,以及DNA修復缺陷的發生頻率和嚴重性增加。總體而言,他們的研究結果表明,驅動突變可以在癌症確診之前數年發生,這對癌症的早期發現和生物標誌物開發具有重要意義。

在最後一篇Nature論文中,PCAWG轉錄組核心小組(PCAWG Transcriptome Core Group)及其同事們利用了具有匹配轉錄組數據的1188個PCAWG樣本,將DNA和RNA的改變功能性地聯繫在一起。該小組發現數百個單核苷酸DNA突變與附近基因的表達之間存在關聯。然而,更大的拷貝數變化是癌細胞中基因表達變化的主要驅動力。突變也與RNA轉錄本結構的變化有關,比如在非編碼區(內含子)中形成新的蛋白編碼區(外顯子)。

這些作者還描述了橋接融合(bridged fusion)---由於第三個DNA片段的插入將兩個基因融合在一起---的發生頻率。最終,儘管在分析的1188個樣本中有87個在DNA水平上沒有發生驅動改變,但是該小組發現每個樣本都具有RNA水平的改變。總之,這些見解說明了將RNA和DNA測序分析整合在一起在癌症研究中的強大作用。

這六篇Nature論文以及在Nature Genetics期刊上發表的5篇論文、在Nature Biotechnology期刊上發表的1篇論文、在Communications Biology期刊上發表的1篇論文、在Nature Communications期刊上發表的8篇論文(go.nature.com/3boajsm)代表了癌症和雲基因組學(cloud genomics)的一個裡程碑。

通過專注於推論,PCAWG聯盟成功地擴展了十年來主要基於觀察的癌症測序研究。值得注意的是,儘管與描述性研究相比,推理性分析對癌症的了解更深,但是它們的結果也具有更高的不確定性。

PCAWG數據集的廣泛可用性和質量幾乎可以肯定會激發一系列生物學見解和方法學發展。與其他功能性基因組數據集整合(比如,探查三維基因組結構)在一起無疑也將提供對遺傳畸變的原因和後果的進一步理解。

當前研究的最大局限性是缺乏有關患者預後和治療的臨床數據。這樣的數據將使得研究人員能夠確定可預測臨床結果的遺傳變化。幸運的是,一個名為國際癌症基因組聯盟-加速基因組腫瘤學研究(ICGC-ARGO)的項目正在進行中,該項目將為100000多名癌症患者構建這樣的資源。

最終,PCAWG聯盟召集了成千上萬的科學家,共同努力實現它的目標。這些努力的長期影響將不僅限於今天發表的研究結果,而且還包括將來自這個全球研究人員聯盟成員之間已經形成的合作以及已經進行的知識交流。(生物谷 Bioon.com)

參考資料:1.Peter J. Campbell et al. Pan-cancer analysis of whole genomes. Nature, 2020, doi:10.1038/s41586-020-1969-6.

2.Esther Rheinbay et al. Analyses of non-coding somatic drivers in 2,658 cancer whole genomes. Nature, 2020, doi:10.1038/s41586-020-1965-x.

3.Ludmil B. Alexandrov et al. The repertoire of mutational signatures in human cancer. Nature, 2020, doi:10.1038/s41586-020-1943-3.

4.ilong Li et al. Patterns of somatic structural variation in human cancer genomes. Nature, 2020, doi:10.1038/s41586-019-1913-9.

5.Moritz Gerstung et al. The evolutionary history of 2,658 cancers. Nature, 2020, doi:10.1038/s41586-019-1907-7.

6.Claudia Calabrese et al. Genomic basis for RNA alterations in cancer. Nature, 2020, doi:10.1038/s41586-020-1970-0.

7.Yuan Yuan et al. Comprehensive molecular characterization of mitochondrial genomes in human cancers. Nature Genetics, 2020, doi:10.1038/s41588-019-0557-x.

8.Kadir C. Akdemir et al. Disruption of chromatin folding domains by somatic genomic rearrangements in human cancer. Nature Genetics, 2020, doi:10.1038/s41588-019-0564-y.

9.Bernardo Rodriguez-Martin et al. Pan-cancer analysis of whole genomes identifies driver rearrangements promoted by LINE-1 retrotransposition. Nature Genetics, 2020, doi:10.1038/s41588-019-0562-0.

10.Marc Zapatka et al. The landscape of viral associations in human cancers. Nature Genetics, 2020, doi:10.1038/s41588-019-0558-9.

11.Isidro Cortés-Ciriano et al. Comprehensive analysis of chromothripsis in 2,658 human cancers using whole-genome sequencing. Nature Genetics, 2020, doi:10.1038/s41588-019-0576-7.

12.Sergei Yakneen et al. Butler enables rapid cloud-based analysis of thousands of human genomes. Nature Biotechnology, 2020, doi:10.1038/s41587-019-0360-3.

13.Joana Carlevaro-Fita et al. Cancer LncRNA Census reveals evidence for deep functional conservation of long noncoding RNAs in tumorigenesis. Communications Biology, 2020, doi:10.1038/s42003-019-0741-7.

14.Marta Paczkowska et al. Integrative pathway enrichment analysis of multivariate omics data. Nature Communications, 2020, doi:10.1038/s41467-019-13983-9.

15.Matthew A. Reyna et al. Pathway and network analysis of more than 2500 whole cancer genomes. Nature Communications, 2020, doi:10.1038/s41467-020-14367-0.

16.Wei Jiao et al. A deep learning system accurately classifies primary and metastatic cancers using passenger mutation patterns. Nature Communications, 2020, doi:10.1038/s41467-019-13825-8.

17.Yiqun Zhang et al. High-coverage whole-genome analysis of 1220 cancers reveals hundreds of genes deregulated by rearrangement-mediated cis-regulatory alterations. Nature Communications, 2020, doi:10.1038/s41467-019-13885-w.

18.Lina Sieverling et al. Genomic footprints of activated telomere maintenance mechanisms in cancer. Nature Communications, 2020, doi:10.1038/s41467-019-13824-9.

19.Shimin Shuai et al. Combined burden and functional impact tests for cancer driver discovery using DriverPower. Nature Communications, 2020, doi:10.1038/s41467-019-13929-1.

20.Marek Cmero et al. Inferring structural variant cancer cell fraction. Nature Communications, 2020, doi:10.1038/s41467-020-14351-8.

21.Vinayak Bhandari et al. Divergent mutational processes distinguish hypoxic and normoxic tumours. Nature Communications, 2020, doi:10.1038/s41467-019-14052-x.

22.EDITORIAL. The era of massive cancer sequencing projects has reached a turning point. Nature, 2020, doi:10.1038/d41586-020-00308-w.

23.Mark Phillips et al. Genomics: data sharing needs an international code of conduct. Nature, 2020, doi:10.1038/d41586-020-00082-9.

24.Marcin Cieslik et al. Global genomics project unravels cancer’s complexity at unprecedented scale. Nature, 2020, doi:10.1038/d41586-020-00213-2.

相關焦點

  • 周佳海/唐奕已合作發表2篇Nature、2篇子刊
    前言上海有機所/深圳先進技術研究院的周佳海研究員和UCLA的唐奕教授可謂是酶催化界的黃金拍檔,兩人合作的論文已有兩篇子刊,兩篇正刊。2016年,兩人合作的第一篇子刊發表在Nature Chemical Biology上(DOI:10.1038/nchembio.2202);2018年,兩人合作,運用以抗性基因為導向的基因組挖掘技術成功發現了一種新型天然產物除草劑,發了一篇Nature(Doi: 10.1038/s41586-018-0319-4);2019年兩人再次合作,揭示了多功能周環酶LepI的催化分子機制,發了一篇Nature
  • Nature子刊,今年首個IF就突破12分,明年或可衝18分
    來自WoS截圖今年是Nature Sustainability拿到的第1個IF,作為Nature子刊,首個IF就超12分,確實值得我們關注~期刊基本信息關於此刊的具體情況,大家可以看看:https://www.nature.com/natsustain/
  • Nature非編碼RNA重要論文被撤,涉多名華人科學家
    近日,世界頂級科技期刊《nature》對2014年發表題為《miR-34a blocks osteoporosis and bone metastasis by inhibiting osteoclastogenesis and Tgif2》的論文做出撤稿的決定,該篇論文當時揭示了miR-34a作為關鍵的破骨細胞抑制劑和潛在的治療策略
  • 浙江大學:最近連發2篇Science和多篇Nature子刊!
    在國家雙一流名單公布的最近一個多月裡,浙江大學在科研方面就取得了很大突破,連續發表2篇Science(含參與發表1篇)和5篇Nature子刊,上升勢頭可謂非常強勁。  這些論文來自浙大不同院系,包括生命科學研究院、醫學院、化學系、物理系、農學院等。
  • Nature又放毒了,記憶T細胞居然起源於效應T細胞(2篇Nature重磅推出)
    2篇Nature同時揭示,記憶T細胞居然來自效應T細胞。2篇Nature同時揭示,記憶T細胞居然來自效應T細胞。Akondy等【1】和Youngblood等【2】揭示了產生記憶T細胞的細胞群,以及記憶T細胞群如何演化。幼稚T細胞是那些以前沒有對病原體作出反應的細胞。當它們識別出病原體時,它們迅速分裂並表達分子。這些反應細胞被稱為效應T細胞(更具體地說,是一種稱為細胞毒性T細胞的效應細胞),它們可以遷移到炎症組織並殺死感染的細胞【3】。
  • 我的三篇Nature子刊之旅
    子刊一作,第3篇日前返修已於昨日返修結束擇期發表。 蠻失落的,一瞬間覺得既往300多日夜仿佛一瞬間變得不值得,Ann看到了我的失落與沮喪,遞來了一杯檸檬水,安慰了幾句,說是這個刊物也是很多人夢寐以求都無法企及的高度,然後就走了,雖然失望,但是我還是按耐住了悲傷,在6個小時內按規定流程提前走完撤稿-再投-確認。
  • Nature又上線2本新子刊!
    你的機會來了——2019年2月,Nature先後推出了兩本新子刊,分別是 Nature Food 和Nature Cancer。Nature雜誌的子刊達到了53本,其中20本為綜述期刊。2019年2月24日,Nature官網正式上線了一個新子刊:Nature Food。這是一本在線期刊,將於2020年1月正式啟動。
  • 寶雞文理學院馮海濤博士在Nature子刊和JACS等國際期刊發表論文
    其中,研究論文「Tuning molecular emission of organic emitters from fluorescence to phosphorescence through push-pull electronic effects」發表在 Nature 子刊 Nature Communications(SCI一區Top期刊,影響因子12.18
  • 合肥工業大學參與的PCAWG聯盟在《Nature》發表6篇研究論文!牛!
    6篇《Nature》!合肥工業大學參與的PCAWG聯盟在《Nature》發表研究論文2020年2月6日,PCAWG(Pan-Cancer Analysis of Whole Genomes,泛癌全基因組分析)聯盟在《Nature》正刊發表了6篇論文,合肥工業大學楊善林院士和丁帥教授是集體作者的成員。
  • 重大團隊發表人文社科領域首篇Nature子刊級別論文
    重大團隊發表人文社科領域首篇Nature子刊。網絡截圖 華龍網發華龍網-新重慶客戶端11月4日16時20分訊(記者 馮茴花)今(4)日,華龍網-新重慶客戶端記者從重慶大學獲悉,Nature子刊《Nature Communications》在線發表了重大管理科學與房地產學院任宏教授和蔡偉光副教授團隊聯合國內外多位研究者共同完成的論文「Dilution effect of the building area on energy
  • 14篇Nature論文合集!「DNA元件百科全書」公布第三階段成果
    《自然》、《自然—方法》和《自然—通訊》聯合發表14篇論文描述了這一結果,為基因組組織和功能帶來了新的認知。合集中的其他論文利用ENCODE的數據集揭示了決定部分功能性元件作用方式的原理。《自然》發表的三篇論文報導了胎鼠在八大發育階段的具體信息。
  • 幸福來得很突然,中山大學兩篇論文同一日被《nature》Online發表
    中山大學校長羅俊團隊論文 中山大學新任校長帶來的捷報2018年8月29日,國際權威期刊《nature》刊登了通訊作者為中山大學新任校長羅俊,物理與天文學院,青年教授薛超為並列一作的論文《Measurements
  • 上大《nature》子刊:揭示低溫下非晶合金的剪切強化機制
    近日,上海大學材料學院青年教師卞西磊,通過高能同步輻射實驗和分子動力學模擬,建立了非晶合金在降溫過程中局域原子結構變化與剪切穩定性增強之間的關係,揭示了非晶合金在原子尺度上的結構不均勻性與中程、短程有序疇的非均勻收縮有關,
  • 今日斬獲6篇Nature,中國科學家取得系列突破
    10月14日,頂級學術期刊 Nature 上,國人一共發表了6篇論文,其中,以國內大學為第一單位,且第一作者和通訊作者都是國人的共三篇,分別為清華大學、北京大學以及廈門大學。國人參與的有三篇,分別為中國科學院大學、浙江大學醫學院以及南開大學。讓我們一起來看看他們在材料、計算機科學、物理科學以及生命科學等領域的突破吧。
  • Nature 中文摘要|08 October 2015
    in Africa between 2000 and 20152000-2015年間非洲的瘧疾防治措施對當地惡性瘧原蟲的影響http://www.nature.com/nature/journal/v526/n7572/full/nature15535.html本文中作者對2000-2015年間撒哈拉以南非洲地區的瘧疾情況進行了分析
  • 4篇Nature齊發!揭開人類基因組變異研究新時代
    為了反映這種多樣性並以前所未有的規模捕捉大群體個體間的基因變異程度,基因組聚合資料庫 (The Genome Aggregation Database,gnomAD) 應運而生。gnomAD目前已經收集了15,708個全基因組和125,748個外顯子組的數據。目前,gnomAD資料庫中的大規模數據已對公眾開放。
  • Nature子刊:EBV編碼的microRNA BART1通過調控PTEN依賴的信號通路誘導了腫瘤轉移
    Nature子刊:EBV編碼的microRNA BART1通過調控PTEN依賴的信號通路誘導了腫瘤轉移 7
  • Nature子刊一周連發兩篇研究,我被相反的結果整...
    根據2017年底的數據,中科院院士中,女性也只有6%;  第一篇,Nature子刊Science of Learning,11月1日發表,作者來自佛羅裡達國際大學、德拉瓦大學、天普大學、卓克索大學。
  • Nature子刊封面:哈佛等開發微型手術機器人
    Wood) 基於摺紙結構研發了一款超輕便,高精度的顯微外科手術機器人——mini-RCM,該項研究發表於nature旗下新子刊《nature machine intelligence(自然-機器智能)》,並登上該期刊8月份封面。
  • 《自然》重磅!迄今最大規模人類遺傳變異資料庫公布,將破解基因...
    而這種「不完整」的局面將會停止:5月27日,國際頂級期刊《自然》共發表了6篇Nature(4篇研究論文),1篇Nature Medicine,2篇Nature Communications細緻闡述了研究人員們在這一方面獲得的最新裡程碑式突破。