導 讀:乳腺癌是危害女性健康的頭號惡性腫瘤,其發病率高、病因不明、早期症狀不清。2017年,多項研究通過已全基因組關聯分析(GWAS)尋找到150個乳腺癌相關的基因易感區段,但由於隨機採樣導致的抽樣誤差以及單核酸多態分子(SNP)之間複雜的連鎖不平衡,GWAS定位到通常只是致病位點的相關區域,其結果具有一定複雜性和不準確性。
基於以上研究,劍橋大學的Alison Dunning課題組1月8日於Nature Genetics發表工作,分析了乳腺癌組織聯合會(BCAC)中217,000多名受試者的基因組數據,通過精細定位技術(fine-mapping)在原先發現的150個易感基因區段中準確定義了191個風險基因,為臨床癌症風險評估提供可靠依據,同時為乳腺癌發生機制的研究指明新的方向!
首先,研究者對樣本進行基因分型,並使用多項式邏輯回歸來識別每個易感區段中獨立的乳腺癌關聯信號,在每個信號中定義可信的因果變異(CCV)。通過聯合關聯分析與計算機基因組特徵注釋,結合貝葉斯方法和PAINTOR,研究者定義了205個具有可信因果變體的獨立風險相關信號,並依據基因表達,染色質相互作用和功能注釋將其進行排序。
研究流程總結圖
在確定每個信號中潛在的因果變異後,研究者希望揭示其靶基因以及在DNA水平上的功能。其中,研究者發現與雌激素受體(ER)陽性乳腺癌的特徵變異,標記在ER陽性細胞上的開放活躍的基因調控區域,很大一部分與轉錄因子蛋白和調節因子的結合位點重疊。
另外,研究者還發現9種與ER陽性乳腺癌相關的重要靶基因編碼蛋白質,這些蛋白產物在雌激素信號傳導中發揮重要作用:CREBBP, EP300, ESR1, FOXI1, GATA3, MEF2B, MYC, NRIP1 和TCF7L2,其中CREBBP,EP300,ESR1,GATA3和MYC已被證明是癌症的驅動基因。
與ER陽性信號相反,研究者發現的ER陰性信號的基因組特徵較少(這受限於樣本數較少和可用的ChIP-Seq數據),但這同時也提示兩種乳腺癌的發展具有共同分子機制。據此,研究者確定了35個ER陰性乳腺癌的靶基因,其中,CASP8和MDM4已有相關的功能研究。
通過表型和顯著通路預測靶基因
最後,研究者們通過分析基因的分子功能、細胞組分和參與的生物學過程這樣一個「基因本體論(GO)」途徑來發現新的靶基因。值得注意的是,14%的靶基因與免疫系統途徑有關,在ER陰性的乳腺癌相關基因中這個比例達到19%,尤其是涉及T細胞活化、白細胞介素信號傳導、Toll樣受體級聯反應和I-κB激酶/NF-κB信號傳導等介導先天免疫系統活化和以及的過程。
這項研究通過精確定位技術,明確乳腺癌風險信號對應的基因突變,並定義了這些變異的靶基因。儘管大多數靶基因所對應的下遊通路機制基礎尚不清晰,但這對現有相關通路研究的方向作擴充和延伸,為乳腺癌易感性和發病機制等生物學研究奠定基礎,並為臨床作乳腺癌風險篩查提供強有力的證據!
參考文獻:
Laura Fachal. Fine-mapping of 150 breast cancer risk regions identifies 191 likely target genes. Nature Genetics. 08 Jan, 2020.
Michailidou, K. et al. Association analysis identifies 65 new breast cancer risk loci. Nature, 2017.