基於ATAC-Seq、HiCHIP數據構建大腦表觀遺傳圖譜

2020-11-11 測序中國

阿爾茲海默症(AD)和帕金森氏症(PD)是世界範圍內的常見神經退行性疾病。通過全基因組關聯研究(GWAS),科學家們已經鑑定出了數千個與這兩類疾病相關的單核苷酸多態性(SNP),但這些SNP大多處於基因組的非編碼區域,因此難以確定其功能。

近日,來自史丹福大學的Howard Chang和Tomas Montine團隊,利用單細胞/多細胞ATAC-Seq和HiChIP數據,分析了認知健康人群大腦不同區域的染色質可及性和三維基因組構象,繪製了成年人類大腦的多組學表觀遺傳圖譜。此外,研究團隊還開發了相應的機器學習框架整合這些多組學數據,用於預測AD和PD相關的非編碼區SNP功能。該研究結果發表在Nature Genetics上,文章題為「Single-cell epigenomic analyses implicate candidate causal variants at inherited risk loci for Alzheimer’s and Parkinson’s diseases」。

圖1. 文章發表在Nature Genetics

利用傳統的多細胞ATAC-Seq,研究團隊首先描繪了來自39個神經系統健康個體的7個大腦區域的染色質可及性圖譜(圖2)。隨後又選取其中10個樣本進行單細胞ATAC-Seq分析,一共獲得了70,631個細胞中的染色質可及性數據。去除批次效應後進行聚類分析,研究人員發現這些細胞可聚成24個類別,分屬於8種不同的細胞類型(圖3),其中包括六種主要的大腦細胞類型:興奮性神經元(excitatory neurons), 抑制性神經元(inhibitory neurons),小膠質細胞(microglia),寡突膠質細胞( oligodendrocytes),星狀膠質細胞(astrocytes)和寡突膠質細胞祖細胞(oligodendrocyte progenitor cells)。

圖2. 研究中取樣的7個大腦區域圖片來源:Nature Genetics

圖3. 70,631個單細胞ATAC-Seq數據利用UMAP聚類的結果圖片來源:Nature Genetics

模體(Motif)分析的結果顯示,不同細胞類型的染色質可及性區域都結合有特異性的驅動轉錄因子,例如小膠質細胞中的SPI1和神經元中的JUN/FOS。同時,研究人員對研究中的神經元細胞進行了聚類分析,鑑定出了30種不同的細胞亞類(圖4)。

圖4. UMAP分析鑑定出的30種神經元細胞亞類圖片來源:Nature Genetics

為了找出非編碼區域SNP的靶標基因,研究人員從最初取樣的7個大腦區域中選擇了其中的6個,製備H3k27ac介導的HiChIP文庫並進行測序,共鑑定出了833,975對染色質交互作用。同時,研究團隊利用單細胞之間可及性強度大小的協同變化情況(co-accessibility),預測出了2,822,924個交互作用。通過這兩種分析方式獲得的交互作用只有20%的重合,表明HiChIP只能鑑定出同一類細胞共有的交互作用,無法捕獲細胞間特異性的交互作用。

此外,研究團隊將ATAC-Seq和HiChIP數據結合預測了非編碼區域SNP的功能,並將SNP的功能按照重要程度分成幾個層級(圖5):

1. SNP位於多細胞或單細胞ATAC-Seq的可及性區域中(第三層次)。

2. 符合條件1的SNP,同時參與H3K27ac介導的交互作用(次重要)。

3. 符合條件1和2的SNP,同時處於轉錄因子結合位點中(最重要)。

對於屬於最重要類別的SNP,研究人員開發了一種多組學機器學習框架(gapped k-mer supprot vector machine / gkm-svm)來預測單個SNP在等位基因不同位點的結合情況。

圖5. 非編碼區域SNP功能預測流程圖圖片來源:Nature Genetics

研究人員認為,新開發的多組學結合的機器學習預測方法,主要解決了以下兩類問題:

1. 已知一些基因與疾病相關,找出遠程調控這些基因的SNP

例如,PICALM是一個與AD相關的基因,作者發現rs1237999位於PICALM上的遠程調控元件中,並處於轉錄因子FOS/AP1結合motif上。同時rs1237999特異性的結合在等位基因的其中一個位點上。

2. 已知一些SNP與疾病相關,找出這些SNP調控的基因。

位於ITIH1的Lead SNP處於600Kb長的LD block中,一共包含317個SNP。研究發現,其中一個SNP rs181391313位於微膠細胞特異性的調控元件中,而這個調控元件處於STAB1基因的內含子內部。STAB1基因編碼一種大的跨膜受體蛋白,其功能與淋巴細胞歸巢(lymphocyte homing),低密度脂蛋白內吞作用(endocytosis of ligands)相關,這兩種功能都與微膠細胞參與PD吻合。同時,該SNP破壞了轉錄因子KLF4的結合位點,而KLF4在小膠質細胞相關基因的活化中也發揮功能。

MAPT基因編碼tau蛋白,這種蛋白的過度磷酸化在胞內形成神經元纖維纏結,在AD中起著關鍵作用,但是目前還不清楚MAPT具體如何影響PD。研究人員在MAPT基因區域創建了haplotype特異性的三維基因組圖譜,並鑑定出28個可及性發生變化的區域,其中就包括在MAPT啟動子上遊68Kb處H1單倍型特異性的遠程調控元件,和下遊330Kb處位於KANSL1啟動子處的調控元件,這兩個調控元件只在H1單倍型中才與MAPT啟動子發生特異性的交互作用。而在H2單倍型中,染色體倒位區域的兩個邊界區域發生特異性的交互。

圖6. MAPT基因啟動子與遠程調控元件的H1單倍型特異性的遠程交互作用圖片來源:Nature Genetics

綜上所述,該研究通過結合ATAC-Seq和HiChIP數據,發現了更多與AD和PD相關的 基因,並通過整合多組學數據開發機器學習分類預測非編碼區域SNP的功能,有助於理解非編碼區域的改變對AD和PD的影響。從更廣泛的意義上來講,該工作提出了一種了解疾病遺傳變異的系統方法,同時,由於基因組上非編碼區域的調控機制十分複雜,因此這項工作也為篩選新的治療靶標提供了途徑。

參考資料:

1. Corces, M.R., Shcherbina, A., Kundu, S. et al. Single-cell epigenomic analyses implicate candidate causal variants at inherited risk loci for Alzheimer’s and Parkinson’s diseases. Nat Genet 52, 1158–1168 (2020). https://doi.org/10.1038/s41588-020-00721-x

相關焦點

  • . | 基於ATAC-Seq、HiCHIP數據構建人類大腦表觀遺傳圖譜,揭示AD/PD遺傳風險位點
    近日,來自史丹福大學的Howard Chang和Tomas Montine團隊,利用單細胞/多細胞ATAC-Seq和HiChIP數據,分析了認知健康人群大腦不同區域的染色質可及性和三維基因組構象,繪製了成年人類大腦的多組學表觀遺傳圖譜。
  • 一文讀懂表觀遺傳學研究利器——ATAC-seq技術及應用丨深度長文
    染色質可及性又稱染色質開放程度,反映了染色質的轉錄活性狀態,是研究基因表達調控的重要方向,在表觀遺傳圖譜繪製、細胞分化和發育及各類疾病的發生發展研究中具有重要的作用。人類早期胚胎染色質可及性圖譜。A. UCSC瀏覽器展示ATAC-seq數據標籤;B.
  • 超能餅乾|SnapATAC分析單細胞ATAC-seq數據(一)
    SnapATAC簡介SnapATAC (Single Nucleus Analysis Pipeline for ATAC-seq) 是一個能夠快速、準確和全面分析單細胞ATAC-seq數據的R包,它可以對單細胞ATAC-seq數據進行常規的數據降維、聚類和批次校正分析,鑑定遠端調控元件並預測其調控的靶基因,調用chromVAR軟體進行motif分析
  • 綜述科普|染色質調控區域的研究:對CHIP-seq和ATAC-seq發展的深入思考
    對其相互作用機制的深入研究還很有限,最近的研究通過構建合成讀寫模塊來探索表觀遺傳調控機制,這將有助於我們更好地理解表觀遺傳的基本原理。最早應用於大規模表觀遺傳學分析的技術是染色質免疫共沉澱(CHIP),然後是微陣列基因晶片雜交(chip)(CHIP-chip),它使科學家能夠在全基因組範圍內檢測DNA-蛋白質的相互作用。
  • 超能餅乾|SnapATAC分析單細胞ATAC-seq數據(三)
    簡介在本教程中,我們將對PBMC的兩個scATAC-seq數據集(5K和10K)和一個scRNA-seq數據集進行整合分析。這三個數據集均來自10X genomics測序平臺產生的數據,可以直接在10x官網下載使用。
  • 從數據分析到結論產生,談談scATAC-seq
    因此,理解基因型-表型軸需要一個全面的功能性非編碼基因組元件目錄,其中大部分涉及基因表達的表觀遺傳調控。開放染色質區域的全基因組圖譜可以通過它們與特徵相關序列變異型的聯繫來促進順式和反式調節元件的功能分析。目前,高通量測序分析轉座酶可及染色質(ATAC-seq)被認為是全基因組可及染色質的最易獲得和最具成本效益的策略。
  • ...學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq...
    生命學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq數據清華新聞網10月12日電 10月8日,清華大學生命學院的張強鋒課題組在《自然·通訊》(Nature Communications)上發表題為「SCALE方法基於隱特徵提取進行單細胞ATAC-seq數據分析」(SCALE method for
  • 大腦中非常規的表觀遺傳現象
    然而,在成年哺乳動物大腦,在非CG序列中非常規的胞嘧啶甲基化出現的頻率很高(mCH; H=腺嘌呤(A)、胞嘧啶(C)、或胸腺嘧啶(T))。非CG甲基化的數量與基因的表達成反比,但是mCH調控轉錄的機制目前還不清楚。此前我們對於大腦中DNA甲基化調控基因的看法僅僅是基於對mCG的研究的,而兩個近期的研究提出了mCH與基因表達的一個新的機制,很大程度上修正了既往的看法。
  • 綜述:水稻的表觀遺傳調控和表觀基因組圖譜
    針對表觀遺傳學及表觀基因組學的深入研究將有望對水稻育種等生產實踐領域產生推進作用,為進一步從表觀遺傳角度進行水稻品種改良及分子設計育種提供全新的思路和手段。 近期,《國家科學評論》發表了中國科學院遺傳與發育生物學研究所曹曉風院士等人的綜述文章「Epigenetic regulation and epigenomic landscape in rice」,對近年來水稻表觀遺傳調控和表觀基因組圖譜方面的研究成果進行了系統性的介紹。
  • 項目文章|新技術助力表觀研究,染色體狀態圖譜一戰「稻」底
    關注表觀遺傳研究的小夥伴,一定對ENCODE(The Encyclopedia of DNA Elements)並不陌生。自2003年由美國國家人類基因組研究所(NHGRI)發起以來,ENCODE資料庫收集了人、小鼠、果蠅和線蟲的大量表觀遺傳學實驗數據,構建了不同組織、不同層面的染色體功能圖譜,無愧為模式動物表觀遺傳研究中的百科全書。
  • 表觀遺傳大牛張元豪繼Cell、Science後,在表觀遺傳領域取得新成果(系統總結!)
    到目前為止,細胞與細胞的表觀遺傳變異不能明確地與細胞表型或細胞狀態相關聯。針對特定細胞類型和細胞階段的蛋白質染色有助於指示細胞表型,例如,對於遷移細胞狀態的磷酸化粘著斑激酶或對缺氧環境中的細胞的缺氧誘導因子(HIF1α)染色。雖然已經在增加這些單細胞技術的吞吐量方面做出了大量努力,但細胞表型與單個細胞的染色質變異的直接聯繫仍然在很大程度上被忽視。
  • 【中文在線網絡研討會】單細胞ATAC-Seq入門:高解析度表觀基因組學研究
    在單細胞解析度下發現表觀遺傳異質性。探索單細胞ATAC-Seq(Assay for Transposase-Accessible Chromatin using Sequencing)技術,這是一種創新的方法,用於分析數百至數千個細胞的全基因組染色質可接近性。
  • Nature:發表野生擬南芥表觀基因組圖譜
    曾作為主要負責人之一參與了擬南芥全基因組測序工作,擬南芥全基因組功能基因T-DNA文庫構建,擬南芥功能基因全長cDNA文庫構建,擬南芥全基因組表觀遺傳學測序工作。同時,Joseph R-cker教授在植物激素研究尤其是乙烯信號轉導研究方面做出了突出貢獻。我們早已知曉,基因攜帶了遺傳指令,能從一個個體傳遞給其後代。
  • 新技術揭示影響CRISPR-Cas9全基因組活性的遺傳和表觀遺傳因素
    新技術揭示影響CRISPR-Cas9全基因組活性的遺傳和表觀遺傳因素 作者:小柯機器人 發布時間:2020/6/17 22:27:49 美國聖猶大兒童研究醫院Shengdar Q.
  • 華中農業大學在油菜表觀遺傳研究方面取得重要進展
    該研究構建了目前為止最大的甘藍型油菜表觀遺傳學相關數據集,繪製了其表觀遺傳參考基因組圖譜,解釋了甘藍型油菜亞基因組間不平衡的表觀遺傳學基礎,並鑑定出植物中一種新的二價染色質狀態(H3K4me1-H3K27me3),為甘藍型油菜和其它多倍體植物的表觀遺傳學相關研究提供了重要資源。
  • Cell:構建出人類免疫細胞圖譜,可確定遺傳變異對基因表達的影響
    2018年11月18日/生物谷BIOON/---比較任何兩個人的DNA,你會發現他們的遺傳密碼中的數百萬個位點存在著不同。如今,在一項新的研究中,來自美國拉霍亞免疫學研究所(LJI)的研究人員分享了大量數據,這些數據對於破譯這種自然遺傳變異如何影響免疫系統保護我們健康的能力至關重要。
  • Nat Methods:開發出基於CRISPR/Cas9和單細胞RNA測序的CROP-seq方法
    Bock團隊成功地開發出一種採用了前沿的分子技術的優雅設計:論文第一作者Paul Datlinger構建出一種病毒載體,能夠讓CRISPRgRNA在單細胞測序實驗中可視化觀察,而最新的用於單細胞RNA測序的液滴方法足以高通量地分析單個細胞中上千種基因組編輯事件的影響。
  • 基於納米孔測序開發同步檢測CpG甲基化和染色質可及性的新方法
    通過對四種人類細胞系進行分析,研究團隊構建了包括CpG甲基化和染色質可及性等信息的人類表觀基因組圖譜,並揭示了乳腺癌細胞和非癌細胞之間的甲基化和染色質可及性差異。基於該技術,研究團隊首先對已有的nanopolish軟體進行優化,使其能夠同時準確檢測CpG甲基化和GpC甲基化。然後應用GpC甲基轉移酶外源性標記開放染色質,利用納米孔技術對細胞進行NOMe-seq測序,即nanoNOMe-seq分析。
  • Sci | SLAF-遺傳圖譜定位小麥抗條銹病QTLs
    該文章主要利用小麥RIL群體繪製了一張高密度SLAF-遺傳圖譜,定位到3個抗條銹病QTLs,並且QTL的聚合互作可增強小麥抗條銹病能力,在後續小麥的遺傳育種改良中具有重要潛在應用價值。核型分析:FISH技術(螢光原位雜交)RIL群體:Chuanmai 42 (CH42) × Chuanmai 55 (CH55),N=200測序策略:SLAF-seq(Sun et al. 2013)—— 40萬SLAF標籤,10×/SLAF圖譜構建:HighMap
  • 劉光慧/曲靜/孫前文/張維綺等繪製人類細胞分化和重編程過程R-loop等多維表觀圖譜
    該研究通過體外誘導分化人類胚胎幹細胞, 系統繪製了人類胚胎幹細胞分化為多種細胞類型過程和細胞重編程過程的單鹼基精度的 R-loop 圖譜,並同時描繪了相應過程的轉錄組、組蛋白修飾組、染色質結構開放性和 DNA 甲基化修飾等多組學變化,並提出 R-loop 可作為一種關鍵的表觀遺傳修飾因子調控人類細胞命運決定。