染色質調控區域在許多疾病過程和胚胎發育中起著關鍵作用。表觀基因組測序技術,如染色質免疫共沉澱測序(CHIP-seq)和轉座酶開放染色質高通量測序(ATAC-seq),使我們能夠通過檢測特定的染色質狀態及其相應的轉錄因子,在時間和空間維度上剖析細胞和組織的基因組調控格局。隨著染色質免疫共沉澱晶片(CHIP-chip)技術的發展,大量的表觀基因組分析技術已經出現,如CHIP-seq、DNase I超靈敏位點測序(DNase-seq)、ATAC-seq等。單細胞測序的出現使下一代測序發生了革命性的變化,在單細胞表觀遺傳學中的應用迅速豐富。表觀基因組測序技術已經從低通量發展到高通量,從批量樣本發展到單細胞範圍,這對科學家從不同角度解讀生命帶來了前所未有的好處。本文在簡要介紹表觀基因組生物學背景知識的基礎上,討論了表觀基因組測序技術,特別是ChIP-seq和ATAC-seq技術的發展及其在科學研究中的應用現狀。最後,我們提出了未來應用和挑戰的見解。
關鍵詞:
染色質調控區域、表觀基因組測序、
單細胞、發育生物學
DNA由組蛋白包裹著,組蛋白帶有各種各樣的修飾。組蛋白乙醯化是染色質修飾中最具特徵性的修飾之一,與局部染色質結構的開放和轉錄激活相關(例如,H3K27ac與增強子相關)。與組蛋白乙醯化相比,組蛋白甲基化在功能和形式上都更加多樣化。組蛋白甲基化包括H3K4me1、H3K4me3、H3K9me3、H3K36、H3K79等。賴氨酸的特異性甲基化可存在於不同功能的單甲基化、雙甲基化或三甲基化。抑制性組蛋白甲基化,如H3K9me3,與凝集性和結構性異染色質高度相關。同時,活躍組蛋白甲基化,如H3K4me3,有助於激活轉錄。一些研究甚至揭示了一類兼具活性和抑制性的二價染色質,它顯示出H3K4me3和H3K27me3的重疊模式。這種穩定基因的二價標籤的發現是出乎意料的,也是非常重要的。例如,它可能是母體向受精卵轉變過程中的一個關鍵裡程碑,提供了關於「中間」狀態的第一條線索。此外,二價染色質並不是胚胎幹細胞所特有的,在其他類型的細胞中也有存在。在更複雜的情況下,在某些組織中充當啟動子的元件可以在其他組織中充當增強劑,稱為CRID(具有動態特徵的順式調節元件),並且相同的調節元件可以同時具有啟動子和增強子特徵。
# 更多的組蛋白修飾還包括磷酸化、泛素化、蘇莫化和ADP核糖化。目前對組蛋白修飾的探索仍然存在以下問題:
1.組蛋白表面的修飾通常是動態的:一些修飾可以在細胞受到刺激後的短短幾分鐘內被添加和去除,因此在特定條件下的給定時刻一組細胞中檢測到的組蛋白修飾實際上僅部分代表了潛在的修飾類型。
2.用於檢測組蛋白修飾的抗體對於許多表觀遺傳染色質測序技術是必不可少的:例如,在CHIP-seq中,需要對組蛋白和轉錄因子進行抗體特異性檢測。
3.組蛋白修飾的異染色質形成和擴散機制以及組蛋白修飾的「記憶」和「消退」的研究還很少。
4.組蛋白密碼的概念在許多情況下不能廣泛用於準確描述和預測特定的生物學現象.
5.某些組蛋白修飾在某些基因組區域是活躍的。相反,在其他區域有抑制作用:例如,H3K9基因座的甲基化在啟動子區域是抑制的,而在編碼區是活躍的。
與單一的組蛋白修飾不同,染色質調控區域是對染色質生物學功能的更高水平的詮釋,它結合了組蛋白修飾、轉錄因子結合和基因組元件的調控功能。著名的 Road-map Epigenomics Consortium領導了大規模的人類表觀基因組研究,對調控元件的功能狀態提供了詳細和準確的描述和分類。此外,通過將這些染色質表觀基因組狀態與現有的全基因組甲基化信息和RNA測序(RNA-seq)的基因表達譜相結合,科學家可以從多維的角度解釋特定組織的表觀基因組現象。
許多染色質動力學研究除了需要獲得組蛋白修飾和基因組調控元件的信息外,還需要正確理解轉錄因子和染色質之間的相互作用,這對於理解發育和疾病進展往往是必不可少的。一些與染色質調節區結合的轉錄因子需要特定的組蛋白修飾,而另一些轉錄因子則需要開放染色質和其他激活子的輔助。一些轉錄因子與調控區域的結合促進了其他轉錄因子的聚集。它可能促進染色質的打開,從而進一步影響轉錄因子的結合。對其相互作用機制的深入研究還很有限,最近的研究通過構建合成讀寫模塊來探索表觀遺傳調控機制,這將有助於我們更好地理解表觀遺傳的基本原理。
最早應用於大規模表觀遺傳學分析的技術是染色質免疫共沉澱(CHIP),然後是微陣列基因晶片雜交(chip)(CHIP-chip),它使科學家能夠在全基因組範圍內檢測DNA-蛋白質的相互作用。CHIP-chip是基於微陣列雜交技術,在高密度晶片上種植覆蓋一個基因組或特定區域的大量探針。但該方法存在解析度低、探針設計要求較多、信號偏差大、難以廣泛應用於更多物種等缺點。
與晶片相比,染色質免疫共沉澱測序(CHIP-seq)具有解析度高、噪音小、覆蓋面大等優點。隨著第二代測序成本的快速下降,CHIP-seq將成為研究基因調控和表觀遺傳學不可或缺的工具之一。除了更好地鑑定序列基序外,晶片序列還可以用來尋找關鍵的轉錄因子、增強子和其他調控元件。
對於DNA結合蛋白,CHIP-seq實驗的目的是得到豐富的與特定蛋白結合的DNA。該過程包括多個步驟(圖1A):首先通過甲醛原位交聯DNA和蛋白質,然後將DNA超聲處理成200-600bp的小片段;再用抗體免疫沉澱特定的DNA蛋白質複合物;最後去交聯化DNA,釋放的DNA經過末端修復、接頭連接和其他文庫準備步驟;最終,進行測序。
然而,CHIP-seq有一些局限性:聚合酶鏈式反應存在偏差;聚合酶鏈式反應擴增的長度有限;裂解和測序過程中的GC偏差;由於免疫沉澱過程的大量損失需要105∼107個細胞;以及由於甲醛交聯過程而可能導致的隱蔽表位。甲醛可以將轉錄因子與DNA交聯,保持它們在體內的結合狀態,但它也可能掩蓋轉錄因子的抗原表位,產生假陽性結果。這種甲醛交聯CHIP也被稱為X-CHIP。另一方面,自然CHIP(N-CHIP)不存在隱蔽表位問題,可以用於細胞數量很少時。這種方法放棄了甲醛固定,使用微球菌核酸酶(MNase)來消化染色質。MNase可以快速、溫和地切斷染色質DNA,最大限度地保留原始染色質結構和靶蛋白的結合,提高CHIP結果的可靠性。然而,當靶蛋白與DNA結合不強時,這種方法可能會導致許多結合位點的丟失,因此它通常用於組蛋白CHIP而不是轉錄因子。對於抗體依賴的表觀遺傳測序技術,選擇合適的抗體往往是最關鍵的一步。在選擇單克隆抗體或多克隆抗體時,由於受到其他蛋白質組分的幹擾,單克隆抗體可能會產生微弱的信號。相反,多克隆抗體可能會產生不必要的假陽性。
(圖1) CHIP-seq和ATAC-seq的工作流程。a.在CHIP-seq中,染色質用甲醛交聯並超聲處理,得到200-600個鹼基對的DNA片段。然後,目標DNA-蛋白質複合體可以被抗體免疫沉澱。文庫製備步驟:末端修復、A-尾和接頭連接、文庫測序。b.ATAC-seq使用高活性的tn5轉座酶識別開放染色質的區域,該轉座酶優先插入到可接近的染色質中,並用測序適配器標記這些位置。
傳統CHIP-seq的主要限制因素是需要大量的細胞(105∼107個細胞)。在過去的幾年裡,已經採用了各種方法來優化實驗,以測量低數量的細胞。化學印跡結合染色質免疫共沉澱和Tn5轉座酶的測序文庫製備。快速、低成本的文庫製備允許組蛋白CHIP-seq使用10,000個細胞。基於超低輸入MNase的自然CHIP(ULI-NChIP)通過調整NChIP程序,生成從103個胚胎幹細胞到106個胚胎幹細胞的高質量組蛋白修飾圖譜。基於微流控振蕩洗滌的CHIP-seq(MOWChIP-seq)甚至可以應用於僅用100個細胞的組蛋白修飾的全基因組分析。雖然這些方法可以在少數細胞中產生相對準確的組蛋白修飾圖譜,如H3K4me3,但它們對許多轉錄因子無效,因為基因組上的結合位點較少。
靶下切割和核酸酶釋放(Cut&Run)與CHIP-seq一樣,用於檢測DNA與蛋白質的相互作用,它不需要甲醛交聯和超聲切碎,而是利用融合到蛋白A/G上的Mnase來原位切割和釋放目標DNA片段,從而顯著提高信噪比,並且可以應用於低至100~1000個細胞中。超低輸入的CUT&RUN(uliCUT&RUN)將該方法進一步提高到單細胞水平。研究人員發現,通過這種方法,CTCF在hESC細胞中的結合位點較為集中,而H3K4me3佔據的區域相對較廣。同時,對SOX2和Nanog的結合模式以及胚胎早期發育中的其他重要轉錄因子也進行了精確的描述。
靶標下切割和標記(Cut&Tag)是另一種可以在低細胞輸入樣本甚至單個細胞中檢測DNA-蛋白質相互作用的技術。Cut&Tag用蛋白A/G融合的Tn5轉座酶(pA/G-Tn5)來切割DNA,而不是蛋白A/G融合的Mnase,這對核心酶的質量要求很高。該核心酶pA/G-Tn5對微量DNA具有高活性、高靈敏度和高親和力,並能有效捕獲少數細胞中有限的結合位點。Cut&Tag的另一大特點是,在添加刀豆蛋白A之後,所有的文庫製備步驟都在同一管中進行。因此,測序數據具有較低的背景。所以,與切割Cut&Run相比,Cut&Tag不需要末端修復和附加接頭,變得更容易和更有效。由於pA/G-Tn5能在不同條件下結合和切割非特異性開放染色質,Cut&Tag有可能通過改變緩衝液組成同時結合一些開放染色質和特異性轉錄因子結合位點。然而,在更科學的背景下,非特異性DNA切割是對所需轉錄因子測定的幹擾,在這些背景下,需要結合已知的開放染色質數據來消除這些幹擾。通常不建議使用過於複雜的數據,因為結合其他數據以消除背景通常會帶來批量效應。
與批量CHIP-seq不能檢測單個細胞的染色質特徵不同,單細胞ChIP-seq(scChIP-seq)有助於研究異質細胞群體中的遺傳多樣性,並了解腫瘤群體的進化。液滴單細胞ChIP-seq(Drop-CHIP)將微流控設備與單細胞DNA相結合,使研究人員能夠獲得相對較低的每個細胞覆蓋率圖。
1.液滴形成:包裹在液滴中的每個細胞與裂解物和MNase混合;然後細胞裂解成液滴,其染色質被碎裂;第二個編碼液滴包含用於連接到染色質片段的DNA編碼。將這兩個液滴混合,形成一個分度微反應器。
2.液滴中的核小體編碼區。
3.核小體編碼區的免疫沉澱。
4.文庫構建和測序。下遊數據分析流程類似於單細胞RNA-seq。ScChIP-seq基於染色質功能的多樣性和每個群體特有的染色質特徵的鑑定來實現細胞群體的聚集,例如某些細胞中H3K27me3標記的丟失可能與化療耐藥有關。然而,由於單個細胞產生的數據過於稀少,需要數千個細胞才能獲得良好的聚類結果。
在很大程度上減少細胞投入的表觀基因組學工具,包括Cut&Run和Cut&Tag,並不一定比CHIP-seq表現更好,這取決於具體情況。單細胞CUT&Tag和單細胞 ATAC-seq (scATAC-seq) 都依賴於一種名為Takara ICELL8的特殊設備。基於微流控的Drop-CHIP每個單元只能產生大約1000個數據,過於稀疏的數據加上昂貴的設備限制了它的應用。因此,迫切需要一種適用範圍更廣、性能更穩健、成本更低的低豐度細胞甚至單個細胞的CHIP方法。基於單細胞同時索引和標記的CHIP-seq技術(sc-itChIP-seq)是一種基於晶片的高解析度技術,其實驗步驟是通過FACS(螢光激活細胞分選)對固定細胞/天然細胞進行全基因組染色質開放,使Tn5能夠均勻地切斷DNA。釋放的DNA片段通過免疫共沉澱得到富集(圖2b)。單個細胞的DNA-蛋白質相互作用可以通過解復用和解鏈編碼獲得。所有的文庫準備步驟都在同一個管中進行,這大大減少了損失。sc-itChIP-seq可用於鑑定分化過程中的譜系特異性增強子和關鍵轉錄因子。科學家們已經應用這種方法成功地鑑定了幼鼠胚胎幹細胞的表觀遺傳軌跡,並揭示了決定心臟祖細胞命運的譜系特異性增強子的重編程事件。鑑於sc-itChIP-seq不依賴昂貴的設備,它在實驗室中的應用比以前的scChIP-seq更廣泛(表1)。
組合條形碼和有針對性的染色質釋放(CoBatch)不僅可以描繪出細胞輸入量相對較低的樣品的表觀遺傳概況,而且還可以應用於具有高信噪比的自然或固定狀態的數千個單細胞的規模。這種方法使用了一種名為PAT的酶,它是Tn5轉座酶的N端與蛋白A的融合。用抗體孵育的細胞分布在孔中(每孔200~2000個細胞),然後加入不同的PAT進行第一輪試驗。所有細胞被匯集並重新分配到不同的孔(每孔20~25個細胞),最後用不同的PCR引物進行第二輪擴增(圖2C)。利用coBatch產生的單細胞數據,研究人員成功地實現了對內皮細胞和間充質細胞等細胞類型的高通量鑑定,深入揭示了內皮細胞群體的異質性。然而,這種方法的缺點是它不能直接應用於低至十幾個細胞的樣本,如植入前胚胎。
(圖2)單細胞CHIP-seq工作流程。a.Drop-CHIP的工作流程。b.sc-itChIP-seq的工作流程。FACS:螢光激活細胞分選。NGS:下一代測序。c.coBatch的工作流程。PAT:Tn5轉座酶N端與蛋白A的融合(Pa-Tn5[PAT])
研究開放染色質區域最經典的技術之一是DNase I超敏位點測序(DNase-seq)。DNaseI具有核酸內切酶活性,可通過控制切割效率獲得適當長度的開放染色質片段。DNaseI被用來切割基因組上的DNA酶敏感部位。然後,對消化的片段進行擴增,分析測序數據中的峰,以獲得相對開放的染色質區域和蛋白質保護區域的信息,這些區域通常是轉錄因子結合的位點。
MNase-seq用於探查核小體定位,並使用MNase消化進行染色質片段化而不進行交聯的實驗。與DNase不同,MNase與開放染色質結合後既具有核酸外切酶活性,又具有核酸內切酶活性。它會直接消化DNA,直到遇到特異因子和核小體,然後去除接頭DNA,這使MNase-seq非常適合探索核小體的定位。Mnase-Seq需要了解合適的酶條件,不可避免地會導致難以控制的混雜因素,如序列結合和酶本身的酶活性所需條件不同。ChIP-seq、DNase-seq和MNase-seq分別測量轉錄因子圖譜、染色質開放性和核小體定位。它們都需要大量的輸入材料,並產生對細胞異質性不敏感的「平均」圖譜,這極大地限制了這些技術在一些稀有和珍貴的樣本中的應用,比如早期胚胎。此外,這些技術涉及複雜且耗時的樣品製備和文庫構建,並且不能直接研究核小體定位、染色質開放性和轉錄因子定位之間的相互作用。
1.高細胞輸入掩蓋了細胞群體間的異質性;對輸入材料的要求限制了DNase-seq和MNase-seq在特定臨床樣本中的應用,並使其難以實現個性化的表觀基因組學研究。
2.為了獲得所需數量的細胞,細胞通常要進行體外培養以進行擴增。然而,體外培養並不能完全模擬體內的條件,會進一步添加可能導致染色質狀態改變的外來因素,從而增加實驗失敗的風險。
高通量測序(ATAC-seq)技術用於轉座酶開放的染色質測定成功實現了開放染色質區域,核小體定位和調控基序的同時鑑定,同時將所需樣品減少到500〜5000個細胞。利用基序推論,科學家成功地推論了B細胞系中DNA結合蛋白的結合位點。同樣,ATAC-seq具有相對簡單和有效的「兩步」文庫製備程序:轉座和PCR(圖1b)。在ATAC-seq實驗中,細胞核分離後收集細胞核,細胞核內的染色質被Tn5轉座酶片段化並連接到測序接頭,從而大大簡化了實驗流程。緊密包裝的染色質DNA不能進入轉座體,而開放區域中的染色質DNA則隨機插入並被轉座體片段化。收集片段化的DNA用於後續分析。ATAC-seq最重大的創新是Tn5轉座酶的應用:Tn5轉座酶的轉座活性較低。為了在科學研究中更好地利用,在經過定向改進後,它可以變成對DNA具有更高親和力的高活性Tn5轉座酶。Tn5轉座酶可與設計的銜接子在體外組裝,形成活性轉座體複合物。儘管Tn5轉座酶不可避免地會由於序列依賴性結合而產生偏倚,但這種轉座偏倚可以通過開發計算工具來糾正。
ATAC-seq具有高效率和低細胞輸入要求的優點,但是其對不同類型樣品的適用性仍然受到限制。為擴展應用而產生的ATAC衍生技術包括fast-ATAC,Omni-ATAC和miniATAC-seq(圖3)。例如,fast-ATAC針對血液樣品進行了優化,使用含洋地黃皂苷的轉座緩衝液將通透和轉座這兩個步驟組合為一個步驟。它不僅增加了每個細胞的片段產量,而且大大降低了線粒體讀段的比例。Omni-ATAC可應用於多種細胞類型和長期保存的冷凍樣品。進行了改進,包括各種不同的去汙劑,細胞裂解後用Tween-20洗滌,以及使用磷酸鹽緩衝鹽水提高轉座反應中的信噪比。所有這些改進使Omni-ATAC可以應用到長期存儲的各種細胞系,組織類型和冷凍樣品中,同時提高了數據質量。miniATAC-seq主要針對DNA純化步驟和裂解緩衝液(針對胚胎的NP-40最佳濃度)進行了優化,甚至可以通過高質量的測序數據應用於20個細胞(例如早期胚胎)中。ATAC-seq程序的優化也已廣泛用於神經組織和生物樣本庫中的細胞。
ATAC-seq可以測量低至500個細胞的樣品,但是它無法在單細胞水平上破譯細胞之間的差異。單細胞測序技術的出現使我們能夠了解更精細的單細胞水平活動。從單細胞轉錄組測序中可以獲得的信息非常有限,在單細胞水平上進一步研究調節元件的表觀基因組動力學對於找出更詳細的細胞分化和發育機制至關重要。2015年,開發了用於轉座酶開放染色質測序的單細胞組合測定法(sci-ATAC-seq),可同時對大量單個細胞進行測序。在這種方法中,對細胞進行標記,並在單細胞水平上對染色質開放性進行測序。首先用特定編碼標記的Tn5轉座酶對96孔板中的所有核進行編碼後,然後將核合併並重新分配到新的一組孔中。因此,可以通過PCR擴增添加第二個編碼信息(圖4a)。第一個基於微流體平臺的scATAC-seq技術與Fluidigm單細胞平臺C1(集成流體迴路)集成在一起(圖4b),這是一種用於研究單細胞染色質開放性的方法。與sci-ATAC-seq相比,它可以捕獲每個細胞更多的數據,從而開啟了對細胞間調節劑(regulome)多樣性的探索。在Chromium平臺(10×Genomics)上執行的液滴scATAC-seq(10×ATAC-seq)實現了scATAC-seq實驗容量的前所未有的大幅提高(圖4c)。將單細胞核懸液加到微流體中,以促進乳液(GEM)中的凝膠珠的形成。在每個GEM中,新設計的凝膠珠寡核苷酸包含29 bp的測序接頭,16 bp的特定序列(用於標記液滴)和讀取的1 N的前14 bp(線性擴增反應的引物),可實現數千個實驗要測量的細胞。應用10×scATAC-seq,研究人員在腫瘤微環境內的免疫細胞中獲得了差異開放染色質的更準確的定位。為了解釋與單細胞RNA-seq數據相比較少的scATAC-seq數據,科學家開發了各種計算工具,例如chromVAR,Cicero,cisTopic,APEC等。
比較兩個或多個樣品時,僅ChIP-seq可能難以尋找有意義的調控元素。在這方面,ATAC-seq具有高解析度和高信噪比的優勢,這使研究人員能夠識別差異調節序列,例如增強子。將ChIP-seq與ATAC-seq結合使用,可以更輕鬆地確定明顯的峰。儘管檢測DNase-seq和ATAC-seq等開放染色質的方法可以幫助推斷基因組特徵,但ChIP-seq方法仍不可替代。所有這些技術都是間接檢測轉錄因子與DNA的結合位點的,這意味著從富集的基序推斷出的轉錄因子作用位點仍然需要進一步驗證。
1.並非所有的染色質調節劑都具有相應的基序,例如染色質重塑蛋白的調節劑並不具有特異的DNA序列。相反,染色質重塑蛋白和核小體之間的相互作用通常是早期胚胎發育以及細胞命運決定的重要因素。單獨的開放染色質信息不能用來推斷這些因子的結合情況。
2.一些基序有可能被多個序列特異性轉錄因子結合。
3.一些同源轉錄因子以相似的基序模式結合,在許多情況下,開放染色質直接分配給特定的單個轉錄因子的可能性較低。直接檢測特定轉錄因子和DNA之間相互作用的結果通常更可靠。
與直接確定特定DNA-蛋白質相互作用的ChIP-seq相比,使用ATAC-seq檢測到的全基因組染色質開放性代表了另一水平的染色質調控格局。因此,將ATAC-seq和ChIP-seq結合使用將有助於科學家對染色質調節動力學及其生物學意義更全面和深入的了解。
(圖4)單細胞ATAC-seq:a.SCI-ATAC-seq的組合標引方法。第一個序列是由Tn5轉座酶引入,第二個索引通過使用包含第二個序列的引物擴增而引入。b.基於集成射流電路(IFC)的scATAC-seq。在使用微流體平臺(Fluidigm)的scATAC-seq中,在IFC上轉座和PCR後,收集文庫,並用細胞識別序列引物進行PCR擴增。然後,將單細胞文庫匯集在一起,並在高通量測序儀器上進行測序。c.基於液滴的scATAC-seq(10×ATAC-seq)工作流程在Chromium平臺(10倍基因組學)上實現。GEM:乳劑中的凝膠珠。
ChIP-seq和ATAC-seq方法完善了我們對早期胚胎染色質重塑的理解
哺乳動物胚胎發育涉及全基因組的表觀遺傳變化,包括DNA甲基化,組蛋白修飾,開放染色質和染色質構象。至關重要的是,許多基因組調控元件(如啟動子,增強子,絕緣子和基因座控制區)通過與細胞類型特異性轉錄因子的相互作用來指導胚胎發育。同樣,這些調節元件之間的長期相互作用也很有趣(圖5a)。通過創新性地優化ChIP,它可以用於非常低的細胞數量(例如胚胎)中的組蛋白修飾重建研究(圖5b)。在早期的小鼠胚胎中,H3K4me3經歷了廣泛的重編程事件,在合子中消失並在後代中再次重建,並伴有合子基因組激活(ZGA)。因此,優化ChIP-seq在胚胎中的應用可能有助於揭示哺乳動物組蛋白修飾從父母傳給後代的詳細過程,即受精前後父母修飾方式的差異。更重要的是,改進的ATAC-seq方法在胚胎組織中的應用有助於在胚胎發育的關鍵時期進行全基因組染色質開放性的定位。例如,在植入前的胚胎中,ATAC-seq用於揭示ZGA中高解析度染色質變化和次要合子基因組激活(minorZGA)的時間動態。附加的表觀基因組研究也顯示了胚胎發育不同階段的獨特染色質狀態。這些發現為將來進一步研究人類胚胎發育和臨床指導提供了有價值的線索。諸如調節染色質狀態轉變的關鍵因素和轉座子等更多問題仍有待發現。
表觀基因組測序技術在實驗系統中追蹤發展軌跡並探索細胞命運決定機制起著不可替代的作用(圖5c)。單細胞水平的ChIP-seq和ATAC-seq有助於全面解決組織和器官的發育動力學。在2018年,scATAC-seq被應用於小鼠前腦發育不同階段的簇細胞,並用於識別從開放染色質推斷出的關鍵調控因子。類器官模型中的ChIP-seq,ATAC-seq和DNase-seq與轉錄組數據相結合,將有助於揭示特定細胞的發育動態,發現關鍵的轉錄調節因子,並確定易患疾病的細胞群。單細胞轉錄組和ATAC-seq在器官發育中的多組學整合可以為疾病的臨床治療提供堅實的基礎。例如,通過全面了解人類海馬發育的關鍵時間點和基因調控網絡,研究人員提供了與帕金森氏病,阿爾茨海默氏病和亨廷頓氏病的病理學有關的潛在細胞群的信息。
除神經生物學研究外,染色質動力學分析還揭示了肌肉發育,乳腺發育和心臟前體細胞命運。對單細胞染色質動力學的細粒度研究將有助於在將來創建人體器官發育的全球模型,使我們能夠追蹤每個組織和器官的胚胎起源。
(表2) CHIP-seq與ATAC-seq的比較
(圖5)單細胞表觀基因組學的未來應用。a.監管因素的長期相互作用。b.稀有細胞類型(如早期胚胎)中的染色質動力學。c.細胞譜系追蹤。d.細胞間異質性的反卷積。
當前對高度異質性腫瘤組織的理解有限,包括腫瘤微環境的差異,原始原發癌和轉移瘤之間的差異以及腫瘤亞克隆的進化。腫瘤微環境中的免疫細胞通常對於癌細胞的免疫逃逸和浸潤過程至關重要。scATAC-seq及其擴展的應用將有助於揭示表觀遺傳學在腫瘤發展中的異質性,並為治療提供潛在的靶點(圖5d)。例如,scATAC-seq的應用已確定了腫瘤微環境中惡性基質和免疫細胞的調控網絡。通過檢測單個細胞水平上免疫細胞發育的動力學,比較了患者在免疫治療前後腫瘤微環境中的腫瘤內T細胞衰竭。可以識別出對免疫療法有反應的關鍵調節性T細胞群體。對同一細胞中ChIP-seq,ATAC-seq和DNA突變圖譜的綜合分析將使科學家能夠發現癌細胞的新亞克隆,從而進行個性化的臨床試驗。因此,了解單細胞水平上的染色質調控格局將顯著加快癌症治療的生物醫學進展。
ATAC-seq的擴展技術還可以提供有關腫瘤異質性的新見解。具有可視化功能的轉座酶開放染色質測定(ATAC-see)通過螢光標記開放基因座,有助於在原位成像開放的染色質。例如,通過使用ATAC-see和螢光原位雜交,科學家提供了染色體外DNA(ecDNA)和ATAC-see螢光信號共定位的物理證據。由ATAC-seq和MNase-seq數據證實,該結果表明ecDNA高度可訪問,這可以解釋為什麼ecDNA上的致癌基因可以大量表達。因此,ChIP-seq和ATAC-seq技術的適應可以為靶向治療提供新的方向,並為癌症的異質性提供影像學的物理證據,從而使科學發現更加全面和可靠。
為了構建完整的調控網絡,通常需要將RNA-seq,ATAC-seq和ChIP-seq結合在一起。儘管已經開發了許多算法來集成多組學數據,但是很難評估這些算法的性能以及它們是否完全保留了生物學差異。近年來,越來越多的研究證明了對同一細胞中多種形態進行平行分析的潛力。基於微滴平臺的單核染色質開放性和mRNA表達測序(SNARE-seq)可通過雙組學捕獲同時對單個細胞中的轉錄組和染色質開放性進行測序,並可適當地關聯兩種方法的結果以獲取有關基因表達的調節。sci-CAR是一種基於組合索引的方法,可以結合sci-ATAC-seq和sci-RNA-seq在數千個單細胞中共同測定染色質的開放性和mRNA(CAR)。Pairedseq是一種超高通量方法,用於並行分析數百萬個單個細胞中的轉錄組和可利用的染色質。在這種方法中,採用基於連接的組合索引策略,以同時標記Tn5轉座酶產生的開放染色質片段和數百萬個細胞中RNA逆轉錄產生的cDNA分子。與SNARE-seq和sci-CAR相比,Pair-seq具有更高的吞吐量,這使得在生物尺度上分析基因調控程序成為可能。與轉錄組相比,開放染色質的一個顯著優點是,開放性提供了基因的表達狀態和調控元件之間的相互作用網絡,因此,通過將ATAC-seq與RNA-seq結合起來,將解決更引人注目的生物學問題。例如,時空基因表達模式與順式調控元件高度相關,因此在單個細胞之間存在差異。基於這一前提,這些異質細胞如何協同工作以構建一個全面的細胞通訊網絡是耐人尋味的。
與來自細胞群體的開放染色質數據相比,scATCA-seq信號是二進位和稀疏的,因此需要一種新的分析框架來解釋與大量數據的根本差異。一種可行的方法是收集許多單個細胞的信息,以確定細胞間染色質變異的決定因素。由於每個片段的末端代表開放染色質的區域,因此可以分析來自這些片段的組合信號來確定基因組中富含開放染色質的區域,從而推測具有調節和功能的意義。然而,從理論上講,這種方法的一個缺點是無法識別僅出現在稀缺人口中的罕見峰值。目前的scATAC-seq方法的一個主要限制是它們只捕獲單個細胞中開放染色質位點的一個子集,在實驗和計算過程中可能丟失或檢測不到許多位點。在不久的將來,似乎不太可能實現更全面的覆蓋。更高的每個小區覆蓋率將會解決新的問題。例如,單個細胞中兩個等位基因之間的染色質可及性如何不同,或者單個細胞中開放的染色質區域是如何相互關聯的,這仍然令人困惑。
Tn5轉座酶被廣泛用於染色質可及性測序、轉座子插入線性擴增,甚至檢測與冠狀病毒共感染的潛在病原體。為了個性化的應用,Tn5能夠對各種適配器進行退火,這是提出創新研究設計的一個重要方面,例如將適配器與螢光相結合以便於進行染色質成像。此外,由於未公開的試劑嚴重限制了新應用的發展,對Tn5的修改設計將進一步實現高通量和大規模的實驗。如果科學家能夠有效地個性化文庫的準備過程,這將使表觀基因組測序技術受益於更多的大型項目,如DNA元素百科全書(ENCODE)。例如,利用空間轉錄組的原理,一旦Tn5大量可用,就有可能直接對樣本進行測序,而不需要細胞解離和離心步驟,從而保持細胞的原始狀態,並顯著減少損失。此外,空間表觀基因組可以通過將單個細胞的染色質狀態映射到它們的位置信息來實現。雖然許多研究已經獲得了組織和器官發育的良好的時間節點,但進一步提高發育研究的空間解析度仍然是一個挑戰,例如胚胎器官中不同階段的細胞遷移軌跡。
不僅需要細胞在空間上的定位和遷移,分子水平上的空間動力學也是至關重要的。細胞內全基因組染色質構象變化是調節細胞行為的重要機制。HiChIP技術將晶片技術與染色質構象捕獲技術相結合,成功地解決了染色質結構的高靈敏度、高解析度的動力學問題。因此,隨著表觀基因組動力學分析技術的進一步發展和完善,將不同的組學和實驗技術結合起來進行多維生命科學研究具有廣闊的前景和誘人的前景。一張更全面的網絡還可以更好地理解單個細胞內多種調控因素的相互作用。
文獻原文:
Ma, S., Zhang, Y. Profiling chromatin regulatory landscape: insights into the development of ChIP-seq and ATAC-seq. Mol Biomed 1, 9 (2020). https://doi.org/10.1186/s43556-020-00009-w
#END#
鞠珊珊 撰稿
冷冰峰 審稿
歡迎分享到朋友圈
獲取專業組學研究解決方案,體驗極致科研支撐服務體系
深圳市易基因科技有限公司(E-GENE)成立於2013年,是位於深圳市坪山區的國家高新技術企業。公司以「解讀表觀藍圖,控制複雜疾病,守護大眾健康」為使命,致力於以表觀基因組及遺傳學為核心的技術與產品開發,涵蓋高通量測序、體外診斷和生命科學研究等領域。
公司自主開發了血漿游離 DNA 甲基化高通量測序文庫試劑盒、靶向血漿游離 DNA甲基化測序技術等,並提供以表觀基因組學為核心的多組學技術研發外包服務,為廣大有志於進行複雜疾病的血漿游離DNA甲基化生物標誌物發現、疾病早篩、甲基化藥物研發、營養調控等研究的科研院所、醫院和公司提供有效工具。公司與國內外多家知名企業和單位建立了戰略合作關係,共同致力於為生物醫藥領域和生命科學研究提供性能卓越的產品和優質的服務。