在全基因組範圍內檢測與組蛋白、轉錄因子互作的DNA區段。這需要染色質免疫共沉澱技術ChIP結合第二代測序技術(高通量測序),組合起來就是ChIP-seq。
ChIP-seq,指的是結合位點分析法,作用為研究體內蛋白質與DNA相互作用。染色質免疫共沉澱技術(Chromatin Immunoprecipitation,ChIP)也稱結合位點分析法,是研究體內蛋白質與DNA相互作用的有力工具,通常用於轉錄因子結合位點或組蛋白特異性修飾位點的研究。將ChIP與第二代測序技術相結合的ChIP-Seq技術,能夠高效地在全基因組範圍內檢互測與組蛋白、轉錄因子等互作的DNA區段。
將ChIP與第二代測序技術相結合的ChIP-Seq技術,能夠高效地在全基因組範圍內檢測與組蛋白、轉錄因子等互作的DNA區段。ChIP-Seq的原理是:首先通過染色質免疫共沉澱技術(ChIP)特異性地富集目的蛋白結合的DNA片段,並對其進行純化與文庫構建;然後對富集得到的DNA片段進行高通量測 序。研究人員通過將獲得的數百萬條序列標籤精確定位到基因組上,從而獲得全基因組範圍內與組蛋白、轉錄因子等互作的DNA區段信息。
實驗流程:(1)甲醛交聯整個細胞系(組織),即將目標蛋白與染色質連結起來;(2)分離基因組DNA,並用超聲波將其打斷成一定長度的小片段;(3)添加與目標蛋白質特異的抗體,該抗體與目標蛋白形成免疫沉澱免疫結合複合體;(4)去交聯,純化DNA即得到染色質免疫沉澱的DNA樣本,準備測序;(5)將準備好的樣本進行深度測序。
生物信息分析流程:(1)將測序得到的短序列片段匹配到參考基因組序列上。(2)有一部分短序列不能匹配到參考基因組上,有可能是未知的基因組序列;另一部分是能夠匹配到基因組上的短序列,通常要對這些短序列進行覆蓋度計算。(3)從匹配到基因組上的短序列中進行富集區域的掃描。通常掃描到的富集區即被認為是蛋白質與DNA相互結合的區域(也有假陽性位點等的影響)。(4)對掃描到的富集區做深度分析,包括基因,GO注釋,利用基因瀏覽器進行可視化瀏覽,研究與基因結構的關係等。
測序:對客戶提供的ChIP樣品(如果有陰陽參啟動子區域或DNA序列的)進行定量檢測,檢測合格後進行測序文庫構建、DNA成簇(Cluster generation)擴增、高通量測序。
基本數據分析:數據產出統計:對測序結果進行圖像識別(Base calling),去除汙染及接頭序列;統計結果包括:測定的序列(Reads)長度、Reads數量、數據產量。
高級數據分析: 標準高級數據分析內容包括:(1)ChIP-Seq序列與參考序列比對;(2)Peak calling:統計樣品Peak信息(峰檢測及計數、平均峰長度、峰長中位數);(3)統計樣品Uniquely mapped reads在基因上、基因間區的分布情況及覆蓋深度;(4)給出每個樣品Peak關聯基因列表及GO功能注釋;(5)在多個樣品間,對與Peak關聯基因做差異分析。
應用領域由於ChIP-Seq的數據是DNA測序的結果,為研究者提供了進一步深度挖掘生物信息的資源,研究者可以在以下幾方面展開研究:(1)判斷DNA鏈的某一特定位置會出現何種組蛋白修飾;(2)檢測RNA polymerase II及其它反式因子在基因組上結合位點的精確定位;(3)研究組蛋白共價修飾與基因表達的關係;(4)CTCF轉錄因子研究。