題目英文:A functional genomics predictive network model identifies regulators of inflammatory bowel disease
題目中文:功能基因組學的預測網絡模型識別炎症性腸病的調節因子
發表時間:2017年9月11日 雜誌:Nature Genetics 影響因子:27.125
摘要英文:A major challenge in inflammatory bowel disease (IBD) is the integration of diverse IBD data sets to construct predictive models of IBD. We present a predictive model of the immune component of IBD that informs causal relationships among loci previously linked to IBD through genome-wide association studies (GWAS) using functional and regulatory annotations that relate to the cells, tissues, and pathophysiology of IBD. Our model consists of individual networks constructed using molecular data generated from intestinal samples isolated from three populations of patients with IBD at different stages of disease. We performed key driver analysis to identify genes predicted to modulate network regulatory states associated with IBD, prioritizing and prospectively validating 12 of the top key drivers experimentally. This validated key driver set not only introduces new regulators of processes central to IBD but also provides the integrated circuits of genetic, molecular, and clinical traits that can be directly queried to interrogate and refine the regulatory framework defining IBD.
摘要中文:炎症性腸病(IBD)的主要挑戰在於整合各種IBD數據集以構建IBD預測模型。我們提出了IBD免疫成分的預測模型。該模型通過使用IBD相關的細胞,組織和病理生理學的功能性和調節性注釋信息,從而對揭示在先前全基因組關聯研究(GWAS)中與IBD相關的基因座之間的因果關係。從三個處於不同疾病階段的IBD患者隊列中獲取分子數據,構建出由獨立網絡組成的模型。我們進行了關鍵驅動因素分析,以鑑定出那些可以預測與IBD相關的網絡調節狀態的基因,並對這些基因進行排序以及通過實驗對12個最關鍵的驅動因素進行前瞻性驗證。這種經過驗證的關鍵驅動基因集不僅引入了IBD核心過程新的調節器,而且還提供了遺傳,分子和臨床特徵的集成網絡,可以直接查詢這些特性來詢問和完善IBD的調控框架。
背景中文:
克羅恩病(CD)和潰瘍性結腸炎(UC)是IBD的主要形式,其特徵是腸道炎症復發和緩解。雖然克羅恩病和潰瘍性結腸炎的具有不同的臨床表型和僅重疊一些分子途徑,但它們在很大程度上具有共同的遺傳結構。儘管GWAS已鑑定出200多個與IBD相關的基因座,但這些已知的遺傳變異僅貢獻了約26%的克羅恩病和19%的潰瘍性結腸炎的遺傳性。
通過構建因果網絡模型,可以對大規模、多樣的數據進行整合利用,統計推斷出任何感興趣特徵之間的因果關係,從而全面描述IBD的結構。已經證明IBD相關基因可以組織形成顯著富集免疫和炎症過程的調節網絡。
然而,目前為止,還沒有從IBD相關組織以及不同IBD疾病階段的分子狀態構建的IBD網絡模型。因此,本文整合IBD不同疾病階段的大規模DNA和RNA數據,以構建IBD病理性炎症成分模型,這有助於區分與IBD相關的炎症成分和腸道的穩態背景功能。
方法中文:(重點描述清楚數據及數據來源)
1)表達數據來自以下三個數據集,並從RNA-seq中鑑定遺傳變異。
數據隊列
樣本數量
來源
備註
RISK
322
GSE57945
迴腸活檢樣本,包括CD、UC以及control
CERTIFI
118
GSE100833
抗腫瘤壞死因子(TNF)-α治療無效的CD患者樣本,包括多個腸段
MSH
134
GSE83687
晚期IBD患者樣本,多個腸段,包括CD、UC以及control(control取自散發性結腸癌患者正常非炎症腸)
2)從International Inflammatory Bowel Disease Genetics Consortium (IIBDGC)和Immunochip研究獲得CD、UC和IBD基因座(GWAS);整合先前發表的IBD、免疫以及消化相關的eQTL數據集;通過ENCODE、REMC、FANTOM5以及Roadmap的Chip-seq以及DHS-seq等獲得不同細胞類型(參與免疫和消化過程)的細胞類型特異性順式調節元件(CRE)。
3)本文通過獲得保守炎症成分(conserved inflammatory component,CIC)的IBD網絡,繼而進行KDG(key driver gene)分析獲得調控子,最後進行實驗驗證。具體步驟如下:
1、通過整合IBD風險SNP、表達數量性狀基因座(eQTL)以及順式調控元件來識別IBD基因。隨後可以在第6步使用這些IBD基因進行KDG的排序。
2、使用RISK、CERTIFI以及MSH的表達譜數據進行加權基因共表達網絡分析(WGCNA),從而獲得共表達模塊。
3、先前研究所描述的巨噬細胞富集的免疫網絡(對IBD易感基因以及IBD相關炎症作用)作為基因種子集(seed immune network),以便在IBD組織特異性背景(即不同數據集不同疾病狀態下的共表達模塊)下識別同源基因集。具體來說,篩選出不同數據集中與免疫網絡顯著富集的共表達模塊(P<0.05),稱其為免疫超級模塊(immune-super module,亦稱tagged module)。
4、通過將每個數據集中的tagged模塊進行合併,獲得超級模塊(super-module)。然後,將不同數據集的超級模塊進行相交,得到核心免疫激活模塊(core immune activation module,core IAM)。
5、利用三個數據集DNA以及RNA數據構建出各個數據集的貝葉斯網絡後,將core IAM或MSS(macrophage-specific signatures)映射到貝葉斯網絡獲得CIC IBD網絡或是MSG(macrophage specific genes)貝葉斯網絡。註:巨噬細胞特異性特徵(MSS,macrophage specific signatures)是來源於以下三種特徵的併集。1)M1,M2和TPP (TNFα, PGE和TPP- (TLR2 ligand P3C))刺激的巨噬細胞共表達模塊;2)結核感染的人類DC特徵;3)100nM地塞米松治療的人巨噬細胞特徵。此外,使用巨噬細胞特異性基因(MSG,macrophage specific genes)集補充MSS。MSG是在人類巨噬細胞或小鼠小膠質細胞中觀察到表達,但在星形膠質細胞、神經元和之前建立的任何M誘導多能幹細胞系中均未表達的基因。
6、在CIC IBD網絡(或MSG貝葉斯網絡)中進行KDG的預測,並利用GWAS IBD基因、VEO(very early onset)IBD基因、免疫網絡基因、MSH隊列的基因表達特徵(CD vs Control, CD vs UC)以及在CERTIFI隊列中基因表達與臨床特徵相關的特徵集來進行KDG排序。具體而言,排序可以分為兩部分。一是對每個KDG基因映射到CIC IBD網絡(或MSG網絡),取兩個路徑長度的基因,獲得這些基因與上述那些特徵富集的P值,並以P值進行排序;二是對每個KDG基因映射到CIC IBD網絡(或MSG網絡),取兩個路徑長度的基因,獲得這些基因與上述那些特徵顯著富集的次數,並以顯著富集的次數進行排序。最終,結合兩種排序獲得綜合排序。
7、對KDG基因進行實驗驗證,使用人類巨噬細胞並對相應KDG-knockdown進行巨噬細胞KDG的驗證,以及藉助小鼠炎症模型和KDG-knockdown進行CIC IBD的KDG驗證。
結果中文:
1、對CIC IBD網絡或IBD網絡中巨噬細胞成分(MSG網絡)關鍵驅動子的識別和排序
CIC IBD網絡中關鍵驅動子的識別和排序。在將獲得的core IMA(228個基因)映射到不同數據集的貝葉斯網絡後,獲得不同數據集的CIC IBD網絡。為了闡明CIC IBD模型的調控框架及其對IBD發病機制,對每個數據集的CIC IBD網絡都進行KDG識別,最終共獲得133 KDG。在對133個KDG排序後,發現前10%的KDG中有5個KDG(DOCK2, GPSM3, NCKAP1L, DOK3)先前沒有被證實與IBD相關。133個KDG排序具體如下圖,不同圈表示在不同特徵下KDG的排序。
IBD網絡中巨噬細胞成分(MSG網絡)關鍵驅動子的識別和排序。鑑於巨噬細胞在腸內穩態中起前哨作用並導致IBD中不適當的炎症反應、seed免疫網絡中巨噬細胞富集以及核心IAM中巨噬細胞特異表達的富集,本文更加精確的確定了IBD網絡的這一組成部分。
CERTIFI CIC IBD網絡是巨噬細胞特徵最富集的網絡,因此將MSG中的基因投射到CERTIFI IBD網絡上,並從這個投影中識別出最大的連接子網絡(由這些基因的三個路徑長度內的節點組成),獲得IBD網絡的巨噬細胞特異性成分。對網絡進行KDG分析,發現59個KDG(皆在133個CIC IBD網絡中識別的KDG),最終選擇10個KDG(包括前面5個未被證實與IBD相關的4個基因)進行實驗驗證。
2、巨噬細胞KDG的體外分子網絡驗證
在對候選巨噬細胞KDG進行分子驗證時,LPS( lipopolysaccharide,脂多糖)刺激誘導細胞炎症反應時產生最大的差異表達特徵並且大多數KDG會對LPS刺激反應(下圖a),因此在LPS刺激下,通過比較靶向11個KDG的siRNA與非靶向的siRNA進行KDG的分子驗證。發現IBD網絡中巨噬細胞特異性成分的相應KDG很好地預測了巨噬細胞特異性KDG-knockdown特徵,即巨噬細胞KDG的子網與巨噬細胞特異性KDG-knockdown後表達改變的基因的顯著富集(下圖b)。
下圖a左圖表示不同刺激劑與對照組下KDG的倍數改變,a右圖表示在LPS刺激下KDG及其鄰居節點的倍數改變(菱形表示KDG,顏色表示上下調);下圖b左圖表示TNFAIP3-knockdown後CERTIFI IBD網絡中節點改變的情況,b右圖表示在LPS刺激性,相應KDG-knockdown後表達改變的基因與KDG子網富集的情況,縱軸表示取幾層作為子網。
3、巨噬細胞KDG的體外分子網絡驗證
為了評估KDG在巨噬細胞中擾動的直接功能結果,本文測定了LPS刺激的巨噬細胞上清液中的細胞因子水平(KDG敲除與非靶向對照組相比)。其中GPSM3-knockdown時IL-1RA和CXCL10顯著差異表達,NCKAP1L和FPR1-knockdown的IL-6、CCL4和CXCL10的顯著差異表達,以及TNFAIP3-knockdown時導致最強的細胞因子差異表達。這些細胞因子(或其受體或配體)與IBD的遺傳易感性有關,或被認為是IBD的藥物靶點,包括TNF-α、IL-6、IL-1RA47、CXCL10和IL-12Rp40。下圖表示TNFAIP3-knockdown後細胞因子的子網,其中紅色節點表示TNFAIP3 KDG,紫色節點表示KDG,藍色節點表示TNFAIP3-knockdown後顯著差異表達的細胞因子。
4、腸道KDG的體內分子網絡驗證
為了了解CIC-IBD網絡模型的KDGs是否會影響腸道炎症的易感性,在KDG-knockdown後使用DSS(dextran sulfate sodium)培養小鼠以獲得小鼠結腸炎模型從而在體內對KDG進行驗證。KDG-knockdown小鼠與野生型對照的差異基因顯著富集到IBD相關的分子途徑,並且利用表達譜構建的共表達模塊也顯示出對GWAS IBD基因、VEO IBD基因以及核心IAM的顯著富集,表明物種間CIC IBD網絡的保守性。此外,本文還進一步測試了給定的KDG的knockdown特徵(即KDG-knockdown後表達顯著改變的基因)是否會與網絡預測的受該KDG控制的一組基因(即KDG特徵)顯著重疊。除了DOK3外,其他KDG的實驗擾動特徵會顯著地富集IBD網絡預測的KDG特徵(如下圖)。
對於每個IBD網絡來說,KDG都可以通過KDG特徵(即KDG所控制的基因)連結,如下圖a中的CERTIFI IBD網絡所示。在CERTIFI隊列中,與KDG基因表達特徵重疊的KDG子網中的基因與那些CRP(C-reactive protein)、乳鐵蛋白和鈣衛蛋白等臨床信息相關的IBD易感基因也顯著富集(如下圖b,c)。
下圖a表示IBD網絡中5個KDG的預測轉錄特徵;b圖表示GPSM3的子網,其中淺綠色節點表示巨噬細胞IBD CRESNP基因,森林綠色表示DSS培養下GPSM3-knockdown的特徵,亮綠色表示這兩者兼之,藍色邊框節點表示CRP(C-reactive protein)、乳鐵蛋白和鈣衛蛋白等臨床信息相關的基因,紅色節點表示ustekinumab的分子靶標;c圖表示DOCK2的子網,其中淺綠色節點表示T細胞IBD CRESNP基因,森林綠色表示DOCK2-knockdown的上調特徵,亮綠色表示這兩者兼之,藍色邊框節點表示CRP(C-reactive protein)、乳鐵蛋白和鈣衛蛋白等臨床信息相關的基因,紅色節點表示與ustekinumab相關。
5、腸道KDG的體內驗證
為了驗證腸道KDGs與IBD的相關性,我們首先研究了擾動這些基因是否會破壞免疫穩態。對於T細胞,本文評估了CD4+T細胞中IFN-γ和IL-17A的產生(兩者都與克羅恩病的病理學有關)。與野生型同窩對照組相比,Nckap1l−/−小鼠、Dock2−/−小鼠和Gpsm3−/−小鼠腸道固有層中IL-17A+和/或IFN-γ+CD4+T細胞的頻率存在顯著差異(下圖a, b)。對於髓系細胞,使用抗CD103、CD11b和CD64的抗體定義了腸道樹突狀細胞(DC)和巨噬細胞的功能亞群。Nckap1l−/−小鼠的CD103+CD11b+細胞頻率升高,而Nckap1l−/−和Dock2−/−小鼠的CD11b+單陽性DC頻率降低,同時Nckap1l−/−小鼠的CD103+DC頻率降低,CD64+巨噬細胞頻率升高,Dok3−/−,Gpsm3−/−,和Aif1−/−小鼠在結腸中的這些髓細胞亞群的免疫細胞比率沒有顯著差異(下圖c)。
為了確定KDGs是否影響腸道炎症的易感性,本文採用了DSS、TNBS等小鼠結腸炎模型。野生型同窩對照小鼠在DSS、TNBS培養後出現腸道炎症症狀。與同窩鼠對照組相比,Nckap1l−/−和Gpsm3−/−小鼠在DSS治療後有更嚴重的體重減輕和更高的內鏡評分(下圖a, b)。在DSS治療下,Aif1−/−和Dok3−/−緩解小鼠的體重減輕(下圖a)。與野生型同窩對照相比,DSS治療下Dock2-/-,Gpsm3-/-,Dok3-/-和Nckap1-/-小鼠均表現出顯著更差的內窺鏡評分(下圖c,d)。 同時與野生型對照相比,Dok3-/-和Gpsm3-/-小鼠表現出顯著更差的組織學評分(下圖e),而Aif1-/-小鼠表現出顯著降低的病理學評分(下圖f-k)。
總體來說,本文檢測的每隻KDG-knockdown小鼠在結腸炎中至少表現出顯著的體重減輕表型和腸道炎症表型在內的一種表型(如下表)。
討論中文:
有人支持KDG在疾病中的機械作用是由網絡的調節狀態改變所驅動的,而這調節狀態的改變受到免疫有關過程的明確影響。本文確定的KDG中存在一個統一主題,即RAC激活和細胞骨架重排,而這是免疫過程中的一個中心介質,與克羅恩病、實驗性結腸炎以及潰瘍性結腸炎有關(如下圖NF-κB途徑,RAC及其肌動蛋白細胞骨架重排,RAS,NLRP3炎性小體途徑以及TLR和趨化因子受體均由本文確定的KDG調節)。本文通過構建預測網絡模型識別KDG以及使用生物實驗驗證了KDG的合理敏感性,但是對於相應的特異性理解是一項十分困難的任務。