梁晗組報導大規模腫瘤藥物蛋白擾動效應篩選數據集

2020-11-08 BioArt

撰文 | 伊凱

責編 | 兮


對由進化所規定的種群、個體及細胞層級的基因型(genotype)與表現型(phenotype)之間的關聯的解析是分子生物學研究的核心課題。就方法論而言,基因擾動實驗(perturbation)和基因型——表現型特徵統計分析是兩條具有統治地位的路徑,它們能夠分別揭示出具有因果關係的(causal)或者具有相關性的(correlative)調控者——靶標邏輯【1,2】。考慮到基因型與表現型二者的搜索空間均十分龐大,基因擾動實驗往往局限在單一調控者或特定靶標的範圍之內。相反,統計關聯分析的極佳延展性在多組學數據快速積累的背景下成為了大規模闡釋基因型——表現型連接的常用手段,經典案例包括全基因組關聯分析(GWAS)、表達數量性狀基因座分析(eQTL)、等位基因特異性表達分析(ASE)和基因共表達網絡分析(co-expression network)等。不過,統計關聯分析範式易受上位作用(epistatic effect)等因素的影響,從而遺漏具有直接邏輯關聯的基因型——表現型配對。

近年來,隨著CRISPR基因編輯技術、單細胞測序技術及高通量圖像處理技術等的興起,對基因型進行大規模擾動並快速捕捉多維度表現型信息成為了可能。其中,癌症研究領域是擾動生物學(perturbation biology)研究範式的最大受益者之一。具體而言,實驗者通過擾動基因的序列、表達、定位、或修飾等,繼而測量作為反應的RNA、蛋白表達或細胞狀態等特徵, 最終發現疾病、基因和治療之間的關係。由Broad研究所領銜的癌症依賴性圖譜計劃(Cancer Dependency Map)篩選了上千種癌細胞系中全基因組範圍單基因敲除對細胞增殖效應的影響【3,4】,而L1000計劃(前身為Connectivity Map)資料庫中則有超過百萬的小分子化合物、基因過表達,或基因敲低等擾動處理後得到的癌細胞系基因表達譜【5】

不過,現存的各類大規模基因或化合物篩選數據集均缺少以蛋白表達水平為核心的響應指標,這主要是由於蛋白質大規模定量仍較為困難,因而將諸如定量蛋白質組學技術(quantitative proteomics)等應用至大規模擾動生物學研究中並非一條可行的路徑。考慮到蛋白質是細胞功能的主要載體和大部分抗腫瘤藥物的直接作用靶標,其表達水平和修飾狀態對外界刺激作出的響應是反映細胞狀態轉變的關鍵指標,亦是抗腫瘤機制的重要線索。因此,如何將對蛋白水平的監測納入大規模癌症擾動生物學研究,是亟待解決的課題。

2020年11月6日,美國MD安德森癌症中心梁晗課題組和俄勒岡健康與科學大學Gordon Mills課題組合作在Cancer Cell雜誌上發表了題為Large-scale characterization of drug responses of clinically relevant proteins in cancer cell lines的文章,首次報導了以蛋白表達水平作為擾動指標的大規模抗腫瘤藥物效應篩選數據集。這項工作由課題組成員趙維博士、李軍博士、陳玫如博士、羅伊凱博士等合作完成。



與定量蛋白組學技術相比,反向蛋白微陣列技術(reverse phase protein microarray, RPPA)具有樣本通量高、靈敏度高、樣本需求低、成本低等優勢,因而適合於應用至對特定功能蛋白群的大規模表達水平檢測【6】。基於這一技術,MD安德森癌症中心的研究人員此前已經對癌症基因組圖譜(TCGA)中的來自32種癌症類型的超過八千個病人樣本和癌細胞系百科全書計劃(CCLE)中的超過六百種細胞系中的數百個癌症相關蛋白進行了精確定量【7-9】

在該項研究中,作者以RPPA測定的210個癌症相關蛋白質的表達水平作為指標,系統性地描繪了約170種臨床前或已經應用於臨床的藥物對近320種癌細胞系的細胞狀態擾動效應。在經過嚴格的基於內部重複組對比的質量驗證後,作者得到了超過15000個擾動實驗圖譜。在其後與外部公開數據(如CCLE定量蛋白質組和L1000等)的對比中,這一數據集亦表現出良好的跨平臺可重複性。值得一提的是,該數據集中還包括了對於同一藥物與癌細胞系配對的不同梯度和時間進程下的效應測定,因而產生了超越單劑量、單時間點的多維度數據類型和由此衍生的豐富生物學意義。

基於這一數據集,作者主要探討了由癌細胞系敏感性資料庫GDSC等所提供的癌細胞抗藥強度與其自身蛋白表達譜特徵之間的關聯。一個關鍵的發現是,儘管與以往多項研究所揭示的結論相同,癌細胞在未經處理時的靜態蛋白表達數據可以較好地用於預測其對於靶向特定信號通路的藥物的反應性,但當在預測模型中加入經藥物處理後的動態蛋白表達數據時,準確性能夠得到顯著提高。這一結果從癌細胞——藥物互作角度展現了擾動生物學技術相較於統計關聯分析在連接基因型(癌細胞蛋白表達譜)和表現型(抗藥性)上的優勢。

該數據集的高維度和統一化特徵使得建立一個根據藥物作用效應和蛋白功能分類形成的藥物——蛋白大尺度互作網絡成為可能。對這一網絡進行分析,作者發現已知具有類似生物靶標的藥物往往被歸類在一起,而表達水平被同一藥物顯著擾動的蛋白質群之間則具有顯著更多的已知互作連接。另外,當把這一藥物——蛋白互作網絡與癌細胞抗藥性數據聯合分析時,作者能夠通過對應信號通路的反向擾動作用預測出可能具有潛在結合效應的抗癌藥物組合。有趣的是,其中多個組合已經存在於既往的特定研究或者臨床試驗中,因此展現了對大規模藥物蛋白擾動效應的測定在指導臨床藥物運用方面的巨大潛力。

總之,該數據集首次在大規模癌症藥物效應篩選中實現了以蛋白表達為測量基準,彌補了由於蛋白表達信息缺乏所導致的對藥物抗腫瘤機制進行闡釋和效應預測的重大缺陷。另外,考慮到絕大多數常用癌細胞系已經具有統一化、高質量的多組學數據,包括RNA、蛋白質、DNA甲基化、miRNA、基因突變、藥物敏感性等,該研究所提供的蛋白擾動數據將能夠經由多模態整合分析發揮超出本身數據含量指數級的價值,為闡明癌細胞的藥物反應在各個分子層級的潛在影響因素的交叉作用提供絕佳的機會。



原文連結:

https://doi.org/10.1016/j.ccell.2020.10.008


參考文獻

1. Parnas, O. et al. A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect Regulatory Networks. Cell 162, 675–686 (2015).

2. Chen, H., Wu, C. I. & He, X. The genotype–phenotype relationships in the light of natural selection. Mol. Biol. Evol. 35, 525–542 (2018).

3. Meyers, R. M. et al. Computational correction of copy number effect improves specificity of CRISPR-Cas9 essentiality screens in cancer cells. Nat. Genet. 49, 1779–1784 (2017).

4. McDonald, E. R. et al. Project DRIVE: A Compendium of Cancer Dependencies and Synthetic Lethal Relationships Uncovered by Large-Scale, Deep RNAi Screening.Cell 170, 577-592.e10 (2017).

5. Subramanian, A. et al. A Next Generation Connectivity Map: L1000 Platform and the First 1,000,000 Profiles. Cell 171, 1437-1452.e17 (2017).

6. Akbani, R. et al. Realizing the promise of reverse phase protein arrays for clinical, translational, and basic research: A workshop report the RPPA (Reverse Phase Protein Array) Society. Mol. Cell. Proteomics (2014) doi:10.1074/mcp.O113.034918.

7. Li, J. et al. Explore, visualize, and analyze functional cancer proteomic data using the cancer proteome atlas. Cancer Res. (2017) doi:10.1158/0008-5472.CAN-17-0369.

8. Akbani, R. et al. A pan-cancer proteomic perspective on the cancer genome atlas.Nat. Commun. 5, (2014).

9. Li, J. et al. Characterization of Human Cancer Cell Lines by Reverse-phase Protein Arrays. Cancer Cell 31, 225–239 (2017).

相關焦點

  • 梁晗課題組報導大規模腫瘤藥物蛋白擾動效應篩選數據集
    不過,現存的各類大規模基因或化合物篩選數據集均缺少以蛋白表達水平為核心的響應指標,這主要是由於蛋白質大規模定量仍較為困難,因而將諸如定量蛋白質組學技術(quantitative proteomics)等應用至大規模擾動生物學研究中並非一條可行的路徑。
  • 癌症治療新思路 Science:篩選到靶向腫瘤幹細胞的轉化藥物
    癌症治療新思路 Science:篩選到靶向腫瘤幹細胞的轉化藥物時間:2016-03-12 20:10   來源:川北在線整理   責任編輯:沫朵 川北在線核心提示:原標題:癌症治療新思路 Science:篩選到靶向腫瘤幹細胞的轉化藥物 本期Science中Pattabiraman等人篩選到誘導腫瘤起始細胞的表型發生改變的化合物
  • 體外新藥篩選系列(一):KRAS篩選助力靶向腫瘤藥物研發
    在眾多癌基因中,RAS基因家族在人類腫瘤中突變概率最高。RAS突變腫瘤佔人類所有惡性腫瘤的三分之一,其中KRAS作為RAS基因家族中的主要亞型,促發人類多種致死性腫瘤,如肺癌、結腸癌和胰腺癌等。 KRAS編碼一種小型GTPase膜結合蛋白,這種蛋白以兩種不同的形式出現,非激活狀態下的GDP結合形式以及激活狀態下的GTP結合形式。
  • ...Communications|整合藥物大數據與貝葉斯方法大規模預測藥物靶點
    作者整合了大量的公共數據來訓練此模型,並在2000多種小分子的數據集上進行測試, BANDIT的預測準確率為90%。然後,在對14,000多種化合物的靶點進行預測過程中,BANDIT計算出約4,000種未知的分子靶標。隨後BANDIT被應用於預測臨床開發階段的靶點未知的抗腫瘤藥物ONC201的靶點,通過實驗驗證了BANDIT預測的準確性,並且此靶點信息推動了相關臨床試驗進展。
  • 【生信文獻200篇】06 高通量藥物篩選 + Rhabdoid tumors
    期刊:《Cell reports》影響因子:8.109    發表時間:2017-11-14研究領域:高通量藥物篩選DOI號:10.1016/j.celrep.2017.10.076橫紋肌樣腫瘤(RTS)是一種以SMARCB1失活為特徵的侵襲性兒科腫瘤。
  • 藥物和基因的細胞效應發現並提供對蛋白質功能的見解
    麻省理工學院和哈佛大學布羅德研究所的研究人員已經將連接圖 - 一種廣泛使用的工具和數據資源 - 推向了一個新的高度,並且具有大規模擴展版本。對於這個新平臺,研究人員還改進了其對科學界的可及性,使小分子和基因功能的研究成為可能,並為臨床試驗提供信息。
  • 重組蛋白藥物生產用哺乳動物細胞系構建中篩選標記的應用現狀及審評思考
    本文以中華倉鼠卵巢(Chinese hamaster overy, CHO)細胞為例,介紹篩選標記在重組蛋白藥物生產用哺乳動物細胞系構建中的應用,設計篩選標記以提高篩選嚴謹性的方法,以及細胞基質穩定性及篩選標記安全性的審評思考,以期為藥物研發機構高效開發重組蛋白藥物提供參考。
  • 腫瘤藥物潛在靶點PDK1
    3-磷酸肌醇依賴性蛋白激酶1(PDK1)是AGC蛋白激酶家族的主要調節器,是腫瘤磷脂醯肌醇3激酶(PI3K)/蛋白激酶B(AKT)信號通路上的一個重要蛋白質,PDK1已經成為一類有潛力的腫瘤藥物靶標。
  • TCPA:腫瘤RPPA蛋白晶片數據中心
    蛋白組學數據的分析是腫瘤病理生理學領域常用的手段之一,在TCGA項目中,廣泛使用了反相蛋白晶片reverse-phase protein arrays(RPPA)技術來進行腫瘤蛋白質組的研究。通過該晶片, 能夠有效分析多種標記蛋白在樣本中的表達量及其變化趨勢,是一種經濟高效的腫瘤蛋白質組學研究手段。
  • Nature | 手把手教你搭建大規模藥物虛擬篩選平臺
    簡介目前,一個上市的藥物平均需要花費20-30億美元,並且需要10年左右的研發時間。大部分經費都花費在了昂貴且耗時的溼實驗部分,初始Hits陽性率太低以及(臨床前)階段的高損耗率。使用基於結構的虛擬篩選,Hits質量隨著篩選化合物的數量而提高。儘管存在大量的化合物資料庫,但是缺乏有效的靈活的方式使用計算機集群進行大規模的SBDD的手段。
  • 聚焦單克隆抗體藥物技術瓶頸
    當前,抗體藥物研發的瓶頸在於靶分子的篩選,抗體人源化和人抗體製備,抗體的高通量大規模篩選技術,抗原表位的預測、建模和分析技術,抗原-抗體相互作用的立體構型構建和各種增加抗體效應功能的技術等。1.抗體藥物靶標篩選傳統抗體藥物研發的方法是在單個基因、單個蛋白及單個抗體水平上研發,首先需要經過許多年的時間研究這個基因和及其編碼蛋白的功能,確認是否能夠將這個基因及其編碼蛋白作為抗體藥物靶標來研發抗體藥物。這種方法的缺點主要在於:所獲得的抗體藥物靶標的數量極其有限,並且這些靶標都是十多年前就已發現的;歷時長,一般需要十到二十年的時間。
  • 親和質譜技術:藥物靶標配體的高通量篩選
    研究者通常從大量化合物庫中篩選出與靶蛋白發生特異結合作用的小分子配體,如此的混合物篩選方式可以顯著提高篩選通量和降低成本。水雯箐研究員2016年初加入上海科技大學,在iHuman研究所建立了配體篩選與組學技術課題組,是國內較早開展親和質譜用於藥物靶標配體高通量篩選的學者之一。
  • 腫瘤蛋白標誌物論壇搶先看 | CCTB 2020中國腫瘤標誌物學術大會
    篩選潛在的蛋白質標誌物一直是理想腫瘤標誌物追尋過程中不容忽略的一環。近年,蛋白質組學技術的飛速發展為蛋白質標誌物的篩選帶來革命性變化。去年大會的分論壇裡我們解碼了最新的組學技術用於腫瘤標誌物篩選及臨床應用。
  • 新的資源可以幫助預測藥物敏感性和優化治療策略
    美國醫療服務機構和生元國際了解到,德克薩斯大學MD安德森癌症中心的研究人員通過對腫瘤細胞系中藥物治療反應的蛋白質變化進行大規模分析,獲得了一種寶貴的資源,可以幫助預測藥物敏感性,了解治療耐藥機制,並確定最佳的聯合治療策略。
  • 北京新抗元的新抗原:大數據驅動的腫瘤免疫新藥
    如何從30億的DNA鹼基中準確識別患者的突變,然後通過人工智慧算法計算出可以引起免疫細胞攻擊的突變靶點,離不開組學大數據分析技術和基於AI的精準靶點識別技術;另一方面,人體血液中有不少於109 不同種類的免疫殺傷性細胞(殺傷性T細胞),如何精準地從數十億T細胞中篩選出可以特異地殺死腫瘤的T細胞,再次需要海量腫瘤免疫大數據和最新腫瘤免疫數據分析算法的支持。
  • 上海藥物所等發現小G蛋白Rho亞家族不可逆變構抑制劑
    該研究報導了小G蛋白Rho亞家族的共價抑制劑,發現其新型變構調控口袋,並闡明其變構調控分子機制。  小G蛋白家族關鍵成員Rho亞家族是細胞內重要的調控因子,由於臨床發現其關鍵成員RhoA等存在多種致病性突變,引發腫瘤惡性增殖和轉移,因而該家族成為抗腫瘤藥物研發領域的重要靶標。
  • 看得見的蛋白互作新技術Duolink PLA
    在疾病的致病機理、分子機制、信號通路、藥物篩選以及新型診斷標誌物的發現中,傳統的蛋白研究「金標準」方法如Co-IP、Western blot、ELISA、IF等已呈現出很大的局限性。在腫瘤的靶向治療過程中,BRAF是非常重要的藥物靶點,很多腫瘤都存在BRAF(V600)的突變,很多藥物都是針對這個位點,但是逐漸增加的藥物抗性讓大家迫切希望能夠進一步發現新的藥物靶標,和傳統藥物聯合治療,進一步提高藥物治療效果。
  • 創新藥物研發中的高通量篩選方法進展
    在小分子篩選中,不可使用GFP,因為這兩個片段不可逆地結合,不能通過小分子的結合而解離。最近一種可逆性螢光互補結構被報導,其通過一種結合小分子染料的蛋白,增強螢光。雙雜交(2H)篩選是另一種基於活性轉錄因子形成的互補方法。在雙雜中,DNA結合域與誘餌蛋白結合,而轉錄激活域與靶蛋白結合。報告基因(如GAL或LAC)插入啟動子後,如果靶蛋白與誘餌結合,激活域與報告基因相連,激活報告基因並能被檢測到。
  • 科學家發現了胰腺癌的新藥物靶標——PPP1R1B蛋白
    桑福德·伯納姆·普雷比醫學發現研究所的腫瘤啟動和維持項目副教授、該研究的資深作者Anindya Bagchi博士表示:「我們的研究發現一種名為PPP1R1B的蛋白質,對於胰腺癌研究人員來說是全新的,它能驅動腫瘤轉移,癌症轉移是癌症致命的主要原因。有了這些概念驗證的數據,我們可以開始藥物篩選,確定一種PPP1R1B的抑制劑,如果成功,可能幫助更多的胰腺癌患者存活下來。」
  • 科學家發現靶向銅離子伴侶蛋白調控劑的抗腫瘤作用機制
    近年來,體內銅調控機制研究已經成為腫瘤生物學研究的重要方向。相對正常細胞,銅離子在腫瘤細胞中明顯富集。臨床研究發現,癌症患者血漿中銅離子的濃度與腫瘤的惡化程度以及藥物治療的反應相關。種種證據都表明,靶向銅離子調控和轉運通路的藥物研究可能成為抗腫瘤藥物研發的新策略。