引言
上海藥物研究所通過深度學習技術發現p300/CBP組蛋白乙醯轉移酶先導化合物,然後通過結構改造發現活性最強的抑制劑。
先睹為快
靶點
p300/CBP組蛋白乙醯轉移酶
模型訓練庫
ChEMBL 資料庫(~200000個小分子)
已報導的p300 抑制劑(135個小分子)
Asinex和ChemBridge的大環化合物資料庫(38176個小分子)
計算方法
LSTM(長短期記憶)神經網絡模型生成分子庫
分子對接
計算軟體
RDKit,Glide
計算流程
作者利用ChEMBL中的類藥分子訓練LSTM(長短期記憶)神經網絡模型,然後利用已發表的135個p300抑制劑和576個大環分子作為微調,生成了672個分子,然後結合類藥性、藥物結構複雜程度以及分子對接的打分,選擇排名前20的化合物進行肉眼篩選,選擇其中的B003進行化學合成以及生物活性測試,發現活性為10nM,基於B003進行結構改造和優化,發現目前活性活性最強,選擇性最好的B026化合物(1.8nM)。
p300/CBP先導化合物的發現
作者首先基於ChEMBL資料庫中大約200,000個化合物用於訓練(train)構建LSTM(長短期記憶)神經網絡模型,隨後基於ECFP4特徵,使用Butina算法對Asinex和ChemBridge的大環化合物資料庫中38,176個分子進行聚類,得到額外的576個大環分子,這些分子與已發表的135個p300抑制劑被用於模型的微調(fine-tune)。模型採用ADAM算法進行優化,得到準確度可靠的LSTM分子生成模型(由三個LSTM層、三個Dropout層、一個TimeDistributed層和一個用於激活過程的Softmax函數組成)。基於該模型生成一系列有潛力的p300抑制劑並進一步篩選,最終得到一種符合篩選規則(類藥性、結構複雜性、對接分數)的新的有效的p300抑制劑--B003(圖2)。
分子對接
作者以Glide SP(標準精度)進行分子對接研究,通過富集分析評估p300對接模型是否能夠區分已發表的p300抑制劑和DecyFinder50產生的陰性分子。對接模型在2%排名靠前的分子中達到了約70%的準確率,總體ROC得分為0.61(圖3),說明了對接模型的可靠性。分子對接預測的結合模式分析表明,B003和A-485與p300具有相似的特異性相互作用,包括Gln-1455與甲基尿素部分之間的兩個氫鍵,惡唑烷二酮的4』羰基與Ser-1400之間的氫鍵作用,以及與醯胺羰基的水介導氫鍵作用(圖1B)。
結構優化
作者以B003作為先導化合物,進行了系統的構效關係(SAR)研究,以進一步提高藥效以及藥物代謝和藥代動力學(DMPK)性質。利用放射性乙醯轉移酶活性測定,評價化合物對p300活性的抑制作用。最終得到一種非常有前途的p300/CBP HAT抑制劑B026,可作為潛在的臨床開發候選藥物進行廣泛的臨床前研究。
圖1.人工智慧輔助藥物發現新型p300抑制劑的工作流程
圖片來源JMC
圖2.前20個AI提出的p300抑制劑的化學空間
圖片來源JMC
圖3.對p300結合親和力預測的富集評估
圖片來源JMC
圖4. p300/CBP抑制劑B026的發現流程
圖片來源JMC
參考文獻:
Yang Y, Zhang R, Li Z, et al. Discovery of Highly Potent, Selective, and Orally Efficacious p300/CBP Histone Acetyltransferases Inhibitors[J]. Journal of Medicinal Chemistry, 2020.
相關文章
Science Advances | 利用深度強化學習方法從頭設計特定活性的分子JCAMD-D3R | 藥物設計比賽中的深度學習工具MathDLNature Biotechnology | 46天!深度學習加速DDR1激酶抑制劑研發JMC | 英國Astex製藥公司利用卷積神經網絡精確預測靜電勢表面人工智慧成為基金熱點,2019年國家基金(藥物設計與藥物信息)AI藥物分子設計系列(1)-優質虛擬分子庫的生成AI藥物分子設計系列(2)-分子性質的預測應用深度學習方法對抗胰腺癌應用人工智慧預測藥物組合的副作用深度學習促進藥物-藥物和藥物-食物相互作用預測