2010年代,進入了醫藥研發大數據時代,伴隨著科研信息化設施的升級以及組學數據的爆炸式增長,藥物設計領域也逐漸向智能化邁進。
我國從事藥物分子設計的研究機構也在不斷增多,形成了許多以藥物分子設計為特色的研究方向如網絡藥理學、系統生物學等,研究成果在國內外產生了重要的影響。
蔣華良課題組採用計算模擬、預測並聯合實驗驗證的研究策略,針對一些重要的藥物靶標的結構、功能和調控機制開展了研究。
KCNQ2是與癲癇相關的一類電壓門控鉀離子通道,蔣華良、陽懷宇課題組[107]通過綜合運用動力學模擬、分子對接、定點突變和電生理測試等方法,發現了一個位於通道門控電荷通路(gating charge pathway)中的激動劑結合口袋。
針對該口袋開展虛擬篩選和藥物設計,進一步發現了 9個KCNQ2新型激動劑,其中兩個在兩類動物模型中表現出優異的抗癲癇活性。
該研究為發現離子通道調製劑結合口袋提供了成功的案例,並且首次實現了基於結構的電壓門控鉀離子通道激動劑的發現(圖2)。
此外,該團隊還發現,PIP2與Kv1.2,Shaker和KCNQ通道的結合以及對它們的調控作用都存在顯著差異,表明磷脂與膜蛋白相互作用可能是決定大量同源家族膜蛋白功能差異的重要因素之一,需要在更微觀的角度研究膜與膜蛋白相互作用[108]。
胰高血糖素受體(glucagon receptor,GCCR)屬於B型G蛋白偶聯受體(G proteincoupled receptors,GPCRs),參與調節體內血糖穩態,是治療Ⅱ型糖尿病的重要靶點。
蔣華良課題組[109]應用分子動力學模擬方法研究了全長GCGR不同結構域之間的作用模式及動態改變,闡明了可能影響受體功能的構象變化,計算結果與一系列功能研究結果吻合。
該成果有助於人們深入認識GPCR超家族蛋白結構與功能的關係,為Ⅱ型糖尿病治療新藥的開發提供了新的思路。
蔣華良、鄭明月等人[110]開展了基於蛋白質-配體相互作用的打分函數的工作,其開發的打分函數與常見的分子對接打分函數相比,在親和力預測方面有較明顯的改進,能顯著提高對合理的蛋白-配體結合構象的識別能力。
蔣華良、鄭明月等人還應用藥效團組合和機器學習等方法進行了一系列應用研究,發現了靶向OCT2[111],FGFR1[112],DOT1L[113],BRD4[114]等重要靶點的新型抑制劑。
計算生物學方法在研究表觀遺傳學修飾(如DNA甲基化)等過程中起到了重要作用[115~117],DNA甲基化是一種重要的表觀遺傳修飾,TET蛋白介導了5-甲基胞嘧啶(5-methylcytosine,5mC)的連續氧化,相繼生成5-羥甲基胞嘧啶(5-hydroxymethylcytosine,5hmC)、5-醛基胞嘧啶(5-formylcytosine,5fC)和5-羧基胞嘧啶(5-carboxylcytosine,5caC)3種產物。
羅成與復旦大學徐彥輝等人[118]合作,綜合利用結構生物學、生物化學和計算生物學等研究方法揭示了TET底物偏好性分子機制。
分子模擬與QM/MM計算結果表明,氫抽提為限速步驟,且能壘趨勢與實驗觀測反應效率一致,並預測氫抽提反應的能壘差異主要來源於不同底物在反應中間體時取向不同,計算結果被進一步的同位素動力學效應實驗和停留光譜實驗所證實。
北京大學來魯華課題組較早地開展了基於結構的從頭藥物設計方法發展及應用研究,並取得了豐碩的成果。
該課題組將其此前開發的LigBuilder軟體升級更新至LigBuilder 3.0[119],首次從頭設計出了COX-2和 LTA4H的雙功能抑制劑,它和已知最好的COX-2和 LTA4H雙功能抑制劑相當,並且具有更好的配體效率。
在LigBuilder蛋白質結合口袋分析模塊的基礎上,該課題組還相繼獨立發展了Pocket 2[120],Pocket 3[121]和Pocket 4[19]方法,這些方法被廣泛應用於基於結構的藥效團模型分析。
該課題組應用Pocket 4方法生成藥效團模型,與華東理工大學李洪林課題組合作,升級了基於反向藥效團搜索的藥物靶標發現伺服器PharmMapper[19],進一步發展了蛋白質小分子結合位點探測方法CAVITY[9],以及開放式圖形在線計算服務平臺CavityPlus[11]。
CavityPlus用於精確探測蛋白質表面的結合口袋,並同時計算結合口袋的多種性質(http://www。pkumdl。cn/cavityplus)。
對於用戶輸入的蛋白質三維結構信息,CavityPlus平臺中的CAVITY模塊可以預測出潛在的藥物結合口袋並給出成藥性打分,從而精確指導後續的藥物設計研究。
很多疾病都是由多基因控制的,針對單一靶標的藥物難以達到預期治療效果,或會產生意想不到的毒副作用,因此必須發展基於系統生物學的藥物設計方法。
來魯華課題組在基於系統生物學的藥物設計方法發展中也取得了一系列創新研究成果。
來魯華與北京大學歐陽頎等人合作,結合生物網絡動力學分析與蛋白質相互作用分子動力學分析,從理論上對基因突變導致癌症發生的機制進行了探索[122],揭示了癌細胞Warburg效應的發生機制[123],為抗癌靶標的選擇提供了新的啟示。
針對花生四烯酸代謝網絡的多靶標調控和激活劑設計需求,來魯華課題組基於公共藥效團的多靶標藥物設計策略[124]等方法,並針對該網絡中的靶標組合發展了針對5-LOX和mPGES-1[125]、COX-2和LTA4H[126]以及LTA4H和PLA2[127]等雙靶標抑制劑,還應用所發展的別構藥物設計方法[8]成功獲得了15-LOX[128]和GPX4[129]的激動劑分子。
內容由凡默谷小編查閱文獻選取,排版與編輯為原創。如轉載,請尊重勞動成果,註明來源於凡默谷公眾號。
上海交通大學張健課題組[33,130,131]開創了以構象誘導為基礎的變構藥物設計系列方法,以期解決新靶標識別和原創先導化合物發現的瓶頸問題。
張健課題組針對新靶標「枯竭」問題,創新性地提出了「Allosterome」體系,並建立了已知變構分子實驗數據的資料庫ASD。
該課題組結合7000例臨床基因組和ASD數據分析,創新性地設計了精準靶標識別方法Allodriver。
該方法根據腫瘤樣本基因組映射到蛋白變構位點的有害變化的發生率來直接識別調控這類腫瘤的敏感蛋白靶標。
他們利用該方法,從臨床樣本發現並驗證了多個來自我國高發腫瘤病人的特異性全新靶標(如非小細胞肺癌的PDE10A、頭頸部腫瘤的PTPRK等)[7,132],為我國創新藥物研發提供了大量來自臨床的第一手靶標資源。
面向對這些新靶標中存在的「原創藥物先導難以發現」問題,該課題組通過合理識別變構位點並研發變構先導化合物來解決該瓶頸。
他們創建了用於發展變構位點識別方法所需的標準體系Asbench[133],並基於Asbench設計了普遍適用於蛋白靶標的變構位點識別方法Allosite[10,134],這是國際上首例公開使用的變構位點識別方法,該方法的使用頻率和識別性能自2013年發布至今一直在同類方法中名列前茅。
利用變構位點特徵,他們設計了富集符合變構特徵的化合物分子集中庫方法Allolike[135]及針對變構位點化合物活性的精準評價方法Alloscore[17],並最終優化實現了高通量變構位點化合物篩選方法Allofinder[18],在SIRT6[136],CK2α[137],STAT3[18]等多個「難靶」靶標中獲得了新型變構先導化合物。
以SIRT6為例,在研究中,他們通過綜合利用變構藥物設計方法發現SIRT6一個潛在的變構位點,繼而在此位點上篩選並系統優化獲得SIRT6激動劑MDL-800和MDL-801。MDL-800等通過結合在底物位點背面的變構位點,增強底物活性及催化效率來激動SIRT6對組蛋白H3K9和H3K56的去乙醯化,且 對HDAC家族中其他成員無明顯活性。
繼而,他們利用MDL-800對SIRT6在腫瘤中潛在的靶標作用進行了藥理學驗證。
MDL-800可以在肝癌細胞內特異性激活SIRT 6組蛋白去乙醯化活性,下調H3K9Ac和H3K56Ac,阻斷細胞周期阻滯從而抑制肝癌細胞增殖。
特別值得一提的是,肝癌移植瘤動物及其敲除模型的實驗發現,MDL-800具有良好的在體特異性抑制腫瘤生長的效果。
華東理工大學唐贇課題組[138]致力於基於網絡的藥物-靶標相互作用預測方法的開發,這些方法在靶標預測、老藥新用、中藥網絡藥理學等方面展現了良好的應用前景。
他們首先基於推薦算法開發了一種基於網絡推理(network-based inference,NBI)的藥物-靶標相互作用預測算法[139],該方法通過已知藥物-靶標相互作用信息來構建藥物-靶標相互作用網絡,從而預測新的藥物-靶標相互作用關係。
為了檢驗該方法的實際應用效果,他們構建了一個上市藥物-靶標相互作用網絡,然後採用NBI方法預測其中新的藥物-靶標相互作用對,併購買了其中打分較高的9個可能作用於二肽基肽酶4(dipeptidyl peptidase-4,DPP4)的老藥,以及31個可能作用於雌激素受體(ERα/ERβ)的老藥,體外生物測試表明,孟魯斯特(Montelukast)可以作用於DPP4,雙氯芬酸(Diclofenac)、辛伐他汀(Simvastatin)、酮康唑(Ketoconazole)和伊曲康唑(Itraconazole)可以作用於ERα/ERβ(表3、圖3)。
進一步的細胞水平實驗結果顯示,辛伐他汀和酮康唑可以抑制人體乳腺癌細胞株MDA-MB-231的增殖(表3)。
相關論文自發表以來,至今已被引用超過300次,為ESI(Essential Science Indicators)高被引論文。
此外,唐贇課題組在藥物ADMET預測及優化方法的開發和應用方面也有著豐碩的成果。
該課題組基於大數據和機器學習,開發了一種能預測ADMET性質的子結構模式識別方法[140],利用該方法他們建立了人體小腸吸收性、血腦屏障滲透性[141]、血漿蛋白結合性[142]、代謝位點[143]、致突變性[144]、致癌性[145]、口服急性毒性[146]、肝臟毒性[147]、心臟hERG毒性[148]、基因毒性[149]、內分泌幹擾性[150]等眾多預測模型,獲得了優於常規方法的結果。
在發展方法和構建模型的基礎上,他們還開發了ADMET相關資料庫及在線服務系統admetSAR(http://lmmd.ecust.edu.cn/admetsar1/)[151],該資料庫收集了超過96000個化合物的21萬餘條ADMET相關實驗數據,並包含開發的31個定性分類和定量回歸模型。
目前admetSAR已得到世界各地眾多用戶的廣泛使用和高度認可,著名藥物信息學網站DrugBank自2014年4月的第4版開始,也使用admetSAR預測其資料庫中藥物分子的ADMET性質。
四川大學楊勝勇課題組基於機器學習、藥效團模型等方法發展了一系列方法及軟體,為新藥發現提供了重要的工具。
他們開發了基於藥效團模型的藥物分子從頭設計方法[152]和軟體PhDD(軟體著作權號:2009SR07119)。
PhDD使用了矢量最優匹配片段連接算法,使得最終產生的分子在較低的能量構象下能與藥效團模型產生很好的匹配,提高了藥物分子從頭設計的準確性。
該方法突破了當前藥物分子從頭設計需要受體結構信息的限制,是對傳統藥物分子從頭設計方法的重要發展。
該課題組還開發了基於逆向合成原理的化合物可合成性評價方法和軟體RASA(軟體著作權號: 2010SR013181)。
該方法採用了一種新型合成樹生成及優化算法,避免了傳統逆向合成分析中的組合爆炸問題,開發了全新的打分評價系統,顯著提高了化合物可合成性評價打分函數的準確度[153]。
此外,他們發展了一種基於遺傳算法和共軛梯度算法的支持向量機算法,並以此為基礎開發了新型化合物藥代動力學性質與毒性預測方法[154,155]和軟體GA-CG-SVM(軟體著作權號: 2008SR17149)。
該方法解決了當前在基於支持向量機預測建模中常常遇到的棘手問題,即描述符的選擇和參數優化問題,顯著地提高了藥代動力學性質與毒性預測的準確度。
他們還開發了一種新型的集成先導化合物優化方法的軟體LeadOpt(軟體著作權號: 2013SR019385)和一種基於蛋白-小分子相互作用指紋圖譜的靶標預測方法的軟體IFPTarget(軟體著作權號: 2017SR046428)等[156]。
他們利用上述自主開發的藥物設計新方法,針對FLT3,PLK1,EGFR,AuroraA/B,PIM1,KDR,ALK,C5aR等30餘種與腫瘤和自身免疫性疾病相關靶標,開展了靶向藥物的設計、合成與構-效關係研究,已向企業轉讓6個一類新藥項目。
其中,針對急性髓性白血病靶標FLT3研發的抑制劑已進入臨床Ⅱ期;針對EGFR突變體研發的抑制劑已獲臨床試驗批件。
李洪林課題組開發了基於分子三維相似性、基於藥物-靶標二分網絡和隨機遊走算法的多向藥理學平臺,並將這些方法應用於藥物先導化合物的設計與優化,取得了一系列重要的進展。
該課題組開發了基於分子形狀及藥效團特徵比較的相似性計算方法SHAFTS[157,158],該方法在考慮分子形狀相似性的同時,也考慮了藥效團特徵相似性。
藥物設計領域著名專業軟體公司Accelrys已將SHAFTS模塊整合到其分子模擬商業軟體包Discovery Studio中。
該團隊進一步開發了基於隨機遊走網絡推理的藥物靶標預測方法ChemMapper (http://lilab.ecust.edu.cn/chemmapper/)[31],可用於識別並預測小分子可能的靶標和結合位點。
該課題組基於C/S模式和高效的基於TCP/IP協議的通信中間件進一步開發了國內首個基於分子三維相似性的藥物設計圖形用戶界面系統 eSHAFTS( 軟體版權 :2015SR078266)[159]。
同現有商業軟體相比,eSHAFTS具有界面友好、易於操作、計算精確度高等優點,便於專業及化學、生物學等非藥物設計專業科研人員使用。
上述方法、平臺和軟體現有國內外使用用戶1000多人,已免費為用戶完成2.5萬次科學計算。
經過EGFR靶向藥物治療後,50%以上的非小細胞肺癌患者在治療6~12月內會出現獲得性耐藥的問題,針對這一問題,李洪林課題組採用藥物設計方法發現一個對EGFRL858R/T790具有較好抑制活性的喋啶酮類先導化合物,進而通過ChemMapper進行骨架躍遷和模塊官能團嫁接,3個月內即完成了候選藥物的設計、合成及生物學驗證實驗,獲得了具有安全性好、選擇性突出、口服生物利用度高、藥效顯著等優點的ZW-W-33,為T790M突變耐藥的NSCLC臨床治療提供了結構新穎的候選藥物[160~162]。
該課題組採用其前期發展的基於反向對接的計算化學生物學方法,發現了具有DPP-4中等強度的抑制活性(IC50=14.13 μmol/L)天然產物——異瑞香新素。
以該天然產物為起點,該課題通過採用SHAFTS開展骨架躍遷、藥效團嫁接等合理藥物設計,獲得了一類骨架新穎的2-苯基-3,4-二氫-2H-苯並[f]色滿-3-胺類DPP-4抑制劑,並將其抑制活性提高近10000倍,代表性化合物IC50值約為2.0 nmol/L,具有良好的成藥性、較長的體內半衰期、較高的口服生物利用度(F=89%)。
體內藥效學實驗表明,在ob/ob小鼠體內代表性化合物(3 mg/kg)能持續抑制>80%的DPP-4活性超過24小時。
進一步的口服葡萄糖耐受實驗表明,該化合物改善葡萄糖耐受性的能力優於長效降糖藥物奧格列汀(Omarigliptin)。
該項研究為開發具有良好成藥前景的靶向DPP-4的長效口服的抗糖尿病候選藥物提供了新化學實體[163]。近年來,計算機硬體的發展、醫藥大數據的積累和人工智慧技術的興起,也都在不斷地為藥物設計領域注入新的力量。
藥物性肝損傷(drug-induced liver injury,DILI)是一個重要的公共健康問題,也是新藥研發過程中導致失敗的原因之一。
針對此問題,在2015年,來魯華課題組將深度學習技術應用於化學信息學與藥物信息學領域,利用深度學習算法的強大的學習能力發展了適用於藥物和活性化合物肝損傷預測模型,該模型在預測198個外部測試藥物時達到了86.9%的準確率,優於當時其他的計算預測模型。
此外,他們還應用全連接神經網絡,通過深度自編碼器初始化網絡參數,開發了一種預測候選化合物類藥性的計算方法[164]。
2019年4月,中國科學院深圳先進技術研究院袁曙光課題組[165]通過計算機模擬構建出嗅覺受體蛋白Olf73的三維結構模型,並利用人工智慧和計算機虛擬篩選方法從158萬個化合物中篩選出25個新型分子,其中17個經生化實驗確證有活性。
最近,蔣華良課題組基於現有的激酶活性大數據,應用多任務深度神經網絡算法,開發了一種預測藥物激酶譜的方法[166],並根據該方法建立了藥物激酶譜在線預測及可視化工具[20]。
此外,蔣華良課題組還開發了一種基於注意力機制的圖神經網絡模型Attentive FP。
該模型可以用於分子表徵,在多個藥物發現相關的數據集上的預測表現達到當前最優,並且該模型對於所學到的內容具有可解釋性[167]。
2019年8月,清華大學生命學院龔海鵬等人發文介紹了他們應用神經網絡進行蛋白質結構預測方面的工作。
他們基於長短期記憶網絡LSTM和聚合殘差轉換網絡ResNeXt,開發了蛋白質結構預測算法DeepFragLib。
與現有方法相比,DeepFragLib模型在預測蛋白質的片段構象和無模板結構域構象方面有明顯改進[168]。
可以發現,以深度神經網絡為主的人工智慧技術已被應用於藥物靶點發現和結構預測、活性化合物篩選和活性優化、成藥性評價以及老藥新用等多個環節,推動藥物設計向精準化和智能化發展。