騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...

2020-11-29 中國科技新聞網

11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。

通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。

此次,騰訊 AI Lab 採用「從頭摺疊」的蛋白質結構預測方法幫助解析了SRD5A2晶體結構,並通過自研AI工具「 tFold」有效提升了蛋白質結構預測精度,在科研突破中發揮了核心作用。除了在SRD5A2結構中的應用,這套方法還可以拓展應用於蛋白質分子和病理學機制的相關研究中。

該項聯合研究成果於近日登上了國際頂級期刊 Nature 子刊《 Nature Communications》。論文題為《人體類固醇II型5a還原酶與抗雄激素藥物非那雄胺的結構研究》,由南科大生物系魏志毅副教授課題組與匹茲堡大學張誠教授、新加坡 A*STAR 研究所範昊研究員、騰訊 AI Lab 黃俊洲博士帶領的研究小組合作完成。本次得到權威學術期刊發表及評審的高度評價,也驗證了該成果對藥物研發的創新價值。

論文連結:https://www.nature.com/articles/s41467-020-19249-z

據了解,tFold工具還在CAMEO(全球唯一的蛋白質結構預測自動評估平臺)的國際測評中連續半年保持周度冠軍。目前,tFold公測版本已通過騰訊「雲深智藥(iDrug)」平臺官網對外開放。

官網連結:https://drug.ai.tencent.com/console/cn/tfold

「從頭摺疊」新方法破解晶體學難題

在人體內,性激素有促進性器官成熟、副性徵發育及維持性功能等作用。

二氫睪酮是人體中已知最強的雄激素,對於人體的發育和生理活動至關重要,但同時也需要保持合理的平衡。一方面,二氫睪酮控制著男性性器官的發育,水平過低將導致男性性徵缺陷。另一方面,水平過高又是導致前列腺增生和脫髮的罪魁禍首。

合成性激素依賴類固醇還原酶,二氫睪酮即由 SRD5A2 催化合成。因此,當患者因為二氫睪酮水平過高而出現前列腺增生和脫髮問題時,可以通過抑制 SRD5A2 來降低患者二氫睪酮水平。作為SRD5A2 的高效抑制劑,非那雄胺(finasteride)被廣泛用於治療這類疾病。

儘管 SRD5A2 具有重要生理作用,其高解析度結構信息卻十分缺乏,導致 SRD5A2 催化二氫睪酮合成的機理以及非那雄胺抑制 SRD5A2 酶活的機制並不清晰。

這是由於 SRD5A2 具有獨特的七次跨膜結構,其與人類全部已知結構的蛋白在結構上存在較大差異,難以通過「模板建模」(template-based modeling)方法獲得初始構型來解析晶體數據。同時又因為 SRD5A2 是一類多次跨膜蛋白,使得傳統的用於獲取蛋白質晶體相位信息的「重原子替代」(Heavy-atom derivatization)方法亦難以奏效。

為了解決這一難題,騰訊 AI Lab 科研團隊採用了難度更高的「從頭摺疊」(de novo folding)方法來預測 SRD5A2 蛋白的三維結構,並將其用於「分子置換」(molecular replacement, MR)的初始構型來解析晶體數據。

所謂「從頭摺疊」,是相對於「模板建模」的一種蛋白質結構預測方法。「模板建模」是目前最普遍的蛋白結構預測手段,但有一個使用前提——人類已知的蛋白結構資料庫(即PDB)當中,必須存在和預測的蛋白相似的結構,否則就無法使用。而騰訊AI Lab採用的「從頭摺疊」方法則跳出了這個限制,可以不依賴於模板來預測蛋白結構。

但此前,通過「從頭摺疊」方法預測的蛋白質結構精度不高,難以滿足晶體數據解析的精度需要。而在騰訊 tFold 工具加持下得到的高精度「從頭摺疊」的結構模型,為分子置換方法提供相位,繼而解析確定2.8Å 原子級別精度的SRD5A2晶體結構。

這一結果能直接推進我們對體內 SRD5A2 活性失調引發的各類疾病的理解,進而為基於 SRD5A2 結構的藥物開發提供更多有價值的參考信息。

《Nature Communications》的一位評審對此創新方法給予了高度評價:「作者能用預測的分子置換(MR)模型來確定晶體結構,這一點非常有趣。本評審認為該技術確實非常出色,整個X射線晶體學界將從該方法中受益匪淺。」

《Nature Communications》期刊評審評論原文節選

 自研冠軍級 tFold 工具突破蛋白質結構預測精度

騰訊 AI Lab 自研的 tFold 工具正是破解 SRD5A2 蛋白結構這一重要難題的關鍵。為了提升「從頭摺疊」方法(又稱「自由建模」)的精度,tFold 工具通過三項技術創新,實現了蛋白結構預測精度的大幅提升。

首先,實驗室研發了「多數據來源融合」(multi-source fusion)技術,來挖掘多組多序列聯配(multiplesequence alignment, MSA)中的共進化信息。

然後,藉助 「深度交叉注意力殘差網絡」 (deep cross-attention residual network,DCARN),能極大提高一些重要的蛋白2D結構信息(如:殘基對距離矩陣)的預測精度。

最後,通過一種新穎的「模板輔助自由建模「(Template-based Free Modeling, TBFM)方法,將自由建模(Free Modeling, FM)和模板建模(Template-based Modeling, TBM)生成的3D模型中的結構信息加以有效融合,從而大大提高了最終3D建模的準確性。

在研究方面,tFold 平臺已在國際公認最權威的測試平臺CAMEO上證明其創新價值及有效性。騰訊 AI Lab 於2020年初在CAMEO平臺註冊了自動化蛋白結構預測伺服器 tFold server,並自2020年6月起至今一直保持周度(圖1)、月度、季度、半年度冠軍。tFold server在一般案例上領先業內權威方法6%以上,在困難案例上則領先12%以上。

在應用方面,tFold server的公測版也已經在騰訊「雲深智藥」平臺發布。用戶可以手動輸入待預測的胺基酸序列或從本地上傳FASTA 格式的序列文件。在經過一定時間的計算之後,用戶即可得到使用「從頭摺疊」方法預測得到高精確度蛋白結構(下圖)。

tFold server的3D Modeling輸出頁面。左邊部分為從頭摺疊得到的3D蛋白模型;右邊部分是該3D模型在給定的預測殘基對距離矩陣下的偏差。

騰訊「雲深智藥」用AI持續助力藥物發現

依託大數據挖掘與機器學習等先進技術優勢,騰訊正致力於推動AI與醫療產業的深度結合,助力社會整體醫療水平提升。

據了解,「雲深智藥」是騰訊發布的首個AI驅動的藥物發現平臺,整合了騰訊 AI Lab和騰訊雲在前沿算法、優化資料庫以及計算資源上的優勢,致力於幫助用戶大幅度減少尋找潛在活性化合物的時間和成本。

騰訊「雲深智藥」平臺主要功能

「雲深智藥」的五大模塊覆蓋臨床前新藥發現全流程,目前各功能模塊正持續完善與升級。除蛋白質結構預測外,平臺還上線了分子生成模塊。AI驅動的分子生成模型是輔助小分子藥物設計的重要工具之一,不僅能加速藥物發現流程,還能啟發藥化專家跳出現有的分子庫,探索更大的化合物空間。該模塊還整合了ADMET屬性預測功能,可對生成的新分子實時進行屬性篩選。

此外,平臺的逆合成算法也已取得了一定進展,計劃於明年上線。其它小分子和大分子藥物發現功能模塊也將逐步上線。

除藥物研發以外,騰訊 AI Lab 也在影像篩查、病理診斷等多個醫療領域持續探索,不斷拓展和深化研究與應用。

在AI助力醫療技術方面,實驗室聯合多家合作單位研發了中國首款智能顯微鏡,幫助醫生提高工作效率。2020年10月,在免疫組化樣本(IHC)分析的基礎上,智能顯微鏡新增了針對宮頸液基細胞(TCT)標本進行臨床樣本的顯微圖像進行觀察、篩選、標記功能,並已獲得國家藥監局審批證書。

在病理研究領域,騰訊 AI Lab 也研發出了世界領先的前沿算法,比如斬獲MICCAI 2020 CPM-RadPath 挑戰賽第一名的算法,能夠準確區分神經膠質瘤(大腦最常見腫瘤)的不同亞型並進行分級,有望彌補人工診斷效率低、主觀因素影響較大等問題。

此外,騰訊 AI Lab 在今年早些時候與南方醫院合作發表了名為《基於病理圖片的結直腸癌微衛星不穩定性預測模型的開發和解釋》的文章,利用算法模型可輔助病理醫生篩查結直腸癌中微衛星不穩定亞型,降低微衛星不穩定篩查的條件要求,幫助更多的地方醫院也有能力執行這樣的篩查。

相關焦點

  • 獨創方法提升蛋白質結構預測精度 騰訊AI Lab聯合研究登上Nature子刊
    本文轉自【中國科技網】;11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 騰訊AI Lab聯合研究登上Nature子刊,首次破解它的結構
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 騰訊AI Lab聯合研究登上Nature子刊,首次...
    雷鋒網(公眾號:雷鋒網)消息,11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • Nature子刊重磅:騰訊 AI Lab 聯合研究成果 揭示男性脫髮的潛在...
    11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • Nature子刊重磅:騰訊 AI Lab 聯合研究成果,揭示男性脫髮的潛在病理學機制
    11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • Nature 子刊重磅:騰訊與鍾南山團隊發布新冠危重症 AI 預測模型 Cox
    相比傳統衡量肺炎嚴重程度的CURB-6模型和未進行深度學習的經典Cox模型,此次聯合研究團隊提出的Cox模型在驗證集上的 C-index (即一致性指數(index of concordance)從0.876(線性模型)提升到了 0.894,AUC從 0.889 提升到了 0.911。
  • 騰訊AI Lab 2020 年度回顧
    2020 年 7 月,鍾南山院士團隊與騰訊 AI Lab 聯合發布了一項利用AI預測COVID-19患者病情發展至危重概率的研究成果,可分別預測5天、10天和30天內病情危重的概率,有助於合理地為病人進行早期分診。 該研究發表於國際頂級期刊 Nature 子刊 Nature Communications。
  • 騰訊發布AI醫學進展:首次破解「禿頭元兇」SRD5A2的蛋白質結構
    DoNews 11月17日消息(記者 程夢玲)騰訊通過其官方技術傳播帳號「鵝廠技術派」發文稱,騰訊11月17日發布了一項重要AI醫學進展——禿頭元兇「SRD5A2」的蛋白質結構被首次破解。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    排名前六位的分別是David Barke lab的兩個工具(第二、第三位)、密西根州立大學的 Michael Feig和密西根大學Yang Zhang排名在第四位、第五位,而騰訊AI lab 的tFold_human 排名第六。 這說明,在某種程度上,在對蛋白質結構和摺疊的預測這件事情上,人類已非望塵莫及。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    從CASP14,這項權威的蛋白質結構預測競賽結果中,可以看到AlphaFold2排名第一(總分遠高於第二),排名前六位的分別是David Barke lab的兩個工具(第二、第三位)、密西根州立大學的 Michael Feig和密西根大學Yang Zhang排名在第四位、第五位,而騰訊AI lab 的tFold_human 排名第六。
  • Nature子刊:騰訊程式設計師立功了,讓頭禿元兇首次暴露真面目
    「從頭摺疊」想要破解SRD5A2的真面目,主要的技術難點在於,它具有獨特的7次跨膜結構,與人類全部已知結構的蛋白質差異較大,難以通過常用的「模板建模」方法獲得初始構型於是,研究人員基於騰訊 AI Lab開發的tFold工具,採用了「從頭摺疊(de novo folding)」的方法。該方法可以不依賴於模板來預測蛋白質結構。
  • 意念加AI算法「復原」每個手指,智能義肢登上Nature子刊封面
    最近,瑞士洛桑聯邦理工學院(EPFL)展示的新技術卻讓科幻變成了現實,他們的研究還登上了最新一期自然雜誌子刊《Nature Machine Intelligence》的封面。近日,瑞士洛桑聯邦理工學院的研究人員開發出了一種全新的機械臂控制方法,它利用人工智慧為被截肢者提供前所未有的準確操縱能力。
  • 在線預測蛋白質三級結構,讓文章提升逼格的策略!(附攻略)
    而要更好地從空間結構的觀點來理解蛋白質相應的生物機制,就需要解析蛋白的具體分子結構,因此,採用計算機模擬( in silico) 的方法進行蛋白的結構預測就顯得十分必要。基於序列決定結構的基本思想,通過對預模擬的蛋白序列與PDB資料庫中的序列進行相似性搜索,根據相似序列的結構來測序。一般而言,同源建模的預測結果是比較可靠的,也是目前比較主流的預測方法。2) 從頭預測(ab initio)對於沒有同源模板或者同源性過低的序列,則無法採用同源模建的方法進行蛋白質結構預測。
  • 最前線丨脫髮治療新發現,騰訊AI立功
    11月17日,騰訊公布了一項AI醫學的新進展,「令人頭禿」的罪魁禍首——「SRD5A2」的蛋白質結構首次被破解,這意味著,可以更有效治療脫髮等問題的防脫藥物離我們又近了一步。儘管 SRD5A2 具有重要生理作用,但是因為與人類全部已知結構的蛋白在結構上存在較大差異,其高解析度結構信息卻十分缺乏,導致 SRD5A2 催化二氫睪酮合成的機理以及非那雄胺抑制 SRD5A2 酶活的機制並不清晰。
  • 國科大博士生導師郎明林課題組在Nature子刊發表蛋白質糖基化與...
    蛋白質糖基化是目前在高等真核生物中發現的最普遍最重要的蛋白質翻譯後修飾方式之一。該類修飾涉及聚糖與蛋白質分子的連接,是蛋白質分子正確摺疊、維持穩定、參與互作和細胞黏附等活動所必需的,異常的糖基化修飾會導致多種人類重大疾病發生,例如白血病(leukemia)、胰腺功能障礙(pancreatic dysfunction)、阿爾茨海默病 (Alzheimer’s disease, AD)等。由於糖基化的複雜性,研究難度大,相關領域研究起步較晚,研究結果還不盡完善。
  • 騰訊AI Lab聯合清華港中文,解讀圖深度學習歷史、進展應用
    該聯合課程的主題為「圖深度學習:基礎、進展和應用(Deep Graph Learning: Foundations, Advances and Applications)」,由騰訊 AI Lab、清華大學、香港中文大學等機構聯合組織,從基礎的圖概念一直談到了當今最前沿的圖神經網絡研究進展。本次課程分為兩個主題。
  • Nature子刊:太陽能電池效率或大幅提升!
    近期,美國哥倫比亞大學的科研人員開發出一種利用單線態裂變來提高太陽能電池效率的新方法論文連結:https://www.nature.com/articles/s41557-019-0297-7現代太陽能電池板採用工作原理基本一樣:一個光子產生一個激子,激子轉化為電流。
  • Nature又上線2本新子刊!
    你的機會來了——2019年2月,Nature先後推出了兩本新子刊,分別是 Nature Food 和Nature Cancer。Nature雜誌的子刊達到了53本,其中20本為綜述期刊。期刊官網:https://www.nature.com/natfood/目標和範圍到2050年,世界面臨著維持地球健康和100億人口的前所未有的挑戰。食品生產,加工,分銷和消費領域的許多科學學科的研究已經建立並且不斷發展 - 食品界現在需要高質量的食品 聯合思考全球糧食挑戰及其解決方案的主題資源。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    2018年的11月2日,在第13屆全球蛋白質結構預測競賽(CASP)上,AlphaFold獲得了預測43種蛋白中的25種蛋白結構的最高分,在98名參賽者中排名第一。對於DeepMind的預測方法,由於當時沒有具體論文發布,眾多學者認為是計算能力突出使得AlphaFold獲得冠軍。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    正因為蛋白質的結構如此重要,在過去的五十年中,科學家已經能使用低溫電子顯微鏡和核磁共振等實驗技術確定蛋白質的形狀,但是每一種方法都依賴大量的試驗與誤差反饋,每種結構可能需要花費數萬美元、歷時數年進行研究。因此生物學家轉攻 AI 方法,以完成這一困難且單調的過程。