Nature:計算機預測技術對數十億種藥物-蛋白質相互作用進行排序

2020-11-30 生物谷

Drugable.com通過計算機分析,預測藥物作用機制。

幾十年以來,藥物的研發過程通常就像試驗與錯誤之間的一場較量,數以百萬計的候選藥物中最終只有極少數能夠被成功研發出來。近日,研究者們利用計算機技術,為藥物的研發開啟了一個良好的開端。通過分析藥物的化學結構,研究者們就可以了解它是否可能與某個生物學靶標(例如蛋白質)結合或「對接」。這樣的算法尤為有用,有利於發現那些由於藥物與結構相似的非靶標性蛋白質意外結合所引發的潛在毒副作用。

近日,研究者們提出了一個計算機模擬工作計劃,擬以公共資料庫中存儲的藥物信息和蛋白質信息為基礎,對數十億種可能的藥物與蛋白質之間的對接進行評價。紐約大學(New York University)朗格醫學中心(Langone Medical Center)的藥理學家Timothy Cardozo曾經於11月19日參加了美國國立衛生研究院(National Institutes of Health)在馬裡蘭州貝塞斯達舉辦的「高風險-高回報」研討會(High Risk–High Reward Symposium),並在會上展現了這種計算機模擬技術;他指出,這是人類有史以來所做的最大的藥物對接計算機模擬工作。這項工作最終創建了一個名為Drugable(drugable.com)的網站,該網站獲得了美國國家醫學圖書館(National Library of Medicine, NLM)的支持;雖然Drugable仍然處在測試階段,但它最終會向公眾開放,從而使研究者們僅僅根據化合物的化學結構,就能夠預測它們如何在體內發揮作用以及在何處發揮作用(請參閱「藥物信息挖掘」)。


藥物信息挖掘

研究者們利用谷歌的超級計算機檢測數十億種藥物-蛋白質相互作用。

Cardozo承認道,計算機模擬僅僅是新藥研發過程中的一個初始步驟。在預測了某種蛋白質是否能與化合物結合之後,藥物研發者們必須在細胞中檢測藥物對這種蛋白質的作用,從而觀察藥物對蛋白質功能的實際影響,以及藥物在不同情況下所需要的劑量等。隨後再進行動物實驗;如果幸運的話,研究者們接下來還可以進行人體試驗。但是加利福尼亞大學(University of California)舊金山分校的計算生物學家Brian Shoichet指出,醫藥公司往往持有這些額外數據的專利。他指出,儘管一些公共資料庫(例如由NLM進行維護的PubChem)持有藥物與酵母細胞蛋白質相互作用的自動化檢測結果,但是其中卻包含有一些不準確的結果和假陽性結果。

儘管如此,科學家們還是已經證實計算機模擬方法能夠為藥物研發提供一些捷徑。2012年,Shoichet與馬塞諸塞州劍橋市諾華生物醫學研究所(Novartis Institutes for BioMedical Research)的研究人員合作,聯合開發了一種能夠根據藥物之間化學結構的相似性來預測藥物副作用的算法。當研究者們對656種已獲得批准的藥物和73個生物靶標之間的相互作用進行測試時,他們發現該算法能夠預測出數百種前所未知的相互作用,並且大約一半的預測結果都證實這些副作用是真的(E. Lounkine et al. Nature 486. 361-367;2012)。而Shoichet也指出,對於已知的藥物,這類計算提供了一種快捷的方法來確認藥物-蛋白質相互作用,以便進行深入研究。

Drugable嘗試預測那些未經試驗的化合物是如何與體內蛋白質相互作用的,而這種預測工作更具挑戰性。在建立Drugable網站時,Cardozo研究團隊從PubChem資料庫和歐洲生物信息研究所(European Bioinformatics Institute)的ChEMBL資料庫(該資料庫收納了數百萬種公開型化合物的資料)中選擇了大約60萬個化合物分子,評價了這些分子與資料庫中人類蛋白質的7000個結構「口袋」的結合能力強弱。計算領域的巨頭谷歌(Google)向研究者們提供了相當於一億個小時的超級計算機處理器時間,協助他們完成這項龐大的工作。

該研究團隊提出了利用對接分數對40億多個潛在的藥物-蛋白質相互作用的強弱程度進行排序。隨後,該研究團隊將自己預測的靶蛋白與NLM基因表達綜合資料庫(Gene Expression Omnibus)中的靶蛋白進行了相互參照,從而表明不同蛋白質編碼基因在體內的表達部位。Cardozo指出,這使得研究者們可以預測藥物發揮作用的可能部位:如果Drugable發現某種藥物與某個部位中高表達的蛋白質之間存在著相互作用,那麼這種藥物就很有可能會對這種組織發揮作用。

諾華研究所的研究員Jeremy Jenkins指出,多年以來醫藥公司一直都在開展類似的計算機預測工作。但是他也指出:諾華研究所雖然擁有一個包含150萬種公共型化合物和專利型化合物的文庫,但卻從來沒有像Drugable那樣,一次性分析過那麼多種蛋白質和藥物。

Cardozo希望Drugable能夠在抗精神病藥物的評價方面提供特殊的幫助,因為此類藥物通常都以難以衡量的方式發揮作用。作為示範,Cardozo研究團隊採用Drugable算法對兩種常常被用來治療精神分裂症的藥物——氯氮平(clozapine)和氯丙嗪(chlorpromazine)進行了靶標相互作用的預測。

正如所預期的那樣,Drugable預測結果表明兩種藥物與神經遞質羥色胺(serotonin)和多巴胺(dopamine)的受體的結合能力最強,而這兩種神經遞質受體通常表達於進行高級信息處理的大腦區域中。但是Drugable發現,也可用於治療情緒障礙性疾病(如抑鬱症)的氯氮平能夠強烈地結合於一種名為DRD4的多巴胺受體,而這種特殊的受體主要表達於大腦的情緒調節區域——松果體(pineal gland)中。

該研究團隊也發現,氯氮平能夠與大腦中調節唾液分泌區域內的受體結合;而唾液分泌過多恰恰是氯氮平的一種已知的副作用。雖然在之前就有研究者從生物化學的角度對氯氮平的情緒調節和唾液分泌作用進行了解釋,但是Cardozo認為Drugable就能夠用於揭示最合理的藥物作用機制。(生物谷Bioon.com)

生物谷推薦的英文原文



Nature   doi:10.1038/503449a

Project ranks billions of drug interactions

Sara Reardon

For decades, drug development was mostly a game of trial and error, with brute-force candidate screens throwing up millions more duds than winners. Researchers are now using computers to get a head start. By analysing the chemical structure of a drug, they can see if it is likely to bind to, or 『dock』 with, a biological target such as a protein. Such algorithms are particularly useful for finding potentially toxic side effects that may come from unintended dockings to structurally similar, but untargeted, proteins.


Dyslexia linked to brain communication breakdown NASA funding shuffle alarms planetary scientists Thin, weak layer of clay was behind Japan earthquake and tsunami
Last week, researchers presented a computational effort that assesses billions of potential dockings on the basis of drug and protein information held in public databases. 「It’s the largest computational docking ever done by mankind,」 says Timothy Cardozo, a pharmacologist at New York University’s Langone Medical Center, who presented the project on 19 November at the US National Institutes of Health’s High Risk–High Reward Symposium in Bethesda, Maryland. The result, a website called Drugable (drugable.com) that is backed by the US National Library of Medicine (NLM), is still in testing, but it will eventually be available for free, allowing researchers to predict how and where a compound might work in the body, purely on the basis of chemical structure (see 『Mining for drugs』).

Cardozo acknowledges that the computations are just an initial step in drug discovery. After predicting whether a protein can bind to a compound, drug developers must test the drug’s action on the same protein in a cell to see what actually happens to the protein’s function, as well as how much of the drug is needed and under what conditions. Then come animal trials and, if researchers are lucky, human trials. But these extra data are often proprietary and held by pharmaceutical companies, says Brian Shoichet, a computational biologist at the University of California, San Francisco. Some public databases such as PubChem, maintained by the NLM, hold the results of automated tests of drugs on proteins in yeast cells, but they contain inaccuracies and false positives, he says.


Expand
Still, scientists have already shown that the computational approach can provide some short cuts. In 2012, Shoichet and researchers at the Novartis Institutes for BioMedical Research in Cambridge, Massachusetts, developed an algorithm that predicts side effects on the basis of similarities between drugs』 chemical structures. When the researchers tested the program on 656 approved drugs and 73 biological targets, they found that it predicted hundreds of previously unknown interactions — and that these side effects turned out to be real about half of the time (E. Lounkine et al. Nature 486, 361–367; 2012). For known drugs, Shoichet says, this type of computation provides a quick way to identify interactions that should be investigated further.

Predicting how untested compounds will interact with proteins in the body, as Drugable attempts to do, is more challenging. In setting up the website, Cardozo’s group selected about 600,000 molecules from PubChem and the European Bioinformatics Institute’s ChEMBL, which together catalogue millions of publicly available compounds. The group evaluated how strongly these molecules would bind to 7,000 structural 『pockets』 on human proteins also described in the databases. Computing giant Google awarded the researchers the equivalent of more than 100 million hours of processor time on its supercomputers for the mammoth effort.

Related stories
Translational research: Medicine man
Drug discovery: Computer model predicts side effects
Schizophrenia: The drug deadlock
More related stories
The team came up with ranked docking scores describing some 4 billion potential drug–protein interactions. Then the group cross-referenced the target proteins with those in the NLM’s Gene Expression Omnibus database, which shows where in the body different genes that code for proteins are expressed. This allowed them to predict where the drug might act, says Cardozo: if Drugable finds an interaction for a protein that is highly expressed in a certain tissue, chances are good that the effect would manifest itself in that tissue.

Pharmaceutical companies have been doing similar computational predictions for years, says Jeremy Jenkins, a researcher at the Novartis Institutes. But he says that Novartis, which has a library of 1.5 million public and proprietary compounds, has never attempted to analyse as many proteins and drugs at once as Drugable has done.

Cardozo hopes that Drugable will be particularly helpful in evaluating psychiatric drugs, which often act in ways that are difficult to measure. As a demonstration, Cardozo’s group applied Drugable’s algorithm to clozapine and chlorpromazine, two drugs often prescribed to treat schizophrenia.

As expected, Drugable showed that the two drugs bind most strongly to receptors for the neurotransmitters serotonin and dopamine, which are expressed in the parts of the brain involved in higher information processing. But it found that clozapine, which also stabilizes mood disorders such as depression, binds strongly to a particular dopamine receptor called DRD4, which is expressed in the brain’s pineal gland — a known mood regulator.

The group also found that clozapine binds to a receptor in the part of the brain that regulates saliva production; excessive salivation is a known side effect of clozapine. Although the biochemical explanations for mood regulation and salivation have been proposed before, Cardozo says that Drugable can be used to reveal the most plausible mechanisms.

相關焦點

  • JCIM:計算提升蛋白質-蛋白質相互作用的預測精度
    蛋白質-蛋白質相互作用和識別在生物學過程中有著非常重要的作用。儘管結構生物學已經取得了較大的進展,但直接採用實驗方法確定蛋白質-蛋白質複合物結構仍然非常困難。分子對接技術是預測蛋白質-蛋白質複合物結構的有效方法。
  • 蛋白質結構預測:生命科學的又一場競爭
    據歐陽鍾燦介紹,由生物大分子的基因序列預測其結構,是當前生物學研究面臨的最重要挑戰之一,如果能夠實現,將在生物技術與藥物設計領域產生巨大影響。     2006年11月26~30日,第七屆CASP總結大會在美國加州阿薩爾默會議中心舉行,在大會公布的測評排列名單上,美國堪薩斯大學的助理教授張陽位居第一。
  • 科學網—提出預測蛋白質相互作用的方法
    本報訊(記者彭科峰)日前,中科院新疆理化所王延斌在尤著宏研究員指導下,提出一種使用蛋白質序列信息預測蛋白質相互作用的計算方法
  • 藥物發現 | 基於分子晶體形狀與分子間相互作用的藥物發現方法
    然而,這些配體在小分子晶體環境中的分子間相互作用與在蛋白質口袋中的分子間相互作用的相似程度仍未得到充分探索。早有報導表明,利用晶體中的這些相互作用來篩選配體、模擬靶蛋白結合具有一定的可行性。若能有效利用已知的百萬級小分子和蛋白質晶體中的大量化學信息,理論上可以提高藥物開發流程早期階段的成功率。CSD包含超過一百萬個小分子的晶體結構條目。
  • 分子計算機的運算過程是蛋白質分子與物理化學介質的相互作用過程
    分子計算機  分子計算機體積小、耗電少、運算快、存儲量大。分子計算機的運行是吸收分子晶體上以電荷形式存在的信息,並以更有效的方式進行組織排列。分子計算機的運算過程就是蛋白質分子與周圍物理化學介質的相互作用過程。
  • ...Journal of Molecular Sciences:提出預測蛋白質相互作用的計算...
    蛋白質相互作用研究能夠從分子水平上揭示蛋白質的功能,幫助揭示生長發育、新陳代謝、分化和凋亡等細胞活動的規律在全基因組範圍內識別蛋白質相互作用對是解釋細胞調控機制的重要一步。隨著蛋白質相互作用實驗技術的發展,人們能夠獲得大量的蛋白質相互作用數據,甚至能夠在全基因組範圍內對蛋白質相互作用進行分析。然而,由於實驗技術的限制,很多高通量實驗方法測得的蛋白質相互作用數據的錯誤率都比較高。此外,傳統實驗的方法不適用於檢測大規模數據。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    2018年的11月2日,在第13屆全球蛋白質結構預測競賽(CASP)上,AlphaFold獲得了預測43種蛋白中的25種蛋白結構的最高分,在98名參賽者中排名第一。對於DeepMind的預測方法,由於當時沒有具體論文發布,眾多學者認為是計算能力突出使得AlphaFold獲得冠軍。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    最先進的算法通過在超級計算機上運行來計算蛋白質結構 - 或者在Rosetta @ Home和Folding @ Home等項目中利用眾包計算能力來模擬胺基酸相互作用的複雜物理通過蠻力。為了減少大量的計算需求,這些項目依賴於將新序列映射到預定義的模板上,這些模板是先前通過實驗確定的蛋白質結構。
  • 中科院新疆理化所提出預測蛋白質相互作用的方法—新聞—科學網
    本報訊(記者彭科峰)日前,中科院新疆理化所王延斌在尤著宏研究員指導下,提出一種使用蛋白質序列信息預測蛋白質相互作用的計算方法
  • Nat Methods:計算神經網絡驅動下一代「蛋白質預測技術」的誕生
    2019年10月23日 訊 /生物谷BIOON/ --一直以來,合成生物學家一直試圖通過改變自然界中存在的蛋白質,甚至是從頭合成蛋白質,將其進化的途徑掌握在自己手中。通過人工構建不同類型的蛋白,可以設計藥物,感測生物信號,以及生產高價值化學品,等等。為了設計蛋白質,科學家們使用了兩種截然不同的方法。
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    在超級計算機上計算蛋白質結構是目前最先進的算法,在Rosetta@Home和Folding@Home這樣的項目中,這些超級計算機或眾包計算能力可以模擬胺基酸通過強力相互作用的複雜物理過程。為了減少大量的計算需求,這些項目依賴於將新的序列映射到預先定義的模板上,並通過之前的實驗確定的蛋白質結構。
  • 「阿爾法狗」轉行預測蛋白質結構,交大教授建議布局AI+生物醫藥|新...
    上海交通大學生物醫學工程學院特聘教授殷衛海認為,這一成果的科學原理並不新鮮,但確實是一個重大技術突破,有望大幅加快藥物研發速度。上海可加強對「人工智慧+生物醫藥」這個交叉領域的布局,搶佔科技前沿制高點。 人工智慧讓蛋白質結構預測成為可能 蛋白質具有三維結構,由一系列胺基酸摺疊而成。
  • Nat Methods綜述|秦為等闡述鄰近標記技術對蛋白質相互作用的解析
    雖然親和純化和酵母雙雜交等傳統生化研究方法被廣泛應用於發掘潛在的蛋白質相互作用,但它們都具有各自的缺點和局限性。2021年1月11日,來自史丹福大學的化學生物學家Alice Ting教授在Nature Methods雜誌上發表了題為「Deciphering molecular interactions by proximity labeling」的綜述論文。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    除了實驗,隨著計算機的發展,該項技術在上世紀末便已用於預測蛋白質的結構,但效果並不理想。 計算機技術用於蛋白質結構預測的困境,直到AlphaFold在2018年現身於CASP,才讓科學家重新燃起了信心與希望。 AlphaFold的第一次迭代將深度學習應用於結構和遺傳數據,以預測蛋白質中胺基酸對之間的距離。
  • DeepMind精準預測蛋白質結構
    一、預測納米級蛋白質結構,AlphaFold比藥物模擬更強對於生命來說,蛋白質必不可少:它們運輸物質、作為酶進行化學反應,作為抗體抵禦病毒……所有這些功能都是通過結構決定的所以目前,很多公司和高校都在研究,如何通過電腦程式檢測組成蛋白質的各類胺基酸,再基於胺基酸反推蛋白質結構,DeepMind的AlphaFold就是其中之一,也是目前的第一。創立於1994年的CASP,致力於促進蛋白質預測領域的研究,關注該領域的進展,以及建立最新的技術標準。
  • 【AlphaFold精準預測蛋白結構】|蛋白質|胺基酸|生物學|複合物...
    繼圍棋、西洋棋等競技項目之後,近日谷歌旗下DeepMind開發的人工智慧程序AlphaFold在兩年一次的蛋白質結構預測挑戰賽CASP中再次大幅勝出。該程序在根據蛋白質胺基酸序列確定蛋白質三維結構方面取得巨大飛躍,準確性可與冷凍電子顯微術(亦稱冷凍電鏡)(Cryo-EM)和X-射線晶體學等實驗技術相媲美。
  • 科學家開發出新型定量蛋白質組學分析方法
    科學家開發出新型定量蛋白質組學分析方法 作者:小柯機器人 發布時間:2020/11/26 11:45:11 美國威斯康星大學麥迪遜分校Joshua J. Coon、Jesse G.
  • 大規模蛋白質組相互作用的文庫篩選
    大規模蛋白質組相互作用的文庫篩選 作者:小柯機器人 發布時間:2021/1/6 17:15:03 美國哈佛醫學院細胞生物學系Steven P. Gygi研究組取得最新進展。
  • DeepMind用AI精準預測蛋白質結構
    一、預測納米級蛋白質結構,AlphaFold比藥物模擬更強對於生命來說,蛋白質必不可少:它們運輸物質、作為酶進行化學反應,作為抗體抵禦病毒……所有這些功能都是通過結構決定的創立於1994年的CASP,致力於促進蛋白質預測領域的研究,關注該領域的進展,以及建立最新的技術標準。每兩年,CASP都會以實驗室最新研究出的蛋白質結構為目標,開展一次蛋白質結構預測比賽。各參賽團隊在不知道該目標蛋白質的情況下,以功能需求為導向,設計該蛋白質結構,CASP會將各團隊的預測結果與目標蛋白質的真實實驗數據相比對,進行評分。
  • 阿爾法狗團隊公布6種新冠病毒蛋白質結構預測,助力疫苗研發
    DeepMind團隊設計的第一種方法利用這些評估功能,AlphaFold能夠檢索所有的蛋白質圖景,從而找到與研究設想相匹配的結構。DeepMind團隊設計的第一種方法建立在結構生物學常用的技術上,對於蛋白質結構中的某一片段反覆用新的蛋白質片段替換。這樣訓練出來的神經網絡就可以發明新的蛋白質片段,從而不斷提高設想的蛋白質結構的得分。