我們如何用AI來研發新藥?

2020-12-06 新浪科技

來源:創事記

歡迎關注「創事記」微信訂閱號:sinachuangshiji

演講/賴力鵬 文/李瑩

來源:造就(ID:xingshu100)

一個殘酷的事實是,我們已研發出的藥物,與現存的疾病數目相比,可謂是九牛一毛,有許多疾病至今無藥可治,而新的疾病、病毒又層出不窮,比如我們眼下正在經歷的新型冠狀病毒肺炎。

我們如何才能提升新藥研發的效率?也許人工智慧可以?

傳統的新藥研發過程是怎樣的?它有兩個特點:第一,周期特別長;第二,體系非常複雜。

一個藥物的發現,首先需要在生物學上確定可能產生疾病的原因,然後到各種可能的分子當中去尋找,找到合適的藥物,最後在醫學上臨床測試。

傳統藥物的研發過程

前後平均下來,可能要花超過10年時間,總體的投入會超過10億美元,但成功率可能還不到10%。

1901年,我們人類第一次確診阿爾茲海默症,到2019年已經經過了100多年的時間,我們依然沒有能夠找到有效的治療方法。(阿爾茨海默症,一種神經退行性疾病,多發於老年,出現記憶障礙、失語、失去認知能力等是該疾病主要表現)我們等待了100年,還是沒有找到更好的藥。

《Nature》在2017年有篇文章叫The drug-maker’s guide to the galaxy,它給了我們一個新的希望:經過化學家的分析,在整個化學空間裡面,我們可以找到的藥物分子的個數,可能性是10的60次方。

整個化學空間中可以找到的藥物分子的個數,可能性是10的60次方

什麼概念呢,我們太陽系裡面所有的原子加到一起,數量大概是10的54次方,所以這不單單是54和60的區別,這是一個指數級的差別。

而我們在傳統實驗室裡,通過傳統的藥物篩選辦法能夠接觸到的分子數量,大概在10的11次方,11和60,這兩個數字中間,存在著一個巨大的差異。

就像我們要探索的可能是整個太陽系裡所有的原子,我們要把每個原子都拿起來,看一看這個原子到底能不能成為藥物,但我們現在實驗室裡能夠接觸到的原子,大概可能就是不到這個屋子這麼大的一個範圍裡的原子數量。

賴力鵬在造就演講

這篇文章中還提到,在人類的實驗室裡,我們沒有辦法真的把這些分子全部合成出來,那麼虛擬的手段,或者人工智慧手段,可能是我們下一個階段尋找新藥的努力方向。

《復仇者聯盟》裡面有個角色叫蟻人,蟻人可以把自己縮小到叫量子力學的尺度,在電影裡他可以在這個尺度看到一個非常奇幻的世界。

現在其實不需要到量子力學尺度,阿伏加德羅定律告訴我們,我們周圍大概20升的氣體裡面大約有10的23次方個分子,假設這些分子都各不相同,我們想做的就是在這麼大量的分子數目裡面,去找到那個和我們所遇到的疾病、我們所遇到的挑戰,能夠相匹配的藥物分子。

類似於我們去問在宇宙中10的25次方個恆星當中,存不存在另外一個人類可以居住的星系?在這麼大規模的潛在藥物分子裡面,我們能不能找到一個真的能夠治癒我們疾病的分子?

如果有,我們怎麼找到它?

我們把這個問題拆成兩個部分:

第一,如何構造一個虛擬的化學空間?現在很多的化合物,包括層出不窮的新藥,它本來在自然界中是不存在的,那麼我們需要想出怎樣把它構造出來的辦法。

第二,在這10的60次方的空間裡面,我們怎麼找到真的能夠成為藥物的分子?

當我們真的走近第一個問題去看的時候,我們就發現,首先在工程上這是一件很難的事情,我們假設每一個藥物分子,可以用一個比特來存儲,這已經是一個很理想的假設,因為一個分子,它可能並不是只有0和1兩個狀態,這裡只是一個簡化的假設。

目前像Facebook這麼龐大的社交網絡,它所有的數據加起來,大概在10的18次方的比特左右。假設我們地球上每一個人,都擁有Facebook這麼大的存儲能力,我們大概有100億人,也就是10的10次方,每個人有10的18次方的存儲能力,所以我們擁有接近10的28次方的存儲能力。

我們需要的空間是多大呢,10的60次方。所以這就意味著——我們要在宇宙當中對應每一個恆星有100億人,然後每一個人,都擁有像Facebook這樣的存儲能力,我們才能把這些數據存下來。

10的60次方意味著什麼

再假設,我們突然有了一個特別好的高科技,我們能把這些數據全部儲存下來,我們的處理能力也不夠。

現在我們經常處理的一個龐大的虛擬化合物庫的數據量,大概可能到1000億的範圍。而在1000億的可能性當中尋找到藥物分子的處理時間,大概需要幾天時間。

所以當數據從1000億,也就是10的11到12次方,增加到10的60次方的時候,它已經是一個比一般概念的天文數字更大的一個數字。現有的計算能力,我們還沒有辦法處理這麼龐大的數據。

我們會關注新的計算方法,比如說量子計算的出現,會不會在這種暴力美學的情況下,給我們帶來一些更多的可能性。但在新的計算方法還沒有出現之前,我們還需要想辦法。

我們提出一個設想,10的60次方的化學分子,是不是都是有用的分子?

比如,現在針對阿爾茲海默症的藥物,很顯然在10的60次方裡面,它們並不是都是對阿爾茨海默症有用的分子,我們只需要找到那些可能孤立的、但是每個分子都可能對阿爾茨海默症有用的小島。

賴力鵬在造就演講

面對著10的60次方的化合物空間,我們怎麼樣用一個更好的數學方法,把這些可能有用的化合物小島找出來、表示出來?

一個藥物能夠成為藥,它在多方面都必須是優秀的:有很好的藥效,被很好地吸收,不具有毒性……我們就是要在這個空間當中,用這些條件去找到那些孤立的小島,讓我們發現藥物的機會變得越來越大。

和傳統的方法相比,我們具有模擬的優勢:在對一個分子去做一些改變的時候,我們可以相對容易的用計算機產生幾十萬或者幾百萬和這個分子相似的一些分子,讓它們能夠具有相似的成藥的可能性;

大家看這個分子,是我隨便挑出來的,你們覺得這個分子長得漂亮嗎?它像不像個藥?

來那度胺

其實這個是一個已經成藥的、非常重磅的抗腫瘤藥物,叫來那度胺。它是美國Celgene公司在2005年上市的一個重磅藥物,最近幾年的年銷售額應該是過幾十億美元。

化學、生物本身,它也有自己的語言規律,比如說碳可能最多連四個鍵,然後在藥物裡,可能我們更習慣看到苯環的出現等等。

熟悉這種語言,並針對這種大量的分子結構,做深度學習,人工智慧就有可能學會這種化學分子結構的語言。

人工智慧畫的分子

這是我們做的一個比較早期版本的一個人工智慧,就像大家可能聽過說人工智慧可以作曲、畫畫,其實人工智慧也可以畫分子。

我們通過讓機器學習了大量的分子結構數據之後,它學到了一些化學的知識,然後它開始去產生分子結構。

但我知道這些圖畫出來,如果有化學家看見,可能會把我拍在地上,其中有些分子的化學結構可能是非常不合理的。目前我們在這個最早期版本上已經做了很多的改進,讓AI產生的分子儘可能符合藥物設計的要求。

化合物空間分布示意圖

這張圖我非常喜歡,它特別像天空中的一些星圖,它也特別像大腦。它是我們自己做出來的一張化合物空間分布示意圖。

這個圖上的每一個點代表一個分子結構:藍色的點是我們用來訓練人工智慧所用到的我們的分子數據集。紅色是人工智慧學習完之後,去隨機地產生不同的、新的分子結構的分布。

我們最想找到的是,去找到那些更可能成藥的真正高質量的小島。

就像Alpha Go或者Alpha Master,它們可以和自己對弈,不斷強化,不斷去糾正自己的習慣,從而下得越來越好一樣。產生分子的人工智慧也是,我們通過一定的規則去告訴它,我到底需要什麼樣的分子結構,那麼它就可以去學習。

這張圖上黃色的點,是我們對分子溶解度表現進行重點優化後篩選出來的分子。可以看到這些經過強化學習的黃色分子的分布,和紅色的隨機分布,產生了顯著的不同。

我們其實是利用我們的化學手段,在嘗試和人自身進行一場對話。

上個世紀的人類基因組計劃是一個偉大的計劃,是我們嘗試在分子層面上去理解:

我們的生命是如何自我表達,我們的代際之間是怎麼去溝通,我們如何通過遺傳物質,讓一代人和下一代人進行對話

現代生物學已經知道,鹼基可以形成DNA的序列,然後DNA通過生物學的過程,可以去指導蛋白質的合成,而蛋白質是由20種胺基酸按照一定的規律排列起來的,不同的排列可能會有不同的功能。

而我們已經可以用人工智慧和計算的方法在一定程度上做到:你給我一個蛋白質序列,我可以告訴大家,它在三維空間當中會具有什麼樣的結構,而這個結構會怎樣影響到生物的功能,不同的蛋白質之間通過三維的結構如何產生對話,從而去影響彼此。

在虛擬空間計算得到的蛋白質的三維結構

下面這張圖左邊藍色的部分是蛋白質,是生物學的理解,然後黃色的部分,是我們做的化學分子,是我們的化學語言。

藥物研究是一場我們嘗試與自身的「對話」

我們要做的事情就是,嘗試理解生物學語言,嘗試理解化學語言,然後把這兩個語言合到一起,從而能夠找到和疾病相關的蛋白質最匹配的那個化學分子,最終治癒我們的疾病。

剛才所講的這些東西聽起來很科幻,但它其實並不是神話。這裡演示的是我們的實際案例,但圖裡面的結構不是真實案例中的。這裡只是演示了我們利用人工智慧進行早期藥物發現的過程:

人工智慧藥物發現的流程

我們拿到了一個蛋白,然後我們可以用人工智慧的方法去產生那些我們所感興趣的、可能有用的化合物的空間,這個案例裡我們產生了600萬的化合物空間;然後我們基於對蛋白結構的理解,以及對小分子化合物的溶解度、毒性,在體內的吸收、代謝、排洩等屬性進行同時的優化,最後我們留下了六個分子;然後這六個分子,在為期一個月的篩選過程中,最後的結果表現非常良好,可以進行到藥物研發的下一個階段。

這個項目我們在繼續推進,在未來,新的藥物很有可能會誕生在這六個分子當中。

這也是人工智慧比傳統的方法更有優勢的地方,利用機器學習、人工智慧的方法,能夠在在非常早期,對未來將會成為藥物的這些分子同時進行相對全面的判斷,我們能提前篩掉後續實驗會失敗的分子。

賴力鵬在造就演講

所以這就是為什麼,人工智慧用在新藥發現上,有希望能極大地提高現在的發現效率和現在的成功率,我們可能有希望說,把現在需要三到四年才能完成的新藥發現的前期過程,縮短到一年的時間就可以做完

但回到現在現狀本身,我們不得不充滿敬畏地說,生物是一個非常複雜的體系。我們不認為說現在人工智慧,可以單槍匹馬完成整個新藥發現的歷程,我們更多認為人工智慧,是在幫助我們更好地理解自己。

在整個新藥發現的過程中,人工智慧技術已和藥物化學家一起合作,來讓人類可以去發現更好的藥物。

當然,在所有的藥物發現創新過程中,計算只是一方面。我們可以看到還有其它大量的創新:機器人自動化的實驗方法、基因檢測技術和化合物篩選的結合、大規模的分子庫的篩選方法,其實都在蓬勃的發展中。

藥物發現創新過程中的創新

2019年美國FDA一共批准了48款新藥,其中有20個是全新意義上的新藥。

在藥物創新這一塊,大家都在努力,但是遠遠不夠。在人工智慧幫助我們發現新藥的路徑上,我們可能還是會面臨很多挑戰,比如如何把各個藥企的數據結合到一起,利用更多高質量數據去做出更好的模型。

更重大的挑戰是,當面臨這樣一個跨學科的複雜問題,在人工智慧新藥發現這個話題下面,我們會匯聚化學、生物、計算機、數學、統計等多個學科的人才,這些人怎麼樣才能夠站到一起,彼此對話,彼此理解,而不是堅持己見,保有原來固有的思維方式。這個可能是我們需要解決的最大的困難。

阿西莫夫曾經在《永恆的終結》中說:

阿西莫夫《永恆的終結》中的一句話

用技術發現藥物,也是這樣。

相關焦點

  • 利用AI「發現」新藥 為研發提速
    既然算法完全有能力進行藥物發現,我們不禁要問,「藥物發現的真正含義是什麼?」結論就隱藏在我們的視線之下嗎?以往,從藥物研發階段到臨床前測試階段,整個周期往往需要五到六年。而再到實際上市則平均需要十到二十年時間,且每種藥物的發現及生產成本約為20億美元。但根據德勤公司的說法,在將新藥投放市場之後,預期的投資回報率還不足2%。如果能夠將藥物發現的自動化程度提高,則製藥行業將擁有更加豐厚的利潤空間,從而降低新藥的上市成本。人工智慧無疑是最具前景的新藥早期開發解決方案。
  • 《新藥的故事》新藥研發的背後隱藏著不少耐人尋味的故事
    所以接下來我會分兩部分和大家講講《新藥的故事》看看新藥研發它背後隱藏的故事。 第1,我們看 新藥它是如何產生的? 第2,就是如何平衡公眾與製藥企業之間的利益關係? 好,我們先看第一部分,在很多情況下 新的藥物是如何誕生的?
  • 專注研發AI新藥,費米子獲上億元A輪融資
    08:44:19 來源: 投資界 舉報   投資界11月12日消息,據36氪報導,AI新藥公司費米子科技
  • 成都先導董事長李進:新藥研發成功率低於10%,平均研發成本15億...
    他表示,如何通過對新技術、新研發流程、新研發模式的探索,使創新藥的(研發)過程變得更快,藥效更好、副作用更少,同時能減少研發成本的支出,是行業面臨的最大挑戰。公司從2016年就將該技術推向藥物研發市場裡進行合作研發,每年都增加了不少的國際合作夥伴,有大藥企,也有新型的生物技術公司。另外我們不僅將該技術用於合作研發,也在有節奏地進行一些自主的新藥研發項目的推進。2018年我們第一個自己的針對腫瘤的新藥HG146獲得了國家藥監局的審批,開始進入了臨床試驗。2019年底,我們的HG030,也獲得了臨床試驗批准。
  • 中國科學家在新藥研發上做出多少貢獻?《新藥的故事》解碼藥片背後的工業
    一年半前,當新冠疫情還未暴發,梁貴柏博士在《新藥的故事》中曾這樣提到。近日,他與研發客副總裁張詠晴在黃浦江畔上海中心52層的朵雲書院,與讀者一起再次解碼新藥的秘密。梁貴柏分析,一是因特殊情況,二是過去幾十年中,生物醫藥工程得到了突破性發展,才得以使疫苗的研發,至少在臨床前的這部分速度加快。從歷史上來看,通過研發藥物來阻止突發性的疫情是件很難的事情。疫苗這一概念已經在很多年前建立起來,製藥的情況則不盡相同。
  • 【新藥研發的故事】攻克河盲症
    非洲孩子用木棍領著失明的親人前行。在世界上的很多地方,都可以看到紀念默沙東與聯合國共同抗擊河盲症的雕像。
  • 諸多新法規下藥企如何更好研發新藥?
    l 百濟神州高級副總裁,藥學部首席總監杜爭鳴博士帶您探索一種安全、綠色、高效和穩定的原料藥生產工藝; l 默克雪蘭諾全球早期發展部中國臨床藥理部負責人黃悅博士將為您分享如何量身定製的新藥早期研發策略; l 人福普克(武漢)藥業總經理孟曉峰博士為您講述新版cGMP實踐過程中的重點要點; l
  • 人民日報海外版:結合化學藥中藥 新藥研發中國創新路
    來源:人民日報海外版原標題:把化學藥和中藥知識結合起來新藥研發走出中國創新路(醫聲)近年,醫藥創新成為醫療健康領域的熱點話題。從新藥創製納入國家科技重大專項,到新藥獲批量連年增加、速度加快,再到國產創新藥不斷上市,中國的醫藥創新之路在國家政策和資本市場的雙重助力下,越走越順暢。但創新藥研發技術要求高、投入大,有著高風險、高投入、高回報和長周期的特點,如何在此約束下走出中國特色新藥研發之路?如何結合中醫藥體系進行新藥研發?日前,在第十二屆健康中國論壇上,相關人士進行了討論。
  • 解析新藥研發WBS(工作分解結構)
    在討論WBS(工作分解結構,WORK BREAKDOWN STRUATURE)之前,我們先來看看新藥研發的特點。新藥研發一般具有以下特點:首先是周期長。一類新藥研究從發現苗頭到最後批准投產上市需要經過漫長的過程,有關資料表明國外新藥研發一般需要10-15年時間, 我國也要6-10年的時間。 其次是高投入、高風險。在美國開發一個新藥往往要投入數億美元,國內以往以仿製研發為主,所需費用較少,但也在百萬、千萬級;同時,新藥研發風險大,淘汰率高。
  • 不破不立,阿茲海默病新藥研發或迎重大變化
    而鑑於近年來阿茲海默病的新藥研發屢遭失利,在與患者群體和科研人員進行溝通後,阿茲海默病的研發標準可能迎來重大變化。Gottlieb博士指出,近年來,我們在醫學上取得了過去難以想像的突破,免疫療法和基因療法也已成為現實。
  • 對付新冠病毒,新藥研發走到哪一步了
    本期邀請全球健康藥物研發中心(GHDDI)主任、清華大學藥學院院長丁勝詳解抗病毒藥物研發,闡釋新藥研發的理念、手段和規律。新藥研發的背後有一套嚴謹的邏輯和科學機製作為支撐。全球健康藥物研發中心(GHDDI)於2016年成立於北京,是由比爾·蓋茨及梅琳達·蓋茨基金會、清華大學和北京市政府聯合發起成立的一個獨立運營、非營利性質的新藥研發機構。
  • 2020吉利德科學用科技表達愛——不斷研發B肝新藥,為治癒而生
    「32年時間開發上市25個以上新藥,躋身全球十大藥企俱樂部;全球11000人團隊,近6000人是科學家,1987年成立的吉利德是個「獨特」的存在,與大多數傳統製藥巨頭動輒百年的歷史相比,它在通往萬眾矚目的路上僅用了不到30年,被譽為「製藥界的傳奇公司」。
  • 科學網—新藥研發模式亟須轉變
    ■劉昌孝
  • 從新藥研發到守護健康,生命科技將成AI巨頭新賽道
    從新藥研發到守護健康,生命科技將成AI巨頭新賽道 2020-12-01 11:25 來源:澎湃新聞·澎湃號·湃客
  • 新藥研發到上市流程,看這一篇文章就夠了
    藥物作用靶點(target)以及生物標記(biomarker)的選擇與確認早期人們對藥物作用靶標認識有限,往往只知道有效,但不知如何起效。比如,百年來,人們知道阿司匹林(aspirin)具有解熱、消炎、止痛、抗血栓,甚至抗癌作用。直到1971年,英國人John R.
  • B肝新藥研發難點,共價閉合環狀DNA難定位,未來NA聯用新藥方案
    在不斷更新2019-2020B肝全球在研創新藥期間,不禁要問,慢性B肝新藥研發難度在哪裡?眾所周知,B肝病毒感染是導致肝硬化、肝癌(HCC)的主要原因之一,預防性B肝疫苗成為減少感染的關鍵。B肝新藥研發難點,共價閉合環狀DNA難定位,未來NA聯用新藥方案同時,包括治療性B肝疫苗已有在全球正在註冊審批當中。小番健康提醒,治療慢性B肝難點在病毒複製模板cccDNA,而這是B肝病毒複雜的生命周期步驟中最難的地方。
  • 新藥研發關鍵是啥?「偉哥」理論發明人:一氧化氮!
    現場,醫藥界諾獎得主費裡德·穆拉德在成都分享最新研究,在他看來,一氧化氮為新藥研發提供「信號」,已經成為生物學非常重要的研究領域,市場上很多新藥物與一氧化氮的研究成果有關。↑費裡德·穆拉德(左一)、卡瑞瑪·沙巴(左二)諾獎得主費裡德·穆拉德:一氧化氮為新藥研發提供「信號」因為發現一氧化氮能促使心血管擴張,費裡德·穆拉德獲得1998年諾貝爾醫學、生理學獎,這一發現也促成新藥「偉哥」的發明,他也成為「偉哥」」理論發明人。弗裡德·穆拉德來說,「我在一兩年前來過成都,這是非常棒的一座城市。」
  • 李競:做生物新藥研發的阿里巴巴
    15年的生物技術領域資深專家李競,帶著一個簡單的行囊,回到闊別良久的祖國。在這期間,李競作為實驗室主任,帶領團隊研究新的腫瘤疾病靶點,同時還參與抗體偶聯藥物技術平臺的運行開發。2010年,隨著項目的增加,諾華急需一名能夠對各個疾病研究領域有所了解,且懂得生物藥研發流程,對內外部資源了解且有說服力、影響力的人,來統領協調整個集團大分子生物藥的研發工作。
  • 新藥研發成本降低90%:一群理想主義者的務實創舉
    你也許會好奇,為何DNDi能將新藥研發的成本銳減近90%?要回答這個問題,我們首先得了解DNDi是怎樣的一個機構。2003年,包括法國的巴斯德研究所及「無國界醫生」等全球七個研究機構與組織共同建立了DNDi,旨在通過研發新藥,提高「受忽視疾病」(neglected diseases)患者的生活質量與健康狀況。
  • AI新藥公司費米子科技完成累計上億元A輪融資
    費米子科技創始人兼CEO鄧代國表示,「費米子在近兩年合作的項目多為PCC階段及以前,我們希望在今後能夠做到在PCC階段、IND階段、甚至臨床1期與藥企展開深入合作。同時,我們也會進一步加大在算法及數據方面的投入,形成一個完整的、新型的基於AI的小分子研發臨床前藥物研發流程的解決方案,同時打造更豐富的產品管線。」