Science:根據分子結構預測氣味?AI再勝一籌

2021-02-08 X-MOL資訊

‍‍‍


人類不少玄妙的感覺,其實都可以用簡單的方式來定義。比如,如果有人發射了一束波長為510 nm的光,那麼大部分人看見的就是綠色,當然色盲除外。除了視覺,聽覺也是一樣,超過80分貝的聲音肯定會讓大部分人覺得吵。這種確切的定義可以讓業界很好地設計相關的材料和產品,來滿足人類的需要。但是,另一種感覺——嗅覺卻和視覺與聽覺不一樣,很難通過簡單的方式來定義。這也導致了另一個很讓科學家們頭疼的問題——如何根據物質的分子結構來預測氣味。這個問題咋一看好像沒啥難度,比如接觸過巰基乙醇的人看到巰基就會不自覺的預測「奇臭無比」。不過,如果換一個複雜點的結構呢(下圖)?

圖片來源:Science


事實上,人類的嗅覺比我們想像得要靈敏許多,理論上一個嗅覺正常的人可以分辨上萬億種氣味。以往曾有研究工作者提出可以通過氣味分子的化學結構來推斷所能帶來的嗅覺體驗。但大量事實表明,一些分子看似具有十分相似的化學結構,但帶給人的嗅覺體驗卻存在巨大的差異。相反,結構迥異的分子有時候卻可以給人們帶來十分相似的嗅覺體驗。這裡不妨舉一個簡單的例子,S構型的香芹酮具有芫荽(俗稱「香菜」)的氣味,而R構型的香芹酮卻具有留蘭香的氣味,可見分子中一個手性中心構型的改變,都會帶來不一樣的「味道」。一般認為,人類的嗅覺體驗歸因於氣味分子與鼻子中特定的受體結合,並將信號傳達到大腦進行後續信息處理。到目前為止,科學家們已經發現在人體內存在著400多種分辨氣味的受體,但不同的受體如何組織以分辨不同的氣味,目前機理尚不十分明確。


那這個問題就無解了麼?不一定。這裡就要引出今天的主角、近期火的不能再火的人工智慧(AI)。AI在很多領域都已經展現出了非凡實力,無論是「阿法狗」及其升級版挑翻眾多人類圍棋高手,還是預測晶體製備策略(點擊閱讀詳細)、優化偶聯反應條件(點擊閱讀詳細)、根據照片診斷皮膚癌症(點擊閱讀詳細),AI的發展勢頭都讓人瞠目結舌。美國IBM研究中心Pablo Meyer以及洛克菲勒大學Leslie VosshallAndreas Keller決定趕個時髦,他們發起了一個眾包項目「DREAM Olfaction Prediction Challenge」,提供一個百萬級的數據集(包括化合物結構以及相應的人類志願者判斷的氣味信息),供22個計算機科學家團隊使用,以開發根據化合物結構預測氣味的機器學習算法(也就是AI)。最終,AI完成了人類無法完成的預測任務。相關工作也發表在了Science 雜誌上。

志願者「聞」的476個樣品。圖片來源:Rockefeller University


Meyer等人邀請了49名志願者「聞」476個玻璃樣品瓶中的化合物,對它們的氣味逐一進行分類,每個樣品可以用給定的19種描述項進行描述,例如這瓶有「魚腥味」,那瓶有「大蒜味」,那瓶有「水果味」等等。與此同時,他們還需要對每種氣味的濃淡以及帶給人的愉悅程度進行定級,由此得到了大量數據(下圖A)。另外,研究者還收集了這些樣品分子的結構特徵數據,比如原子類型、官能團種類等,每個分子的結構特徵都超過4800種(下圖B)。隨後這些數據分批提供給22個參與團隊,寫算法、建模、訓練、模型驗證等(下圖C)。

數據系統及DREAM Challenge流程示意圖。圖片來源: Science


這些算法大多表現不俗,而密西根大學Yuanfang Guan團隊和亞利桑那州立大學Richard C. Gerkin團隊的工作尤其出色。研究者們綜合了多個團隊的算法,優化出最終的AI模型。這一模型可以精準地預測一個分子的氣味強度和愉悅度,還能對之前提及的19種氣味描述項中的8種(「大蒜味」、「魚腥味」、「甜味」、「水果味」、「焦糊味」、「辣味」、「花香味」和「酸味」)進行準確預測。Meyer表示,AI有能力將氣味的分子結構與氣味聯繫起來,例如分子中帶有含硫的基團傾向於具有大蒜味,而與香蘭素結構相似的分子則可能帶有類似麵包房裡的香味,如此等等。利用這些數據關聯,AI可以從大量的化學結構數據中找到合適氣味描述項,其結果十分接近實際的嗅覺感受。


研究者認為這一模型可以幫助香料香精公司省去尋找特定氣味分子所需的大量精力和投入,同時也節省了不少後期的用戶體驗調查等工作。同時,未來還有可能實現通過特定氣味識別出該氣味中組成的分子。然而,僅僅使用19種描述項對氣味進行分類是遠遠不夠的,增加氣味的描述項無疑會使系統的數據處理量暴增,而AI是否有能力應對這一問題仍舊未知。無論如何,有一點可以肯定,這一研究結果對於探究分子結構與氣味之間的關係具有十分重要的借鑑意義。


——後記——


前不久在江蘇衛視《最強大腦》的一期節目中,著有「鬼才之眼」稱號的王昱珩與AI展開「人機對戰」,他們被要求通過行車記錄儀、高位監控、自拍照片等數據記住三名偷走公文包的小偷特徵,並將這三個人從三十名犯罪嫌疑人中指認出來。題目難度較大,超出人類的能力,AI最終勝出。


AI在某些方面可以比人類表現的更卓越,這已經不是什麼新鮮事。目前,AI主要應用於人臉和語音識別、服務型機器人以及金融、醫療等行業的解決方案。而在未來,AI將會有更加廣闊的應用,那時的人類,又將如何自處?


原文(掃描或長按二維碼,識別後直達原文頁面):

Predicting human olfactory perception from chemical features of odor molecules

Science, 2017, 355, 820-826, DOI: 10.1126/science.aal2014


DREAM Olfaction Prediction Challenge

http://dreamchallenges.org/project/dream-odor-classification-challenge/ 


本文部分內容編譯自:

http://www.sciencemag.org/news/2017/02/artificial-intelligence-grows-nose 

http://cen.acs.org/articles/95/i9/Computers-predict-moleculesscent-structures.html




本文版權屬於X-MOL(x-mol.com),未經許可謝絕轉載!歡迎讀者朋友們分享到朋友圈or微博!


長按下圖識別圖中二維碼,輕鬆關注我們!



點擊「閱讀原文」,參加討論

相關焦點

  • 讓機器辨彆氣味:利用圖神經網絡預測分子的嗅覺屬性
    基於視覺和聲音深度學習研究的類似進展,我們通過類比得知,即使不知道所有相關系統的複雜細節,嗅覺深度學習應該也可以直接預測出輸入分子的最終感應結果。解決氣味預測問題將有助於發現新的合成氣味劑,從而減少取用天然產品造成的生態影響。審視生成的嗅覺模型甚至可以帶來嗅覺生物學的新見解。小氣味分子是香精香料最基本的組成成分,因此也代表了最簡單的氣味預測問題。
  • AlphaGo顛覆生物圈,精準預測蛋白質結構
    拿它預測的結構與實際結構對比,可以看到基本完全吻合(下圖,綠色是實驗得到的實際結構,藍色是計算預測結構)。 根據AlphaFold的主要負責人之一John Jumper介紹,在第二個步驟中,雖然沒有使用AI技術,但AlphaFold使用結構與遺傳數據得出了蛋白質的外觀模型,與之前的研究達成一致。 但第一次迭代存在缺陷。因此,該團隊開發了一個AI網絡。該網絡結合了有關確定蛋白質如何摺疊的物理和幾何約束的信息。
  • 解決生物學50年來重大挑戰 生物界"AlphaGo"精準預測蛋白質結構
    根據AlphaFold的主要負責人之一John Jumper介紹,在第二個步驟中,雖然沒有使用AI技術,但AlphaFold使用結構與遺傳數據得出了蛋白質的外觀模型,與之前的研究達成一致。 但第一次迭代存在缺陷。因此,該團隊開發了一個AI網絡。該網絡結合了有關確定蛋白質如何摺疊的物理和幾何約束的信息。
  • 除了下圍棋,AI還能預測「難纏」的蛋白質結構,它是怎麼做到的?
    這實際上很符合直覺,我們可以想像,如果同樣的胺基酸序列可以摺疊成不同結構的蛋白質,發揮不同的功能,我們的身體內部會陷入怎樣的混亂狀態。自然界經過漫長的生命進化過程,蛋白質分子在眨眼之間就能夠自發地完成整個摺疊過程。但科學家們發現,如果想要通過計算胺基酸分子間的相互作用來預測它們如何摺疊,那麼要窮盡所有可能的蛋白質構型,需要的時間將比整個宇宙年齡還要長。
  • Science:從結構上揭示tau蛋白與微管之間的相互作用,有助深入認識...
    論文通信作者為勞倫斯伯克利國家實驗室分子生物物理學與綜合生物成像部門資深科學家Eva Nogales。圖片來自GerryShaw/wikipedia。tau蛋白是一種內在無序的蛋白,包括一個突出結構(projection domain)域,一個含有4個不完整重複序列的微管結合區和一個羧基端結構域。
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    CASP始於1994年,是蛋白質結構預測的評估標準和全球社區,評價每兩年進行一次。△圖源:Science從1994年起,隨著技術的進步,蛋白質的預測準確性在不斷增加,而在今年,迎來了重大突破,預測準確性得分達到了92.4/100。而這,便是DeepMind的AlphaFold 2系統帶來的。
  • Science和Nat Commun兩篇研究揭示出塑料PET降解分子機制
    論文通信作者為KAIST化學與生物分子工程系的Sang Yup Lee教授和韓國慶北國立大學生物技術系的Kyung-Jin Kim教授。圖片來自KAIST。科學家們一直致力於解決材料的不可降解問題。然而,PET降解的詳細分子機制仍然是未知的。這項研究通過模擬PETase與一種PET替代性模擬底物之間的對接,預測了一種特殊的分子機制。他們利用基於結構的蛋白工程構建出IsPETase的一種具有增強的PET降解活性的變體。據預計這項研究中使用的新方法可能有助於進一步研究其他的不僅能夠降解PET而且也能夠降解其他塑料的酶。
  • Science|遺傳相互作用圖譜可確定蛋白質複合物的整合結構
    大家好, 今天分享的是發表在science上的一篇關於遺傳相互作用圖譜輔助蛋白複合物整合結構確定的文章,題目是Genetic interaction mapping informs integrative structure determination of protein complexes
  • Science:利用基因相互作用圖譜確定蛋白複合物的整體結構
    最令生物學煩惱的任務之一是弄清楚蛋白---這些承擔細胞工作重任的分子---是如何完成它們的工作的。每種蛋白的表面都有各種旋鈕、褶皺和裂縫,決定了它能做什麼。科學家們可以相當容易地在單個蛋白上可視化觀察這些特徵。但蛋白並不是單獨行動的,科學家們還需要知道蛋白在一起工作時形成的複合物的形狀和組成--他們稱之為結構。
  • 現實版黑客帝國,AI能給氣味編程了,想要啥味要啥味
    ▲NeOse Pro有機物和無機物會根據能量和生物時間過程的變化釋放出氣味分子,當能量增加時,會發生氣味揮發,鼻腔有可能會順勢吸收異味,這樣的行為會刺激到嗅覺神經元,然後刺激嗅球,進而促使嗅覺皮層識彆氣味及其來源。
  • 饒子和團隊《Science》解析「藥靶-藥物」三維結構
    但是自該藥物問世以來,其分子機制一直未被解開,這就大大阻礙了乙胺丁醇這一「傳統老藥」的更新換代和耐藥性的解決。饒子和院士團隊長期以來致力於針對結核病重要靶點的研究及新藥開發。研究團隊再獲重大突破,解析了一線藥物乙胺丁醇靶點——EmbA-EmbB和EmbC-EmbC兩種複合物的三維結構,揭示了乙胺丁醇作用於靶點的精確分子機制。
  • 蛋白質3D結構可用AI解析
    「結構即功能」是分子生物學的定理,若能根據蛋白質的胺基酸序列推出其結構,有助於人們加速了解細胞的組成和運作規律,一些新藥物的研發也能更快推進。  長久以來,人們需要藉助實驗確定完整的蛋白質結構,比如X射線晶體學和冷凍電鏡,這些方法往往要花費數月甚至數年時間,目前人類已發現的2億蛋白質中,只有不到20萬的蛋白質結構被解析。
  • AlphaFold成功預測蛋白質結構
    原文作者:Ewen Callaway科學家認為,谷歌預測蛋白質3D結構的深度學習程序將顛覆生物學。谷歌旗下人工智慧(AI)公司DeepMind的一個AI網絡朝著解決生物學領域最大的挑戰之一邁出了一大步,這裡的挑戰是:根據一個蛋白質的胺基酸序列來確定它的3D結構。
  • 會預測蛋白結構的AI,還要教我們設計新蛋白
    利用蛋白質設計開發的可高效中和新冠病毒的人工蛋白質(點擊看大圖) 丨UW Institute for Protein Design蛋白質設計是蛋白質結構預測的逆操作,兩者就像一枚硬幣的正反面:結構預測是從蛋白質序列出發,預測現有胺基酸序列能夠形成什麼樣的三維結構;蛋白質設計剛好相反,先確定我們需要什麼樣的三維結構,再找到能夠自發摺疊成所需三維結構的蛋白質序列。
  • MIMOSA: 用於分子優化的多約束分子採樣
    MIMOSA用GNN進行迭代預測,並且採用三種基本的子結構操作(添加、替換、刪除)來生成新的分子和相關的權重。權重可以編碼多個約束,包括相似性約束和藥物屬性約束,在此基礎上選擇有前途的分子進行下一次預測。MIMOSA能夠靈活地對多種屬性和相似性約束進行編碼,且高效地生成滿足各種屬性約束的新分子,在成功率方面比最佳基線改進高達49.6%。
  • 2020年9月4日Science期刊精華 - Science報導專區 - 生物谷
    2.Science:揭示病情較重的COVID-19患者存在三種不同的免疫反應doi:10.1126/science.abc8511在一項新的研究中,來自美國賓夕法尼亞大學佩雷爾曼醫學院的研究人員發現針對SARS-CoV-2感染的三種不同的免疫反應,這可能有助於預測重症COVID-19患者的疾病軌跡,並可能最終為如何最好地治療他們提供信息。
  • 2020年12月11日Science期刊精華
    2.Science:利用基因相互作用圖譜確定蛋白複合物的整體結構doi:10.1126/science.aaz4910; doi:10.1126/science.abf3863如今,在一項新的研究中,來自美國格拉斯通研究所和加州大學舊金山分校的研究人員證實了一種大規模的系統性遺傳方法確實可以獲得可靠和詳細的蛋白複合物結構信息。
  • 蛋白質的分子結構
    胺基酸分子通過形成肽鍵連接成肽鏈,再由一條或一條以上的肽鏈按照一定方式組成具有一定空間結構和生物活性的大分子,承擔一定的生理功能。由於組成蛋白質分子中的胺基酸的種類、數量與排列順序以及蛋白質的空間結構的不同,形成了多種多樣結構不同的蛋白質。蛋白質的分子結構是蛋白質承擔功能的物質基礎。蛋白質的分子結構分為4個層次,包括一級結構、二級結構、三級結構和四級結構。
  • 【前沿科普】會預測蛋白結構的AI,還要教我們設計新蛋白
    撰文 | 曹龍興(華盛頓大學蛋白質設計所博士後)盧培龍(西湖大學特聘研究員)不久前,谷歌公司旗下的DeepMind研發的AlphaFold2人工智慧系統在國際蛋白質結構預測競賽(CASP)上取得驚人的準確度,多數預測模型與實驗測得的蛋白質結構模型高度一致,引起了舉世矚目。實際上,蛋白質的結構不僅可以被預測,還可以被設計,二者互為「逆操作」。
  • 【科技前沿】顏寧/閆創業合作解析固醇感受器分子機制
    SREBP信號通路簡化示意圖儘管這條信號通路已經發現了幾十年,但是具體的結構信息和分子機制仍然尚未被完全闡述。信號通路的分子機制。結構和生化實驗證明,S4螺旋的不連續對於配體的結合和與Insig-2的相互作用不可或缺。Insig-2的結構與此前解析的MvINS結構類似。在MvINS的晶體結構中,一個內源的diacyl-glycerol (DAG)分子插入在TM1/2/3/5的中心口袋中。