風味是一種複雜的、多感官的人類體驗,有著豐富的進化史(1)。分子構成了風味的化學基礎,主要通過味覺和嗅覺機制表達。對風味的感知源於風味分子與生物組織的相互作用,可以被認為是複雜生化系統的一種突現特性。雖然這個謎團的一些組成部分已經被發掘出來,但我們仍然不能對這個現象有一個整體的看法(2-5)。採用以數據為中心的方法可以通過提供辨別風味關鍵特性的方法來提供風味研究的系統視角。
來自自然來源的風味在整個人類歷史上形成了烹飪習慣。與地區語言的變異類似,文化在烹飪方式上也進化出了變異。傳統的食譜組合編碼的配料組合不僅美味,而且令人開胃。分子特性和風味感知之間的啟發式關聯為其化學基礎提供了指示(1)。例如,脂肪酸酯的組合在許多水果風味中起著主要作用。
眾所周知,酮在氧化黃油中具有金屬風味,而單萜類化合物提供了許多草藥和香料的特有風味。然而,這些知識在很大程度上仍然是非結構化和不全面的。
創建FlavorDB的目的是集成風味分子的多維方面,並表示它們的分子特徵、風味特徵和自然來源的細節(圖1)。FooDB是類似方向的努力之一,它從食品成分中編譯分子;儘管它的重點不是風味或風味配對的化學基礎(http://foodb.ca).。Flavornet是另一種資源,它提供了風味分子及其氣味特徵的列表,但沒有提供其自然來源的信息(6)。在這個方向上的其他嘗試側重於收集特定於風味方面的數據:苦味(BitterDB)和甜味(超甜味),以及揮發性香味化合物(SuperScent)(7-9)。另一些則針對營養因子(NutriChem)、多酚(Phenol-Explorer)和食物的藥用價值(10-13)。
在其他來源中,FlavorDB整理來自FooDB、Flavornet、Supersweet和BitterDB的信息,以創建風味分子、風味特徵、理化特性和自然來源的綜合存儲庫(S1節,補充數據)。與擁有2816種風味化合物的FooDB相比,FlavorDB除了整合上述所有來源的數據外,還涵蓋了從費納羅利風味成分手冊和文獻調查中彙編的25595種風味分子。FlavorDB跨越34種配料類別,涵蓋936種配料,其中190種是獨一無二的。使FlavorDB有別於類似資源的特徵之一是,它以食品類別、成分、風味分子及其風味特徵以及包括官能團和物理化學性質的化學描述符的層次結構呈現信息。通過豐富的配料及其組成的風味分子,FlavorDB還提供了一種嘗試風味配對的工具。
因此,它在功能豐富的視覺界面的幫助下,為探索風味空間提供了一個綜合的平臺。
FlavorDB組合了不同維度的風格,構成了「實體空間」和「風格空間」(圖1)。前者結合了成分的各個方面,這些成分是來自食品中經常使用的自然來源的實體,而後者代表了負責風味的分子及其描述符。通過將相關信息放在單一的保護傘下,FlavorDB提供了一個全面的數據集,以用戶友好的界面、創造性的可視化和互連的搜尋引擎為後盾,用於探索有助於風味的功能。因此,FlavorDB為更好地理解風味化合物與生物系統和相關應用之間的複雜相互作用而產生的風味感知鋪平了道路。
圖1.FlavorDB是「實體空間」和「風格空間」的無縫融合。該資源提供了一個全面的數據集,以及一個用戶友好的界面和相互連結的搜尋引擎,用於探索風味世界。
資料庫概述
FlavorDB是一個廣泛覆蓋25,595個風味分子的資源(圖1)。在資料庫中列出的分子中,據報導在936種天然實體/成分中發現了2254種。這些天然成分被進一步劃分為34類,並映射到527個不同的自然來源。另外還有13,869種化合物被鑑定為合成的。對於剩下的9472個分子,無法確定具體的來源。作為這些化合物詳細分子和風味特徵的一部分,這些特徵通過味覺和嗅覺機制對它們的味道和氣味產生影響。
FlavorDB提供了一個用戶友好的界面,用於查詢和瀏覽風味分子、實體/成分、自然來源,以及執行風味配對。提供交互式數據可視化,例如風味網絡和相互連結的搜索選項,以檢索相關信息。除了通過文本查詢或繪製化學結構進行搜索外,FlavorDB還提供「視覺搜索」。使用這一點,用戶可以交互地瀏覽配料類別以訪問相應的自然實體,並隨後獲得其風味分子的細節。
對於任何風味分子,該資源還便於在資料庫中查找結構相似的分子,以及從外部來源(ZINC(14))獲得的那些商業上可獲得的分子。因此,通過交互實體和風味空間以及動態界面和可視化,FlavorDB提供了廣泛的信息,便於深入了解風味世界。
數據彙編
創建這一資源背後的主要動機之一是繪製對味覺和嗅覺至關重要的分子的空間。首先,使用fooDB(http://foodb.ca)和arxiv預印本arxiv:1502.03815創建配料列表。然後,將936種成分中的每一種手動分類為34類:添加劑、動物產品、麵包店、飲料、酒精飲料、含咖啡因飲料、穀物、玉米、乳製品、乳製品、精油、魚、海鮮、花卉、水果、漿果、水果柑橘、水果香精、菌類、草藥、肉類、豆類、堅果、種子、植物、植物衍生物、香料、蔬菜、甘藍、蔬菜水果。每個實體也在圖中被標記到其自然來源,總共確定了527個獨特的來源。使用Python的
BeautifulSoup4庫(https://www.crummy.Com/soft/BeautifulSoup)從維基百科獲取實體及其自然來源、相關圖像和科學分類的詳細信息和MediaWiki的操作API(MediaWiki,免費的Wiki引擎)。
通過Fenaroli的風味成分手冊、先前報導的數據(16,17)、FooDB(http://foodb.ca),arxiv預印本arxiv:1502.03815和文獻調查(也參見S2節,補充數據)等風味資源來彙編這些成分中的每一種的風味分子的數據使用成分的常用名、學名和同義詞查詢PubMed以獲得報導其風味分子的文章。因此,與實體/成分相關的風味分子從現有來源(15-17)(FooDB;http://foodb.ca,arxiv preprint arxiv:1502.03815,2015年)中進行整理並手動編譯。
Flavornet、BitterDB和Supersweet的分子以及它們的風味特徵(6,7,9)被進一步包括在內。此外,FlavorDB還提供33種味覺感受器(甜味、苦味、酸味和鮮味)和1068種氣味感受器的信息。對於每個受體,我們提供了它的UniProt ID、名稱、味覺相關信息和UniProt連結(18)。
分子的化學標識符從各種來源獲得(FooDB;http://foodb.ca)(6,7,9,15,16)(也參見S2節,補充數據),並被標準化以獲得其CAS(化學摘要服務)編號。CAS編號然後被映射到它們相應的PubChem ID,因為前者通常是簡併的,多個CAS編號指向同一分子,一些指向多個分子。因此,PubChem ID被用作每個風味分子的唯一識別特徵。使用PubChem ID,從PubChem rest API(https://pubchem.ncbi.nlm.nih.gov/pug rest/pug REST.html)獲得複合標識符(如通用名稱、IUPAC、典型微笑)、理化屬性和2D圖像。通過編輯來自FooDB(http://foodb.ca),FlavorNet(6)、Supersweet(9)、BitterDB(7)和PubChem)的信息來創建分子的風味簡檔(風味簡檔、FEMA風味簡檔、FEMA編號、味道和氣味)。
使用Discovery Studio4.0(DS4.0;Accelrys Inc.)獲得所有25,595個分子的進一步2D/3D、ADMET和物理化學性質以及Mol2文件。
使用Checkmol軟體(19)獲得官能團。官能團是指當它們出現在不同化合物(20)中時具有相似化學性質的一個原子或一組原子。因此,它定義了有機化合物家族特有的物理和化學性質。
有關實體、類別、風味分子及其風味和官能團的統計,請參閱補充資料中的補充圖S1、S2、S3和S4。
資料庫體系結構和Web接口
FlavorDB便於理解風味分子、實體/成分及其自然來源之間的複雜相互關係(圖2;也參見補充數據的圖S5)。交互式數據可視化和各種用戶友好的搜索提供了對所需信息的快速訪問。FlavorDB中的以下實用程序和應用程式支持「風味空間」和「實體空間」的可視化探索,以深入了解風味領域。
風味網絡
風味網絡可視化了所有實體/配料之間的風味共享圖表。為了更容易觀察到類別內和類別之間的風味共享,實體按類別分組,並沿圓周隔開。
為了解決由於大量共享而導致的密集相互關係模式,描述了顯示統計上顯著邊緣的骨幹網絡(21)。點擊一個實體,通過共享風味分子顯示它與其他實體的關聯,從而能夠在看似不同的實體之間搜索相似性。風味網絡是用D3.js JavaScript庫(https://d3js.org).)實現的。
圖2.突出顯示數據搜索和圖形導航功能的FlavorDB用戶界面示意圖。(1)風味分子搜索、(2)實體/成分搜索、(3)天然來源搜索、(4)風味配對、(5)高級搜索、(6)分子和風味簡檔(包括用於查找相關實體、搜索結構相似分子、外部連結和數據下載的特徵)、(7)每日分子、(8)風味網絡和(9)視覺搜索。
視覺搜索
可視化搜索,使用Google Chart庫實現(http://developers.google.com/chart),提供了一種瀏覽FlavorDB的交互方式。在層次結構的頂部,它以框的形式顯示所有34種配料類別。每個盒子的大小由該類別中存在的獨特風味分子的數量決定。分子的數量越多,盒子的尺寸就越大。點擊任何一個類別,就可以導航到它的組成成分和它們各自的風味簡檔。因此,可視化搜索實現了對FlavorDB的多層次、開放式探索。
分子搜索
由於FlavorDB提供了廣泛的分子和風味特性,「分子搜索」形成了一個關鍵的查詢機制。它便於根據一系列特徵進行查詢,這些特徵包括通用名稱、官能團、FEMA風味、分子量、氫鍵供體/受體數量和分子類型(天然、合成、未知)。此外,JSME分子編輯器能夠基於結構相似性進行搜索(22)。
該編輯器便於使用SMILS、MOL或SDF文件創建分子。使用分子簡介頁面上提供的「在FlavorDB中搜索類似化合物」按鈕也可以找到結構相似的化合物。
分子搜索會得到與詳細的「分子和風味特徵」相匹配的風味化合物。JSmol庫提供了分子的3D可視化,並提供了到PubChem的外部連結。此外,還可以選擇下載不同格式的分子(MOL2、微笑、2D圖像)。可以使用「數據表」插件提供的搜索和排序功能來過濾風味分子。
用於執行結構相似性的算法使用OpenBabel(11)計算所有風味分子的分子指紋(FP2)。對於所查詢的任何分子結構,使用OpenBabel協議計算其指紋,並使用結構相似性的TAnimoto係數與資料庫進行比較。具有至少30%相似性的分子被返回。FlavorDB還通過執行空搜索(無約束;所有查詢欄位為空)來方便地瀏覽所有25,595種風味分子。「每日分子」功能可以讓用戶窺探風味世界,用戶可以從那裡開始探索資源。
高級搜索
高級搜索通過根據各種分子屬性(環數、可旋轉鍵、能量、表面積等)查詢FlavorDB數據,提供精細化搜索選項。除了在基本搜索中提供的那些之外。
對於數值欄位,可以將範圍或離散值作為查詢提供。
實體和天然資源搜索
這些搜索便於基於「實體/成分名稱」以及「類別名稱」進行查詢,以檢索與實體相關聯的實體、類別、自然來源、科學分類、維基頁面連結、同義詞、圖像和風味分子的詳細信息。
此外,我們還方便了基於同義詞的搜索,因為我們知道很多成分通常都有不同的替代名稱。例如,要搜索「茄子」,可以按「Aubergine」或「Brinsal」進行搜索。所有文本搜索欄位都由jQuery UI自動完成功能輔助。
風味配對
「風味配對」(也被稱為「食品配對」)是一種具有經驗證據(15,16)的啟發式方法(arxiv preprint arxiv:1505.00155,2015年),用於尋找在食譜/食品中有望搭配得很好的配料對。
在936個實體及其組成的風味分子(2254)的廣泛目錄的基礎上,「風味配對」工具提供了一個強大的引擎,用於跨越>437,000個配對,以揭示不同類別和不同實體之間的風味特徵重疊。該應用程式通過交互式可視化提供配對結果,以便於理解。
詳細分析產生查詢實體和具有至少一個共享風味分子的所有其他實體之間的共享風味分子的數量。可以使用數據表進一步過濾結果,以探測共享風味分子的列表。
Web伺服器技術堆棧
Flavor DB已設計為使用mysql(https://www.mysql.com).)的關係資料庫。Web伺服器是使用Python Web開發框架Django(https://www.djangoproject.com).)構建的。Django有一個內置的ORM(Object Relational Mapper,對象關係映射器)用於查詢資料庫,因此除了縮短開發周期外,還可以優化查詢並使執行複雜查詢變得更容易。前端是使用HTML、CSS和JavaScript構建的。JQuery、Bootstrap、D3.js和Google Charts庫用於添加FlavorDB的功能。Apache HTTP Server用於將請求路由到Django應用程式,並啟用數據壓縮以加快頁面加載速度。該網站最好使用最新版本的Google Chrome、Firefox、Opera、Internet Explorer和Microsoft Edge查看。
示例
下面我們提供幾個案例研究,說明FlavorDB在各種應用程式中的實用性。
調味品/食品配對的應用
食物配對原則表明,味道相似的配料傾向於在食譜中一起使用(23)。從歷史上看,食物配對是在反覆試驗的基礎上進行的,它在很大程度上依賴於人類的判斷和食物鑑賞家的直覺。以證據為基礎理解規定食物選擇的規則可以促進知情的實驗,以便在食譜中配對配料。據報導,許多西方菜餚的特點是「統一配餐」,而印度菜餚傾向於遵循「對比配餐」模式(15,16)(arxiv預印本arxiv:1505.00155,2015年,arxiv預印本arxiv:1502.03815,2015年)。基於配料和風味分子的數據,FlavorDB提供了一款應用程式,用戶可以通過該應用程式試驗所需配料的食物配對。
讓我們考慮一下用戶想要找到牛至替代品的情況。使用風味網絡,人們可以快速獲得與牛至具有相同風味分子的成分的概述。通過風味配對APP,可以觀察到牛至和百裡香含有最多的共同分子。因此,通過統一的食物配對,百裡香可能成為牛至的替代品。這個例子演示了FlavorDB的不同特性在做出關於口味配對和配料選擇的明智決策時的效用。
搜索類藥化合物
找到與滿足利平斯基五規則的化合物結構相似的分子。此示例演示了如何使用FlavorDB的「高級搜索」和「結構相似性搜索」功能來查找與所需化學特性匹配的分子。利平斯基規則是評估類藥物的啟發式方法;化合物具有藥理或生物活性的適宜性使其有可能成為口服活性藥物的候選者。它規定,口服活性藥物不超過一次違反以下標準:不超過5個氫鍵供體;不超過10個氫鍵受體;分子量小於500Da;辛醇-水分配係數(LogP)不大於5。
在「高級搜索」中使用上述標準,可以搜索滿足利平斯基規則的分子。通過使用JSME工具提供的結構搜索,可以進一步細化該查詢,以查找在結構上與特定化合物相關的類藥物化合物。例如,人們可以在「高級搜索」中指定利平斯基規則的條件,並繪製吡啶的化學結構。結果搜索返回所有可能適合作為藥物進行測試的分子,按與吡啶結構相似的降序排列。
找到與任何所需化合物相似的風味分子
大蒜素(SMILES:O=S(SC\C=C)C\C=C)是大蒜中存在的主要分子之一。使用結構搜索,可以在FlavorDB中獲得相似分子的列表。
本例的最高結果是二烯丙基二硫,相似性為66.7%。有趣的是,正如它的「分子和風味特徵」所反映的那樣,二烯丙基二硫化物有一種「尖銳的大蒜味道」。因此,它可能成為大蒜素的替代品,並作為支架來創造合成大蒜的味道。還可以在自然產生的以及合成的化合物中搜索與特定的FEMA風味項和/或官能團相匹配的風味分子。
探索配料的風味特性
根據經驗,芥末有刺激性氣味。使用「實體搜索」選項,可以發現在FlavorDB中有五種已知的Wasabi風味分子。
其中,有一種分子,異硫氰酸烯丙酯,據報導表現出一種「非常刺鼻」的氣味特徵。可以推測,芥末的刺鼻氣味主要是由於異硫氰酸烯丙酯的存在。
上面的例子說明了如何交互地使用FlavorDB及其特性來做出數據驅動的決策,以迎合口味的各個方面。
總結與展望
味覺分子和機理的研究因其在食品和香料中的應用而備受關注(1-13)(http://www.pherobase.com).。FlavorDB致力於編輯來自食物及其風味的分子,為「實體空間」、「風味空間」以及兩者之間的潛在聯繫提供了詳細的視角。通過這樣做,它為進行數據驅動分析奠定了基礎,這些數據驅動分析可以幫助構建用於分子美食學、烹飪食品配對、新配方生成、香氣混合和根據化學特徵預測氣味的應用程式(24-26)。
儘管我們盡了最大努力,FlavorDB並不是所有風味分子和成分的詳盡存儲庫。我們關於一種配料的風味分子的數據受到文獻調查中有關它們的信息的可用性的限制。
同樣,資料庫中顯示的成分本身並不詳盡,因為它們的選擇受到風味化合物報告的限制。此外,目前的資料庫主要關注天然成分的風味特徵,因此,我們的風味空間的癥結是由來自天然來源的風味分子組成的。
在未來,我們打算增加香料分子的覆蓋率,並尋找它們對人類健康的潛在影響。
我們的努力是將風味特徵與迄今尚未探索的實體和分子的特徵相結合。
http://cosylab.iiitd.edu.in/flavordb
參考文獻
1. Fisher,C. and Scott,T. (1997) Food Flavours: Biology and ChemistryRoyal Society of Chemistry.2. Shepherd,G. (2013) Neurogastronomy – How the Brain Creates Flavorand Why it Matters Columbia University Press.3. Malnic,B., Hirono,J., Sato,T. and Buck,L.B. (1999) Combinatorialreceptor codes for odors. Cell, 96, 713–723.4. Mouritsen,O.G. (2015) The science of taste. Flavour, 4, 1–2.5. Newcomb,R.D. and Ohla,K. (2013) The genetics and neuroscience offlavour. Flavour, 2, 17.6. Arn,H. and Acree,T.E. (1998) Flavornet: a database of aromacompounds based on odor potency in natural products. Dev. FoodSci., 40, 27.7. Wiener,A., Shudler,M., Levit,A. and Niv,M.Y. (2012) BitterDB: adatabase of bitter compounds. Nucleic Acids Res., 40, 413–419.8. Dunkel,M., Schmidt,U., Struck,S., Berger,L., Gruening,B.,Hossbach,J., Jaeger,I.S., Effmert,U., Piechulla,B., Eriksson,R. et al.(2009) SuperScent – a database of flavors and scents. Nucleic AcidsRes., 37, 291–294.9. Ahmed,J., Preissner,S., Dunkel,M., Worth,C.L., Eckert,A. andPreissner,R. (2011) SuperSweet-A resource on natural and artificialsweetening agents. Nucleic Acids Res., 39, D377–D382.10. Scalbert,A., Andres-Lacueva,C., Arita,M., Kroon,P., Manach,C.,Urpi-Sarda,M. and Wishart,D. (2011) Databases on foodphytochemicals and their health-promoting effects. J. Agric. FoodChem., 59, 4331–4348.11. Rothwell,J.A., Perez-Jimenez,J., Neveu,V., Medina-Remon,A., ´M』Hiri,N., Garc´ıa-Lobato,P., Manach,C., Knox,C., Eisner,R.,Wishart,D.S. et al. (2013) Phenol-Explorer 3.0: a major update of thePhenol-Explorer database to incorporate data on the effects of foodprocessing on polyphenol content. Database, 2013, bat07012. Jensen,K., Panagiotou,G. and Kouskoumvekaki,I. (2015)NutriChem: a systems chemical biology resource to explore themedicinal value of plant-based foods. Nucleic Acids Res., 43,D940–D945.13. Neveu,V., Perez-Jimenez,J., Vos,F., Crespy,V., du Chaffaut,L.,Mennen,L., Knox,C., Eisner,R., Cruz,J., Wishart,D. et al. (2010)Phenol-Explorer: an online comprehensive database on polyphenolcontents in foods. Database, 2010, bap024.14. Sterling,T. and Irwin,J.J. (2015) ZINC15––ligand discovery foreveryone. J. Chem. Inf. Model., 55, 2324–2337.15. Jain,A., Rakhi,N.K. and Bagler,G. (2015) Analysis of food pairing inregional cuisines of India. PLoS One, 10, e0139539.16. Ahn,Y.-Y., Ahnert,S.E., Bagrow,J.P. and Barabasi,A.-L. (2011) Flavor ´network and the principles of food pairing. Sci. Rep., 1, 196.17. Burdock,G.A. (2010) Fenaroli’s handbook of flavor ingredients.18. Wasmuth,E.V. and Lima,C.D. (2016) UniProt: the universal proteinknowledgebase. Nucleic Acids Res., 45, 1–12.19. Haider,N. (2010) Functionality pattern matching as an efficientcomplementary structure/reaction search tool: an open-sourceapproach. Molecules, 15, 5079–5092.20. IUPAC (2014) Compendium of chemical terminology.21. Serrano,M.A., Boguna,M. and Vespignani,A. (2009) Extracting themultiscale backbone of complex weighted networks. Proc. Natl.Acad. Sci. U.S.A., 106, 6483–6488.22. Bienfait,B. and Ertl,P. (2013) JSME: a free molecule editor inJavaScript. J. Cheminform., 5, 1–6.23. Blumenthal,H. (2008) The Big Fat Duck Cookbook BloomsburyPublishing.24. Keller,A., Gerkin,R.C., Guan,Y., Dhurandhar,A., Turu,G., Szalai,B.,Mainland,J.D., Ihara,Y., Yu,C.W., Wolfinger,R. et al. (2017)Predicting human olfactory perception from chemical features ofodor molecules. Science, 355, 820–826.25. Spence,C., Hobkinson,C., Gallace,A. and Fiszman,B.P. (2013) Atouch of gastronomy. Flavour, 2, 14.26. This,H. (2002) Molecular gastronomy. Angew. Chem. Int. Ed., 41,83–88.