ACS Cent. Sci.|利用深度學習實現流式肽合成的預測與優化

2020-12-04 DrugAI

大家好!今天為大家推薦一篇發表ACS. Cent. Sci.上的文章:Deep Learning for Prediction and Optimization of Fast-Flow Peptide Synthesis,文章的通訊作者是來自麻省理工的Bradley L. Pentelute和Rafael Gomez-Bombarelli,Pentelute教授專注的方向是蛋白質工程與藥物遞送,而Bombarelli教授則是從事計算輔助的合成方法學研究。

固相肽合成(SPPS)是人工合成多肽的重要手段,與基因重組表達相比,SPPS合成的肽不受序列與胺基酸種類的限制,因此使用範圍更廣。然而,SPPS涉及多個步驟的重複反應,對時間和體力的消耗非常大。近年來,流式化學技術的發展催生了自動合成儀化學平臺的設計與使用,作者的實驗室就設計了一個自動化的快速流式肽合成儀(AFPS),可以實現高效自動的SPPS。但是,合成過程中出現聚集等副反應的問題仍未得到解決。為了提高產率,作者設想通過算法對自動合成進行實時的優化。

為了實現這一設想,作者需要這種算法可以在合成條件與產率之間建立準確的聯繫,這一目標可以通過深度學習來實現。但是,有效的深度學習需要大量高質量且標準化的數據,這意味著不能簡單地從出版的資料中收集這些數據,因為它們是不同標準的且不一定可重複。為了獲得統一標準的高度可重複的數據,作者用AFPS在相同的優化參數下做了大量的脫保護合成步驟,獲得了35427個獨立的UV-Vis檢測數據。作者將每個合成反應中的前體序列和引入的胺基酸都用指紋圖譜編碼成類似條形碼的形式,這些條形碼包含胺基酸的側鏈、醯胺鍵和保護基等所有關鍵亞結構的信息。作者將這些條形碼信息和對應的合成參數(包括反應溫度、流速、偶聯試劑等)作為輸入,肽合成中Fmoc去保護的UV-Vis跡線的積分、高度和寬度作為輸出,這些變量是衡量反應是否成功的重要標準。作者在用收集到的數據訓練了深度神經網絡模型後,用該模型預測的UV-Vis跡線與實驗所得數據在誤差允許範圍內是相匹配的。

作者使用該模型預測了聚集與序列的關聯性,聚集是SPPS中發生的最重要的副反應之一,但是聚集與肽段序列之間的關係尚不明確。發生聚集的特點是UV-Vis峰變得更平更寬,作者用寬高比對這一特徵進行量化定義,並用訓練的模型準確判斷出了GLP-1在添加Ala18後發生的聚集。為了進一步了解聚集與序列間的關聯,作者用該模型預測了PDB中8000餘種蛋白質可能的聚集行為,發現芳基和較大側鏈的胺基酸最容易導致聚集。作為驗證,作者將選定的對待合成肽進行了單點突變並用模型判斷了所有突變體的發生聚集的可能性;隨後用實驗合成了其中幾個肽並將產率與模型預測進行了比較,二者是相符的。

最後,作者用該模型的預測結果作為指導去優化了AFPS自動合成過程中的參數,從而對於除了Trp之外的所有胺基酸都獲得了一個新的偶聯配方。實驗證明在優化的條件下大多數胺基酸的偶聯產率都提高了,但包括Trp在內的幾種胺基酸仍有進一步優化的空間。

綜上,作者利用一個深度學習模型對流式肽合成的產率進行了預測並用該模型指導了合成條件的優化。作者希望未來該模型能夠實現在合成過程中的實時調控,即根據上一步合成的表徵信息自動給出下一步合成的最佳優化條件。

本文作者:TZY責任編輯:LYP原文連結:https://pubs.acs.org/doi/abs/10.1021/acscentsci.0c00979原文引用:DOI:10.1021/acscentsci.0c00979

相關焦點

  • 【文獻推送】ACS Cent. Sci. |合成矽羅丹明和矽螢光素的通用方法
    合成Si-螢光素2. 合成Si-羅丹明3. 氟代SiRh染料用於生物分析標記螢光探針是生物學的重要研究工具。利用化學的手段調節螢光團的性質可將染料基於特定的應用場景進行微調。其中螢光素和羅丹明染料作為生物探針具有優異的性能1-2。
  • ACS Cent. Sci:用於亞單位疫苗持續共遞送的可注射水凝膠增強體液免疫
    該凝膠形成迅速,且能夠實現多化學組分的完全封裝。該設計中通過調節HPMC-C12與PEG-PLA的比例,能夠合成不同機械性能的凝膠。剪切速率掃描結果顯示,隨著剪切速率的增加,這些PNP水凝膠的粘度降低了2個數量級以上證明了它們剪切變稀的能力,意味著這些凝膠在注射過程中呈流動態,而當注射完成後在注射部位快速形成固體凝膠結構,防止混合組分從注射部位流出,這有助於形成局部炎症。
  • ACS Catal.:江西師大趙軍鋒課題組實現炔醯胺介導的大環內酯化
    鑑於大環內酯類化合物的重要性及其所面臨的問題,溫和、高效的大環內酯化策略一直是有機合成化學家所迫切需要的。近期,江西師範大學趙軍鋒課題組在非常溫和的反應條件下首次實現了炔醯胺介導的大環內酯化,該成果發表於ACS Catal.(DOI: 10.1021/acscatal.0c00523)。(圖片來源:ACS Catal.)
  • ACS Cent Sci:一種新型分子探針讓癌症幹細胞無處可逃
    他們描述了利用這種分子探針在多種人癌細胞系的體外培養物中和活小鼠體內鑑定出癌症幹細胞的有效性。圖片來自ACS Central Science, doi:10.1021/acscentsci.8b00313。論文通信作者、伊利諾伊大學香檳分校化學教授Jefferson Chan說,「這真地是首次能夠在癌症幹細胞存在的複雜環境中觀察到它們---不僅僅是在體外的細胞培養物或者人工腫瘤微環境中。觀察到它們是理解它們的第一步。
  • 餘桂華團隊ACS Cent. Sci.:基於易熔合金的下一代液態金屬電池
    本文來自微信公眾號:X-MOLNews人類社會的可持續發展依賴於對新能源的有效利用。相比於傳統的化石能源,太陽能、潮汐能、風能等環境友好的可再生能源受到了越來越多的關注,然而其隨機性、間歇性等特點又需要發展高效快捷的儲能技術以滿足人類的能源需求。
  • ACS Cent Sci:製造出可與細菌細胞通信的人工細胞
    圖片來自ACS Central Science, doi:10.1021/acscentsci.6b003302017年2月2日/生物谷BIOON/---在一項新的研究中,來自義大利特倫託大學的Sheref Mansy和同事們開發出通過細菌版本圖靈測試(Turing Test)的人工細胞。
  • 前沿| 利用遺傳算法優化神經網絡:Uber提出深度學習訓練新方式
    但是,Uber 近日發布的五篇論文表明,神經進化(neuroevolution)這種利用遺傳算法的神經網絡優化策略,也是訓練深度神經網絡解決強化學習(RL)問題的有效方法。這種方法可以使上百層的深度神經網絡成功進化,遠遠超過了以前的神經進化方法所展示的可能性。我們通過計算網絡輸出關於權重的梯度(即,和在傳統深度學習中使用誤差梯度不同)來實現這一點,使得在隨機突變的校準過程中,對最敏感的變量(相比其他變量而言)進行更加精細的處理,從而解決大型網絡中隨機變量的一個主要問題。
  • ACS Cent Sci:龐貝氏症治療取得突破
    在新的研究中,研究人員們合成了螢光化學"探針",能夠用於醫學診斷。這些工具允許科學家測量人類細胞提取物中GAA酶的水平,允許進行酶水平的快速檢測。研究人員說,這些化合物將為更有效的治療提供信息,最終導向更好的療法和個性化醫學。類似的診斷方法已經改進了其他遺傳病的醫療。
  • 關於深度學習未來發展方向的六項預測
    關於深度學習未來發展方向的六項預測 隨著深度學習在大規模市場化應用領域的快速推進,其將與數據可視化、商務智能與預測分析一道成為眾多行業的立足基石。本文將與大家一同探討關於深度學習未來發展方向的六項預測。
  • 「可解釋學習」利用SHAP對分子活性預測機器學習模型進行解釋
    文章利用可解釋學習方法SHAP(SHapley Additive exPlanation)對基於複雜機器學習模型的分子活性預測模型進行解釋,嘗試打開「黑箱」。——背景——眾所周知,機器學習模型在藥物研究中取得了許多優秀的成果,其中包括分子性質預測、從頭藥物設計、分子合成分析等多個方面。
  • 「深度學習」通過學習勢能函數實現蛋白質的結構預測
    然而在很多情況下,蛋白質的三維結構信息是難以獲得的,因此有必要藉助基於理論計算的方法對其結構進行預測。深度神經網絡(DNN)近期在蛋白質結構預測方面展現出了優異的表現,該領域常用的方法包括(1)胺基酸殘基間距預測(參考:AlphaFold開啟了新方向嗎)以及(2)相鄰殘基間的扭轉角預測(參考:最新蛋白結構預測模型-循環幾何網絡RGN),這些方法在往期的推送中都有所涉及。
  • 深度學習在醫學影像中的研究進展及發展趨勢
    如何藉助大數據和人工智慧技術,深入挖掘海量的醫學圖像信息,實現基於影像數據的智能診斷、智能臨床決策以及治療預後,已成為目前的研究熱點。深度學習屬於機器學習的分支,是目前實現人工智慧技術的重要手段。隨著深度學習技術在圖像處理和計算機視覺領域的廣泛應用,利用深度學習技術輔助臨床診斷和決策已成為醫學圖像分析領域的研究重點。
  • 西北工大欽傳光教授團隊在多肽合成領域取得重要進展
    (GPS),成功地實現了藥物分子普卡那肽(Plecanatide,商品名稱:Trulance)的液相全合成。相比於傳統的利用樹脂固相多肽合成方法,該論文提出了更優的無樹脂合成策略來合成長鏈雙環的普卡那肽
  • 英偉達Volta架構深度解讀:專為深度學習而生的Tensor Core到底是...
    而解決這些日益複雜的問題則需要日益複雜的深度學習模型,為深度學習提供強大的計算硬體是英偉達努力的目標。圖 1. Tesla V100 加速卡內含 Volta GV100 GPU,以及 SXM2 Form Factor。高性能計算設備(HPC)是現代科學的基礎,從預測天氣、發明新藥到尋找新能源,大型計算系統能為我們模擬和預測世界的變化。
  • CellPress|單細胞技術和基於深度學習的藥物反應預測
    目前,深度學習模型已經能夠從大量複雜的序列數據中提取出特徵,用於預測藥物的反應。論文的作者總結了近來單細胞技術和基於深度學習方法的藥物敏感性預測模型。作者認為,通過利用大規模的序列數據,深度學習模型可以幫助我們更好的利用單細胞數據去完成藥物反應預測任務。下圖是單細胞數據結合深度學習模型的一個概述圖。
  • |FBGAN:優化蛋白質功能的反饋-循環架構
    在本文中,作者運用GANs生成編碼變長蛋白質的DNA序列,並提出了一種名為反饋GAN(Feedback GAN,FBGAN)的反饋-循環(feedback-loop)架構,並用此架構合成基因序列往某個所需屬性優化。該架構還利用了一個稱為外部函數分析器(external function analyzer)的結構,並且此分析器無需是可微分的。
  • 研究人員利用深度學習探究RNA 為COVID-19診斷儀開發傳感器
    他們使用深度學習來分析大量的趾甲開關序列,以準確預測哪些趾甲能夠可靠地執行預期任務,從而使研究人員能夠為他們的實驗確定高質量的趾甲。他們的研究結果今天已經在《自然》雜誌上分別發表了兩篇論文。對於解決任何機器學習問題,第一步是收集特定領域的數據來訓練模型。研究人員收集了一個由腳趾頭開關序列組成的大型數據集。聯合第一作者、在Wyss工作的研究生Alex Garruss表示。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    近年來,計算方法在基於其胺基酸序列的知識預測蛋白質如何摺疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和範圍方面受到限制。現在,哈佛醫學院的一位科學家使用了一種稱為深度學習的人工智慧來預測基於其胺基酸序列的任何蛋白質的三維結構。
  • 使用Python從頭開始實現深度學習庫
    理解深度學習平臺基本構建基礎的初學者指南。深度學習已在短時間內從簡單的神經網絡演變為非常複雜的架構。為了支持這種快速擴展,在此過程中開發了許多不同的深度學習平臺和庫。這些庫的主要目標之一是提供用於構建和訓練深度學習模型的易於使用的界面,使用戶可以將更多的精力放在手頭的任務上。
  • 微軟推出深度學習加速平臺「Project Brainwave」
    近日在 Hot Chips 2017 上,微軟團隊推出了一個新的深度學習加速平臺,其代號為腦波計劃(Project Brainwave),機器之心將簡要介紹該計劃。腦波計劃在深度學習模型雲服務方面實現了性能與靈活性的巨大提升。微軟專為實時人工智慧設計了該系統,它可以超低延遲地處理接收到的請求。