谷歌開發出的深度學習算法模型,可用於預測DNA鏈等亞細胞結構的變化

2020-11-22 鎂客網

該算法通過研究細胞的變化來進一步研究相關疾病的變化,獲得了多項人類尚未發現的研究成果。

眼睛是心靈的窗口,但從去年開始,谷歌的研究團隊就利用機器學習將眼睛轉化為檢查人體健康的「窗口」,他們通過算法分析人體的高精度3D視網膜照片發現,圖像裡面包含的信息可以用來判斷出一個人的血壓、年齡和吸菸狀況。

近日,研究團隊又獲得了新的進展,利用算法分析其亞細胞結構(如線粒體、染色體、DNA鏈等)的變化後,發現了通過分析「眼睛」,我們可以判斷一個人是否有患心臟病的風險。

不同於以往,這裡的研究成果不斷,背後的首要功臣是谷歌研究團隊開發的3D細胞結構模型的算法。繼Alpha Go之後,谷歌研究團隊又一「黑科技」秒殺人類。

其實揭開它的神秘面紗,其核心就是圖像處理算法。

圖像處理是如何應用到生物學領域的?

在生物學研究領域,細胞生物學的研究核心點就是:結構決定功能。其中,蛋白質學中就有理論明確提出,細胞的狀態由細胞內結構的位置以及細胞周期的改變來確定。

在這一背景下,研究學者自然就想到從3D顯微鏡圖像切入研究細胞結構,希冀藉由圖像處理來進行生物學的研究。而隨著科技的發展,深度學習成為圖像處理領域的最佳利器,故而許多研究人員開發出了算法,以用於處理活細胞等微生物螢光圖像:

如當科學家希望利用深度學習來分析基因組中的基因突變,他們先將DNA鏈中的鹼基轉換為計算機可以識別的圖像,然後將已知的DNA突變片段信息與基因組信息一起用於訓練神經網絡系統,隨後用機器學習進行預測和數據分析。

但是谷歌研究團隊發現,這一過程本身存在著一項技術缺陷:因為現有算法模型處理2D圖像,所以在利用其對生物圖像進行處理之前,每一次都首先需要對3D圖像進行處理,以將其轉換為現有圖像處理算法能夠處理的照片。

可見,想將深度學習用於生物學研究領域,「磨刀」的功夫就需要花費很久,將每一項研究的3D圖像轉化為2D圖像極大得降低了研究效率、限制了圖像處理算法在生物醫學研究上的應用。

谷歌團隊讓生物學圖像處理更輕鬆,研究成果不斷

為了解決圖像維度轉換過程帶來的應用局限性,谷歌研究團隊基於卷積神經網絡提出了一種條件生成模型,他們可以直接利用3D顯微鏡圖像對模型算法進行訓練,以用於學習細胞和細胞核形態的變化,並利用訓練後的模型分析預測亞細胞結構的位置。

上個月,谷歌就基於該模型發布了一款名為DeepVariant的工具,人們可以用它來識別DNA序列中的細微變化。

但不止於此,谷歌研究團隊還整合了條件生成模型和傳統的算法處理方法,提出了一種不需要參數的3D細胞結構模型的算法,它可以直接處理高精度的三維生物器官圖像。

此外,這種新算法還可以將細胞內部結構的變化和細胞的變化結合在一起,以用於研究相關疾病的變化。在最新的報告中,研究團隊給出了初步的實驗結果,即其在心臟病預測上的應用。

圖像處理算法因此更強大

對於該算法,谷歌研究院工程總監Philip Nelson介紹說:「之前,將機器學習應用於很多生物學領域是不切實際的。現在,我們可以做到了。但更讓人激動的是,如今機器能發現之前人類可能無法看到的東西。」

值得指出的是,谷歌開發的這種方法本質上就是一種通用的圖像處理算法,不僅可以用於通常的圖像識別,還可以用於生物學領域高精度三維圖像的分析和相關細胞變化的預測。

最後,記得關注微信公眾號:鎂客網(im2maker),更多乾貨在等你!

相關焦點

  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    可視化模擬AlQuraishi的蛋白質摺疊深度學習方法。該模型通過反覆預測結構(彩色)並將其預測與地面真實結構(灰色)進行比較來訓練。這是重複成千上萬的已知蛋白質,隨著模型的學習和提高其準確性的每一次迭代。蛋白質從二十多種的胺基酸中構建起來,這就像把字母從字母表中挑出來,連詞逐句構建文章。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    深入培訓為了開發新方法,AlQuraishi應用了所謂的端到端可微分深度學習。人工智慧的這一分支極大地降低了解決圖像和語音識別等問題所需的計算能力和時間,從而實現了Apple的Siri和Google Translate等應用程式。
  • 速度提高100萬倍,哈佛醫學院提出可預測蛋白質結構的新深度模型
    蛋白質摺疊方式的計算方法有可能大大降低確定蛋白質結構的成本和時間。但經過近四十年的不懈努力,這個難題仍未解決。可視化模擬 AlQuraishi 的蛋白質摺疊深度學習方法。模型通過反覆預測某個結構(彩色)並將其預測與真實結構(灰色)對比來實現自訓練。
  • 深度學習預測RNA二級結構,螞蟻金服提出端到端模型E2Efold
    本文將介紹一種用於預測 RNA 二級結構的端到端深度學習模型 E2Efold,在結構預測方面具有顯著更優表現,同時大大縮短新冠病毒 RNA 二級結構預測時間,為病毒研究、藥物篩選、疫苗研製等工作提供更多助力。這項成果來自螞蟻金服的研究團隊,目前這篇論文已被 ICLR 2020 接收為 Talk 論文。
  • 深度學習算法,加快新興科技產業材料發現
    相反,研究人員已經開發出一種基於深度學習的智能算法,該算法使用一種稱為生成對抗網絡(GAN)模型的技術,大幅提高材料搜索效率,高達兩個數量級。它有可能大大加快新型功能材料的發現。這項研究發表在NPJ計算材料上,是南卡羅來納大學工程與計算學院的研究人員和位於中國貴陽的研究大學貴州大學合作出版的。
  • 谷歌AI可預測新冠病毒蛋白質結構 或有助於遏制全球爆發
    谷歌的英國研究團隊剛剛使用DeepMind的新深度學習系統AlphaFold預測新型冠狀病毒的蛋白質結構。該系統使用被稱為「自由建模」的機器學習技術,當沒有類似的蛋白質結構可用時,它可以自主生成新的蛋白質結構。據最新統計,世界各地的科學家都在竭盡全力了解這種新病毒,DeepMind的發現希望減少確定病毒蛋白質結構的時間。
  • 機器學習算法集錦:從貝葉斯到深度學習及各自優缺點
    )集成方法是由多個較弱的模型集成模型組,其中的模型可以單獨進行訓練,並且它們的預測能以某種方式結合起來去做出一個總體預測。它比使用單個模型預測出來的結果要精確的多缺點:需要大量的維護工作決策樹算法(Decision Tree Algorithm)決策樹學習使用一個決策樹作為一個預測模型,它將對一個 item(表徵在分支上)觀察所得映射成關於該 item 的目標值的結論(表徵在葉子中)。
  • |可解釋膠囊網絡深度學習框架從單細胞RNA測序...
    文中提出了一個使用膠囊網絡(稱為scCapsNet)的可解釋的深度學習體系結構。膠囊結構(代表一組特定對象屬性的神經元向量)捕捉層次關係。通過利用競爭性單細胞類型識別,scCapsNet模型能夠進行特徵選擇以識別編碼不同亞細胞類型的基因組。將RNA表達特徵有效地整合到scCapsNet的參數矩陣中,實現了亞細胞類型識別。
  • 谷歌《Cell》論文:光學顯微鏡+深度學習=螢光顯微鏡
    隨著包括圖像質量自動評估算法和協助病理醫師診斷癌組織在內的機器學習技術在顯微鏡領域的應用越來越廣泛,谷歌因此考慮是否可以結合透射光顯微鏡和螢光顯微鏡這兩種顯微鏡技術來開發一種深度學習系統,從而最大限度降低兩者的不足之處。
  • 谷歌AI可預測新冠病毒蛋白結構,有助於研究人員阻止其全球爆發
    這個位於英國的團隊剛剛使用了DeepMind的新深度學習系統,IT之家了解到,該系統使用一種稱為「自由建模」的機器學習技術,當沒有相似的蛋白質結構可用時,幫助它預測蛋白質結構。DeepMind的發現希望減少確定病毒蛋白質結構的時間。
  • 深度學習「賦能」光子結構設計
    單層感知器只能學習線性函數,而多層感知器也可以學習非線性函數。 基於多層感知器的光子學設計 在2018年,Itzik Malkiel及其同事提出了一種雙向多層感知器設計方法,該模型可用於設計等離子體納米結構。如圖所示是一種H型金屬結構。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    因此,科學家們開始利用AI技術開發深度學習算法,在基因組學數據的基礎上對蛋白質結構進行預測。在此基礎上,AlphaFold誕生了。和以往方法不一樣的是,AlphaFold並未使用已經明確結構的蛋白質3D模型作為模板,而是從頭開始探索預測方法。
  • 機器學習算法盤點:人工神經網絡、深度學習
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。   在非監督式學習中,數據並不被特別標識,學習模型是為了推斷出數據的一些內在結構。常見的應用場景包括關聯規則的學習以及聚類等。常見算法包括Apriori算法以及k-Means算法。
  • 深度學習預測比特幣價格;基於神經網絡的自動化前端開發 | Github...
    用深度學習預測虛擬貨幣價格 —— ethereum_futureGithub 地址:https://github.com/llSourcell/ethereum_future這是 Youtube 網紅小哥 Siraj Raval 「Ethereum Future Price Prediction」視頻的代碼,視頻 B 站連結:https://www.bilibili.com
  • 谷歌大腦負責人Jeff Dean:深度學習技術及趨勢報告 | 網際網路數據...
    >容易分享模型,開發代碼應用到可重用的效果通過同一個系統把研究工作直接用於生產環境初期重點是:儘可能拓展計算機的感知和語言理解能力隨著時間推移,深度學習在谷歌得到越來越廣泛的應用神經網絡特點(略)深度學習在谷歌的應用語音識別
  • 開發出單鏈DNA/RNA摺紙術
    第二種方法是DNA支架(scaffolded DNA),在這種DNA支架中,通過使用輔助性的DNA鏈,讓單鏈DNA形成一種結構,其中這些輔助性的DNA鏈將這種結構固定在原位。Zhang說,「就合成而言,這兩種方法的可擴展性都不太好。當你具有如此多的短鏈DNA時,你不能夠利用生物系統對它們進行複製。解決這個問題的一種方法是設計一條能夠自我摺疊成任何結構的長鏈DNA。」
  • 盤點金融領域裡常用的深度學習模型
    要解決這個問題,如果我們考慮到深度學習在圖像識別、語音識別或情感分析方面所做的研究,我們就會看到這些模型能夠從大規模未標記數據中學習,形成非線性關係的遞歸結構,可以輕鬆予以調整以避免發生過度擬合。如果金融生態圈能夠使用這些網絡進行建模,應用領域就會深遠而廣泛。這些模型可用於定價、投資組合構建、風險管理甚至高頻交易等領域,讓我們來解決這些問題。
  • 機器學習算法匯總:人工神經網絡、深度學習及其它
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。常見算法有邏輯回歸(Logistic Regression)和反向傳遞神經網絡(Back Propagation Neural Network) 非監督式學習: 在非監督式學習中,數據並不被特別標識,學習模型是為了推斷出數據的一些內在結構
  • 當模型預測控制遇見機器人學習
    本文將不使用任何讓人敬而遠之的公式,試圖通過自然語言深入淺出的討論,當模型預測控制遇見機器學習,它們會擦出怎樣的思想火花。機器學習方法可以分為如下幾種類別:監督學習:從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常見的監督學習算法包括回歸分析和統計分類。
  • 谷歌天氣模型MetNet 可預測未來8小時降水量
    在最新一期谷歌AI博客中,官方介紹了一款可以快速準確預測未來8小時內將水量的天氣模型MetNet,並表示該模型性能優於美國國家海洋和大氣管理局(NOAA)目前使用的最先進的物理模型,MetNet能在幾秒鐘內對整個國家進行預測,而此前則需要一個小時左右。