科學家開發卷積神經網絡預測三維基因組

2021-01-19 科學網

科學家開發卷積神經網絡預測三維基因組

作者:

小柯機器人

發布時間:2020/10/15 15:45:23

格萊斯頓研究所的數據科學和生物技術Katherine S. Pollard小組在研究中取得進展。他們開發了Akita用於基於DNA序列預測三維基因組。 相關論文發表在2020年10月12日出版的《自然—方法學》雜誌上。

這裡研究團隊提出一個卷積神經網絡Akita,只通過DNA序列就可以準確地預測基因組的摺疊。由Akita學習的演示強調了一個特定方向語法對於CTCF結合位點的重要性。Akita學到了基因組摺疊中可預測的核苷酸水平特徵,揭示了核心CTCF模體(motif)以外核苷酸的作用。訓練後,Akita可以進行快速的計算機模擬預測。為展示Akita的預測能力,課題組人員演示Akita如何進行計算機上的飽和突變(saturation mutagenesis),解釋eQTLs,預測結構變異以及探測特定種類的基因組摺疊。總而言之,這些結果使得能夠從序列到結構解碼基因組功能。

據悉,在複製間期,人類基因組序列在三維空間摺疊成多樣的基因座特有的聯繫模式。黏著蛋白和CTCF(CCCTC結合因子)是關鍵調控因子。如通過染色體構象捕獲方法所測定的,幹擾任一水平都會極大地破壞全基因組摺疊。一個給定DNA序列如何編碼基因座特有的摺疊模式仍然是未知的。

附:英文原文

Title: Predicting 3D genome folding from DNA sequence with Akita

Author: Geoff Fudenberg, David R. Kelley, Katherine S. Pollard

Issue&Volume: 2020-10-12

Abstract: In interphase, the human genome sequence folds in three dimensions into a rich variety of locus-specific contact patterns. Cohesin and CTCF (CCCTC-binding factor) are key regulators; perturbing the levels of either greatly disrupts genome-wide folding as assayed by chromosome conformation capture methods. Still, how a given DNA sequence encodes a particular locus-specific folding pattern remains unknown. Here we present a convolutional neural network, Akita, that accurately predicts genome folding from DNA sequence alone. Representations learned by Akita underscore the importance of an orientation-specific grammar for CTCF binding sites. Akita learns predictive nucleotide-level features of genome folding, revealing effects of nucleotides beyond the core CTCF motif. Once trained, Akita enables rapid in silico predictions. Accounting for this, we demonstrate how Akita can be used to perform in silico saturation mutagenesis, interpret eQTLs, make predictions for structural variants and probe species-specific genome folding. Collectively, these results enable decoding genome function from sequence through structure. 

DOI: 10.1038/s41592-020-0958-x

Source: https://www.nature.com/articles/s41592-020-0958-x

相關焦點

  • 贈書|人工智慧識萬物:卷積神經網絡的前世今生
    在前述章節的基礎上,本章將主要介紹訓練卷積神經網絡和深度神經網絡的重要方法與技巧,深度神經網絡的遷移學習策略,以及如何訓練深度神經網絡以解決實際問題等內容。發展至80年代,日本科學家Kunihiko Fukushima 通過研究並融合有關生物視覺的相關領域知識,提出了Neocognitron 神經認知機的概念,該神經認知機由S 細胞和C 細胞構成,可通過無監督的方式學習識別簡單的圖像。
  • 人工智慧之卷積神經網絡(CNN)
    ^_^本文引用地址:http://www.eepw.com.cn/article/201806/381807.htm  20世紀60年代,Hubel和Wiesel在研究貓腦皮層中用於局部敏感和方向選擇的神經元時發現其獨特的網絡結構可以有效地降低反饋神經網絡的複雜性,繼而提出了卷積神經網絡CNN(Convolutional Neural Networks)。
  • 光學卷積神經網絡加速器:通過光學實現更強大的人工智慧!
    導讀據美國喬治·華盛頓大學官網近日報導,該校和加州大學洛杉磯分校的研究人員與深度科技創業公司 Optelligence LLC 共同開發出一種光學卷積神經網絡加速器,每秒能夠處理拍字節創新近日,美國喬治·華盛頓大學和加州大學洛杉磯分校(UCLA)的研究人員與深度科技創業公司 Optelligence LLC 共同開發出一種光學卷積神經網絡加速器,每秒能夠處理拍字節(1拍字節=2^50位元組)級的大量信息
  • 從特徵檢測器到視覺轉換器:卷積神經網絡的時代到此結束了嗎?
    圖源:unsplash近十年來,卷積神經網絡一直在全球計算機視覺研究領域發揮著主導作用。但研究者們正在提出一種新方法,想要利用轉換器的功能賦予圖像更深層的意義。卷積神經網絡(CNN)存在的問題在深入研究視覺轉換器的運行方式之前,釐清卷積神經網絡的缺點和根本缺陷很有必要。首先,卷積神經網絡無法編碼相對空間信息。也就是說,它僅關注於檢測某些特徵,而忽略了相對空間位置。上面兩幅圖像都會被識別為人臉,因為卷積神經網絡只關注輸入圖像中是否存在某些特徵,而忽略了它們相對於彼此的位置。
  • 從圖(Graph)到圖卷積(Graph Convolution):漫談圖神經網絡 (二)
    在從圖(Graph)到圖卷積(Graph Convolution): 漫談圖神經網絡 (一)中,我們簡單介紹了基於循環圖神經網絡的兩種重要模型,在本篇中,我們將著大量筆墨介紹圖卷積神經網絡中的卷積操作。
  • 時間卷積網絡:時間序列的下一場革命?
    我們首先介紹運動檢測的案例研究,並簡要回顧一下TCN架構及其相對於傳統方法(如卷積神經網絡(CNN)和遞歸神經網絡(RNN))的優勢。然後介紹了TCN的幾個新穎應用,包括改善交通預測,聲音事件定位和檢測以及概率預測。TCN簡要回顧Lea等人的開創性工作。(2016)首先提出了基於視頻的動作分割的時間卷積網絡(TCN)。
  • 卷積神經網絡的卷積到底是什麼
    打開APP 卷積神經網絡的卷積到底是什麼 人工智慧遇見磐創 發表於 2020-05-05 08:40:00 卷積神經網絡是一種特殊的神經網絡結構,是自動駕駛汽車、人臉識別系統等計算機視覺應用的基礎,其中基本的矩陣乘法運算被卷積運算取代。
  • 卷積神經網絡預測模型:提前24個月預測ENSO
    但目前業務部門一般的ENSO 預測時效只有6~9個月,最長為1年左右,這樣的預報時效無法滿足現實需求。較長時間的ENSO預測也是國際上的難點,如何延長ENSO的預測時效,成為眾多科學家迫切想要解決的問題。羅京佳及其研究團隊目前正在攻克這個難題。2016年3月,羅京佳被一個新聞熱點所吸引——「人工智慧擊敗世界圍棋冠軍」。
  • 反之亦然,科學家開始用深度神經網絡解釋人類大腦
    老實說,在我的實驗室裡,之前沒有人用深層網絡做任何事情,"麻省理工學院神經科學家南希-坎維舍說,"而現在,他們中的大多數人反而常常去訓練神經網絡模型。"01深度網絡和視覺人工智慧裡的神經網絡是由相互連接的感知器構建的,感知器是一種生物神經元的簡化數學模型。在這種神經網絡裡至少有兩層感知器,一層是輸入層,一層是輸出層。
  • 從全卷積網絡到大型卷積核:深度學習的語義分割全指南
    2014年,加州大學伯克利分校的Long等人提出全卷積網絡(FCN),這使得卷積神經網絡無需全連接層即可進行密集的像素預測,CNN從而得到普及。使用這種方法可生成任意大小的圖像分割圖,且該方法比圖像塊分類法要快上許多。之後,語義分割領域幾乎所有先進方法都採用了該模型。  除了全連接層,使用卷積神經網絡進行語義分割存在的另一個大問題是池化層。
  • 表徵圖數據絕不止圖神經網絡一種方法
    連結預測:以往,我們並不知道缺乏哪些連結或未來會形成哪些連結。從宏觀上說,連結預測任務旨在預測網絡結構如何隨著現有的成員形成新的連結、斷開連接而演化。例如,在「蛋白質-蛋白質」交互網絡中,連結預測可以確定蛋白質之間新的交互。
  • 表徵圖數據,絕不止圖神經網絡一種方法
    雖然現在深度神經網絡在物體識別、圖像分類和自然語言處理領域都取得了巨大的成功。然而,「設計出最優的神經網絡,學習並輸出任意的圖」仍然是一個熱門的研究課題。本文是一篇出自倫敦大學學院的圖表徵學習綜述,詳細介紹了圖核、卷積、圖神經網絡、圖嵌入、概率模型共五類圖表徵學習方法的起源與發展,並對圖數據表徵學習方法的最新進展和未來發展方向進行總結和討論。
  • NeurIPS 2020最佳論文;全卷積網絡實現E2E目標檢測
    利用不同方法的預測分類可視化示意圖。推薦:原來,丟棄 Transformer,全卷積網絡也可以實現 E2E 檢測。Transformer Network for Video Frame Synthesis作者:Zhouyong Liu、Shun Luo、Wubin Li、Jingben Lu、Yufan Wu、Chunguo Li、Luxi Yang論文連結:https://arxiv.org/pdf/2011.10185.pdf摘要:深度卷積神經網絡
  • 深度神經網絡預測8小時內降水:解析度小到1公裡、間隔2分鐘
    另一種天氣預測方法就是使用深度神經網絡,深度神經網絡不僅能夠克服這些局限,而且由於它不是對顯性物理定律進行編碼,而是發現其中的數據模式,同時藉助GPU和TPU這類專用硬體強大的並行計算能力,學習從輸入到合理輸出的複雜轉化。
  • GCN圖卷積網絡入門詳解
    字幕組雙語原文:【GCN】圖卷積網絡(GCN)入門詳解英語原文:Graph Convolutional Networks (GCN)翻譯:聽風1996、大表哥在這篇文章中,我們將仔細研究一個名為GCN的著名圖神經網絡。
  • 圖神經網絡前沿綜述:動態圖網絡
    雪梨科技大學的 Katarzyna 團隊最近發表了預印本論文,對實際的複雜網絡以時間尺度進行分類,並以此為基礎總結了目前用於表徵動態複雜網絡數據的各種圖神經網絡架構。最近,她的團隊將精力集中在利用機器學習和可預測性模型來研究動態複雜網絡。 本綜述可以分為以下幾部分: 動態網絡的分類和表示; 作為動態網絡編碼器的DGNN; 動態網絡表徵的解碼與結構預測:以鏈路預測為例。
  • 百度李偉彬:基於PGL的圖神經網絡基線系統
    報告內容:傳染病的有效防治是全人類面臨的共同挑戰,如何通過大數據,特別是數據的時空關聯特性,來精準預測傳染病的傳播趨勢和速度,將有助於人類社會控制傳染病,保障社會公共衛生安全。而數據上的空間關聯特性,恰好是圖神經網絡所擅長的。圖神經網絡在非結構化數據上有著出色的處理能力,使得最近一段時間圖神經網絡在學界與工業界上大放光彩。
  • 【GNN】從圖(Graph)到圖卷積(Graph Convolution):漫談圖神經網絡模型 (一)
    轉載自 https://www.cnblogs.com/SivilTaram/p/graph_neural_network_1.html,點擊閱讀原文跳轉至原文地址本文屬於圖神經網絡的系列文章,文章目錄如下:從圖(Graph)到圖卷積(Graph Convolution):漫談圖神經網絡模型 (一)
  • Yann LeCun引爆AI社區:1993年文本識別卷積網絡演示視頻,獲上千人...
    據了解,這項代碼開發主要是為了應用於NCR(National Cash Register Coporation)的支票讀取系統。不過,到了1998年,Yann LeCun及其合作者共同構建了更加完備的卷積神經網絡LeNet-5,並在手寫數字的識別問題中取得了進一步的成功。截止90 年代末期,該系統已經處理了美國 10%-20%的支票識別。其實,LeNet-5神經網絡早在1989年已經被LeCun提出。
  • 機器學習之神經網絡(1)
    其實神經網絡技術的靈感來自人體內的神經結構。(可以細細體會一下~)由此,神經網絡的理論開始大放異彩,再加上如今硬體設備的發達以及網絡結構的不斷簡化,神經網絡得到了很好的發展。多層前饋神經網絡單層感知器也就是「神經元」是所有神經網絡的核心,由上面的介紹可以知道,其主要由一個加法器和一個激活函數組成。