沒有完整圖時,如何使用圖深度學習?你需要了解流形學習2.0版本

2020-12-05 澎湃新聞

機器之心編譯

編輯:陳萍

流形學習,自 2000 年在著名的科學雜誌《Science》被首次提出以來,已成為信息科學領域的研究熱點。可能很多人會問,流形學習有什麼用呢?首先流形學習可以作為一種數據降維的方式,第二,流形能夠刻畫數據的本質。其主要代表方法有等距映射、局部線性嵌入等。那麼,具有流形學習 2.0 之稱的潛圖學習方法如何呢?

自從神經網絡提出以來,其在人臉識別、語音識別等方面表現出卓越的性能。以前需要人工提取特徵的機器學習任務,現在通過端到端的方法就能解決。

傳統的深度學習方法在提取歐氏空間數據(比如圖片是規則的正方形柵格,語音數據是一維序列)的特徵方面取得了巨大的成功。但是,在許多任務中,數據不具備規則的空間結構,即非歐氏空間下的數據,如電子交易、推薦系統等抽象出來的圖譜,圖譜中每個節點與其他節點的連接不是固定的。在經典的 CNN、RNN 等框架無法解決或效果不好的情況下,圖神經網絡應運而生。

圖左(紅框):歐氏空間數據;圖右:非歐氏空間數據。

圖神經網絡利用關係歸納偏置來處理以圖形式出現的數據。然而,在許多情況下,並沒有現成的圖。那麼圖深度學習適用於這類情形嗎?本文將介紹潛圖學習(latent graph learning)和更早的流形學習(manifold learning)。

潛圖學習

在過去的幾年裡,人們對使用機器學習方法處理圖結構數據產生了濃厚的興趣。這類數據自然也出現在許多應用中,例如社會科學(如 Twitter 或 Facebook 上的用戶 Follow 圖)、化學(分子可被建模為鍵連接的原子圖)或生物學(不同生物分子之間的相互作用通常被建模為相互作用組圖)。圖神經網絡(GNN)是一種特別流行的圖學習方法,該算法通過在相鄰節點之間交換信息的共享參數進行局部操作。

然而,在某些情況下,沒有現成的圖可以作為輸入。在生物學中尤其如此,諸如蛋白質 - 蛋白質相互作用的圖只有部分已知,因為發現蛋白質相互作用的實驗費用昂貴,而且噪聲很大。因此,研究者從數據中推斷出圖並在其上應用 GNN,並將其稱為「潛圖學習」。潛圖學習特定於應用,並針對下遊任務進行了優化。此外,有時這樣的圖可能比任務本身更重要,因為它可以傳達關於數據的重要洞察,並提供解釋結果的方法。

潛圖學習是學習具有空邊集的圖。在這一設置中,輸入為高維特徵空間中的點雲。在集合上進行深度學習的方法(如 PointNet)對每個點應用共享可學習 point-wise 函數,與之不同,潛圖學習還尋求跨點信息傳遞。

DGCNN

點雲動態圖卷積神經網絡(DGCNN)是第一個這樣的架構,該架構由麻省理工學院的 Yue Wang 開發。受計算機圖形學中涉及 3D 點雲分析問題的啟發,該架構將圖用作點雲下局部光滑流形結構的粗略表示。Yue 的一個重要發現是,圖在整個神經網絡中不需要保持不變,事實上,它可以而且應該動態更新——因此該方法被命名為 DGCNN。

DGCNN 動態構造一個用於特徵擴散的 k 近鄰圖。圖依賴於任務,並在每個層之後更新。這幅圖(摘自 [4])展示了與紅點的距離(黃色代表更近的點),表明在分割任務中,更深層次的圖捕捉語義關係而不是幾何關係,如成對的機翼、發動機等。

DGM

DGCNN 的一個局限性是用相同的空間來構造圖和圖上的特徵。Anees Kazi 和 Luca Cosmo 提出了一種新的架構——可微圖模塊(DGM),通過對圖和特徵構造進行解耦來擴展 DGCNN,如下圖所示:

DGM 提供了一種基於輸入數據構造圖並在圖上擴散特徵的機制。(圖源:[5])

當應用於醫學領域問題時,DGM 顯示出優秀的結果,例如根據腦成像數據預測疾病。在這些任務中,研究者獲取到多個患者的電子健康記錄,包括人口統計學特徵(如年齡、性別等)和大腦成像特徵,並嘗試預測患者是否患有神經系統疾病。之前的工作展示了 GNN 在這類任務中的應用,方法是在一個根據人口統計學特徵手工構建的「病人圖」上進行特徵擴散。而 DGM 提供了學習圖的優勢,可以傳達某些特徵在特定診斷任務中是如何相互依賴的。其次,DGM 在點雲分類任務中也擊敗了 DGCNN,不過優勢很小。

流形學習

DGCNN 和 DGM 在概念上與流形學習或非線性降維算法相似,流形學習很早就已出現並流行,且目前仍用於數據可視化。流形學習方法的基本假設是數據具有內在的低維結構。雖然數據可以在數百甚至數千維的空間中表示,但它卻只有幾個自由度,示例如下:

雖然這個數據集中的手部圖像是高維的(64x64 像素構成 4096 個維度),但它們本質上是低維的,可以用兩個自由度來解釋:手腕旋轉和手指伸展。流形學習算法能夠捕捉數據集的這種內在低維結構,並將其在歐幾裡德空間中進行表示。(圖源 [9])

再比如球面上的一點(即三維歐式空間上的點),可以用三元組來表示其坐標:

但事實上這個三維坐標只有兩個變量 θ 和 φ,也可以說它的自由度為 2,正好對應了它是一個二維的流形。

流形學習的目的是捕捉這些自由度,並將數據的維數降至其固有維數。流形學習與 PCA 等線性降維方法的重要區別在於,由於數據的非歐幾裡德結構,我們可能無法通過線性投影恢復流形。如下圖所示,線性降維(左)為線性降維,流形學習(右)為非線性降維。

流形學習算法在恢復「流形」方法上各不相同,但它們有一個共同的藍圖。

首先,創建一個數據表示,通過構造一個 k 近鄰圖來獲取其局部結構。其次,計算數據的低維表示(嵌入),並試圖保留原始數據的結構。這是大多數流形學習方法的區別所在。這種新的表示將原來的非歐幾裡德結構「展平」成一個更容易處理的歐幾裡德空間。第三,一旦計算出表示,就會對其應用機器學習算法(通常是聚類)。

多種流形學習方法的藍圖:首先,將數據表示為圖;其次,計算該圖的低維嵌入;第三,將 ML 算法應用於這種低維表示。

這其中面臨的一項挑戰是圖構建與 ML 算法的分離,有時需要精確的參數調整(例如鄰域數或鄰域半徑),以確定如何構建圖才能使下遊任務正常運行。流形學習算法更嚴重的缺點或許是:數據很少表示為低維的原始形式。例如,在處理圖像時,必須使用各種人工制定的特徵提取技術作為預處理步驟。

圖深度學習提供了一種現代方法,即用單個圖神經網絡代替上文提到的三個階段。例如,在 DGCNN 或 DGM 中,圖的構造和學習是同一架構的一部分:

潛圖學習可以看作是流形學習問題的一種現代設置,在這裡,圖被學習並用作某些下遊任務優化的端到端 GNN pipeline 的一部分。

這種方法的吸引力在於:將單個數據點和它們所在的空間結合在相同的 pipeline 中。在圖像的例子中,我們可以使用傳統的 CNN 從每個圖像中提取視覺特徵,並使用 GNN 來建模它們之間的關係。

PeerNet 是標準 CNN 中基於圖的正則化層,可聚合來自多個圖像的相似像素,從而降低對對抗性擾動的敏感性。(圖源 [12])

潛圖學習的其它應用

潛圖學習還有許多其他有趣的應用。

第一是少樣本學習:利用基於圖的方法從少量樣本中進行歸納(重點:只需要少量帶有標註的樣本)。在計算機視覺中,數據標註量從幾千到上萬不等,成本很高,因此少樣本學習變得越來越重要。

第二是生物學領域:人們經常通過實驗觀察生物分子如蛋白質的表達水平,並試圖重建它們的相互作用和信號網絡。

第三是對物理系統的分析:其中圖可以描述多個對象之間的交互作用。尤其是處理複雜粒子相互作用的物理學家,最近對基於圖的方法表現出了濃厚的興趣。

第四是 NLP 問題:在 NLP 領域中,圖神經網絡可以看作是 transformer 架構的泛化。所提到的許多問題也提出了在圖結構中加入先驗知識,這一結構在很大程度上仍然是開放的:例如,人們可能希望強迫圖遵守某些構造規則或與某些統計模型兼容。

潛圖學習,雖然不是全新的領域,但它為舊問題提供了新的視角。對於圖機器學習問題而言,這無疑是一個有趣的設置,為 GNN 研究人員提供了新的方向。

參考連結:

https://towardsdatascience.com/manifold-learning-2-99a25eeb677d

https://zhuanlan.zhihu.com/p/75307407?from_voters_page=true

從算法到應用,入門聲紋技術。

10月19日,第一講:音頻基礎與聲紋識別。谷歌資深軟體工程師、聲紋識別與語言識別團隊負責人王泉老師將介紹聲紋識別技術相關基礎知識,包括發展歷程、聽覺感知和音頻處理相關基本概念與方法、聲紋領域最核心的應用聲紋識別等。

添加機器之心小助手(syncedai5),備註「聲紋」,進群一起看直播。

© THE END

轉載請聯繫本公眾號獲得授權

投稿或尋求報導:content@jiqizhixin.com

原標題:《沒有完整圖時,如何使用圖深度學習?你需要了解流形學習2.0版本》

閱讀原文

相關焦點

  • 潛圖學習:流形學習新視角
    但是,在許多情況下,我們沒有圖可用。在這種情況下,仍然可以應用圖深度學習嗎?在這篇文章中,我將有關潛圖學習的最新工作與較早的流形學習技術進行了比較。過去的幾年裡,面向圖結構數據開發機器學習方法的興趣激增。
  • 為什麼要進行圖學習?談一談逆勢而上的圖神經網絡
    下面是最近的推送,看看有沒有你需要的~:近期40條精彩推送Dynamic/Temporal Graph動態圖|時態圖相關論文,數據集匯總AAAI 2021 |圖模型相關工作——數據擴充;近似梯度下降;解決災難性遺忘問題NeurIPS2020 | 結合集成學習與Rademacher複雜度分析多尺度GNN解決過擬合問題NeurIPS2020
  • 如何刻畫數據的本質?流形學習能幫到你
    流形學習能幫到你 發表於 2019-04-28 19:08:08 在格物匯之前的文章中,我們系統性的介紹了特徵抽取的經典算法——主成分分析PCA與線性判別分析LDA的原理、應用場景,以及這兩種算法的局限性和改進方法。
  • 深度學習時代的圖模型,清華發文綜述圖網絡
    因此,如何利用深度學習方法進行圖數據分析近年來吸引了大量的研究者關注。該問題並不尋常,因為將傳統深度學習架構應用到圖中存在多項挑戰:不規則領域:與圖像不同,音頻和文本具備清晰的網格結構,而圖則屬於不規則領域,這使得一些基礎數學運算無法泛化至圖。例如,為圖數據定義的卷積和池化操作並不是直接的,而這些是卷積神經網絡(CNN)中的基礎操作。
  • 深度學習 vs. 概率圖模型 vs. 邏輯學
    概率圖模型的計算方法介紹(視頻和PPT下載)Dato CEO,Carlos Guestrin教授如果你覺得深度學習能夠解決所有機器學習問題,真得好好看看上面的視頻。如果你正在構建一套推薦系統,一個健康數據分析平臺,設計一個新的交易算法,或者開發下一代搜尋引擎,圖模型都是完美的起點。
  • 一個簡單的深度學習模型,帶你深度了解背後原理
    全文共4431字,預計學習時長9分鐘深度學習是目前在實際數據科學應用中最流行的模型之一。從圖像到文本,再到語音/音樂等領域,它都是一個有效的模型。隨著使用量的上升,快速且可擴展地實現深度學習變得至關重要。Tensorflow等深度學習平臺的興起可以幫助簡化開發人員的實現方式。
  • 使用Python從頭開始實現深度學習庫
    理解深度學習平臺基本構建基礎的初學者指南。深度學習已在短時間內從簡單的神經網絡演變為非常複雜的架構。為了支持這種快速擴展,在此過程中開發了許多不同的深度學習平臺和庫。這些庫的主要目標之一是提供用於構建和訓練深度學習模型的易於使用的界面,使用戶可以將更多的精力放在手頭的任務上。
  • 深入了解深度學習 - 中國數字科技館
    (圖片來源:pixabay)2019年3月27日, Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun三個人因在深度學習的研究工作而獲得了2018年的圖靈獎。通過複雜神經網絡進行深度學習的應用,最終將人工智慧從科幻小說領域帶到了現實世界。聲音識別可以讓你和機器人說話,圖像識別是自動駕駛汽車的關鍵,但是究竟什麼是深度學習呢?
  • 【乾貨】圖神經網絡的十大學習資源分享
    Hamilton編寫的圖表示學習書籍Graph Representation Learning Book本書是改變遊戲規則的書,目前可以在線下載的預出版的版本。本書從圖理論和傳統圖方法等初級課題開始,到前沿GNN模型和最先進的GNN研究等高級課題。本書設計精巧,自成體系,擁有圖神經網絡所需的大部分理論。2.
  • 深度學習專項課程精煉圖筆記!必備收藏|原力計劃
    右上:為什麼要使用激活函數呢?更準確地說是,為什麼要使用非線性激活函數呢?上圖中的實例可以看出,沒有激活函數的神經網絡經過兩層的傳播,最終得到的結果和單層的線性運算是一樣的,也就是說,沒有使用非線性激活函數的話,無論多少層的神經網絡都等價於單層神經網絡(不包含輸入層)。右下:如何初始化參數 w、b 的值?
  • 聽說你了解深度學習最常用的學習算法:Adam優化算法?
    By蔣思源2017年7月12日  深度學習常常需要大量的時間和機算資源進行訓練,這也是困擾深度學習算法開發的重大原因。雖然我們可以採用分布式並行訓練加速模型的學習,但所需的計算資源並沒有絲毫減少。而唯有需要資源更少、令模型收斂更快的最優化算法,才能從根本上加速機器的學習速度和效果,Adam算法正為此而生!
  • 阿里發布的機器學習平臺PAI2.0,和騰訊的DX-I區別在哪? | 雲棲2017...
    有趣的是,在大會前一天,騰訊剛剛發布了DX-I深度學習平臺,根據騰訊官方的介紹,DX-I將基於騰訊雲的大數據存儲與處理能力來提供一站式的機器學習和深度學習服務,隨著阿里機器學習平臺PAI2.0的發布,兩大平臺孰優孰劣便引起了一陣熱議。當然,兩款產品都是剛發布不久,要下結論,還需要等待第三方應用的檢驗。
  • 【PPT下載】深度學習入門指南!六步構建深度神經網絡
    類似於算法,當你在做某一個人臉識別時,你給它一隻貓,它是識別不了。因此,算法還是有很大的空間能夠讓大家去做相關的研究。上圖右邊是一堆鑷子,是配鎖師傅的專門鑰匙,可以開非常多機械保險柜的鎖。但是在人工智慧領域,還沒有像這種鑰匙一樣可以識別非常多物體的算法。
  • Pieter Abbeel:深度強化學習加速方法
    另外,作者對演員評論方法的貢獻在很多方面超越了目前的很多人做法,他們主要做了:「」改進抽樣組織,使用多個GPU大大提高規模和速度,以及包含異步優化。  並行,加速的RL框架  作者考慮使用深度神經網絡來實驗基於CPU的模擬器環境和策略,在這裡描述了一套完整的深度RL並行化技術,可以在採樣和優化過程中實現高吞吐量。
  • 思維導圖學習:探究東尼.博贊的《記憶導圖》
    因此在人與人交往中,你只有一次給別人第一印象的機會,請你好好的把握。在學習和記憶的過程中,大腦往往更容易記住開始時的信息。首因效應在記憶導圖的圖表裡用P 表示,在左上角。2. 近因效應(Recency Effect)近因效應是在其他條件相同的情況下,大腦更容易記住臨近發生的事情並留下的印象。
  • 深度學習大神Yoshua Bengio經典前瞻演講,幫你打通深度學習的任督...
    Yoshua Bengio連同Geoff Hinton老先生以及 Yann LeCun教授一起造就了2006年始的深度學習復興。他的研究工作主要聚焦在高級機器學習方面,致力於用其解決人工智慧問題。目前他是僅存的幾個仍然全身心投入在學術界的深度學習教授之一(蒙特婁大學),本文是他在2009年的經典前瞻演講——「人工智慧學習深度架構」有關內容的第一部分。
  • 關於深度學習在各個領域的應用分析
    深度學習網絡作為一個功能多樣的工具,雖然最初僅用於圖像分析,但它已逐漸被應用到各種不同的任務和領域中。高準確性和高處理速度,使得用戶無需成為領域專家即可對大型數據集執行複雜分析。 小編邀請 MathWorks 產品經理 Johanna 分享一些深度學習網絡的使用示例以供參考: 文本分析 在本例中,我們將分析推特數據,了解針對特定詞或短語的情感是積極的還是消極的。情感分析有很多實際的應用,如品牌推廣、競選活動和廣告營銷。 過去(目前仍然)進行情感分析通常使用機器學習。
  • 人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習
    人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習 人工智慧利用單眼強度圖像進行面部深度圖估計的對抗架構深度學習 2018-06-05 11:36:53  來源:今日頭條
  • 還不會使用PyTorch框架進行深度學習的小夥伴,看過來
    選自heartbeat.fritz.ai作者:Derrick Mwiti機器之心編譯參與:Geek AI、王淑婷這是一篇關於使用 PyTorch 框架進行深度學習的教程,讀完以後你可以輕鬆地將該框架應用於深度學習模型。
  • 騰訊AI Lab聯合清華港中文,解讀圖深度學習歷史、進展應用
    過擬合是深度學習的一個常見問題,當數據點數量少而參數數量很多時,就會出現這種情況。此時模型會與訓練數據完全擬合(本質上就是記住了數據),而在驗證數據上表現很差。訓練動態變化也是深度學習領域的一大常見問題。根據鏈式法則,當模型變深時,s_l-1 乘以 λ_m+1 的結果小於 1,會出現梯度消失問題。