圖神經網絡的「前世今生」

2020-12-24 DrugAI

作者 | 俞壹齡編輯 | 李仲深

GNN的前世今生 Humility簡介GNN的分類網絡Embedding與GNN的異同GCN從CNN到GCN -- 卷積算子的泛化譜域卷積算法SCNN-- 譜圖卷積理論的直接應用ChebNet-- 利用切比雪夫多項式對譜圖卷積理論的近似GCN -- 在ChebNet基礎上更進一步的簡化空域卷積方法ConvGNNGraphSAGE其他GATGAEGGNGSTN圖網絡基準數據集經典圖網絡實現參考文獻代碼實現

GNN的前世今生

簡介

從圖像分類, 視頻處理到語音識別, 自然語言處理. 深度學習通過端到端的訓練徹底改變了很多機器學習任務. 但是這些任務的數據都是歐式空間上的規則數據. 而現實中很多數據之間都有著相當複雜的關係, 一般表現為非歐空間之上的圖結構.

為處理圖數據之上的任務, 圖神經網絡就應運而生了.

GNN的分類

GCN -- 圖卷積神經網絡譜域空域池化模型GAT -- 圖注意力網絡GAE -- 圖自編碼器GGN -- 圖生成網絡GSTM -- 圖時空網絡

圖一: GNN的分類網絡Embedding與GNN的異同

網絡embedding旨在在保留網絡拓撲結構和節點信息的基礎之上, 在低維向量空間之中對網絡節點進行表示.

得到的嵌入向量可以用於後續的各類任務.

網絡embedding的方法可以大體分為如下三類 :

矩陣分解隨機遊走深度學習其中第三點深度學習的方法需要使用GNN的模型. 可以是GAE, 也可以是無監督的GCN.

GCN

圖二: 常見的GNN模型分析從CNN到GCN -- 卷積算子的泛化

CNN的成功在於他的卷積核能夠提取整個數據集上共享的局部特徵. 而CNN中卷積算子的定義依賴於圖像這種規則數據的平移不變性和局部連結性.

想要在圖網絡中複製CNN的成功, 泛化和定義新的卷積算子便是一種良好的方案.

圖三: 從2D卷積到圖卷積譜域卷積算法

圖四: 圖卷積發展歷史譜域卷積主要的理論依據是卷積定理 : 時域中的卷積同構與譜域中的乘法. 譜域卷積通過離散傅立葉變換把拓撲圖映射到譜域, 然後據此來定義自己的圖卷積算子.

主要的模型有SCNN、ChebNet和GCN(按發表時間升序排列). 這三個模型都是基於同一種算法, 可以說是一脈相承的了.

圖二:譜域卷積公式圖五: 圖離散卷積算法SCNN -- 譜圖卷積理論的直接應用

圖結構的刻畫 : (拉普拉斯矩陣)與特徵矩陣拉普拉斯矩陣用於刻畫圖的結構信息.

易知L是一個非負定矩陣, 對其進行相似對角化處理可得

其中的對應了圖中的離散傅立葉變換(具體推導可以參考傅立葉變換和拉普拉斯算子之間的關係).

圖中除了用拉普拉斯矩陣刻畫的結構信息之外, 還有每個節點上的信息. 這種節點信息我們一般會用特徵向量來對人工選擇的特徵進行量化. 每個節點的特徵組合起來就得到了我們的特徵矩陣, 也就是最底層的語義. 特徵矩陣和拉普拉斯矩陣一起完成了對圖中信息的量化.

卷積定理: 時域中的卷積同構於頻域中的乘法由此我們可以定義與兩個函數之間的卷積.

離散形式:為了便於參數的設置和反向傳播, 我們取作為卷積核.

這樣就給出了文中的卷積公式

前向傳播的公式其中是我們的第k層的卷積層. 他的行數是輸入的通道數, 列數為輸出的通道數.

ChebNet -- 利用切比雪夫多項式對譜圖卷積理論的近似

既然前文中提到的SCNN中特徵分解的開銷難以接受, 我們可以對其進行近似處理從而簡化運算.

ChebNet就是這樣一個在SCNN的基礎上做了近似處理的網絡.

採用Chebyshev多項式對譜域卷積的卷積核進行插值.這邊是Chebyshev多項式:這裡用於多項式插值.這是利用Chebyshev多項式近似後的卷積核.上述插值過程中還有一個小小的trick(你有沒有注意到呢?)這是一個標準化處理, 將中的特徵值全部化到[-1, 1]這個區間內, 旨在避免網絡迭代層數過深帶來的梯度爆炸問題.GCN -- 在ChebNet基礎上更進一步的簡化

GCN在前面ChebNet的基礎上再一次進行了簡化. 他只取了卷積核Chebyshev插值多項式的前兩項, 而且預設了這兩項前面的參數相等. 將每個卷積核可學習的參數量降低到了1.

這就是GCN的卷積核. 其中就是它可學習的參數.

除了更精簡的近似之外, GCN中還有兩點trick:

是在鄰接矩陣的基礎上加上了自環, 將節點自身的特徵也添加到了網絡之中.對拉普拉斯矩陣的標準化和對稱化.空域卷積方法

譜域卷積基於圖譜理論, 具有相當良好的可解釋性. 但是譜域上的模型一來只能對整幅圖進行處理, 而且無法處理變化的圖結構. 這時候空域卷積方法或許是更好的選擇.

卷積算子的定義: 採樣 + 聚合. 用於特徵提取ConvGNN

歐式空間上的卷積可以理解為先對固定數量的鄰域進行排序, 然後使用卷積核進行內積.

非歐空間之上圖結構的卷積也可以參考這種模式.

在這裡插入圖片描述圖六: 圖卷積的泛化定義 採樣 + 聚合利用隨機遊走這一馬爾科夫過程, 以步之內節點被訪問次數的期望進行排序.以標準化之後的圖相似度矩陣來作為狀態轉移矩陣.取期望最大的個節點作為的鄰域, 按期望由大到小排序.使用參數數量為的一維卷積和對鄰域進行卷積操作.

圖七: 空域卷積網絡GraphSAGE

*SAGE(Sample and AggreGatE)*不同於前面的GNN, GraphSAGE認為卷積是採樣加上的信息的聚合.

採樣均勻採樣法: 在節點一階相連的節點上均勻採樣, 構建固定大小的鄰域.

聚合GraphSAGE認為節點的鄰域中沒有順序可言, 所以要求聚合函數不依賴於鄰域節點的輸入順序.

均值聚合 : 取鄰域內節點的均值.LSTM聚合 : -- 這個真的是順序無關的嗎???Pooling聚合 : 採用Max Pooling.聚合函數聚合之後還需要結合自身信息然後進行卷積和激活.

最後進行標準化以防止梯度爆炸和梯度消失.

其他

空域卷積網絡還有著各種各樣的變體. 諸如LGCN, MoNet之類的, 在此不多贅述.

GAT

都說Attention is all you need.

GAT模型將attention機制引入圖卷積模型, 為更重要的節點分配更大的權重.

正常的圖卷積神經網絡卷積核的參數都是共享的, 這種就是所謂的分心模型. 他預設了輸入節點對不同的輸出節點的影響是相同的.

但是從我們人的認知模型出發, 輸入節點對不同的輸出節點影響肯定是不同的. 所以就提出了所謂的Attention機制. 通過每個輸出節點上掛載的權值數組來衡量各個輸入節點對該輸出的重要程度.

圖八: 注意力機制中權重的分配計算節點之間的關聯度 其中為注意力係數, 可以認為它正比於兩節點的關聯度.利用softmax歸一化, 求得注意力係數.以上文求得的注意力係數作為權重來對鄰域節點的信息進行聚合, 完成圖卷積操作.其中的是共享的權值, 而真正的差異化的卷積核為.

GAE

圖九: 自編碼器圖自編碼器, 一種自監督的學習框架. 通過編碼器學習網絡節點的低維表示, 然後通過解碼器重構圖數據.

GAE最早使用GCN來作為編碼器.

其中X為節點特徵, 為圖的鄰接矩陣.

解碼器:

採用變分法進行訓練, 最小化變分下界

近來又提出了一種對抗正則化自編碼器(ARGA), 利用GAN的方案訓練正則化圖自編碼器.

編碼器用節點的特徵編碼其結構信息, 也就是GCN中的隱層表示, 然後解碼器從編碼器的輸出中重構鄰接矩陣. GANs在訓練生成模型的時候在生成和判別模型之間進行一個最小-最大博弈. 生成器儘可能生成真實的「偽樣本」, 而判別器則儘可能從真實樣本中識別」偽樣本「.

圖十: 常見GAE總結GGN

圖生成網絡, 從數據中獲取圖的經驗分布, 然後根據經驗分布來生成全新圖結構的網絡.

特定領域有很多圖網絡模型, 比如用於分子圖生成的SMILES.

近來提出了一些統一的生成方法, 其中有一部分將圖生成看做節點和邊的交替生成的過程, 另一部分採用GAN的方案進行訓練.

GSTN

圖時空網絡, 處理時空圖的網絡. 利用GCN提取空間特徵, 然後將時間離散化使用CNN或者RNN來提取時間特徵.

圖十一: 圖時空網絡匯總附

圖網絡基準數據集

圖十二: 基準數據集匯總經典圖網絡實現

圖十三: 經典圖網絡實現匯總參考文獻

[[1901.00596] A Comprehensive Survey on Graph Neural Networks (arxiv.org)](https://arxiv.org/abs/1901.00596#:~:text=In this survey%2C we provide a comprehensive overview,networks%2C convolutional graph neural networks%2C graph autoencoders%2C )

[1710.10903v3] Graph Attention Networks (arxiv.org)

[1801.07455] Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition (arxiv.org)

[1312.6203] Spectral Networks and Locally Connected Networks on Graphs (arxiv.org)

[1706.02216] Inductive Representation Learning on Large Graphs (arxiv.org)

代碼實現

見圖十三

相關焦點

  • 2021年的許願瓶.陪你一起翻越前世今生
    許願瓶2021年的許願瓶你在我的囊中我的夢想在你的心中從此以後陪你一起翻越前世今生前世今生有你有我2021年的許願瓶裡面響起了我的心跳聲曾經的傲慢年輕的任性流失的一點都不剩我要輕裝上陣陪你一起翻越前世今生
  • 今生的夫妻是前世情人,今生的情人是前世夫妻:善待每一份相遇!
    作者:胡楊映月情人之所以對你柔情似水,之所以是浪漫溫柔的代名詞,之所以讓你感覺愛得百轉柔腸,之所以讓你刻骨銘心,是因為你們是前世的夫妻。今生之所以尋你而來,只因為前世的一份緣還沒有盡,所以今生來續前緣,是來還債的。
  • 豆瓣評分9.3:一件國家寶藏裡的前世今生之《千裡江山圖》
    今日帶大家走進國家寶藏欄目的第一期節目,那些靜躺在故宮博物館的前世今生。為大家介紹的第一件文物是王希孟的《千裡江山圖》,讓我們一起了解一幅畫的文化。《千裡江山圖》的創作年代來自北宋徽宗年間,屬於青綠山水畫代表之一,它的畫作長度堪比《清明上河圖》還要長,而畫它的畫師王希孟居然當時只有18歲,不得不說王希孟少年得志。王希孟不似李白那樣狂放,但他也有他的不羈,這個不羈細微體現在他與宋徽宗之間的相處。
  • 清華大學圖神經網絡綜述:模型與應用
    機器之心專欄作者:PaperWeekly近年來,圖神經網絡的研究成為深度學習領域的熱點,機器之心曾介紹過清華大學朱文武等人綜述的圖網絡。近日,清華大學孫茂松組在 arXiv 上發布預印版綜述文章 Graph Neural Networks: A Review of Methods and Applications。
  • 《瀋陽北大營》 梳理北大營的前世今生
    《瀋陽北大營》 梳理北大營的前世今生 瀋陽晚報
  • 烏金木家具的前世今生
    那會有什麼樣的前世今生呢?先來說說烏金木家具的前世。烏金木的前身是大斑馬木,烏金木家具的前世是斑馬木家具。了解了烏金木家具的前世,再來說說烏金木家具的今生。烏金木沙發看過文章的朋友對於烏金木和烏金木家具的前世今生,會有一種什麼樣的感悟呢?
  • 今生的情人,是前世未盡的緣
    來自靈魂深處的記憶,讓我們彼此沒有絲毫陌生感,我知道你喜好,你懂的我的感覺一切都好想是留著前世的記憶。01.你深情的說,也許我們是前世的夫妻,沒有纏綿夠,所以今生來續前世未盡的緣,平淡的話語,比什麼甜言蜜語,都讓人心動,或許我們就是遵循著前世的記憶,才會相聚。你說你在佛前求了好多年,你說你在三生石上刻下了我們的名字,你說你在薩提樹下,等了幾個輪迴,只是為了今生和我的一程陪伴。
  • 穿越滄海桑田,尋找山水重慶的「前世今生」
    穿越滄海桑田,尋找山水重慶的「前世今生」 2020-04-22 12:12 來源:澎湃新聞·澎湃號·政務
  • 妖怪名單前世今生怎麼刷初始好-初始角色選擇推薦
    妖怪名單前世今生怎麼刷初始好,相信不少的玩家都有這樣的疑問,今天小編就為大家帶來妖怪名單前世今生初始角色選擇推薦,希望可以幫到玩家。妖怪名單前世今生初始角色選擇推薦
  • 《白蛇:緣起》:前世一眼,今生一面
    前世500年,許仙前世救白蛇的故事,電影以清麗高雅,仙靈柔美的蛇妖白素貞回憶的形式來展現,一條修行的蛇妖,每次修煉到關鍵時刻幾乎走火入魔,在修煉遇劫不得突破時,外貌俏麗、英姿颯爽,性格率直剛毅、愛憎分明、重情重義的好姐妹小青為了幫助她用珠釵喚起了她五百年前的記憶,由此解開了五百年前一段人妖相戀的塵封記憶。
  • 佛說:今生種種皆是前世因果
    佛說:今生種種皆是前世因果,出現在你身邊的人一定會讓你經歷一些什麼,有的人帶給你快樂幸福,有的人讓你悲傷不安,一切的經歷是因為一個緣字,前世有緣今生相聚,三世因果,循環不失。愛情是一場輪迴,這輩子的愛,是上輩子的債;一切相遇皆有原因,一切事皆有輪迴,我們能得到到是前世種下的善因,我們得不到的是沒有姻緣,前世因今世果,有因有果,才會有愛的萌芽,你能得到但不能長久的是種下的善因不夠,我們能得到長久但是生活不如意到是因為前世的虧欠,傷害了別人所以今生不能安寧!
  • 佛教:虛雲大師的前世今生,修行是生生世世的事情
    關於前世今生的故事,歷史上有許多有名的名人都會為我們做證明,證實每個人都有自己的前世今生。書到今生讀已遲,黃庭堅的前世今生。清朝的大才子袁枚,讀過宋朝文學家,書法家,詩人黃庭堅前世今生的故事後,不禁嘆曰:書到今生讀已遲;那些聰明絕頂的神童,絕對不是一生一世的事情,讓我們看一看黃庭堅前世今生的公案。
  • 你前世欠了多少情債?前世姻緣註定今生的相遇,宿世情深該如何把握?
    前世你對我有恩,今生我便以身相許 如果雙方前世有恩情,今生相會便能喜結良緣,這樣的夫妻緣,報恩的一方能夠為了對方無怨無悔的奉獻,最能美滿幸福。
  • 中科院計算所設計全球首款圖神經網絡加速晶片
    「HyGCN,寓意向圖神經網絡的加速說『Hi』。」嚴明玉介紹道,圖神經網絡將深度學習算法和圖計算算法相融合,取長補短,能達到更優的認知與問題處理等能力,在搜索、推薦、風險控制等重要領域有著廣泛應用。現有的處理器晶片在執行圖神經網絡的計算中效率低下,其團隊前瞻性地展開面向圖神經網絡的加速晶片設計,為解決這一難題提供了可行方案。
  • 妖怪名單前世今生SSR排行榜 妖怪名單什麼角色厲害
    妖怪名單前世今生什麼角色厲害?妖怪名單前世今生遊戲裡我們可以選擇的ssr角色很多,而很多都有不錯的戰鬥力。不過ssr裡還是有很強力的角色的,這些角色都有哪些呢?下面就為大家列出值得培養的那些ssr角色。
  • 表徵圖數據絕不止圖神經網絡一種方法
    近年來,圖神經網絡掀起了將深度學習方法應用於圖數據分析的浪潮。不過其作為一門古老的認識世界的方法論,人們對於圖表徵技術的研究從很早以前就開始了。雖然現在深度神經網絡在物體識別、圖像分類和自然語言處理領域都取得了巨大的成功。然而,「設計出最優的神經網絡,學習並輸出任意的圖」仍然是一個熱門的研究課題。
  • 漫畫記錄回龍觀「前世今生」
    漫畫 記錄回龍觀「前世今生  最近,一組名為「北京以北回龍觀的前世今生」的漫畫在網上廣為流傳。70餘幅手繪漫畫,記錄了從2000年到2020年之間,昌平區回龍觀地區一年又一年的變化:交通越來越便捷,生活越來越便利,環境越來越優美,家門口有了健身公園,鄰裡間守望相助……一幅幅漫畫勾起了無數人對回龍觀的記憶。漫畫的作者吳戈是最早搬進回龍觀文化居住區的居民。
  • 今生嫁你的人是前世葬你的人嗎
    這時,路過一遊方僧人,從懷裡摸出一面鏡子叫書生看.書生看到茫茫大海.一名遇害的女子一絲不掛地躺在海灘上路過一人 看一眼,搖搖頭走了.又路過一人,將衣服脫下給女屍蓋上走了.再路過一人過去 挖個坑 小心翼翼把屍體掩埋了.僧人解釋道那具海灘上的女屍,就是你未婚妻的前世。你是第二個路過的人,曾給過他一件衣服。她今生和你相戀,只為還你一個情。
  • 測你前世戀人在哪,今生會不會相遇
    可能還是因為緣分不夠深,所以今生對方已經是別人的愛人,其實對你來說並沒有什麼,過去的就是過去了,沒必要一直糾結,今生的你會遇到屬於自己的幸福,珍惜當下才是最好的。B、你與前世的戀人不會再相遇!前世你和你的戀人相愛相殺,兩個人在一起都是折磨對方,過得並不快樂,兩個人都感到很痛苦,可能受到的傷害太深,所以今生選擇不再相遇,就算遇見也不會有交集,今生的你們彼此都會找到那個真正愛的人,幸福一生。C、你前世的戀人就是你今生的愛人!
  • 表徵圖數據,絕不止圖神經網絡一種方法
    雖然現在深度神經網絡在物體識別、圖像分類和自然語言處理領域都取得了巨大的成功。然而,「設計出最優的神經網絡,學習並輸出任意的圖」仍然是一個熱門的研究課題。本文是一篇出自倫敦大學學院的圖表徵學習綜述,詳細介紹了圖核、卷積、圖神經網絡、圖嵌入、概率模型共五類圖表徵學習方法的起源與發展,並對圖數據表徵學習方法的最新進展和未來發展方向進行總結和討論。