如何讓圖卷積網絡變深?騰訊AI Lab聯合清華提出DropEdge

2020-12-06 機器之心Pro

機器之心發布

機器之心編輯部

近年來,圖神經網絡的研究異常火爆,被各大頂會錄取的文章數量爆炸式增長。然而,目前大部分圖卷積網絡,尤其是面向節點分類的網絡,都是淺層網絡。這些模型分類效果往往隨著深度加深而變差(即使使用殘差連接),這與用於圖片分類的卷積網絡動輒超過幾十層的現象很不一致。圖卷積神經網絡變深之後難以訓練的現象嚴重製約了其表達能力。所以,如何有效的訓練超深圖卷積網絡是圖學習研究的一個重大挑戰。這項工作由騰訊 AI Lab 與清華大學合作完成。

騰訊 AI Lab 和清華大學的這項研究表明,圖神經網絡無法做深由兩個原因造成:過擬合 (Overfitting) 和過平滑(Oversmoothing)。為了解決這兩個問題,文章提出了一種簡潔但非常有效的方法:隨機刪邊技術,DropEdge,極大提升了超深圖卷積網絡的訓練效率和節點分類效果。值得注意的是,文章投稿到 openreview 的時候就引來了眾多研究同行的關注。文章正式被接收後,圖靈獎獲得者 Yoshua Bengio 的團隊成員 Petar Velikovi(注意力圖網絡 GAT 的發明者)在 openreview 平臺上也給與了關注與好評。

論文地址:https://openreview.net/forum?id=Hkx1qkrKPr

代碼地址:https://github.com/DropEdge/DropEdge

引言

圖神經網絡(GNN)在近年取得了長足的發展。非常多的圖神經網絡的模型,例如圖卷積神經網絡(GCN),圖注意力網絡(GAT)等,在各種圖學習的應用上都取得了非常不錯的結果。但是,現在大部分的圖卷積網絡結構,其實都是淺層的(兩層)。這種淺層網絡極大的限制了圖卷積網絡的表達能力。最近,基於卷積神經網絡裡面的經驗,有一些對圖卷積網絡做深的模型修改嘗試。但是這些工作並沒有真正去分析為什麼圖卷積網絡很難做深以及去解釋模型修改在圖卷積網絡裡面是有效的。

這篇論文希望能夠對圖卷積網絡不能做深這一問題得到一個完善的理論分析;並且基於理論的結果,尋找到可以解決深度圖卷積網絡訓練的問題:過擬合 (Overfitting) 和過平滑(Oversmmothing)。在這裡,過擬合指的是使用複雜模型去擬合少量數據的時候造成的泛化能力變差的情況。過擬合的現象在深度學習模型中是廣泛存在的。

而過平滑則是指在圖神經網絡消息傳遞過程中,所有節點的輸入特徵會收斂到一個和輸入無關的子空間的過程。這一過程會導致輸入 GCN 的特徵失效並造成梯度消失。過平滑是 GCN 模型特有的問題,它造成了深層圖神經網絡的訓練困難。

下圖的虛線部分是原始的 4 層和 8 層 GCN 在 Cora 數據集上的訓練曲線(這裡為了更好展示過擬合和過平滑,取消了 GCN 層中的 bias),可以看到,在 GCN-4 上,驗證集 (Validation Set) 的損失函數在訓練經過一定輪數後反向增長。這個增長是優於過擬合。而在 GCN-8 上,訓練集 (Training Set) 上的損失函數則根本沒有下降,這是因為過平滑的存在,導致 GCN-8 上訓練失效。

文章定義了一個 subspace 和-smoothing 的概念去刻畫過平滑這一現象。具體地,

其中為一個 GCN 層。是正則化後的鄰接矩陣,為當前層參數。通過將過平滑的收斂目標定義為一個子空間而非一個固定點,-smoothing 可以刻畫包含非線性激活函數和參數矩陣的 GCN。

DropEdge

本質上,減緩過平滑的影響就是要去增加-smoothing layer 的層數,以及減少收斂到子空間

的信息損失。基於此,文章設計了一種非常簡單但是有效的方法 DropEdge。在每輪訓練的時候,DropEdge 會隨機去掉輸入的圖上的邊,即會將鄰接矩陣

的非零元素置 0,

是刪邊概率。如果用

表示 DropEdge 後的鄰接矩陣,則

是被去掉的邊的鄰接矩陣。在得到

後,對其進行正則化得到

代替

進行計算。

基於 relaxed -smoothing layer 的定義,文章證明了經過 DropEdge 後的鄰接矩陣

在進行 GCN 計算中可以減弱過平滑對模型的影響,即:

這種隨機刪邊技術,可以看作是 Dropout 在圖結構上的推廣:Dropout 是通過丟掉特定的特徵來實現模型內部的 Ensemble,而 DropEdge 則是通過丟掉邊來實現 GNN 的 Ensemble,所以 DropEdge 也有防止 Overfitting 的作用。有趣的是,這種防止 Overfitting 的作用可以和 Dropout 一起使用來防止模型過擬合。同時,DropEdge 作為一個前處理的步驟,可以和任意 GNN 方法結合,具有非常強的普適性。

從圖 1 可以看出,在加了 DropEdge 後,GCN-4 在驗證集的損失函數不再升高,而 GCN-8 可以成功進行訓練,得到下降的損失函數。這驗證了 DropEdge 可以在防止過擬合和過平滑兩個方面提升深層 GNN 的訓練效率和模型效果。

為了進一步驗證這一簡單方法的有效性,文章在不同模型,不同層數,不同數據集上進行了大量的實驗,可以看到不同模型添加 DropEdge 可以顯著提升節點分類任務的效果:

同時,在四個數據集上,添加 DropEdge 後均可以超過現有的 STOA 模型,值得注意的是,大部分的結果都是在大於等於 4 層圖神經網絡上得到的。

另外,下表也展示了 Dropout 和 DropEdge 在減弱過擬合上的協同效果:

總而言之,這篇文章提出了一個新穎且有效的方法 DropEdge 來提高深度圖卷積網絡訓練效率和在節點分類任務上的性能。DropEdge 具有很好的通用性可以很方便地應用到已有的圖卷積網絡的架構中。更重要的是,文章給出了圖卷積網絡訓練過程中遇到的過平滑現象詳細嚴謹的理論描述,這為未來研究人員進行深度圖神經網絡的研究提供了非常重要的指導意義。

相關焦點

  • 騰訊AI Lab聯合清華港中文,解讀圖深度學習歷史、進展應用
    該聯合課程的主題為「圖深度學習:基礎、進展和應用(Deep Graph Learning: Foundations, Advances and Applications)」,由騰訊 AI Lab、清華大學、香港中文大學等機構聯合組織,從基礎的圖概念一直談到了當今最前沿的圖神經網絡研究進展。本次課程分為兩個主題。
  • 騰訊AI Lab 2020 年度回顧
    除了前文已經介紹過的虛擬人成果,騰訊 AI Lab 還提出了一種針對視頻中時序句子定位和事件描述學習模態間交互的新方法,該方法能學習成對的模態交互,從而改善兩項任務的性能。 另外,騰訊 AI Lab 還研究了如何基於場景圖分解來生成自然語言描述,通過遞歸子查詢構造改善視覺和自然語言匹配[6]以及一種新的視覺-文本匹配模型。
  • 騰訊AI Lab入選20篇論文,含2篇Spotlight
    文中提出了一種新穎的部件神經網絡,它描述了如何從環境和任務來組成強化學習策略的元規則。值得注意的是,這裡的主要挑戰之一是環境和任務的特徵描述必須與元規則一起學習。為此,研究者又進一步提出了新的訓練方法來解鎖這兩種學習任務,使得最終的特徵描述不僅成為環境和任務的獨特籤名,更成為組建策略的有效模塊。
  • AI入門:卷積神經網絡
    講到AI不得不講深度學習,而講到深度學習,又不能不講卷積神經網絡。如果把深度學習比作中國的網際網路界,那捲積神經網絡和循環神經網絡就是騰訊和阿里級別的地位。今天我們主要討論的卷積神經網絡,到底卷積神經網絡能解決什麼問題,它的結構是怎樣的?是怎麼學習的?應用在哪些具體的產品上?本文將為大家一一解答。
  • 騰訊AI Lab 20 篇論文入選 NIPS2018,含 2 篇 Spotlight
    文中提出了一種新穎的部件神經網絡,它描述了如何從環境和任務來組成強化學習策略的元規則。值得注意的是,這裡的主要挑戰之一是環境和任務的特徵描述必須與元規則一起學習。為此,研究者又進一步提出了新的訓練方法來解鎖這兩種學習任務,使得最終的特徵描述不僅成為環境和任務的獨特籤名,更成為組建策略的有效模塊。
  • 深度卷積網絡的BUG一例:騰訊AI「絕藝」最近被人類棋手找到了一個...
    前段時間騰訊的AI 「絕藝」 在野狐圍棋越殺越勇,勝率接近90%,戰績一片紅色,充分展示了強化學習自我進化的威力。這是深度卷積網絡的一個 BUG:電腦對於局部的死活很敏感,但是對於大龍的死活不一定看得清。最近我在訓練網絡時也發現,深度卷積網絡在此有一個"信息傳遞困難症"。這首先有兩個原因:第一,AlphaGo v13 的網絡層數實際是不夠的。
  • 騰訊安全雲鼎實驗室利用騰訊安全自主研發的系統到底是什麼
    騰訊安全雲鼎實驗室利用騰訊安全自主研發的「defylibrary」和騰訊安全開放雲平臺聯合打造了基於anyway.os的開源系統——anywaylab系統。騰訊安全雲鼎實驗室表示:「anywaylab計劃旨在面向未來企業級系統應用,開發高效、可擴展、安全的解決方案,創建跨運營商、雲計算、ai、5g、物聯網等多場景大生態,推動產業創新發展。」
  • 騰訊提出NumNet+模型,超越谷歌登DROP排行榜第一名
    新智元楊靜、科大訊飛胡鬱、微軟王永東、華為王成錄、英特爾宋繼強、曠視及智源學者孫劍、滴滴葉傑平、AWS張崢、依圖顏水成、地平線黃暢、autowise.ai黃超等重磅嘉賓中關村論劍,重啟充滿創新活力的AI未來。
  • 更精確地預估到達時間,滴滴新研究提出異質時空圖卷積網絡
    圖表 3:瀋陽某道路在 2 周內的交通速度變化情況由此,滴滴在這篇論文中主要針對以下問題提出解決方案:如何挖掘空間信息中不同關係連結所蘊含的語義關係?如何克服大規模道路網絡的稀疏性?如何聯合道路網絡信息和車流信息對 ETA 任務進行預測?如何處理不同時序(近期的、每日的、每周的)路況信息中的模式關係?
  • 騰訊AI Lab 21 篇 CVPR 2018 錄用論文詳解
    由編碼器 - 解碼器得到的傳統損失和由重構器造成的重構損失以端到端的形式聯合訓練 RecNet。在基準數據集上的實驗結果表明,所提出的重構器可以增強編碼器 - 解碼器模型性能,並可顯著提高視頻描述的準確性。7.
  • Nature子刊重磅:騰訊 AI Lab 聯合研究成果 揭示男性脫髮的潛在...
    11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 清華-騰訊聯合實驗室管委會會議在深圳召開
    清華-騰訊聯合實驗室管委會會議在深圳召開  清華新聞網6月11日電 6月6日,「清華-騰訊網際網路創新技術聯合實驗室」管理委員會會議在深圳召開。清華大學副校長、聯合實驗室管委會主任邱勇,騰訊公司高級執行副總裁盧山出席會議。
  • 騰訊AI Lab 聯合研究登上Nature子刊,獨創方法提升蛋白質結構預測...
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • CVPR 2019 | 騰訊AI Lab解讀六大前沿方向及33篇入選論文
    ,今年騰訊公司共有 58 篇論文入選,其中騰訊 AI Lab 33 篇(含 8 篇oral),騰訊優圖實驗室 25 篇。近年來,基於深度卷積神經網絡的人臉識別取得了顯著的成就。但是,深度卷積神經網絡很容易受到對抗樣本的攻擊。因此,人臉識別系統的安全性也可能受到很大的威脅。為了驗證當前最先進人臉識別模型的安全性能,我們研究了基於決策的黑盒攻擊,即無法獲知人臉識別模型的參數或結構,只能通過詢問來獲取模型的結果。這種設定完全符合現實情況下的攻擊情形。
  • 從圖(Graph)到圖卷積(Graph Convolution):漫談圖神經網絡 (二)
    在從圖(Graph)到圖卷積(Graph Convolution): 漫談圖神經網絡 (一)中,我們簡單介紹了基於循環圖神經網絡的兩種重要模型,在本篇中,我們將著大量筆墨介紹圖卷積神經網絡中的卷積操作。接下來,我們將首先介紹一下圖卷積神經網絡的大概框架,藉此說明它與基於循環的圖神經網絡的區別。
  • AI 影響因子 8 月份回顧:騰訊 AI Lab 再佔榜首
    超大規模圖計算在阿里巴巴的應用都有哪些?NLPCC 中文語法錯誤修正比賽冠軍在於荷蘭舉辦的 IEEE CIG 計算智能與遊戲大會上,清華大學張鈸院士領導的人工智慧創新團隊 TSAIL清華 TSAIL 聯合騰訊 AI Lab 奪冠 FPS 遊戲 AI 競賽 VizDoomPart.3 開發
  • 騰訊AI Lab聯合研究登上Nature子刊,首次破解它的結構
    通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 騰訊AI Lab聯合研究登上Nature子刊,首次...
    雷鋒網(公眾號:雷鋒網)消息,11月17日,騰訊公布了一項人工智慧助力藥物發現的新進展。通過騰訊自研的提升蛋白質結構預測精度的新方法,聯合研究團隊首次解析了II型5a還原酶(SRD5A2)的三維結構,揭示了治療脫髮和前列腺增生的藥物分子「非那雄胺」對於該酶的抑制機制,這將有助於深化研究相關疾病的病理學機制及藥物優化。
  • 清華-騰訊聯合實驗室團隊獲ACM Multimedia大會最佳論文獎
    在剛剛結束的第20屆ACM Multimedia多媒體學術會議頒獎晚會上,清華大學-騰訊網際網路創新技術聯合實驗室團隊獲得「最佳論文獎」和兩項技術挑戰獎共三項大獎。其中博士生王智與指導教師楊士強教授、朱文武教授、孫立峰副教授聯合發表的論文《基於社會感知的網絡視頻內容分發方法》(Propagation-Based Social-Aware Replication for Social Video Contents)獲得大會唯一的「最佳論文獎」(Best Paper Award)。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!