訓練時間和參數量百倍降低,直接使用標籤進行預測,性能竟超GNN

2020-11-26 手機鳳凰網

選自arXiv

作者:Qian Huang等

機器之心編譯

機器之心編輯部



將傳統標籤傳播方法與簡單模型相結合即在某些數據集上超過了當前最優 GNN 的性能,這是康奈爾大學與 Facebook 聯合提出的一項研究。這種新方法不僅能媲美當前 SOTA GNN 的性能,而且參數量也少得多,運行時更是快了幾個數量級。

圖神經網絡(GNN)是圖學習方面的主要技術。但是我們對 GNN 成功的奧秘以及它們對於優秀性能是否必然知之甚少。近日,來自康奈爾大學和 Facebook 的一項研究提出了一種新方法,在很多標準直推式節點分類(transductive node classification)基準上,該方法超過或媲美當前最優 GNN 的性能

這一方法將忽略圖結構的淺層模型與兩項簡單的後處理步驟相結合,後處理步利用標籤結構中的關聯性:(i) 「誤差關聯」:在訓練數據中傳播殘差以糾正測試數據中的誤差;(ii) 「預測關聯」:平滑測試數據上的預測結果。研究人員將這一步驟稱作 Correct and Smooth (C&S),後處理步驟通過對早期基於圖的半監督學習方法中的標準標籤傳播(LP)技術進行簡單修正來實現。

該方法在多個基準上超過或接近當前最優 GNN 的性能,而其參數量比後者小得多,運行時也快了幾個數量級。例如,該方法在 OGB-Products 的性能超過 SOTA GNN,而其參數量是後者的 1/137,訓練時間是後者的 1/100。該方法的性能表明,直接將標籤信息納入學習算法可以輕鬆實現顯著的性能提升。這一方法還可以融入到大型 GNN 模型中。

論文地址:https://arxiv.org/pdf/2010.13993.pdf

GitHub 地址:https://github.com/CUAI/CorrectAndSmooth

圖神經網絡的缺陷

繼神經網絡在計算機視覺和自然語言處理領域的巨大成功之後,圖神經網絡被用來進行關係數據的預測。這些模型取得了很大進展,如 Open Graph Benchmark。新型 GNN 架構的許多設計思想是從語言模型(如注意力)或視覺模型(如深度卷積神經網絡)中的新架構改編而來。但是,隨著這些模型越來越複雜,理解其性能收益成為重要挑戰,並且將這些模型擴展到大型數據集的難度有所增加。

新方法:標籤信息 + 簡單模型

而這篇論文研究了結合更簡單的模型能夠達到怎樣的性能,並重點了解在圖學習特別是在直推式節點分類中,有哪些提高性能的機會。

研究者提出了一個簡單的 pipeline(參見圖 1),它包含 3 個主要部分:

基礎預測(base prediction),使用忽略圖結構(如 MLP 或線性模型)的節點特徵完成;

校正步驟,這一步將訓練數據的不確定性傳播到整個圖上,以校正基礎預測;

平滑圖預測結果。

步驟 2 和 3 只是後處理步驟,它們使用經典方法進行基於圖的半監督學習,即標籤傳播。

通過對這些經典 idea 進行改進和新的部署,該研究在多個節點分類任務上實現了 SOTA 性能,超過大型 GNN 模型。在該框架中,圖結構不用於學習參數,而是用作後處理機制。這種簡單性使模型參數和訓練時間減少了幾個數量級,並且可以輕鬆擴展到大型圖中。此外,該方法還可以與 SOTA GNN 結合,實現一定程度的性能提升。

該方法性能提升的主要來源是直接使用標籤進行預測。這並不是一個新想法,但很少用於 GNN。該研究發現,即使是簡單的標籤傳播(忽略特徵)也能在許多基準測試中取得出色的效果。這為結合以下兩種預測能力來源提供了動力:一個來源於節點特徵(忽略圖結構),另一個來源於在預測中直接使用已知標籤。

具體而言,該方法首先使用一個基於節點特徵的基礎預測器,它不依賴於任何圖學習。然後,執行兩種類型的標籤傳播 (LP):一種通過建模相關誤差來校正基礎預測;一種用來平滑最終預測。研究人員將這兩種方法的結合稱作 Correct and Smooth(C&S,參見圖 1)。LP 只是後處理步驟,該 pipeline 並非端到端訓練。此外,圖只在後處理步驟中使用,在前處理步驟中用於增強特徵,但不用於基礎預測。這使得該方法相比標準 GNN 模型訓練更快速,且具備可擴展性。

該研究還利用兩種 LP 和節點特徵的優勢,將這些互補信號結合起來可以獲得優秀的預測結果。

實驗

為了驗證該方法的有效性,研究者使用了 Arxiv、Products、Cora、Citeseer、Pubmed、Email、Rice31、US County 和 wikiCS 九個數據集。

節點分類的初步結果

下表 2 給出了相關實驗結果,研究者得出了以下幾點重要發現。首先,利用本文提出的 C&S 模型,LP 後處理步驟會帶來巨大增益(如在 Products 數據集上,MLP 的基礎預測準確率由 63% 提升至 84%);其次,具有 C&S 框架的 Plain Linear 模型的性能在很多情況下優於 plain GCN,並且無可學習參數的方法 LP 的性能通常也媲美於 GCN。這些結果表明,通過簡單使用特徵在圖中直接合併關聯往往是更好的做法;最後,C&S 模型變體在 Products、Cora、Email、Rice31 和 US County 等 5 個數據集上的性能通常顯著優於 SOTA。在其他數據集上,表現最佳的 C&S 模型與 SOTA 性能之間沒有太大的差距。

使用更多標籤進一步提升性能

下表 4 展示了相關結果,強調了兩點重要發現。其一,對於想要在很多數據集上實現良好性能的直推式節點分類實驗而言,實際上並不需要規模大且訓練成本高的 GNN 模型;其二,結合傳統的標籤傳播方法和簡單的基礎預測器能夠在這些任務上優於圖神經網絡。

更快的訓練速度,性能超過現有 GNN

與 GNN 或其他 SOTA 解決方案相比,本文中的 C&S 模型需要的參數量往往要少得多。如下圖 2 所示,研究者繪製了 OGB-Products 數據集上參數與性能(準確率)的變化曲線圖。

除了參數量變少之外,真正的增益之處在於訓練速度更快了。由於研究者在基礎預測中沒有使用圖結構,與其他模型相比,C&S 模型在保持準確率相當的同時往往實現了訓練速度的數量級提升。

具體而言,與 OGB-Products 數據集上的 SOTA GNN 相比,具有線性基礎預測器的 C&S 框架表現出更高的準確率,並且訓練時長減至 1/100,參數量降至 1/137。

性能可視化

為了更好地理解 C&S 模型的性能,研究者將 US County 數據集上的預測結果進行了可視化操作,具體如下圖 3 所示。正如預期的一樣,對於相鄰 county 提供相關信息的節點而言,殘差關聯往往會予以糾正。

相關焦點

  • MIT斯坦福一文綜述GNN到底有多強
    特別是,我們對基於各種聚合函數的 GNN 性能進行了對比。我們的結果證實了最強大的 GNN(我們的圖同構網絡 GIN)具有很強的表徵能力,可以近乎完美的擬合訓練數據,然而較弱的 GNN 變體有嚴重的欠擬合問題。此外,在許多圖分類的基準測試集上,它的表徵能力和性能優於其他的 GNNs。
  • TweetFit - 融合多種社會媒體和傳感器數據進行健康檔案學習
    然而,數據源整合是以「早期融合」的方式進行的,其中所有的特徵在模型訓練之前被融合成一個向量。這樣的數據集成策略可能導致高維度和次優的最終結果。Farseev等人(2015年)引入了有效的集成學習解決方案,旨在將多源多模態數據組合用於人口統計學用戶狀態學習。該模型在每個數據源上獨立進行訓練,並以「後融合」方式進行整合,不能充分利用多源數據。
  • 5篇必讀的數據科學論文(以及如何使用它們)
    不妨試試論文中專家談到的實用技巧來簡化你的開發和生產。第二篇:Software 2.0這篇來自於Andrej Karpathy的優質博文闡明了機器學習模型是基於數據進行編程的軟體應用程式之範例。如果數據科學是軟體,那麼我們到底要朝著什麼方向發展呢?
  • 蘋果MacBook Air評測:使用M1晶片,性能超i9處理器,無風扇
    蘋果的新款MacBook Air性能到底怎麼樣?當你第一次用它來打開大型網站的時候,你可能感受不出來。但當你玩遊戲時,你會驚奇地發現它強大的性能表現完全不像一臺超便攜筆記本電腦,並且它沒有風扇,所以很靜音。表面上看,蘋果M1晶片讓新款MacBook Air性能得到了大幅提升。
  • 8.6M超輕量中英文OCR模型開源,訓練部署一條龍|Demo在線可玩
    無論是移動端和伺服器端,待識別的圖像數目往往非常多,都希望模型更小,精度更高,預測速度更快。GPU太貴,最好使用CPU跑起來更經濟。在滿足業務需求的前提下,模型越輕量佔用的資源越少。2. 實際業務場景中,OCR面臨的問題多種多樣,業務場景個性化往往需要自定義數據集重新訓練,硬體環境多樣化就需要支持豐富的部署方式。
  • 邯鄲雙螺杆吹膜機供應商如何進行性能的改進呢?
    吹膜機製造機械工藝的改造將推動行業的發展,一直以來,行業依賴外國先進機械設備,引進國外技術,將提高行業和塑機行業的生產成本,發展塑機智能化模式不僅提高了吹膜機的性能,而且更能降低成本、縮減工作時間,將顯著改善行業現狀。因此高低壓吹膜機的吹膜效果會受到這些因素的影響,故而我們多加注意。
  • 機器學習實戰:GNN(圖神經網絡)加速器的FPGA解決方案
    GraphSAGE算法簡介 學術界已對GNN算法進行了非常多的研究討論,並提出了數目可觀的創新實現方式。其中,史丹福大學在2017年提出的GraphSAGE是一種用於預測大型圖中動態新增未知節點類型的歸納式表徵學習算法,特別針對節點數量巨大、且節點特徵豐富的圖做了優化。
  • CNN已老,GNN來了!清華大學孫茂松組一文綜述GNN
    在這裡,我們描述了原始的GNN,並列舉了原始GNN在表示能力和訓練效率方面的局限性。 接著,我們介紹了幾種不同的GNN變體,這些變體具有不同的圖形類型,利用不同的傳播函數和訓練方法。其次,我們列出了在傳播步驟進行修改(卷積、門機制、注意力機制和skip connection)的幾種變體,這些模型可以更好地學習表示。最後,我們描述了使用高級訓練方法的標題,這些方法提高了訓練效率。 圖2概述了GNN的不同變體。
  • 虛擬桌面基礎架構(VDI):如何針對當前現狀進行擴展和優化
    VMware Horizon 是針對軟體定義數據中心進行了優化的虛擬桌面解決方案,能夠通過一個統一工作空間提供虛擬桌面和應用。而且,隨著遠程辦公需求的增加,即使已經支持 VDI 的企業也能獲益匪淺,最大限度地提高 CPU 性能以增加用戶數量,從而使全部員工都能獲得所需的資源。
  • 成本降低超60%,每年節省電費約10億元,國產「高鐵生命線」有何秘訣...
    成本降低超60%  眾所周知,接觸線是電氣化高速列車牽引供電系統的核心環節,也是我國發展高速鐵路所面臨的關鍵技術之一,直接影響到列車的運行安全和速度身為劉平研究團隊成員之一的上海理工大學教師周洪雷告訴記者,隨著高鐵的快速發展,高速運行的列車受電弓對接觸線提出更高強度、更優導電性能的要求。但是,當時相關技術由國外企業壟斷,技術受限、產量受限、高昂的原料加工費,令大家感到「國產化」刻不容緩。  從2002年開始,劉平教授帶領著二十多人的團隊開始著手研究,2007年開始和企業合作,進行產業化。
  • NVIDIA發布AI平臺 大幅減少超算數據中心停機時間
    日前,NVIDIA發布了NVIDIA Mellanox UFM Cyber-AI平臺,該平臺運用AI分析技術檢測安全威脅和運行問題並預測網絡故障,能夠大幅減少InfiniBand數據中心的停機時間。
  • 性能超GTX680四成? Titan性能震撼首測
    因此這種設計不僅可以比較直接的為架構帶來更好的幾何和光柵化處理能力,同時還可以提升任務的執行效率。  與去年發布的GK104不同,NVIDIA在GK110架構中使用了新的宏觀並行結構。GK104的8組SMX單元被兩兩分組結合成一個GPC,整個架構的8組SMX單元被劃分成了4 GPC並行的形式。
  • 「以性能論豪華」,廣汽Acura找到了專屬個性標籤
    但對於相對不那麼大眾的Acura品牌而言,以「性能豪華」的個性標籤向這一市場規模性進軍,要想成為這一市場的代表卻不容易。一方面,好比操控之於寶馬、科技之於奧迪、安全之於沃爾沃,打造一個專屬的個性化標籤極具挑戰。另一方面,Acura要深入性能,這也就意味著,廣汽Acura要打造的性能豪華,更多需要駕乘才能得以感知。
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    容易說明雖然非常成功,但使用物理工具識別蛋白質結構的過程既昂貴又耗時,即使使用低溫電子顯微鏡等現代技術也是如此。因此,絕大多數蛋白質結構 - 以及引起疾病的突變對這些結構的影響 - 仍然在很大程度上是未知的。計算蛋白質摺疊方式的計算方法有可能顯著降低確定結構所需的成本和時間。但是,經過近四十年的緊張努力,這個問題很難解決。
  • 超高頻射頻識別標籤靈敏度測試
    近年來我國也在這個技術上發展革新,推出了自有標準GB/T 29768,其頻率規定在840-845MHz 和920M-925MHz,避開了臨近的GSM業務波段。  目前這些協議被統稱為800-900MHz超高頻射頻識別。而這些協議都繼承了高速應答,快速盤點,讀寫距離較遠的特點。而這些熱門協議產品的性能成為使用的關鍵。其中尤其是標籤,處於競爭激烈的中心。
  • 以色列一家公司推出超輕超高效發動機,一箱油竟能跑出1600公裡!
    於是,以色列有一家公司Aquarius Engines就發明了一款超輕超高效的全新發動機。其燃油效率高,使得能耗大大降低。這款發動機由以色列一家名為Aquarius Engines公司所開發。其工作原理與傳統發動機完全不同:傳統發動機都是往返活塞式內燃機,藉助多個活塞上下運動向汽車提供能量。
  • 進行力量訓練有什麼好處?在力量訓練期間,養成良好的生活習慣
    力量訓練可以稱為無氧運動,與跑步和跳舞等有氧運動有很大的不同。 它基於無氧訓練。 力量訓練不僅可以鍛鍊肌肉和體形,還可以讓我們獲得力量,例如有效的改善上肢力量,腰、腹部力量等 一、進行力量訓練有什麼好處?第一、身體素質得到改善!當您開始有氧運動時,您可能會感到疲倦,而運動時,您可能會氣喘籲籲,因為您的心肺功能仍處於低水平。
  • 江恩九方圖——如何使用這個預測工具進行交易
    來源:匯商Forexpress江恩(WilliamDelbert Gann)所使用的交易概念帶來了神秘感。他主要以市場預測能力而聞名,如結合了幾何學、佔星術和古代數學技巧的江恩九方圖。江恩24歲開始交易,是個虔誠的人。江恩還是一位33度共濟會會員,一些人把這歸功於他的數學和比率知識。
  • RFID電子標籤設備高端生產商——紐豹將在IOTE2019深圳物聯網展上...
    DDA 40000直接貼片設備  在多年前,紐豹研發部門就提出了直接貼片的概念。這項只使用了一個放置系統的專利技術可達到每小時40000的產能,且機器佔地面積減小了30%。 CL 30000電子標籤複合設備  CL 30000 是一款可進行靈活輸出配置的高性價比設備。可對幹Inlay進行分切和卷對卷的複合操作。