圖機器學習有多大神力?一文帶你回顧2020,展望2021

2021-01-12 新智元

【新智元導讀】近兩年,圖機器學習可謂是機器學習研究領域的新星,隨著模型的更新和應用的推廣,越來越多的人開始把注意力轉向了這一方向。過去一年中,圖機器學習在哪方面有突破呢,在未來的一年中,哪些分支和方向會成為新的研究趨勢呢?這篇文章,帶你領略該領域諸多名人的最新思考。

2020年,圖機器學習成為了機器學習領域中炙手可熱的」明星「。

不管是剛入門的小白,還是在該領域深耕的專家,都會對該領域的迅速發展有深刻的體驗。

而此篇文章,就涵蓋了圖機器學習及其應用領域的大佬們的一些深入思考,其中包括了對2020年的總結,以及對2021年的的展望。

在這些人中,有GraphSAGE的作者、GCN的作者,Graph Attention Network的作者等這樣的巨佬。

他們的觀點,又會給我們帶來什麼引導和啟示呢?

相關領域和感興趣的小夥伴們,準備好了嗎?

消息傳遞(Message Passing)

威爾·漢密爾頓(Will Hamilton),麥吉爾大學(McGill University)助理教授,Mila CIFAR主席,GraphSAGE一書作者表示:

「2020年,圖機器學習領域開始接受消息傳遞範式的基本限制。這些限制包括所謂的「瓶頸」問題、過度平滑的問題,以及表徵能力方面的理論限制。

展望未來,我希望在2021年,我們會尋找圖機器學習的下一個大的範式。我不確定到底下一代圖機器學習算法的會是什麼樣子,但是我相信,如果想要進步,那麼就需要脫離在2020年之前成主導地位的消息傳遞機制。

此外,我還希望在2021年,也能出現更多的富有更大影響力和更具挑戰性的圖機器學習應用領域。最近,已經有太多的研究是集中在簡單的同質節點分類任務上的。實際上,我更希望在需要更複雜算法推理的任務上看到方法論的進步:比如涉及知識圖、強化學習和組合優化的任務。」

算法推理(Algorithmic reasoning)

Petar Velikovi是DeepMind的高級研究員,也是圖注意網絡的作者表示:

「2020年絕對且不可逆轉地,將圖表示學習轉變為了機器學習的『一等公民』。」

今年取得的巨大進步太多了,無法簡單列舉,但我個人最興奮的,則是神經算法推理。

傳統上,神經網絡在插值領域是非常強大的,但眾所周知,它的推理能力是不充分的。推理的主要特徵之一,就是能夠在分布之外發揮作用。

對於GNN的未來發展,推理任務很可能會佔有很重要的地位,不僅因為GNN與這些任務匹配地非常好,還因為許多真實世界中的圖任務具有同質性。這意味著最有效的可擴展的方法,通常會以更簡潔的GNN框架形式出現。

建立在先前如神經圖靈器和差分神經計算機之類神經設計的成功上,又經過當前圖機器學習工具的普遍應用,2020年的許多工作,探索了神經設計的理論局限性、發明了更加新穎且強大的GNN推理結構、並使神經推理任務的泛化能力得到了大幅提高。

我個人最激動的是,經過預訓練的算法執行者,可以讓我們將經典算法應用於過於原始甚至不適合該算法的輸入。例如,我們的XLVIN代理,正是使用了這些概念,即使在底層MDP的具體情況尚不清楚的情況下,也能允許GNN在強化學習中執行值迭代風格的算法。

我相信,到2021年,GNN應用於強化學習的時機將成熟。」

關係結構發現(Relational structure discovery)

Thomas Kipf是谷歌Brain的研究科學家,也是Graph Convolutional Networks的作者,他表示:

「自從最近基於GNN的模型被廣泛採用以來,在圖機器學習領域中,一個特別值得注意的趨勢是計算結構與數據結構的分離。

在最近的ICML研討會上,我將這種趨勢稱為關係結構發現。通常,我們設計的是具有固定結構的圖神經網絡,而固定結構一般是由對應數據集而來,即數據集的節點和邊被作為我們模型的計算結構,或者是消息傳遞結構的黃金標準。

在2020年,我們已經看到人們對能夠適應計算結構的模型越來越感興趣,也就是說,它們使用哪些組件作為節點,在哪些節點對上執行消息傳遞,而不僅僅是簡單的基於注意力的模型。

2020年,具有影響力的例子包括使用神經關係推理,從時間序列順序去推斷因果圖的攤銷因果發現( Amortised Causal Discovery)、具有可學習指針和關係機制的GNN、以及在學習出的推理抽象節點上進行計算的模型。

這些發展都具有廣泛的意義,因為它們允許我們有效地利用GNN架構在其他領域((如文本或視頻處理) 中提供的對稱性(如節點排列等)和歸納偏差(如成對交互函數建模)。

展望未來,我希望,我們能夠看到在不依賴明確監督的情況下,如何在給定數據和任務的情況下,學習最佳的計算圖結構(包括節點和關係)。

對這些學習到的結構進行探索,將有助於更好地解釋學習到的模型在解決任務時的計算行為,並可能使我們進一步進行類比因果推理。」

表現力(Expressive Power)

Nvidia的研究科學家Haggai Maron,是可證明表達的高維圖神經網絡的作者,他表示:

「圖神經網絡的表達能力是2020年圖機器學習的核心主題之一。

有許多優秀的論文討論了各種GNN架構的表達能力,並展示了當GNN的深度和寬度受到限制時其基本的表達極限,並描述了可以使用GNN進行檢測和計數的結構類型。

這表明使用固定數量的GNN對許多圖形任務沒有意義,此外,這些論文還提出了使用迭代GNN學習,來自適應地終止消息傳遞過程的建議。

在2021年,我很高興看到在圖生成模型的原理方法、圖匹配和GNN之間的聯繫、GNN的表達能力、學習圖像和音頻等結構化數據的圖上的發展和進步,並在GNN領域和研究場景圖的計算機視覺領域之間建立更牢固的聯繫。」

可擴展性 (Scalability)

Matthias Fey是多特蒙德工業大學的博士學生,也是PyTorch幾何圖形和開放圖基準測試的開發人員,他表示:

「2020年圖機器學習研究中最熱門的主題之一,是解決GNN的可擴展性問題。

我們已經看到了許多論文,這些論文簡單地將不可訓練的傳播方案與圖形不可知的模塊結合在一起,作為前面或後面的處理步驟。這導致了極短的運行時間,並且顯著地提高了同構圖的性能。」

動態圖(Dynamic graphs)

Emanuele Rossi,Twitter的機器學習研究員,帝國理工學院的博士生,也是Temporal Graph Networks的作者,他表示:

「許多有趣的圖機器學習應用,本質上都是動態的,其中,圖拓撲和屬性都會隨著時間而演變。

社交網絡,金融交易網絡以及用戶項目交互網絡就是動態圖的例子。之前的大部分時間,對圖機器學習的絕大多數研究,都集中在靜態圖上。嘗試處理動態圖的工作,主要涉及的則是離散時間動態圖。

在2020年,我們看到了一系列關於連續時間動態圖的更廣泛類別的最新研究,這些作品可以被視為定時事件的異步流。

此外,動態圖模型的第一個有趣的成功應用也開始出現:我們看到了虛假帳戶檢測,欺詐檢測和控制流行病的傳播之類的實際用途。

我認為我們還處於持續摸索的狀態中,許多有趣的問題仍未得到解答。

重要的開放問題包括可擴展性,對動態模型的更好的理論理解,以及在單個框架中結合時間和空間的信息擴散。

此外,我們還需要更可靠,更具挑戰性的基準,以確保可以更好地評估和跟蹤進度。

最後,我希望看到動態圖神經架構的更多成功應用,特別是在工業界中。」

新硬體(New hardware)

Mark Saroufim是Graphcore的機器學習工程師,他表示:

「在和我曾經合作過的客戶中,永遠都找不到既沒有在生產中部署Graph Neural Network,也沒有計劃這樣做的人。

不使用GNN的部分原因是,忽略了諸如NLP,蛋白質設計或分子特性預測等實際應用中的自然圖結構,而選擇將數據視為適合現有和完善的機器學習模型(如Transformers)的序列。

但是,我們知道,Transformer不過是注意力被用作鄰域聚集函數的GNN,其中。在計算中,某些算法獲勝的現象不是因為它們非常適合解決特定問題,而是因為它們在現有硬體上運行良好而被稱為「硬體福利」 ,而在GPU上運行的Transformers就是這種情況。

在Graphcore,我們建立了具有1472個內核的新MIMD體系結構,該體系結構可以並行運行總共8832個程序,我們稱為智能處理單元(IPU)。該架構非常適合加速GNN。

我們的Poplar軟體堆棧,主要利用了稀疏性,將計算圖的不同節點分配給不同的核心。對於可容納IPU 900 MB內存的型號,我們的架構可大大提高GPU的吞吐量。

我很高興看到我們的客戶可以使用我們的架構來進行大量的研究。

我希望在2021年,能夠看到更多使用我們先進機器學習硬體的研究人員」

參考連結:

https://towardsdatascience.com/predictions-and-hopes-for-graph-ml-in-2021-6af2121c3e3d

相關焦點

  • 全面回顧2020年圖機器學習進展,12位大神論道、寄望2021年大爆發!
    「2020 年,圖機器學習領域開始受限於消息傳遞範式的本質缺陷。」上述缺陷包含人們常說的「瓶頸」、「過平滑」[2]等問題,以及表徵能力的理論限制[3,4]。展望未來,我們希望研究人員在 2021 年開始尋找圖機器學習的下一種核心範式。
  • 回顧2020、展望2021丨中科院湖州中心揚帆再啟航
    回顧2020、展望2021丨中科院湖州中心揚帆再啟航 2021-01-11 20:06 來源:澎湃新聞·澎湃號·政務
  • 北京大學王立威教授:機器學習理論的回顧與展望(四)
    *機器學習前沿所作報告《機器學習理論:回顧與展望》編輯整理而來,雷鋒網在未改變原意的基礎上略作了刪減。Algorithmic Stability,就是從定量的角度上來刻畫以下的關係:當換掉其中一個訓練數據時,算法學出來的結果會有多大的改變。
  • 回首2020 展望2021
    回首2020 展望2021 2021-01-05 01:21 來源:澎湃新聞·澎湃號·政務
  • 致敬人民警察節:「回首2020 展望2021 我想說...」
    2021年,我要踐行訓詞精神,以強烈的政治責任感和最堅定的決心,在不斷提高服務水平上下功夫,把每一件戶籍業務都辦成群眾滿意的暖心事,讓人民群眾有更多的獲得感和幸福感!2021,加油!便衣支隊梁波「曾經,你以青春許這身藏藍並為之堅守初心至今;而今,我以芳華為誓不負你半生平安守望」。回顧2020年,作為大隊綜合崗位內勤工作的我,在擔當中不辱使命,以平凡崗位譜華章。
  • 告別2020,有難忘有展望,來聽聽他們最可愛的聲音
    告別2020,有難忘有展望,來聽聽他們最可愛的聲音 2020-12-31 19:13 來源:澎湃新聞·澎湃號·政務
  • 最全乾貨回顧,一文看盡亞馬遜re:Invent 2020全貌
    不過即便採用了線上的模式,依然會有人無法盡數掌握為期三周的大會全部內容,因此 CSDN 聯合 Amazon Web Services (AWS) ,共同推出本篇回顧文章,帶領讀者朋友們共同再看亞馬遜 re:Invent 2020 給我們帶來了哪些驚喜。
  • AI應用場景的回顧與展望
    AI應用場景的回顧與展望 人民數字 Fintech 發表於 2021-01-08 09:29:50   2020年,是不平凡的一年,令人難忘的一年,對於人工智慧來說也是如此。
  • 機器學習 101:一文帶你讀懂梯度下降
    但是在我們開始之前,你可以點擊此處獲取代碼假設你想爬一座很高的山,你的目標是最快到達山頂,可你環顧四周後,你意識到你有不止一條路可以走,既然你在山腳,但似乎所有選擇都能讓你離山頂更近。  同樣的,如果我們有一個有四個變量的函數,我們會得到一個有四個偏導數的梯度向量。通常,一個有n個變量的函數會產生一個n維梯度向量。
  • 2020年深度學習發展大盤點及對2021年深度學習的未來展望|極客雲算
    隨著近年來的人工智慧發展,2020年深度學習依然是發展最快的領域之一,直奔未來工作。其發展是多方面的,而且是多方位的。以下是對2020年發展中一些突出亮點的梳理與盤點及2021年對深度學習的未來展望。
  • 【重磅來襲】2020年宏觀經濟金融回顧與2021年展望
    其中,2020年的242個交易日中,上證綜指僅有23天位於3400點以上,多次衝擊3500點大關未果,這表明整個2020年,雖然A股市場整體上揚,但動力似乎並沒有那麼強勁,需要有一系列的政策刺激。  (一)外圍環境展望  在疫情仍會擾動2021年全球經濟的假設下,我們有理由相信2021年的政策和經濟環境一定程度上會延續2020年的現有節奏。
  • 【年終大戲、重磅來襲】2020年宏觀經濟金融回顧與2021年展望
    當然,市場的諸多一致預期與些許分歧在2021年可能會體現的更加明顯和分化,但預期會不會再次被打破、信用環境收緊力度有多大以及持續時間有多長、疫情影響會在何時有明顯緩和、市場風格如何轉化、下一個擾動事件為何等一系列問題均需要在後面給予持續關注。
  • 2020紙漿價格回顧及2021展望,低價時代一去不復返
    01、2020年紙漿價格回顧上半年,由於新冠疫情衝擊,宏觀風險加劇,市場悲觀情緒蔓延 國內金融市場均經歷了一場暴跌,而隨著國內疫情的好轉,國內復工推進,物流也開始逐步恢復,國內經濟預期開始好轉,紙漿開始反彈至成本線附近。
  • 前沿研究丨光學數位化全息技術——全光學機器學習展望
    中國工程院院刊《Engineering》刊發《光學數位化全息——全光學機器學習展望》一文指出,未來,光學數位化全息技術與人工智慧技術的結合將為基礎科學和全息實際應用帶來重大突破。光學數位化全息技術,即利用光學手段得到高解析度、大尺寸、成本更低的全息圖,利用3D雷射直寫技術加工各種光敏材料,可以實現計算全息圖的光學數位化。
  • 全球會客廳:疫情之下,回首2020,展望2021
    隨著世界各地進入聖誕節和新年假期,艱難的2020年即將畫上一個句號。但與此同時,全球多國出現變異新冠病毒和捲土重來的疫情,給人們的假期生活和即將到來的2021年蒙上一層陰影。疫情之下,來自不同國家的人們度假方式發生了什麼變化?在即將過去的2020年裡有哪些難忘的故事?對新的一年又有哪些期許?
  • 魔域快速提升神力等級 教你三大秘訣
    因為呀,神力等級是開啟新副本的一個最基礎條件,神力不到65級,任你戰力再高,任你攻擊如何爆表,就是進不去新副本呀。 所以說呢,升級神力等級才是新資料片的當務之急!那麼,如何快速升級神力呢?小記也不賣關子,一個個給大家說。 一、災厄空間 第一個就是重量級的玩法,新出的神力等級地圖——災厄空間! 其實,我第一次看到這個地圖,就想說,這不就是深淵迷宮的升級版嘛?地形上簡直就是一個模子裡出來的,但是呢,這裡面的神力經驗是真心多!
  • 新華財經年報|2020年有色金屬行業分析及2021年展望
    2021年,頭部企業將從產品升級、技術創新等維度積極謀劃,進一步提升資源集中度、加速布局國內新興消費領域,豐富風險管理工具,主動融入「雙循環」發展格局。一、基本金屬價格衝至年內高位受新冠肺炎疫情影響,2020年全球經濟亮點難尋。世界銀行最新一期《全球經濟展望》報告顯示,預計2020年全球經濟將下滑5.2%,這將是二戰以來最嚴重的經濟衰退。
  • 40張圖34件大事帶你回顧2020年,感動!最終我們還是迎來更好2021
    或許你也總是念叨著,希望2020快點過去,但總有些不能輕易抹去、值得我們珍惜的瞬間。跟著我的腳步,一起回顧!-1月-澳洲山火為期5個月總過火面積超過600萬公頃,面積與愛爾蘭共和國相當,超過2000件房屋毀於一旦,近30億隻動物死亡或流離失所。 其規模之大、時間之長,是世界近三年之最。
  • 萬字乾貨 | 一文助你了解機器學習
    聽完這句介紹你是什麼感覺,如果一個完全沒接觸過機器學習的小白可能瞬間就懵逼了。原因很簡單,簡單一句話中包含了大量你無法理解的抽象概念,而事實可能並非如此。同樣的介紹我換一種說法:「我們通過一些規則給用戶打上標籤,使用一套計算規則預測用戶希望購買哪些商品,然後給他們做相應推薦」,是不是瞬間感覺沒那麼高大上了。
  • 2020年中國廢銅市場回顧及展望
    2020年在疫情影響廢銅市場陷入較大波動,回顧在上半年在進口政策及用廢企業產能擴張等因素影響下帶來市場變化,促進進口/國產廢銅供應進一步分化,而後續在進口政策打開及疫情後經濟陸續的過程中,廢銅市場或將產生新格局。