雷鋒網AI科技評論按:近日,Cunchao Tu 和 Yuan Yao 兩位研究者在 GitHub 上總結發表了一份關於網絡表示學習(NRL: network representation learning)和網絡嵌入研究領域(NE: network embedding)必讀論文清單。這份清單共包含 5 篇綜述論文和 64 篇會議期刊論文。同時兩位研究者在 GitHub 上發布了 NE / NERL 的開源工具包 OpenNE。該庫提供了標準的 NE / NRL(網絡表示學習)培訓和測試框架,目前在 OpenNE 中實現的模型包括 DeepWalk,LINE,node2vec,GraRep,TADW 和 GCN。
五篇必讀Survey Papers
作者:William L. Hamilton, Rex Ying
論文地址:https://arxiv.org/pdf/1709.05584.pdf
論文摘要:在不同圖(Graph)上的機器學習是一項重要且無處不在的任務,其應用範圍從藥物設計到社交網絡中的好友推薦。該領域的主要挑戰是找到一種方法來表示或編碼圖結構,以便機器學習模型可以輕鬆利用它。傳統的機器學習方法依賴於用戶定義的啟發式方法來提取編碼關於圖的結構信息的特徵(例如,度數統計或內核函數)。然而,近年來,使用基於深度學習和非線性降維的技術,自動學習將圖結構編碼為低維嵌入的方法出現了激增。在這裡,我們提供了關於圖形表示學習領域進展的關鍵概念回顧,包括基於矩陣分解的方法,基於隨機遊走的算法和圖形卷積網絡。文中回顧了嵌入單個節點的方法以及嵌入整個(子)圖的方法。為此,制定了一個統一的框架來描述這些最新的方法,並且強調了未來工作的一些重要應用和方向。
作者:Palash Goyal , Emilio Ferrara
論文地址: https://arxiv.org/pdf/1705.02801.pdf
論文摘要:社交網絡,詞語共現網絡和通信網絡等圖(Graph)出現在現實世界的應用中。在過去,研究人員已經通過很多方法分析它們用來洞察社會結構,語言以及不同的交流模式。最近,在向量空間中使用圖節點表示的方法得到了研究團隊的關注。在這次調查中,我們對文獻中提出的各種圖嵌入技術進行了全面和結構化分析。我們首先介紹嵌入任務及其可擴展性,維度選擇,以及要保留的功能等挑戰及其可能的解決方案。然後,我們基於因式分解方法,隨機遊走和深度學習,提出了三類方法,並給出了每個類別中具有代表性算法的例子以及各種任務的表現分析。我們在幾個常見數據集上評估這些最先進的方法,並比較它們的性能。我們最終呈現了我們開發的開源 Python 庫,名為 GEM(圖嵌入方法,可在 https://github.com/palash1992/GEM 上獲得),它提供了所有在統一界面中提到的算法。
作者:Hongyun Cai, Vincent W. Zheng, Kevin Chen-Chuan Chang
論文地址:https://arxiv.org/pdf/1709.07604.pdf
論文摘要:圖是一種重要的數據表示形式,它出現在各種各樣的現實場景中。有效的圖分析為用戶提供了對數據背後知識更深入的了解,從而可以使許多有價值的應用程式受益,如節點分類,節點推薦,連結預測等。然而,大多數圖分析方法仍遭受高計算和空間成本的限制。圖嵌入是解決圖分析問題的有效且高效的方法,它將圖形數據轉換為低維空間,其中圖形結構信息和圖形屬性得到最大限度地保留。在這次調查中,我們對過去關於圖嵌入的文獻進行了全面的回顧。我們首先介紹圖形嵌入的正式定義以及相關的概念。之後,我們提出了兩種圖嵌入分類法,它們對應於不同圖嵌入問題設置中存在的挑戰以及現有工作如何解決其解決方案中的這些挑戰。最後,我們總結了圖嵌入的應用,並提出了四個有前景的未來研究方向,包括計算效率,問題設置,技術和應用場景。
作者:Daokun Zhang, Jie Yin,Xingquan Zhu, Chengqi Zhang
論文地址:https://arxiv.org/pdf/1801.05852.pdf
論文摘要:隨著信息技術的廣泛使用,捕捉社交網絡,引文網絡,電信網絡和生物網絡等各種學科網絡之間的複雜關係變得越來越流行。分析這些網絡揭示了社會生活的不同方面,如社會結構,信息傳播和不同的交流模式。然而,大規模的信息網絡往往使網絡分析任務計算成本昂貴且棘手。最近,網絡表示學習被提出作為一種新的學習範式,通過保留網絡拓撲結構,頂點內容和其他邊信息將網絡頂點嵌入低維向量空間。這有助於在新的向量空間中輕鬆處理原始網絡以供進一步分析。在這次調查中,我們對數據挖掘和機器學習領域中的網絡表示學習的當前文獻進行了全面的回顧。我們提出了一種新的分類方法,根據他們所使用的方法和他們保存的網絡信息來分析和總結最先進的網絡表示學習技術。最後,為了便於研究這一主題,我們總結了基準數據集和評估方法,並討論了該領域的未來研究方向。
作者:Cunchao Tu, Cheng Yang, Zhiyuan Liu, Maosong Sun
論文地址:http://engine.scichina.com/publisher/scp/journal/SSI/47/8/10.1360/N112017-00145?slug=full%20text
論文摘要:網絡是表示對象及其關係的重要方式。網絡研究中的一個關鍵問題是如何正確表示網絡信息。隨著機器學習的發展,網絡頂點的特徵學習已成為一個重要的研究領域。網絡表示學習算法將網絡信息轉換為密集的低維實值向量,可用作現有機器學習算法的輸入。例如,頂點的表示可以被饋送到分類器,例如用於頂點分類的支持向量機(SVM)。另外,通過將表示作為歐幾裡德空間中的點,可以將表示用於可視化。網絡表徵學習的研究引起了許多研究者的關注。在這篇文章中,介紹和總結了近期關於網絡表示學習的研究工作。
六十四篇期刊會議論文
論文地址:https://arxiv.org/pdf/1403.6652.pdf;
代碼地址:https://github.com/phanein/deepwalk
論文地址:http://webia.lip6.fr/%7Egallinar/gallinari/uploads/Teaching/WSDM2014-jacob.pdf
論文地址:http://media.cs.tsinghua.edu.cn/%7Emultimedia/cuipeng/papers/KDD-NonTransitiveHashing.pdf
論文地址:https://www.researchgate.net/publication/301417811_GraRep;
代碼地址:https://github.com/ShelsonCao/GraRep
論文地址:https://arxiv.org/pdf/1503.03578.pdf;
代碼地址:https://github.com/tangjianpku/LINE
論文地址:http://thunlp.org/%7Eyangcheng/publications/ijcai15.pdf
代碼地址:https://github.com/tangjianpku/LINE
論文地址:https://arxiv.org/pdf/1508.00200.pdf
代碼地址:https://github.com/mnqu/PTE
論文地址:http://www.ifp.illinois.edu/%7Echang87/papers/kdd_2015.pdf
論文地址:https://pdfs.semanticscholar.org/1a37/f07606d60df365d74752857e8ce909f700b3.pdf
論文地址:http://media.cs.tsinghua.edu.cn/%7Emultimedia/cuipeng/papers/hoppe.pdf
論文地址:http://proceedings.mlr.press/v48/yanga16.pdf
論文地址:http://www.kdd.org/kdd2016/papers/files/rfp0218-groverA.pdf
代碼地址:https://github.com/aditya-grover/node2vec
論文地址:http://thunlp.org/%7Etcc/publications/ijcai2016_mmdw.pdf
代碼地址:https://github.com/thunlp/mmdw
論文地址:https://www.ijcai.org/Proceedings/16/Papers/271.pdf
論文地址:http://www.aclweb.org/anthology/P16-1095
論文地址:http://media.cs.tsinghua.edu.cn/%7Emultimedia/cuipeng/papers/SDNE.pdf
論文地址:http://www.kdd.org/kdd2016/papers/files/Paper_679.pdf
論文地址:http://media.cs.tsinghua.edu.cn/%7Emultimedia/cuipeng/papers/NE-Community.pdf
論文地址:https://arxiv.org/pdf/1609.02907.pdf
代碼地址:https://github.com/tkipf/gcn
論文地址:http://thunlp.org/%7Etcc/publications/acl2017_cane.pdf
代碼地址:https://github.com/thunlp/cane
論文地址:http://thunlp.org/%7Etcc/publications/ijcai2017_neu.pdf
代碼地址:https://github.com/thunlp/neu
論文地址:http://thunlp.org/%7Etcc/publications/ijcai2017_transnet.pdf
代碼地址:https://github.com/thunlp/transnet
論文地址:https://www3.nd.edu/%7Edial/publications/dong2017metapath2vec.pdf
代碼地址:https://ericdongyx.github.io/metapath2vec/m2v.html
論文地址:https://dl.acm.org/citation.cfm?id=3098142
論文地址:http://www.public.asu.edu/%7Ejundongl/paper/KDD17_SignedFS.pdf
論文地址:https://arxiv.org/pdf/1704.03165.pdf
代碼地址:https://github.com/leoribeiro/struc2vec
論文地址:http://people.tamu.edu/%7Exhuang/Xiao_WSDM17.pdf
代碼地址:https://github.com/xhuang31/LANE
論文地址:http://www.public.asu.edu/%7Ejundongl/paper/SDM17_AANE.pdf
代碼地址:https://github.com/xhuang31/AANE_Python
論文地址:https://arxiv.org/pdf/1706.02216.pdf
代碼地址:https://github.com/williamleif/GraphSAGE
論文地址:http://aclweb.org/anthology/P17-3010
論文地址:https://papers.nips.cc/paper/7110-prune-preserving-proximity-and-global-ranking-for-network-embedding.pdf
論文地址:https://arxiv.org/pdf/1710.03059.pdf
CIKM 2017
論文地址:https://arxiv.org/pdf/1702.02287.pdf
論文地址:http://www.cis.pku.edu.cn/faculty/system/zhangyan/papers/CIKM2017-lts.pdf
論文地址:http://www.public.asu.edu/%7Eswang187/publications/SNEA.pdf
論文地址:https://arxiv.org/pdf/1706.01860.pdf
論文地址:http://shichuan.org/hin/topic/Embedding/2017.%20CIKM%20HIN2Vec.pdf
論文地址:https://dl.acm.org/citation.cfm?id=3132975&dl=ACM&coll=DL
論文地址:https://arxiv.org/pdf/1709.06636.pdf
論文地址:http://i.cs.hku.hk/%7Ezphuang/pub/CIKM17.pdf
論文地址:https://www.cs.uic.edu/%7Eclu/doc/cikm17_mcge.pdf
論文地址:https://web.cs.wpi.edu/%7Exkong/publications/papers/cikm17.pdf
論文地址:http://sentic.net/community-embedding.pdf
代碼地址:https://github.com/andompesta/ComE
WSDM 2018
論文地址:https://arxiv.org/pdf/1710.02971.pdf
論文地址:http://people.tamu.edu/~xhuang/Xiao_WSDM18.pdf
論文地址:https://arxiv.org/pdf/1712.00732.pdf
論文地址:http://cse.msu.edu/~mayao4/downloads/Multidimensional_Network_Embedding_with_Hierarchical_Structure.pdf
論文地址:https://dl.acm.org/citation.cfm?id=3159711&dl=ACM&coll=DL
AAAI 2018
論文地址:https://arxiv.org/pdf/1711.07838.pdf
論文地址:http://yangy.org/works/dynamictriad/dynamic_triad.pdf
Multi-facet Network Embedding: Beyond the General Solution of Detection and Representation.
RSDNE: Exploring Relaxed Similarity and Dissimilarity from Completely-imbalanced Labels for Network Embedding.
Link Prediction via Subgraph Embedding-Based Convex Matrix Completion.
Generative Adversarial Network based Heterogeneous Bibliographic Network Representation for Personalized Citation Recommendation.
DepthLGP: Learning Embeddings of Out-of-Sample Nodes in Dynamic Networks.
論文地址:http://media.cs.tsinghua.edu.cn/%7Emultimedia/cuipeng/papers/DepthLGP.pdf
Structural Deep Embedding for Hyper-Networks.
TIMERS: Error-Bounded SVD Restart on Dynamic Networks.
Community Detection in Attributed Graphs: An Embedding Approach.
Bernoulli Embeddings for Graphs.
論文地址:http://sumitbhatia.net/papers/aaai18.pdf
論文地址:https://arxiv.org/pdf/1711.08267.pdf
論文地址:https://arxiv.org/pdf/1706.07845.pdf
代碼地址:https://arxiv.org/pdf/1706.07845.pdf
論文地址:https://arxiv.org/pdf/1711.10755.pdf
雷鋒網(公眾號:雷鋒網)整理編譯
更多內容歡迎關注雷鋒網AI科技評論
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。