第五章 時序圖網絡建模
5.1 時序圖數據定義
5.1.1 時序圖定義
在數時序圖之前,我們先來看看靜態圖結構。靜態圖結構,其結構是靜態的,節點和邊的屬性、數量等都不會隨時間改變,這個一般僅供圖論中研究。其具體的數學定義如下: G = {V, E},其中V表示定點集合,E 表示連邊集合,網絡的拓撲結構可以用鄰接矩陣 D = {Dij}n×n表示,若每個節點具有自己的維屬性向量,則網絡的屬性矩陣表示為A={Aij}n×n,靜態圖網絡整體便可表示為G={V,E,A}。
與之對應的就是時序圖網絡了,簡單來說,時序圖網絡就是指圖網絡結構隨時間不斷變化、演化的動態網絡,網絡中節點和邊的屬性、數量等隨時間改變。按理來說,世界上所有事物都可以構成一個拓撲圖,這個拓撲圖就是動態網絡,最常見的就是我們的社交網絡,每天都有新的人員加入、離去,或修改人員屬性,這個巨大的社交網絡就是時序圖網絡。下面我們給出其具體的數學定義:給定一個時序圖G=(V,E),其中V是G中的一組頂點,E是G的一組邊,對於一條邊e∈E,用四元組(u,v,t,r)來表示,其中頂點u,v∈V,t是起始時間,r是從u到v遍歷時間,則從u到v的終止時間為t+r,邊e的起始時間為t(e),遍歷時間為r(e),即e在[t,t+r]時是被激活的。
如圖所示,圖(a)表示有4個頂點的靜態圖;圖(b)表示存在與1-10時間閾值內的時序圖,圖(c)表示圖(b)中頂點和邊對應的時間序列。
5.1.2 時序圖分類
時序圖網絡可以分成兩種情況,一種是,頂點間的相互作用是在一個確切時間上發生的、持續時間可以忽略不計的時序圖,即r(e)=0。直接一點說就是該種時序圖網絡不考慮兩個節點之間相互作用持續的時間,而是只考慮某個時刻是否有相互作用;另外一種是,時序圖中的邊在時間閾值中被激活,即r(e)≠0。常用來表示持續時間很重要的時序圖,例如在交通網絡中,頂點間的邊表示通行時間。
5.1.3 時序圖性質
由於時序圖網絡中最重要的屬性是時間,所以時間對時序圖網絡有重要影響,這也導致了其性質不同於我們常見的靜態結構。比如說連通性,時序圖的網絡結構在不斷變化,兩個節點在某個時刻可能存在一條連接路徑,某些時刻可能又不存在一條連接路徑,所以時序圖網絡的連通性是基於時間的,其也可以分為強聯通和弱連通:
還有其它的一些性質也有些不同,比如:
頂點之間的距離:指兩個頂點可達的最短時間;
時序圖直徑:最小的頂點距離;
5.2 時序圖數據模型
要對時序圖網絡進行分析,必須首先對時序圖網絡進行數據模型建模,其常見的數據模型主要有三種,下面分別進行介紹。
5.2.1 連續時間圖模型
連續時間圖模型就是邊構建帶有時間信息標籤的圖結構,一條邊有一個或多個時間戳。對時序上的網絡等間隔取快照是比較粗糙的方法,不能捕捉所取間隔時間內網絡的變化。更加細緻的表示方法是記錄網絡中所有變化:定義一個動態網絡
,其中VT是所有定點的集合,
記錄了定點出現的時間。
表示網絡中的時序連邊(temporal edges),也就是將每個連邊都打上多個時間戳,表示連邊在該時刻發生變化。每一條邊都被賦予了一個特定的時間戳
另外,t屬於R+還可以定義網絡的屬性矩陣,AT記錄每個點的屬性在不同時刻的值。
這種模型的特點是,可以構建統一的查詢機制,但時間信息複雜,為時序圖構建索引也相對複雜並且索引量巨大,索引效果一般。
5.2.2 時間圖快照模型
時間圖快照模型是指在離散的時間上為時序圖構建相應的快照。這類表示方法在時序上對動態網絡等間隔取快照(Snapshot),從而得到網絡演化的離散序列,定義為:
其中
表示動態網絡在 t 時刻的快照。這種表示方法相當於將動態網絡拆解成單個靜態網絡的序列。
該種模型的特點是,適用於具有特定時間結構的時序圖,特別是在即時網絡中;這種情況下,時序圖是由一系列靜態圖組成的,該建模方式與動態圖類似,只能滿足離散時間上的查詢與挖掘需求,而且保存所有快照需要大量的內存空間,因此也不能很好的應用與所有的時序圖。
5.2.3 頂點多副本模型
頂點多副本模型是指通過時間為頂點構建副本,將時序圖完全轉換成靜態圖,即在同一時刻的圖中同時存在頂點和頂點的多個副本,通過頂點副本將時序圖轉換成靜態圖。該種數據模型的特點是隨著數據的增多,圖的規模不斷增大,稠密且大規模的圖數據不斷增多,這種方法使圖的規模激增,因此不能很好的應用於大圖數據中。
5.3 時序圖應用及方向
並不是說所有的時空網絡都可以用時序圖的方法來解決,一般來說,只有當一個網絡有時序性結構,符合時序圖的框架,並且涉及到時間標度時才需要用時序圖來解決問題。而且如果動態系統的變換速度遠快於動態連結的速度,或者圖中的邊是活躍的變化的,那麼就不需要將動態系統轉換成時序圖。針對目前時序圖的研究來看,主要是沿著如下的幾個方法:
提高查詢處理與挖掘效率;
更多的查詢處理與挖掘方法;
構建統一的時序圖管理系統;
5.4 基於時序圖的時間序列分析
前面章節討論過,時間序列數據可以通過引入數據節點之間的關係來構建時序圖網絡,以實現模型中對數據節點之間的相互影響的建模,進一步加強模型的預測精度。從上述三種時序圖數據模型分析可知,可用於時間序列分析的主要是基於時間圖快照的數據模型,該模型符合時間序列等間距的特點,可以方便的建立每個時刻的圖數據結構。如下圖所示:
每個時刻都可以構建成一個靜態圖,每個靜態圖都具有一定的全局屬性、節點屬性、邊屬性,而這些屬性都是隨時間不斷演變的,其中可能存在某些演變的規律和模式。後續,我們將進一步研究如何利用圖神經網絡算法來分析時序圖的演變,包括全圖屬性、邊屬性、節點屬性隨時間的演變規律。
參考文獻:
大規模時序圖數據的查詢處理與挖掘技術綜述.王一舒、袁野等.計算機研究與發展 55(9):1889-1902 2018
未來地圖:物聯--數聯--智聯
【物聯】
【數聯】
【智聯】