張江:從圖網絡到因果推斷,複雜系統自動建模五部曲

2021-01-11 騰訊網

導語

隨著深度學習崛起和圖結構數據井噴,從複雜系統角度揭開人工智慧黑箱、利用人工智慧輔助複雜系統建模都成為可能。集智俱樂部組織了系列閉門讀書會,在7月5日的第一場討論中,張江直播分享了複雜系統建模的深度學習技術綜述。

本文是對直播內容的整理,錄播視頻已上線,地址見文末。7月12日(周日)晚將進行讀書會第二場,討論兩篇利用圖網絡技術實現複雜系統自動建模的經典文章。系列讀書會目前開放報名中,詳情見文末。

從上世紀50年代以來,「想要創造擁有和人一樣智能的機器」,一直都是學術界和工業界爭相追逐的課題,「人工智慧」這個領域也隨著人們對於「什麼是智能」這個問題的思考之下,曲折向上發展。隨著算力的提升,人工智慧的研究對象,逐漸由單個個體,發展到了系統,尤其是對複雜系統的研究。而在另一邊的複雜科學領域,對複雜系統進行建模,一直以來都是一個非常重要的科學問題,關乎人們對這個世界的理解和認知。於是,用人工智慧的技術,來對複雜系統進行建模,應勢而生。

為什麼要自動建模

過去,人們為了研究複雜系統,往往是通過經驗,人工構建模型。包括生命遊戲、Boid模型,SIR病毒傳播模型,偏好依附網絡增長模型、匹配生長模型、人工股市模型等等。

這些人工模型有其獨特的優點。首先,模型往往非常簡潔,比如 Boid 模型,通過簡單的三條規則就能模擬出鳥群看似複雜的行為;其次,人工模型通常會依據科學家的經驗,非常具有洞察性,使得它更能夠抓住事物的本質,如小世界模型,無標度模型都描述了網絡的本質特徵;另外,簡潔的模型也非常便於理論分析,也不需要很強的算力就能執行。

但人工模型有其很強的局限性。首先它太過簡單,以至於很難解釋更多的複雜現象,也很難與真實數據去做擬合,預測的精度也會較低。比如人工股票市場,雖然它構建了一套機制,使得整個系統能夠與真實股票漲落趨勢非常接近,但實際上,這套機制與真實市場中的個體行為是完全無關的,所以不能用來做真實預測。其次,人工模型的構建與否建模者的個人經驗非常相關,它沒有統一的建模規則,非常依賴建模者的能力和啟發性思考。 「如何對複雜系統進行自動建模」,這是一個迫切的需求。

自動建模發展5個階段

隨著大數據的積累和人工智慧,特別是深度學習技術的發展,使得我們可以通過數據驅動的方式,利用深度學習算法來自動構建複雜系統的模型。其基本流程如圖所示:

圖1:利用深度學習算法來自動構建複雜系統模型的基本流程

我們根據獲取到的複雜系統的觀測數據,利用 AI 系統,自動去構建出一個我們想要的模型,從而捕獲到複雜系統內部的規則。這樣,我們就能夠對真實的複雜系統做出預測,甚至是控制。 其實這個發展趨勢最近幾年已經在迅猛發展了。最近,Chaos期刊推出了用於複雜系統的機器學習特刊,從這些文章中可見整個領域的發展趨勢。

圖2:Chaos上最新的有關機器學習與複雜系統特刊 接下來,我將對「人工智慧自動建模」這個領域進行綜述。在這裡大體按照發展順序,將這一領域劃分成了五個階段。

階段1:基於RNN的模型

複雜系統的行為數據大多表現為時間序列,而RNN是時間序列預測的主要工具,因此用RNN來自動建模是一個主力方向。使用RNN進行建模,其記憶機制可以捕捉到複雜系統的長程關聯。

基於 RNN 的方法有非常多,這裡我們提一個跟複雜系統相關的工作。

在這個工作中,用 RNN 的一種變種模型「庫計算」(reservoir computing),具有強大的預測能力,甚至可以預測混沌模型:

圖3:火焰方程模擬(上)以及RNN的預測(下)

階段2:基於圖網絡的模型

圖神經網絡,簡稱圖網絡,是近年發展起來的一種模型。在這類模型中,它基於一個給定的圖結構,這被稱為基於關係的偏置先驗(inductive bias),學習一種網絡節點到連邊,連邊到節點的映射過程。由於模型將圖結構充分利用,能夠把握非常異質化的網絡起來,因此準確度可以大大高。 圖網絡特別適合對複雜系統進行自動建模,更多關於圖網絡的基礎信息,可以在圖神經網絡、網絡科學、系統科學綜合交叉入門一文詳細學習,這裡不再展開敘述。

圖4:圖網絡做動力學預測原理圖

這篇文章對圖網絡進行了很好的綜述:

Relational inductive biases, deep learning, and graph networksPeter W. Battaglia,Jessica B. Hamrick,Victor Bapst.et al.(2018)

在時間序列自動學習方面,下面這篇文章是很好的典範。圖網絡不僅很好地學習了動力學,預測出了「機器蛇」的運動行為,而且還能夠在學好的動力學上做控制,即給定目標位置,讓「機器蛇」模型演化中間的運動狀態。

Graph networks as learnable physics engines for inference and control Alvaro Sanchez-Gonzalez, Nicolas Heess, Jost Tobias Springenberg.et al.(2018)

下面這篇文章是彩雲天氣算法工程師的工作,將圖網絡應用於霧霾預測,並結合氣象領域知識,構建城市間的相互作用網絡模型,對預測霧霾有非常好的效果

PM2.5-GNN: A Domain Knowledge Enhanced Graph Neural Network For PM2.5 ForecastingShuo Wang,Yanran Li,Jiang Zhang.et al.arXiv(2020)

階段3:基於神經微分方程求的方法

2018年的 ICLR 會議上,一篇題為 Neural Ordinary Differential Equation 的文章引發了大量的關注。在短短 2 年不到的時間裡,已經在 Google Scholar 上獲得了 500+ 引用:

圖5:NeuralODE的引用情況

NeuralODE文章:

Neural Ordinary Differential EquationsRicky T. Q. Chen,Yulia Rubanova,Jesse Bettencourt.et al.arXiv(2018)

儘管有很多人批判這篇文章創新性欠佳,但是它的巧妙之處就在於在關鍵的時間點,對多方面發展起來的技術進行融匯貫通。

首先,儘管不是這篇文章首發,但它明確指出可以將ResNet拓展為一種微分方程的形式。於是,ResNet變成了無窮深的網絡,而神經網絡的訓練問題也變為了微分方程的求解問題。 其次,該文章提出了基於伴隨方程的訓練求解方法。

我們終於可以擺脫自動梯度反傳方法的束縛了。儘管人們發現這種方法除了可以節省內存外,並沒有在精度上很大提升。 最後,該文章融合了另一項很火的技術,就是「歸一化流」(Normalizing Flows)。

這種技術可以通過訓練一個可逆的映射,從而簡化概率函數的訓練求解。而NeuralODE則可以將其提升為一種漂亮的續的形式。

這是一篇歸一化流的介紹:

Normalizing Flows for Probabilistic Modeling and InferenceGeorge Papamakarios,Eric Nalisnick,Danilo Jimenez Rezende.et al.arXiv(2019)

NeuralODE可以在時間序列擬合和預測好的效果:

圖6:NeuralODE在曲線擬合上的效果

下面這篇文章是2020年 AAAI 的獲獎論文,它將 NeuralODE 與圖網絡巧妙地結合到一起,來進行各種複雜網絡上各種動力學的預測,在很小的數據量下取得了非常好的結果:

Neural Dynamics on Complex NetworksChengxi Zang,Fei WangarXiv(2020)

階段4:圖結構與動力學一起學習

我們為什麼要自動學習個體的相互作用結構呢?那是因為,複雜系統中的連邊往往代表的是一種因果聯繫,因此圖結構的學習也就是因果關係的發現。

其次,當我們從時間序列中提取出這種圖結構,可以讓我們更清楚地看到系統各個部分之間是如何相互作用的,從而提高這種系統的可解釋性。

最後,我們還可以用豐富的網絡科學技術手段來分析獲得的這種圖結構,從而幫助我們對系統進行更深入的理解。

那麼,這種圖結構如何獲得呢?實際上,注意力權重就是一種圖結構。利用 NLP 中的 Transformer 模型預測時間序列,其實就相當於學習出了詞與詞之間的網絡關係:

Deep Transformer Models for Time Series Forecasting: The Influenza Prevalence CaseNeo Wu,Bradley Green,Xue Ben.et al.ariv(2020)

這篇文章用一種時空注意力機制來進行交通流預測:

GMAN: A Graph Multi-Attention Network for Traffic PredictionChuanpan Zheng, Xiaoliang Fan, Cheng Wang.et l.(2019)

然而,這種注意力往往具備多個Head,而且有方向有權重,生成的網絡還會時常變化,不方便我們分析。因此,圖卷積網絡的提出人 Thomas Kipf 首次提出了一種顯示圖結構的網絡學習方法(NRI):

Neural Relational Inference for Interacting SystemsThomas Kipf, Ethan Fetaya, Kuan-Chieh Wang.et al.arXiv(2018)

NRI模型複雜度高,只能用於小規模網絡,我們(張江老師科研組)在NRI的基礎上,提出了一種更輕便、效率更高、可用於大規模網絡的網絡重構方法(GGN):

A general deep learning framework for network reconstruction and dynamics learningZhang Zhang, Yi Zhao, Jing Liu.et al.(2019)

我們還可以將圖結構學習的方法用於因果發現。例如,下面這篇文章就結合了圖結構學習和普通的RNN網絡,拓展了格蘭傑因果檢驗(Granger Causality)的方法,取得了良好的效果。

Neural Granger Causality for Nonlinear Time SeriesAlex Tank,Ian Covert,Nicholas Foti.et al.(2018)

另外,利用自注意力機制,我們也可以用於提煉動態的圖結構。例如,下面這篇文章就將Transformer用到了各種具有動態交互圖的複雜系統之中。

Towards Automated Statistical Physics : Data-driven Modeling of Complex Systems with Deep LearningSeungwoong Ha,Hawoong Jeong(2020)

該模型能夠通過分析學習得到的注意力,而獲得每個 Agent 的互相作用半徑。

圖7:以鳥為例給出的模型結構

圖8:模型自發學習到的視野半徑

階段5:幹預與反事實

著名圖靈獎獲得者,Bayes網提出者 Judea Pearl 對於因果推理的執著令人印象深刻。他在其著作《Why》中出了因果的三重階梯:

圖9:因果推理的三重境界

我們發現,儘管我們可以從數據中直接挖掘因果關係,但是按照 Pearl 的標準來看,前面討論的所有模型都屬於因果階梯的第一層,也就是根據數據被動地獲得知識。因此,我們重構出來的連邊也極有可能是一種相關關係,而不是因果關係。

要想繼續爬升,我們必須讓算法走出實驗室,來對真實世界進行幹預,甚至進行反事實推理。那麼,人工智慧算法如何突破這些限制呢?

好在,我們完全可以給這類算法構建出一個虛擬的實驗室,從而讓算法幹預虛擬世界中的物體,從而幫助自己提升對系統的理解。

例如,下面這篇最新的文章就是利用了這樣一種思想,讓算法通過選擇幹預哪一個物體才能更好地提升預測,從而成功攀爬到了因果階梯的第二層:

Towards Curiosity-Driven Learning of Physical DynamicsMichael John Lingelbach,Damian Mrowca,Nick Haber.et al.

圖10:主動幹預可以提高機器對動力學學習的準確度

甚至有文章聲稱,可以利用深度學習方法攀爬第三層階梯,儘管是否符合真正的反事實推理還需要進一步確認:

Deep Structural Causal Models for Tractable Counterfactual InferenceNick Pawlowski, Daniel C. Castro, Ben GlckerarXiv(2020)

最後,當我們學習到了基本模型之後,還可以對系統實施控制。下面這篇文章就以模擬的智能交通系統為平臺,討論了自動學習以對系統動態控制。

Flow: A Modular Learning Framework for Autonomy in TrafficCathy Wu,Aboudy Kreidieh,Kanaad Parvate.et al.arXiv(29)

總結與展望

總結來看,複雜系統的自動建模已經取得了豐碩的成績。相比於傳統的人工模型,自動建模的優勢在於:

可以同時學習出網絡結構和動力學

具有較高的準確度

可泛化

不強依賴於建模者的先驗知識

當然相比於經典模型,它還處於剛起步的階段,現在尚沒有對如下問題進行充分討論:

網絡的演化模型

複雜適應系統模型

多尺度建模

目標驅動+數據驅動建模

好奇心驅動

……

另外,這套方法雖然在準確度、通用性等方面取得了良好的進展,但是要想用於真實世界還有很長的路要走。

最後,之所以人工智慧可以取得如此豐富的成績,歸根結底就在於可微分計算技術的大量應用。而未來在工程應用方面的一種可結合方向就是可微分的仿真平臺。

例如,DeepMind就開發出了可微分的流體仿真平臺,它可以通過訓練而加速模擬速度,還可以自動對系統進行數據驅動式的建模。這也許是一個非常值得投資長期鑽研的方向。

Learning to Simulate Complex Physics with Graph NetworksAlvaro Sanchez-Gonzalez,Jonathan Godwin,Tobias Pfaff.et al.(2020)

我們相信,在深度學習技術的賦能之下,複雜系統研究的發展一定會再次升級。同時,二者的結合可能也會幫助我們解開這個世界更深層次的奧秘。

葦草智酷簡介——

葦草智酷(全稱:北京葦草智酷科技文化有限公司)是由長期從事網際網路前沿思想、人文、科技和投資領域的專家所組成一個的思想者社群組織,其前身是已運營 5 年的網際網路思想者社區—網絡智酷。

葦草智酷秉承「讓天下思想者連接起來」、「讓思想流動起來」、「讓思想直立行走」的主旨和願景,在泛網際網路思想領域中,立足全球視野,感知時代脈搏,聚焦思想前沿。

相關焦點

  • 複雜系統自動建模綜述:描述、預測與理論發現
    本文總結了張江老師在集智-凱風讀書會上的《複雜系統自動建模》專題,介紹了如何更好地利用AI來對複雜系統更好的進行描述、預測乃至於理論發現,最後,本文還對通過AI對複雜系統進行自動建模中的一些可能的問題進行了簡單的描述和討論。
  • 跨媒體因果推斷
    本論壇將從跨媒體智能的抽象歸納、演繹推理及因果推斷等方面,討論跨媒體大數據表徵與推理、分析因果計算的前沿理論和方法、探索跨媒體因果推斷的未來發展趨勢,並暢想未來的創新應用方向。演講題目:網絡多媒體大數據表徵與推理摘要:網絡多媒體大數據異構性強、維度高、關聯複雜,給其表徵與推理帶來巨大挑戰。
  • PM2.5-GNN 圖網絡:複雜系統自動建模在大氣汙染中應用
    這項工作將圖神經網絡(Graph Neural Network,GNN)與循環神經網絡(GRU,Gated Recurrent Units)結合,並融入大量領域先驗知識,在基於圖(Graph)建模的 PM2.5 預報中達到了當前最優(state-of-the-art, SOTA)的效果。
  • 因果推斷領域新書(附PDF):Causal Inference: What If
    集智斑圖頂刊論文速遞欄目上線以來,持續收錄來自Nature、Science等頂刊的最新論文,追蹤複雜系統、網絡科學、計算社會科學等領域的前沿進展
  • 因果觀念新革命?萬字長文,解讀複雜系統背後的暗因果
    在對各種複雜系統進行測試之後,他們證明這種方法在重構因果關係的能力上具有相當大的準確度,勝過幾乎所有流行的因果推斷方法。作者特意錄製半小時的解讀視頻,幫你理解這篇長文。下拉至文末,掃碼即可獲得。不過現在情況有所改變,得益於最近幾年因果推斷方法的研究,人類對因果的理解和形式化處理可能會再上升一個臺階。從去年到今年,一位新進研究複雜系統、在利物浦大學數學系就讀的前哲學博士 Stavros K.
  • 因果發現:如何讓算法成為複雜系統中的「福爾摩斯」?
    ,在凱風研讀營中黃碧薇博士的關於因果發現的分享中,講述了如何用算法,做複雜系統中的「福爾摩斯」。,分別是:(1)基於大腦影像時序數據,找出不同腦區之間的因果圖;(2)基於細胞內的蛋白質濃度變化,推測基因調控網絡;(3)根據金融市場的交易數據,推測不同行業的股票價格之間存在的因果關係。
  • 集智俱樂部學術年會:5場主題報告+3場分論壇,一起因果糾纏!
    數位化、智能化進程再度加速的今天,集智俱樂部聯合智源社區,邀請北京大學公共衛生學院生物統計系主任周曉華,清華大學計算機科學與技術系副教授崔鵬與北京師範大學系統科學學院教授張江,匹茲堡大學助理教授吳令飛等眾多學者進行分享,同時還有共同開因果推薦系統、圖網絡與時序數據網絡、理解複雜性、高中生專場等不同主題的分享,與大家一起面對面分享對交叉學科的最新探索及對複雜系統的最新見解。
  • 張江:從複雜科學視角,追問生命是什麼
    期間,北京師範大學系統科學學院張江教授做了題為《生命自主體理論一瞥》的專題分享。以下是報告紀要。 什麼是生命? 生命是什麼? 最後,生命是一個多層次的複雜系統。一個層次的生命湧現後並不會停止,存在多層次的湧現,這也是對未來研究的展望。
  • 響應號召,集智俱樂部學術年會線上舉辦,一起因果糾纏!
    因果推斷是一種強有力的統計建模工具,用於解釋和穩定學習。在這次分享中,崔鵬老師著重於因果推理和穩定學習,旨在從觀察數據中探索因果知識,以提高機器學習算法的解釋性和穩定性。 個人簡介:崔鵬,清華大學副教授,研究方向包括大數據環境下的因果推理與穩定預測、網絡表徵學習,及其在金融科技、智慧醫療及社交網絡等場景中的應用。
  • Nature子刊:反事實推斷幫模型識別罕見病,躋身專家水平
    結果表明,關聯算法的準確率在醫生團隊中能排到 top 48%,而反事實算法可以排到 top 25%,實現了專家級別的臨床準確率。這一結果表明:因果推理是將機器學習應用到醫療診斷中的重要缺失元素。下圖 1 展示了疾病與症狀之間的 3 種不同的因果結構,圖 b 中的 R 即是 D 和 S 的混雜因素。
  • 利用瞬態動力學和擾動,推導動力系統因果網絡 |網絡科學論文速遞25篇
    摘要:從時間序列測量數據推斷因果關係是一個不適定的數學問題,通常有無限多的潛在解可以重現給定的數據。我們深入探討了一種策略,通過擾亂網絡,消除可能的潛在因果網絡之間的歧義,其中的執行要麼是有針對性的,要麼是隨機應用。由此產生的瞬態動力學提供了推斷因果關系所必需的關鍵信息。
  • 貝葉斯網絡之父Judea Pearl力薦、LeCun點讚,這篇長論文全面解讀機器學習中的因果關係
    論文地址:https://arxiv.org/pdf/1911.10500.pdfJudea Pearl 開創的圖因果推斷源自人工智慧研究,長期以來與機器學習領域關聯甚少。本文討論因果推斷和機器學習已有的聯繫以及應該建立哪些聯繫,並介紹其中的核心概念。本文認為機器學習和人工智慧領域中的待解難題本質上與因果關係有關,並解釋了該領域逐漸理解它們的過程。
  • 哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)
    harvard.edu/miguel-hernan/causal-inference-book/在本書中,我們強調需要足夠認真對待因果問題,才能明確表述它,我們還區別了數據和因果推斷假設的不同作用。一旦建立了這些基礎,因果推斷就必然變得不那麼隨意,這有助於防止混淆。
  • 動力學重構經典論文:用於稀疏觀測動力學重構的物理感知差分圖網絡...
    圖神經網絡雖然能夠解決不規則分布的採樣點的建模,但是缺乏物理建模的能力。而本文提出了一個新的圖神經網絡組件,可以圖神經網絡具備進行物理建模的能力,具體來講是要學習圖上節點的差分信息。  例如彈簧小球模型,我們輸入給 GNN 的 feature 維度是 4,x、y 位置坐標信息以及x、y 方向的速度。其中速度信息可以理解為位置信息的梯度。
  • 數學院等通過調控網絡數學建模揭示幹細胞分化關鍵轉錄因子
    機制上,TFAP2C引發表面外胚層染色質狀態變化並誘導p63表達,從而允許成熟因子p63正向自動調節其表達並關閉TFAP2C早期啟動的部分原始基因,推動分化過程的完成。該工作提供了一個總體建模框架來推斷控制染色質狀態轉換的調控網絡,有望促進未來再生醫學的進步。
  • 機器之心GitHub項目:從循環到卷積,探索序列建模的奧秘
    序列建模序列建模即將一個輸入或觀測序列映射到一個輸出或標記序列,李航在《統計學習方法》中也將其稱為標註問題。他表明標註問題是分類問題的推廣,又是更複雜的結構預測問題的簡單形式。標註問題或序列建模的目的在於學習一個模型,從而能對觀測序列給出標記序列作為預測,即最大化概率 P(y_1,y_2,...,y_n | x_1,x_2,...,x_n)。
  • Nature通訊:基於先驗知識的網絡推斷
    圖1:網絡推斷工作流傳統方法需要利用假設檢驗來確定哪些相關係數在統計上是顯著的,該檢驗會產生與每個相關係數相關的p值,並與給定的顯著性水平閾值進行對比。只有當相關係數統計顯著時,才認為其對應連邊存在。這樣的網絡推斷過程雖然簡單,卻有明顯缺陷,以至於降低網絡推斷的魯棒性和可重複性。
  • 怎樣理解複雜關係?PNAS提出圖學習,認知與網絡科學擦出火花
    該現象提出了一個重要的問題:當解析單詞(或執行任何其他統計學習任務)時,人們是學到了網絡中單個過渡概率的差異,還是學到了網絡更大尺度的特徵?但是人類是如何學習這種高階的網絡特徵的呢?對人類的圖學習進行建模給出了答案。人類進行圖學習的機制首先考慮一個簡單的模型,假設刺激序列的轉移概率由轉移矩陣Pij決定,我們可以計算刺激元 i 轉移到 j 的頻率,從而用頻率來估計 i 到 j 的轉移概率。事實上,該估計是對 Pij 的最大似然估計。
  • 相關不等於因果,深度學習讓AI問出「十萬個為什麼」
    加州大學洛杉磯分校的教授朱迪亞·珀爾(Judea Pearl)的關於實施貝葉斯網絡統計分析的研究取得重要成績,他在開發一個可以在可計算框架中區分事件原因的、用於繪製因果關係圖的框架。  分析因果關係的最大挑戰之一是通過專家判斷一件事情的原因,此為主觀意見,然後再通過各種分析技術將其分開。這與統計機器學習所追求的「客觀」形成鮮明對比。