因果觀念新革命?萬字長文,解讀複雜系統背後的暗因果

2020-11-23 騰訊網

導語

一直以來,人們對因果的理解和處理都止步於線性因果關係。最近PNAS上發表了兩篇探討因果推斷的論文,通過考察金融市場要素之間的潛藏的交互作用,定義了一種新型因果:暗因果,並發展出一種基於符號動力學最近鄰域相空間重構的方法,對各種因果關係了進行分離和計算。在對各種複雜系統進行測試之後,他們證明這種方法在重構因果關係的能力上具有相當大的準確度,勝過幾乎所有流行的因果推斷方法。

作者特意錄製半小時的解讀視頻,幫你理解這篇長文。下拉至文末,掃碼即可獲得。

目錄

一、 因果觀念的變遷

二、 暗因果關係的發現

三、計算時空鄰域與因果模式矩陣

四、應用例子與效果對比

五、因果之路走向何方

乾燥的空氣,炙烤著山下的溪谷,一陣雷暴之後,旁邊的森林躥起一場漫天大火。

一時間森林裡的動物們,無論老虎還是狐狸,兔子還是蜂猴,都仿佛收到了天上某種信號,紛紛逃竄[1]。距今十萬年前丹尼索瓦人的穴洞邊上口,這一切被一個小女孩看在眼裡:她覺得這不可能是偶然。

在相近的時間、相鄰的地點,所發生的事情之間一定是有聯繫的,即我們所常說的因果思維,是多麼自然的一種認知方式。動物行為學家們發現[2],烏鴉中的新喀鴉,就懂得將想要吃的堅果啄拋到十字路口上,在車輪將堅果壓壞、綠燈過後,再飛下去捉啄食果仁。這樣就既能吃到食物,又能保證自己不被車撞傷。

圖1:新喀鴉利用汽車壓壞堅果,並趁紅燈時啄食果仁

但就是看起來這麼簡單的事,卻代表了某種主體智能水平的核心特質。在圖靈獎得主、貝葉斯網絡的奠基人朱迪亞·珀爾看來,基於統計相關性的主流機器學習方法,永遠無法使機器獲得真正的智能。鸚鵡學舌得再精巧,也遠比上那只會解決問題的新喀鴉。

至於人類,更是從小就懂因果。除了直接觀察現實外,還能通過想像學習:從語言講述的故事和模型中,就能學到從未見過的新奇知識。甚至習得作為複雜推理載體的語言本身,人類也是小樣本學習的典範——完全不需要大量語料,孩子在父母身邊隨便聽聽就自然會自己造句了。

沒有因果,就找不到規律,無法組織出任何有意義的知識。儘管人類因果思維已經很強了,但似乎仍然有很多現象,隱約有著規律卻在知識形式描述之外。它們往往關係錯綜複雜、變化撲朔迷離,只可意會,不可言傳,就如讓社會經濟學家們和人類個體往往都頭疼的社會複雜系統——既然找不到確定的因果,乾脆就都當成隨機概率和內隱知識好了。

其中最簡單是一個兩主體交互的例子:愛情——傳說中的永恆之謎。愛一個人,究竟是不是讓對方愛的原因?無數種知識焦慮被兜售著:「保持高價值」;「真愛,就是付出」;「運氣,大樣本,試錯」……而回到冰冷的現實,又往往是多種情況混雜交織,就如《亂世佳人》中斯嘉麗與白瑞德那糾結的愛情故事一樣。

於是很多人放棄了思考,放棄了尋找原因。儘管人類這臺天然的因果機器,在直覺上很難相信「去愛」和「相愛」之間沒有因果關係(cause and effect)。可如果不再想有努力去做任何改變,任何事就都變成了執念和運氣,完全不值得認真對待了。

與之類似的,還有大量對人生具有重要影響的問題:德行與幸福的關係、努力與成功的關係、人際交友的原則、如何進行投資理財……對這些不確然答案的問題,即使你並非口號地「擁抱不確定性」或「適應變化」,往往最終也會隨波逐流而泯然於眾:要找到一個有確定關係的決策依據實在是太難了。

不過現在情況有所改變,得益於最近幾年因果推斷方法的研究,人類對因果的理解和形式化處理可能會再上升一個臺階。

從去年到今年,一位新進研究複雜系統、在利物浦大學數學系就讀的前哲學博士 Stavros K. Stavroglou,和波士頓大學物理教授 、美國國家科學院院士、金融物理學奠基人之一 Eugene Stanley,共同發表了兩篇論文,專門探討了在複雜系統,尤其是金融市場各種主體要素之間的潛藏的交互作用。他們在傳統的因果關係之外,通過加入對對象或事件的時空領域變化考量,定義了一種新型的因果關係:暗因果關係(dark causality),由此發展出一種基於符號動力學相空間重構結合的因果推斷方法,使用包括正、負、暗三種類型的因果模式矩陣表達複雜系統中潛伏和難以捉摸的動態結構,從而得以對所有因果關係類型進行計算、分離和預測。在對生態學、神經科學、金融市場等各種真實系統的廣泛測試之後,他們證明這種方法在重構複雜系統隱藏結構之間因果關係的能力上具有相當大的準確度,勝過幾乎大多數流行的因果推斷方法。

論文題目:

Hidden interactions in financial markets

論文地址:

https://www.pnas.org/content/116/22/10646.short

論文題目:

Unveiling causal interactions in complex systems

論文地址:

https://www.pnas.org/content/117/14/7599

由於其中暗因果關係的定義和發現,具有某種觀念革新的意義,為講清楚,本文先會回顧下因果關係的認知歷史和背景 ,然後介紹作者工作,最後對因果關係模型及未來發展進行總結。

一、因果觀念的變遷

神話思維時代,人類對諸如雷電、地震等自然現象都會歸結為某個神靈的意志。這種擬人化的目的歸因,是人類試圖捕捉現象背後本質因果思維的最初嘗試,並發展出交感巫術、祈禱等手段與神靈溝通,從而對自然過程進行幹預。英國人類學家弗雷澤認為,巫術思維中的「果必同因」的「相似率」,和觸染生效的「接觸率」,是科學思維的雛形[3]。此時人類已經意識到了世界存在著某種規律,並非萬事萬物虛幻無常,只能像動物那樣被動接受命運。

人類文明的軸心時代,是古希臘人最早發揚了理性精神。哲學和科學的誕生,不僅來自經驗知識,更因為是有數學和幾何。古希臘最早的哲學家,包括泰勒斯、畢達哥拉斯等,都同時也是數學家和自然科學家。數學對象之間的必然關係,放到經驗世界,就產生了讓哲學脫胎於神話的第一次天問:「世界如何起源的?從此人類以理性思維探討世界秩序成為了可能。

希臘哲學家對世界起源的回答,無論是水、數、活火與邏各斯、氣或無定形,最後都被亞里斯多德總結為四種原因(cause):質料因(hyle)、形式因(eidos)、動力因(kinesis)和目的因(telos)。

圖2:亞里斯多德四因說:一個桌子得到形成

在四因中,涉及物理世界的是前三種,大體對應物理意義上的物質、信息、能量。其中形式因最重要,它不僅適用抽象理念還關乎具體事物,決定了一個事物與他者根本不同,並且往往可以囊括另外三者。亞里斯多德本人持有一種形質論(Hylomorphism),認為形式和質料結合決定了某個事物一切。此外他還首創了目的因,這意味著在原因中可能存在某種主體意向性。

目的因在某種意義上繼承了神話思維,是一種「解釋」(reason)——可見這時哲學家們還沒有區分出解釋與 「原因」(cause)的不同,也沒有充分因(sufficient)和必要因(necessary)的概念。

到了17世紀,另一位百科全書式的學者——德國數學家和哲學家萊布尼茨,提出了「充足理由律」(Principle of sufficient reason):「任何事物都有其存在的充足理由」,甚至將其列在邏輯學三大定律(同一、矛盾、排中)之上。充足理由律確信所有事物都有其是如此而非其它的原因,只不過人們未必能找得到。萊布尼茨在最高邏輯層次肯定了充分因,使它成為一切科學和理性活動的基礎。此外,萊布尼茨還有一個我們世界是所有「可能世界」最好的樂觀信念。

18 世紀重要的哲學家休謨則先後在《人性論》和《人類理智研究》中給出了因果關係兩個定義:第一個訴諸「兩個類似的對象在時間上先行空間上的鄰近的關係」,第二個則表達為「假如沒有前一個對象,那麼後一個對象就不可能存在」。第一個定義將因果關係表達為觀念間的聯結,第二個則涉及到了反事實推理的必要因,也即「若非因」(but for,之前萊布尼茨論證可能世界時已用到必要因推理)。但不管哪一個,休謨都已經將因果關係限定在了客觀經驗世界的具體對象中。在休謨看來,理性能研究的兩類對象,純粹觀念的關係(Relations of Ideas),如數學和幾何是確定的,然而建立在因果觀念上的實際的事情(Matters of Fact),卻是不可靠的,只不過是人類因為記憶和經驗習慣「恆常連接」的產物。

充分因:A B,有之必然,無之未必不然。「投資」是「移民」的充分因,但也通過「結婚」;

必要因:¬B¬A,「沒它不行,有它不夠」。若不是英國國籍,就不能競選首相。英國籍是競選首相的必要因。可見,找到必要因必須涉及反事實推理。

19 世紀德國哲學家、唯意志論創始人叔本華,在博士論文《充足理由律的四重根》中給出了萊布尼茨的充足理由律的四種表現形式:

1. 因果關係(Becoming):生成/變化的充足理由律,適用於現實對象;

2. 邏輯推論(Knowing):認識的充足理由律,適用於邏輯對象;

3. 數學證明(Being):存在的充足理由律,解釋時間和空間的必然性;

4. 行為動機(Willing):行動的充足理由律,解釋動機和行為之間的必然性。

在此叔本華已經明確區分出,科學最為關注的因果關係是充足理由律在現實對象中的體現。此外它還體現在邏輯、數學和意向系統不同領域的關係中。後面我們會看到,另外三重根對因果觀念復興和發展起到了關鍵作用。

儘管如此,對現實對象和事件之間因果關係的本性,是主觀還是客觀,是不確定性還是確定,不同的信念和假設,依然經歷了一個跌宕起伏、針鋒相對且漫長的過程,而這都與科學的發展狀況有關。

回到 17 世紀,牛頓創立經典力學之後,一時決定論佔據了所有學科領域的核心:包含世界在內的整個時空都看成了一系列確定性因果事件的鏈條。法國數學物理學家拉普拉斯的一句話最為著名:「只要給我足夠的初始條件,宇宙所有粒子初始位置和速度,我就可以預測一切」。

但隨後,本意是想效法牛頓在精神道德和政治領域建立一個科學的體系的休謨,卻開始懷疑因果關係的客觀有效性,就像那隻隨時可能被殺掉的「羅素的火雞」一樣:從「實然」(本來是)並不能推出「應然」(應該是)。此外,還有同一時代的牧師兼數學家貝葉斯,也將概率現象解釋為主觀信念程度的變化和更新,讓概率本身也失去了客觀性。

然而「除了物理學之外,都是集郵」(盧瑟福),紛紛效法物理學的其他自然和社會科學並沒有取得想像中確定性的成功。到了19 世紀,統計學創始人高爾頓、以及他的學生作為統計學之父的卡爾·皮爾遜,則乾脆用相關關係(Correlation)取代了因果關係,認為因果關係只是相關關係的一個特例。

進入 20 世紀,就連在物理學中人們也發現了更多不確定性現象。量子力學對微觀世界的描述,讓很多人確信,世界在根基上就是不確定性的。混沌理論革命則讓人們意識到,對複雜系統即使存在確定的關係,也會因為初始敏感導致計算不可約性。

在這些科學發展的背景下,不確定性完全佔據了上風,大多數人認為可能只存在相關性,在科學實踐和決策上也廣泛採取統計學方法。科學反映客觀實在的觀念已一去不復返,物理定律也降格為基於某種觀測數據擬合的理論模型。

科學家對統計方法如此依賴,以至於在現代計量經濟學家格蘭傑(Clive Granger)在給出近代第一個有關因果關係的形式定義時,也是以概率形式給出的。如今倡導因果關係革命的朱迪亞·珀爾,在早年也曾全心擁抱統計學方法並創立出對人工智慧有重要影響的貝葉斯網絡。

方法圖:Granger 因果檢驗,若X存在與否讓下一時刻Y出現概率發生了變化,則X是Y的一個格蘭傑因

然而珀爾在隨後的研究中發現,統計相關性並不能取代因果性,它無法處理具有共同混雜因子的變量關係,就像鸛鳥並不導致嬰兒出生一樣,統計數據常常倒因為果,或造就偽相關。過於依賴於數據和算力的人工智慧,不僅要求數據獨立同分布,泛化能力很差,其對抗脆弱性(adversarial vulnerability)更使得在意外場景中即使微小幹擾也會造成嚴重誤判。簡而言之,沒有因果模型,縱萬千數據,也是鸚鵡學舌,比不上一隻能吃到自己堅果的烏鴉。

珀爾認為,現在人工智慧只處於「因果關係之梯」的第一階段:觀察,其本質是關聯,被動發現數據中的規律。另外兩個層級是幹預和反事實推理(想像),分別是主體介入後預測行動改變環境的能力,以及在虛擬世界獲反思和理解事件因果關係能力。

圖3:因果關係之梯,關聯、幹預、反事實想像。注意這裡採取概率或函數表示都無關緊要。例如在第二層, do 算的「幹預」結果,與格蘭傑因果基於觀察的數據定義是不同的。前者會主動增加鸛鳥數量,再去計算嬰兒數量,發現二者並無因果關係

雖然珀爾本人並不關心因果實在與否,只是從技術實踐角度對因果進行研究。但他的因果思想,尤其反事實定義,確實來自邏輯學對因果語義的研究,由美國哲學家學家大衛·劉易斯提出的模態實在論(modal realism),認為在探討必要因(休謨有關因果第二種定義)時,「若非…」中那個與我們最接近的可能世界都是真實的。有了可能世界的情景,我們才能反對什麼是必要的。

例子:「法院命令 隊長傳令 士兵 A 開槍 犯人死亡」。

圖4:因果圖:A 是 D 的充分因,但不是必要因。因為若非 A 開槍,B 也會遵循命令開槍

顯然,必要因處理反事實事件,能有效定位和處理特定具體事件的原因和責任。我們看到,在因果推斷從統計方法中復甦的過程中,哲學思想起到了關鍵的作用。

更一般的,通過將宏觀物理的確定性模型(機械/物理模型 Mechanistic/Physical)的特定解作為條件,對必要因和充分因進行形式化,我們可以得到因果圖和結構因果模型(SCM,Structural Causal Model),從而將反事實視為狀態函數在因變量取某個值的一個潛在結果。這與諸如牛頓力學中那樣傳統物理模型,單純表達宏觀充分因素之間的的影響是不同的。

(一個一般的結構因果模型[4]:在狀態函數 f 中 pa 是影響 x 的父變量因素,u 是忽略幹預的默認狀態。當僅考慮線性因素時就是結構方程模型(Structural Equation Modeling,SEM),引入特定解作為條件就變成了結構因果模型,後者與因果圖的區別在於,狀態函數 f 的變化可以是連續和非線性的)

例如,令變量 X 的值 xi 為志貴在時間 i 的健康狀態,A,B 是影響 x 的幹預因素,U 是不採取任何行動的默認狀態。令 A = 「服用芬太尼」,B = 「早起床」,於是志貴的健康與 A、B 的結構因果方程為:

這時,可以很容易表達在某個特定事實時 X 的狀態值,例如 F(A=0,B,U) 代表不服用芬太尼時志貴的狀態——如果志貴變得更健康了,那麼通過反事實推理,就說明變得健康與服藥沒有關係。我們可以看到,不同時間狀態之間,幹預變量之間可以存在相互作用,可以是連續、離散,線性或非線性的。

儘管如此,從方程中也能看出結構因果模型一定局限,儘管它可以表達連續狀態,但與因果圖一樣它最善於處理還是單獨時間點上離散的事件性因果(Event Causation)。例如 「上一天不健康,服藥,晚起」 「第二天健康,默認不幹預」。

顯然,這些某些條件下具體事件的關係,很難上升到更普遍因素如(「吃藥」和「早起」)之間的因果關係。如果要這麼做的話,就意味著要去不斷隨著時間循環處理一次又一次具體事件——於是就變成了諸如類似存在持續交互作用的情景。例如,人類個體之間的戀愛關係、捕食者和獵物之間的關係,以及金融市場中的交互反饋等中,這些要素之間互相反饋互為因果——屬於一種過程性因果(Causal Process)。如果說事件性因果是單向鏈條的話,那麼過程性因果就是一條繩子,變量之間會因為拉扯導致方向大小隨時改變[5]。

因此對這類關係,即使X和Y之間可以表達為某種函數關係,如果採用結構因果模型去分析,就會出現因果環路打破了有向無環圖結構。這種循環因果結構,很難分離和處理,其中因果環路圖(Causal Loop Diagram)[6]是一種初步的分析方法,但目前還沒有通用基於數據的方法去有效識別和計算。

那麼,如何解決這種因果關係呢?就如十萬年前丹尼索瓦人小女孩和休謨的因果定義所啟示一樣,我們可以不僅考量變量本身,更進一步去考慮變量最近時空鄰域(Nearest Neighbors)的變化模式,例如志貴健康程度在一定時間範圍內的變化模式,與服藥劑量在相應時間內的變化模式是否一致(甚至包括志貴所在的環境,與藥品環境),如果遵循相同的模式,那麼就可以認為它們之間具有正向或反向的因果關係。如果不一致,但是有穩定的不一致,那麼就認為它們之間存在一種可識別的非線性因果結構——即暗因果關係。

下面我們會看到,兩位作者所發展出的基於符號動力學的最近鄰相空間重構方法,就為研究變量時空領域之間的因果變化模式,即非線性——暗因果關係提供了一個有效的解決方案。但在此之前我們先要知道什麼是暗因果以及它們是如何表示的。

二、暗因果關係的發現

暗因果並不神秘。雖然識別暗因果關係最有效的地方在於對數據建模,但在最簡單的動力學方程中就有非線性因果存在(也因此兩位作者在論文附錄中饒有興趣地測試了很多理論模型)。

讓我們回到最開始最簡單也最難解的戀愛的例子:戀愛中明明只有兩個人,為什麼關係發展過程卻往往撲朔迷離、充滿不確定性?為什麼即使一方對另一方好,甚至雙方都著為彼此著想,兩人的關係也可能不像期望那樣完美的方向發展?

美國著名的數學與非線性系統專家、小世界網絡模型的提出者 Steven H. Strogatz 曾經提出一個戀愛動力學模型[7],從兩個變量就刻畫出了戀愛關係變化的複雜模式。

羅密歐愛上了朱麗葉,但在這個故事版本中,朱麗葉是個充滿不安全感、不穩定的戀人(即依戀關係中的恐懼型依戀 [8]):羅密歐越愛她,朱麗葉越想逃離並躲起來。但當羅密歐心灰意冷後退時,朱麗葉又發覺出他的好,捨不得離開而轉身回來;另一方面,羅密歐也會傾向正面回應她的情感:當朱麗葉愛他時,他會活躍起來重新愛她;但當她疏遠他時,他也會變得冷淡。我們用 R 和 J 兩個變量分別代表羅密歐和朱麗葉的感情:

R(t) = 在時刻 t,羅密歐對朱麗葉的愛/恨

J(t) = 在時刻 t,朱麗葉對羅密歐的愛/恨

於是,他們充滿糾結的的戀愛方程模型為:

顯然,這是一對互為因果的變量,屬於過程性因果,二者之間作用是一種非線性因果關係。

圖5:羅密歐與朱麗葉的戀愛動力學曲線

在上圖,我們可以看出,羅密歐和朱麗葉之間的愛情將是永無止境的「熱情-冷漠」循環。如果以事件性因果來看,R 和 J 之間並沒有明確的因果關係:當羅密歐的 R 增加時,朱麗葉的 J 在不同時間可能會降低、也可能增加,反之亦然。

但二者變化又不是隨機的,或者相關關係,如果直接計算變量會發現他們的相關係數是變化的。

如果我們以 τ 表示變量變化的時間延遲間隔,以符號、、 表示變量增減情況的話,即:

:X(τ)

:X(t) = X(t+τ),X 值不變

:X(t) > X(t+τ),X 值減少

會發現 R 和 J 之間遵循以下變化模式:

J R J R J……

J R J R 這種作用模式,在整體上形成一種平衡反饋迴路。如果單從兩個點取值之間的事件來看,完全看不出哪一種關係佔據主導。那麼如果不僅考慮點、而是包括包裹點的鄰域點的變化情況呢?J……

讓我們回憶下休謨有關因果關係的第一個定義:

……它是先行於、接近於另一個對象的一個對象,而且在這裡,凡與前一個對象類似的一切對象都和與後一個對象類似的那些對象處在類似的先行關係和接近關係中……

圖6:從點到鄰域點集:不僅要考慮點本身,還要考慮鄰域點集的變化模式

在休謨看來,因果關係本來就是由於空間上的鄰近和時間上的先行、類似對象之間的關係導致觀念上的聯結——換句話說。如果僅僅是考慮對象本身,不考慮對象周圍的時空鄰域,就更難找到(形成)真正的因果關係(觀念)。正如開始的乾雷暴導致森林大火,那樣判斷一定是乾燥高溫下,如果是空氣溼度較大雷雨的話,那麼雷電作就很可能不是原因了。

當然,更重要在數學上,對於以微分方程形式呈現的動力學方程而言,柯西-利普希茨定理(Cauchy-Lipschitz Theorem)[9]決定了f 存在局部解乃至唯一的最大解,使得在局部範圍內 X(t+dt) 可以完全由 τ 時間之前的 X(t)決定。這就說明,對非線性變化,是可以提取出直觀而準確的某種因果模式的。

因此,如果我們也考慮變量鄰域變化的話,會發現羅密歐與朱麗葉情感遵循以下模式:

J R

R J

J R

R J

現在我們已經可以分離因果模式了:可以看到,除了第一個關係外,其他三個關係都不是傳統因果關係模式。兩位作者認為,這種在鄰域內非正向或負向反饋的關係,可以定義為一種新型的因果關係,即暗因果關係。我們可以通過對任意維空間兩個或多個變量鄰域點集變化情況進行總結,分離出所有因果作用模式,分別計算其權重,寫在下述因果模式矩陣(Pattern Causality)中,並提出三種因果關係的強弱函數,最後判斷究竟是哪一種因果模式佔據主導。

圖7:因果模式矩陣:藍色代表正因果,橙色代表負因果,紫色代表暗因果

這裡可以稍微解釋下這個方法的效果:例如,前面四個變化模式中,可以看到有三個關係都是暗因果關係,佔 75%。但即使如此,我們依然提取出了一個確定因果關係:J R,翻譯過來就是冷漠導致冷漠。這給我們的教訓是,不僅戀愛甚至無論什麼關係,疏離總會導致疏離。除此之外,暗因果也不是運氣或隨機,是真實存在的作用模式,也許我們很難把握,但要相信它的存在,把握住我們能把握的部分就好。

暗因果關係本質是從變量的非線性作用分離出鄰域變化因果關係的模式,它既非相關,又非通常意義上的單向因果,可以認為是過程性因果的肖像,就像對因果繩子形態進行了素描。例如,在狀態空間維度 E=4,對 XY關係中,有一種最典型的暗因果作用模式:

Px = Py = ,代表 X 持續增強引起 Y 的振蕩。這種暗因果關係在現實中也存在,比如心理過程中父母對子女的持續的溺愛。

不僅在理論模型,在諸如在生態系統、大腦神經系統和金融市場中都存在大量的暗因果關係。有了這種符號動力學分析方法後,我們就可以計算出一個系統中究竟哪一種因果模式佔據主導地位,從而對系統有更好的理解、做出更好的預測。

圖8:在 Dequan Li 吸引子中,暗因果關係比例是最高的

三、計算時空鄰域與因果模式矩陣

二位作者在引入符號動力學方法後,基於傳統的相空間重構發展出一套分離和計算複雜系統不同因果模式的方法。

如下圖所示, Mx 和 My 都是動力系統 M 重建的吸引子(通過投影到某一維度坐標重建,所以也被稱為影吸引子),因此理論上必然具備因果關係。然而如果單純考慮變量 x(t)和 y(t)本身的變化的話,如上一節所述,會發現二者沒有穩定的因果關係。因此作者分別計算出兩個吸引子鄰域 NNxt 和 NNyt(以及預測 Mx的 ) 的因果模式,分離出三種因果關係,並比較它們的不同,最後確定影響最大的因果模式類型。

下面會講述作者的計算方法,內容會有一定技術性,建議非專業讀者可以暫時跳過。在看之前,大家可以看下官方對方法講解的視頻。

圖9:基於最近鄰域符號動力學的吸引子重構

1. 影吸引子重構:X(t),τ,E Mx

對於任一在 m 維狀態空間 R^m 上演化的動力系統 M,已知映射到笛卡爾坐標下的離散實值時間序列函數 X(t)∈R,令 X = {X(1),……, X(L)} , L 為時間序列的長度。我們的目標是從 X(t) 重建 M 的影吸引子Mx。

根據 Taken 定理(Taken theorem)[10],通過選取合適的嵌入維 E 和 延遲 τ,可以從 X(t)的延遲序列對原始相空間進行重構:

可見 Mx 是 E*L 矩陣(註:Mx 中表示序列值為矢量,且為了便於觀看理解針對原論文調整了順序),當 E = 3 時,

對已知 M 在 y 軸投影的時間序列 Y 同理,同樣可以重建影吸引子 My。

2. 計算吸引子距離矩陣:Mx,L Dx

在計算 Mx 的時空鄰域之前,我們必須確定一種對吸引子空間合適的度量,並計算 Mx 的距離矩陣 Dx ∈ R^(E-1)。通常可以考慮兩種度量,分別是曼哈頓距離(Manhattan distance),和歐幾裡得距離(Euclidean Distance)。如果要平等對待所有節點,一般使用前者,相反如果要降低更大距離的權重,則使用後者。二者分別記為記為L1、L2,則根據定義有:

歐幾裡得距離即平面距離在高維的推廣,與曼哈頓距離區別直觀表示如下。可以看到,代表紅黃藍色的曼哈頓距離均為 12,而綠色的歐幾裡得距離有6×√2 ≈ 8.48。

圖10:歐幾裡得距離(綠)和曼哈頓距離(紅黃藍)

故而 Mx 的距離矩陣 Dx 為:

同理可以計算出 Dy。

3. 計算吸引子最近鄰域:Mx,Dx NNx

有了 Dx ,對 Mx 上 每一個點 x(t),我們都可以計算出它的最近鄰域 NNx(t)

由於 Mx∈R^E,故對其中每個點,都有 E+1 個最近鄰。例如當 E=3 時,x(t) 會有四個最近鄰在NNx(t) 中。

在這裡,我們可以看下最近鄰域對應的幾何意義,它就是數學上的有界單純形(bounded simplex)。n-單純形是和三角形類似的n維幾何體,定義為n維以上的歐幾裡得空間中的(n+1)個仿射無關點閉包集合,其中 1、2、3 單純形分別為線段、三角形、四面體……等,如下圖所示:

圖11:最近鄰,在1~20維空間的幾何意義有界單純形

於是可以直觀看到,對點 x(t1)∈Mx,當 E=3,會有四個最近鄰域點,記:NN x(t1) = {s1,s2,s3,s4}

注意,不同於影吸引子空間,對每個 x(t)∈Mx,對應的最近鄰 NN x(t) 時間索引下標都是從當前時間點 tx1 而非從 t=1 開始的。

因此,時間序列點為 tx1、tx2、……、txE+1 的 E+1 個最近鄰為:

注意上面,之所以求到 d(x(t),x(t-(E-1)*τ-h),即少h 個時間點,求而非求 x(t)和所點距離最小的 E+1 個點,是為了多出額外h 時的數據點,通過 Mx 對 My 進行預測(即 計算 Mx 預測 h 時間後情況,與My 的最近鄰情況對比)

故可以計算出對應 My 的時間序列點最近鄰距離為:

到這裡,我們可以看到與傳統相空間重構方法如收斂交叉映射[11](CCM,Convergent Cross Mapping)的差異。

4. 計算最近鄰的因果模式:NNx SxPx

因為Mx,My 是已知的,我們可以計算出它們所有點的最近鄰序列。同理,可以計算出在 h 時間後,通過 Mx 對 My 預測的最近鄰序列。然後我們通過對比實際 My 的最近鄰因果模式和預測的因果模式,就可以知道在 h 時變化中,Mx 對 My 究竟有多少是正向因果作用、負向因果作用或不明確的暗因果作用。

通過前面計算,我們已經知道,對於點 x(t)、y(t) 都對應有E+1 個點的最近鄰。例如當 E=3 時,對點 y(t1)∈My,每個鄰域會有四個最近鄰域點,記為

每個點都是三維時間序列的點,如NNy(t1)1 = {0.13,1.25,3.26}。並且有相應時間延遲的變化以及因果變化模式。

對於:

我們可求得所有的變化模式 s:

例如,E=3 有四個點的變化模式,我們可以求得:

S= {s1,s2,s3,s4} = {(0.32,0.45),(-0.11,0.51),(0.13,0.19),(0.05, -0.08)}

然後根據以下符號規則(以 X 表示,換成 Y 或其他變量同理)分別計算出它們在時間延遲 2τ 和 τ 的變化量以及相應的模式。

:X(t-2τ)

:X(t-2τ) = X(t-τ)

:X(t-2τ) > X(t-τ)

:X(t-2τ)

: X(t-2τ) = X(t-τ) = X(t)

:X(t-2τ) > X(t-τ) = X(t)

:X(t-2τ)X(t)

:X(t-2τ) = X(t-τ) > X(t)

:X(t-2τ) > X(t-τ)

因此,s1,s2,s3,s4 因果模式籤名分別為:

P(s1) =(0.32,0.45) =

P(s2) =(-0.11,0.51)=

P(s3) =(0.13,0.19) =

P(s4) =(0.05, -0.08)=

那麼影吸引子在最近鄰域的變化模式和因果籤名究竟是被哪個鄰域點決定呢?這就需要對最近鄰上所有點進行加權求平均。

而對最近鄰因果模式求平均的權重,是通過之前定義的度量 Dx 獲得的,可以由以下公式3進行計算(這裡採取的是曼哈頓距離),然後通過公式2計算出最近鄰變化的評價值。

例如,對於上面的 s1,s2,s3,s4,分別帶著權重 0.91,0.54,0.82,0.69 我們可以求出評價的 S:

S = 0.91 (032,0.45) + 0.54 (-0.110.51) + 0.82 (0.13,0.19) + 0.69 (0.05, -0.08) =(0.3729,0.7855)

即 S 的加權平均後的因果籤名是 P = Signature(S) =

圖12:最近鄰域的平均模式籤名

因此,如果我們得到在 My 上某個點鄰域的因果籤名 Py = ,而在 Mx 上相應點因果籤名為 Px = 。由 Px = Py = ,我們就說 Mx 上的點 x(t) 和 My 上的點 y(t) 具備了正向因果關係。

因為Mx,My 是已知的,我們可以計算出 Mx 所有點的最近鄰序列變化以及因果模式籤名。以及計算出在 h 時間後,My 實際上的和通過 Mx 對 My 預測的最近鄰序列的變化和因果模型籤名。三者分別用以下表示:

5. 填充因果模式矩陣:Sy,Sx PC

我們可以將所求得在 h 時間後後 My 的平均變化值,與 Mx 的相應領域的平均變化值,分別求範數,並求比值:

在通過 11 即高斯誤差函數歸一化輸出後,從而得到 Mx 到 My 的一個因果模式矩陣。

6. 分離因果關係影響函數:PC Pt,Nt,Dt

對因果模式矩陣分塊進行計算,可以得到分別代表三種因果類型影響的(正、負、暗)函數 P(t)、N(t)、D(t):

最後就可以使用諸如最小/最大生成樹 [12,13] [14] 之類的算法對網絡進行過濾,以僅保留最強的關係。

四、應用例子與效果對比

生態系統的例子

首先以理論生態模型:共生、競爭、替罪羊的例子作為方法效果評估對比。

A:互惠共生(Mutualism),兩個物種 X,Y,如鱷魚與牙籤鳥之間的關係;

B:種間競爭(Interspecies competition),如羊和兔子之間是競爭關係;

C:替罪羊(Scapegoat),兩個物種 X,Y在捕食者 Z 下的種間競爭,如牛、羊在獅子之間的關係。

對生態種群數量之間的變化描述通用用 Lotka–Volterra 方程描述:(y 是捕食者的數量,x 是獵物的數量):

其相位變化通常為:

至 C 的情況則是一個 1 捕食者-2 獵物(one predator–two preys)需要三物種 Lotka–Volterra 方程描述 [14]。

下面三張圖表示了三種關係的隨著時間種群人口數量變動情況。

圖13:共生、競爭、替罪羊的種群人口變動情況

因為變量之間存在著非線性作用,用傳統方法很難分清 X 和 Y 之間究竟存在什麼關係。例如,通過相關性分析,會得到以下結果:

圖14:共生、競爭、替罪羊的相關係數

由皮爾遜相關係數定義可知,X、Y 之間的關係是對稱的,

然而在上圖中可以看到,除了共生模型中二者因為種群數量幾乎同步漲落而穩定外,X 和 Y 之間的關係都已開始撕裂脫離。這意味著在非線性系統變量作用中,二者之間並不是相關關係。

如果以 β 係數(Beta coefficient,一種判斷股票或證券價格相對市場整體波動性的方法),對於除了對共生模型在一定時間後穩定有相對穩定的結果外,競爭和替罪羊模型都產生了波動和脫離。

圖15:共生、競爭、替罪羊的β係數

方法圖:β係數考慮了某個變量Re相對整體Rm變動情況,為協方差和總收益方差之比

最後是 S-map(Sequential Locally Weighted Global Linear Maps)的結果,與收斂交叉映射(CCM)[16] 作為生態學分析種間競爭非線性數據建模主要方法之一。S-MAP 相當於一個局部加權的線性回歸,考慮目標點在重構吸引子中鄰域狀態進行預測。CCM 以之為基礎,通過考慮動力系統 M 在兩個子空間 X 和 Y 延遲序列重構的相空間 Mx 和 My 之間相關性計算來確定因果關係。

但他們都沒有像基於符號動力學的因果模式矩陣相空間重構法那樣考慮每個點最近鄰域本身的變化模式,並對所定義的幾種因果模式進行分離。

圖16:方法圖:幾種單變量和多變量嵌入的 S-MAP 方法[17]

方法圖:CCM 考慮了目標點在鄰域變化情況,但沒有考慮最近鄰域本身的變化模式

可以看到 S-map的結果同樣非常不穩定,尤其在 C 的替罪羊模型中,XY 和 YX 在不同時期交替出現,意味著 X、Y 之間沒有穩定的關係。

上面方法之所以無法獲得穩定而有意義結果的原因,就在於很難處理變量之間的不斷變動的非線性因果關係。如果我們採取基於符號動力學的相空間重構方法,會得到以下結果:

可以看到,清晰地分離出了主要的因果關係。在共生、競爭、替罪羊模型中,其主要作用的分別是 XY 的正向、負向、暗因果關係。

金融市場的例子

作者在兩篇論文中,主要對主權國家的CDS金融市場進行了分析。數據來自 Thomson Reuters Datastream,計算了 69 個國家信用違約互換市場影響連結節點情況。

正向因果影響節點在大於 0.2,0.4,0.6 去除閾值以下節點情況如下:

負向因果去除閾值以下節點情況如下:

最後是暗因果去除閾值以下節點情況:

我們可以看到,在CDS金融市場總體因果模式中暗因果是最持久的類型,是它主導了市場本身。

作者認為,通過分析三種因果影響類型在複雜系統尤其是金融市場的比重,可以為國家和企業或個人投資決策提供最有效的決策依據,是一種「天賜的禮物」。

在下表中,作者們對三種原始模型數據(ACE)和三種實際數據預測(BDF)效果進行了評估,可以看到,對三種因果關係,單個鏈長準確度都超過 90%,而即使經過了十五個節點的連結,對系統數據依然有著 50%以上甚至 80%準確的反映。

其他模型的關係

在去年,馬克斯·普朗克智能系統中心主任 Bernhard Schölkopf 寫的一篇有關機器學習中的因果推斷的綜述中[18],作者用一張表格總結了歷來主流因果模型分類和特點。這幾類模型並非都能從數據中習得(最右),但都能對獨立同分布數據(IID)進行預測(左邊)。

17:因果模型種類:從 IID 中預測、在幹預分布後預測、回答反事實、提供物理洞見、從數據中學習

機械物理模型:理想的動力學模型,通常以確定性的微分方程的形式呈現,最大優點是能清晰抽象物理實在關係。但也因此過於依賴人為數學建模而非數據驅動。

結構因果模型:能對具體物理事件抽象,又保留了對特定事件幹和反事實問題的能力(通過對變量取特定值)。在採用確定性方程的 SCM 中,變量之間關係可以是非線性、連續的、互為因果的。

因果圖:直觀清晰,對離散具體事件建模,能夠計算幹預後結果分布(do 算子),但對比 SCM 不善於對反事實情況進行回答(圖示方法的缺點)。

概率統計模型:主流機器學習方法,僅僅從獨立同分布數據(IID)習得並進行預測,無法對建模副現象關聯以外任何事提供見解。

然而所有這些模型,即使能表達非線性關係,例如宏觀物理模型(前面的戀愛動力學和生態學理論模型)或結構因果模型,對過程性因果關係(特點是具備因果環路)處理往往都有一定條件和限制[18][20][21],目前沒有形成一個統一、有效地處理框架。

而基於時空鄰域對相空間重構的符號動力學方法,無論對過程性因果,還是離散的事件性因果,都能提供一種分析非線性因果關係動力模式的有效方法。它繼承了之前的一些研究,如CCM 的優點,可以擴大數據點到最近鄰域集研究以提取多種因果模式,對非線性因果反饋環路模式也能進行有效分離和計算,無論是確定性方程分析,還是數據驅動的數據建模,都能為相應的複雜系統結構提供更好的理解並得到更有效的決策依據。

五. 因果之路走向何方

「因該果海,果徹因源」 ——《大方廣佛華嚴經》

對因果的探索絕不僅僅囿於因果本身,還可能關乎世界萬物的實在,我們的主觀意識和自由意志的意義。

在 Wolfram 今年最新計劃「Finally We May Have a Path to the Fundamental Theory of Physics」[21]中,因果關係就處於一個隱蔽而重要的地位——正是因為所謂「因果不變性」的性質,我們才得以擁有一個有意義的客觀世界。

相關閱讀:

Wolfram長文全譯:從簡單規則到系統物理學

圖18:因果不變性

假設我們有這樣一條規則:{A BBB, BB A},也就是說,對所有 A 都可以用 BBB 替換,對所有的 BB 都可以用 A 替換。這樣我們就可以通過這個規則得到一個多路系統,繪製出一個「多路圖",顯示可能發生的一切。然而即使生成分支存在的兩條歷史道路,在多元系統中分開了,它們也只需要一個步驟就會重新融合:即跟蹤上面的圖,你會發現這樣的現象,生成的每一對分支總是隨後合併,只需要再多走一步。

即使我們的宇宙和想像中最相似的可能世界發生的事件不同,「因果不變性」所體現的分支和合併之間平衡,依然保證了有意義客觀現實存在。在我們熟知的廣義相對論中,即使時空是相對的,然而依然有不變量存在,即時空構成的四維矢量(Four-vector),這其中就包括了事件在類時(timelike)間隔中的因果關係。

可以這樣說,因果不變性和四維矢量不變量,保證了包括相對論和量子力學以及一切有意義科學理論客觀性的存在——無論是哪種科學模型,是否是在更大的時空或因為主體能力限制被降格為近似,但那只是近似,並不代表是主觀構建。

開始我們已經提到,是分析哲學尤其邏輯學的發展,有關反事實和模態邏輯的研究,在如今統計方法佔統治地位的時候,讓科學家們重新拾起對因果的信念和探索。而叔本華也從充足理由律四重根區分了邏輯推理和數學證明,與現實對象因果關係的不同。那麼科學真理,或者說科學命題,與邏輯命題和數學命題之間究竟是一種什麼關係呢?

以邏輯學來看,在因果不變性或因果有效的情況下,邏輯、數學、科學代表了三種不同真理,主要包括三種不同蘊涵(implication)關係:分別是邏輯蘊涵、形式蘊涵與實質蘊涵。

三種蘊涵之間關係,也就是三類真理之間的關係。按照模型論觀點,對系統 L 的一個公式 AB:

邏輯蘊涵:也叫嚴格蘊涵。「A 嚴格蘊涵 B」 記為 A⊰B,代表在任意一個模型取值都真。也就說 「A 真 B 假」不僅是假的,而且是不可能的。每個模型是一個可能的世界,可見邏輯蘊涵在在所有可能的世界中為真。例子:「蘇格拉底是人⊰ 蘇格拉底是動物」。

形式蘊涵:是有關命題函項的,形式為 ∀x(φxψx),意為:對一切 x 而言,如果 φx 則 ψx。變元 x 每一次取值都可以看作一個可能世界,因此數學也是所有可能世界都為真的必然真理。只不過相對邏輯蘊涵,因為數學又與每個可能世界以及世界中主體存在結構耦合,因此僅僅通過數學研究就能得出有關世界必然且有意義的結論。例子:「任意一個素數,無論有多大,在相隔246以內一定存在另一個素數」。

實質蘊涵:即假言推理「如果 A,那麼 B」,記 AB。因為前件是假設的情境,故命題只在某個世界是正確的事實,而非在所有可能世界為真。可見包含實質蘊含的現實命題即反事實推理,通過尋找最相似世界反推我們世界的因果關係。因為科學也總是依賴於某些先驗假設,作為不同的研究綱領,因此科學命題也只能在某種假設和語境下為真。當然根據 Wolfram 的因果不變性,所有有效的科學理論必然反映某種等價的客觀現實,而非主觀上任意構建。例子:「在忽略觀察者的絕對時空下,牛頓定律成立」。

可見科學處理的因果關係主要就是邏輯中的實質蘊涵, 即物理世界客體事件之間的關係。它總是在某一時間、空間和語境下為真,而非像邏輯或數學那樣的形式系統存在永真。但也正因為如此,科學研究總是和我們所處的環境相關,總是能隨著我們的生存和認知邊界不斷修正更新,對我們所關注的事物做出最具指導性的結論。

科學命題之所以有局限,正因為我們宇宙的規律,讓身在其中的我們受到必然的物理限制:

定域性因果:相對論條件下約束光速有限,這使得人類一切獲取信息的手段都不超過以觀察者為中心的「光錐」範圍(「光錐之內就是命運」)。無論是觀察還是幹預,人類所做的改變只能在光錐之內,不可能再超越光錐傳遞因果關係。這就是相對論的定域性原則(Principle of locality)。至於量子糾纏那樣的超距作用,因為不能傳遞有效的信息,實際同樣無法產生超越光速的因果效應(違反會產生因果悖論)。

混沌系統的不確定性:混沌系統的初始敏感性,導致即使對初始位置和動量的測量有極其微小的不精確,也會導致對其的長期預測產生巨大的誤差。這意味著任何圖靈等價的設備都無法通過結果數據反推系統初始狀態。

量子不確定性:量子力學中系統波函數的觀察者效應,以及實際存在的圖靈機讀取數據勢必會影響環境信息本身(這也是形式系統和物理系統的差別),會導致系統不可避免的語義信息損失。

圖19:一切影響現在的未來過去的因果關係都包裹在當前時間點的光錐中

由於以上限制,在處理經驗世界因果關係時,我們不可能像邏輯或數學那樣得到永真的科學定律。但即使如此,採取對物理世界進行幹預,如控制實驗,或者通過考慮模態世界的可能性,採用反事實推理,彌補現實的信息損失,我們還是能得到我們宇宙更強的因果關係的。

目前,有關因果在宇宙中的地位,物理學家們也一直在研究。在一類時空離散化假設下發展的方法中,一些物理學家認為宇宙的基本組成既不是空間也不是時間,而是更具本源性質的某種離散結構,例如量子比特、時空格點或因果關係。

圖20:幾種候選物理學終極理論

其中與弦理論、圈量子理論、全息原理等理論一起作為終極理論的候選之一的因果集理論,就認為宇宙的基本組成是普朗克時空下一系列的物理事件,這些事件構成了因果集,事件之間的偏序關係描述了其中的因果。而對事件的描述,正如廣義相對論中同時的相對性一樣,不可避免地需要引入觀測者所在的坐標系和參照系。

圖21:在時空二維坐標(η ,θ)下, 因果集的事件元素以一定強度隨機分布在特定時空區域,以共形45度直線繪製出的光錐,約束了每個事件過去和未來的因果。當一對元素(如綠和藍)的光錐重疊、或由粗紅線表示出時間分隔時,我們說事件之間具有因果關係。既作為信號的未來又作為觀察者的過去的黑色元素,成對形成了以鴨綠色表示的 Alexandroff 集[23]

那麼最終,因果之路後面會走向何方?我們能否跨越不確定性時代?

如果我們再次從哲學和邏輯學取經的話,也許下一次會走向基於情境理論的因果模型。

在上世紀八十年代,兩位美國哲學家和邏輯學家喬恩・巴威斯和約翰・佩裡在《情境與態度》(Situations and Attitudes)一書中,提出了有關因果關係的情景理論,開創了情境語義學研究。在其中因果關係要素既包括存在世界的具體部分(經驗世界),將之稱為「具體情境—殊型」,也包括非現實存在的「抽象情景-類型」(理念世界或模態世界),並且對二者抱有實在論態度。

巴威斯和佩裡認為,如果一個對象被某個主體感知並被當做世界的一部分在看,那麼主體所訴諸的事件就在某種場景中,在這種情況下,是一幅場景使得某些事件(語句)為真,某些事件(語句)為假,或使得另外一些語事件(語句)既不真又不一假——我們可以看到,在這個因果模型,引入了作為感知者或觀察者的主體,主體所依仗的情景,由此決定在情景中的事件(語句)。在此因果關係中,事件(語句)的真假,就取決於與情景的關係——尤其,在這個因果模型中是三值的,可以為真,假,或沒有定義。

美國哲學家羅伯特·C·孔斯(Robert C.Koons)在此基礎上做了進一步研究,《重塑實在論》認為,有一個極大的事實或情景,就是我們的世界。如果對比暗因果模型,我們可以發現,情景對應時空鄰域——命題與情景的關係,就是變量狀態與最近鄰域之間的關係。決定因果關係存在與否的不僅是事件狀態本身,還包括情景或時空鄰域的狀態。而因果關係除了真值 T 和假值 F 外,還可以取未定義值 U ——我們可以視之為潛在的、在真假之間的因果關係即暗因果關係。

自然,當因果關係的效應為假,或者無法定義(計算)時呈現的暗因果,就是因為前面提到的身處這個宇宙的觀察者我們所遭遇的物理硬性限制了。

但我們也可以看到,科學發展的歷程,從確定性模型,到統計方法,到反事實推理和結構因果模型,最後到考慮時空鄰域和情境,都是因為遭遇了更複雜的系統和更具體場景時,讓我們不得不發展新方法去研究解決——而非發現整個宇宙真的越來越存在不確定性。是我們的需求以及對充足理由律的內在信念,促使我們去這樣做,尋找規律,而不是聽天由命,將一切歸結為偶然。

並且,在這個過程中,我們並沒有失去自由,因為因果不意味著完全確定。我們總能在尊重宇宙客觀規律同時,做出我們自己的選擇,讓自己的主觀融入宇宙客觀的一部分。或者相反,我們的宇宙因為我們的選擇、我們所創造出新的實在而變得更有生命。在冥冥中,這一切新的選擇和創造都保存在了永恆的四維時空中——如果真有上帝視角的話。

圖22:羅伯特·C·孔斯在《重塑實在論》建立的基於因果的萬有理論

因果之路走向何方?

也許這個問題還是太難,現在還無法回答,也許我們永遠無法找到所有原因。但不管走向何方,它絕對不會再走向不確定性,在不確定性中存在因果,這不僅是理論或信念,更是所有意識主體的一生的實踐。

——不管可能世界是否真的存在,只要數學存在,邏輯存在,我們存在,對因果根源的探尋就會一直存在。我們終將知道,它是不是宇宙本身。

參考文獻:

[1] 乾雷暴(Dry thunderstorm),通常是引起山火和森林大火的主要原因。由於雨水在落地之前往往就蒸發了,發生的時候天氣往往高溫、乾燥。

[2] https://www.ted.com/talks/joshua_klein_a_thought_experiment_on_the_intelligence_of_crows

[3] 弗雷澤,《金枝》

[4] CAUSALITY: MODELS, REASONING, AND INFERENCE,Judea Pearl,Cambridge University Press, 2000

[5] https://www.oxfordhandbooks.com/view/10.1093/oxfordhb/9780199279739.001.0001/oxfordhb-9780199279739-e-0011

[6] https://www.wikiwand.com/en/Causal_loop_diagram

[7] http://ai.stanford.edu/~rajatr/articles/SS_love_dEq.pdf

[8] https://www.wikiwand.com/en/Attachment_theory

[9] https://www.wikiwand.com/en/Picard%E2%80%93Lindel%C3%B6f_theorem

[10] http://www.scholarpedia.org/article/Attractor_reconstruction

[11] George Sugihara, Robert May, Hao Ye.et al.: Detecting Causality in Complex Ecosystems ,Science,2012

[12] 14. T. C. Hu, Letter to the editor—the maximum capacity route problem. Oper. Res. 9, 898–900 (1961)

[13] J. C. Gower, G. J. Ross, Minimum spanning trees and single linkage cluster analysis. J.

Appl. Stat. 18, 54–64 (1969).

[14] M. Tumminello, T. Aste, T. Di Matteo, R. N. Mantegna, A tool for filtering information in complex systems. Proc. Natl. Acad. Sci. U.S.A. 102, 10421–10426 (2005).

[15] https://doi.org/10.1016/j.psra.2016.10.002

[16] Theoretical Ecology: Concepts and Applications

[17] https://esj-journals.onlinelibrary.wiley.com/doi/10.1007/s11284-017-1469-9

[18] https://arxiv.org/pdf/1911.10500.pdf

[19] https://papers.nips.cc/paper/3548-nonlinear-causal-discovery-with-additive-noise-models.pdf

[20] http://www.jmlr.org/papers/volume9/chu08a/chu08a.pdf

[21] 非線性因果模型辨識方法,姜楓,周莉莉,計算機應用與軟體,2015.9

[22] https://writings.stephenwolfram.com/2020/04/finally-we-may-have-a-path-to-the-fundamental-theory-of-physics-and-its-beautiful/

[23] https://www.researchgate.net/publication/319642590_Causal_Set_Generator_and_Action_Computer

(參考文獻可上下滑動)

作者:十三維

審校:eBeam、劉培源、曾祥軒

編輯:張希妍

登錄集智學園,觀看直播解讀

探究因果關係,是一場奇妙的思想旅程,你一定意猶未盡。

針對這篇兩萬字長文,作者還錄製了半小時的視頻,幫你梳理~

掃描下方二維碼,直達集智學園《揭秘複雜系統中的因果關係》,聽聽作者怎麼講!

視頻地址:

https://campus.swarma.org/course/1546/?from=wechat

推薦閱讀

為了研究因果關係,原來科學家在這麼多方向上都有嘗試

Science經典論文:如何檢測複雜生態系統中的因果關係?

因果之箭指向何方?| 圖靈獎得主珀爾的《為什麼》

Nature機器智能:如何基於算法信息破解因果推斷難題

加入集智,一起複雜!

點擊播放 GIF 0.2M

集智俱樂部QQ群|877391004

商務合作及投稿轉載|swarma@swarma.org

◆ ◆ ◆

搜索公眾號:集智俱樂部

加入「沒有圍牆的研究所」

讓蘋果砸得更猛烈些吧!

點擊「閱讀原文」,了解更多論文信息

相關焦點

  • 因果發現:如何讓算法成為複雜系統中的「福爾摩斯」?
    導語偵探小說中,神探們能從一堆看似雜亂無章的事件或物證中,抽絲剝繭地發現真相,即案件背後有序的因果鏈條,在凱風研讀營中黃碧薇博士的關於因果發現的分享中,講述了如何用算法,做複雜系統中的「福爾摩斯」。上述三個例子都來自複雜系統,由於涉及的變量很多,如果通過傳統的隨機對照實驗進行驗證,所需做的實驗數量是超指數增長的,在現實中是不可接受的。2.
  • 論堅持系統觀念
    在革命建設改革的各個歷史時期,我們黨一直十分注重運用馬克思主義哲學的系統觀念來指導實踐和推動工作。●我們必須堅持系統觀念,進行認真思考,條分縷析,綜合研判,貫通歷史和現實,聯繫國際和國內,結合理論和實際,得出科學的預見和結論。從而做到未雨綢繆、把握主動,精準施策、正確應對。
  • 堅持系統觀念的科學邏輯
    核心閱讀   系統觀念是複雜系統科學的基本思想,正是因為複雜現象的普遍存在,複雜系統科學的應用空間不斷拓展延伸,系統觀念在經濟社會等多個領域的應用場景中也在發揮重要影響。黨的十九屆五中全會著眼於實現中華民族偉大復興的戰略全局和當今世界百年未有之大變局,提出「十四五」時期我國經濟社會發展必須遵循的原則,其中一條是「堅持系統觀念」。
  • 【五中全會精神解讀】深入理解「堅持系統觀念」
    全面建設社會主義現代化國家開好局、起好步的必然要求  系統觀念是馬克思主義基本原理的重要內容,強調系統是由相互作用、相互依賴的若干組成部分結合而成的、具有特定功能的有機體;要從事物的總體與全局上、從要素的聯繫與結合上研究事物的運動與發展,找出規律、建立秩序,實現整個系統的優化;用開放的複雜系統的觀點、用從定性到定量的綜合集成方法研究經濟社會問題
  • 萬字長文:2020智源大會總結-多角度看AI的未來
    1 因果角度一個當下機器學習界的共識是,機器學習需要從感知過度到認知,但是對於如何引導這次革命,大家的答案是不一樣的, 而一個重要的觀點在於當下機器沒有因果推理的能力。這次會議有幸請到Jude Pearl, 因果被稱為是第二次數學科學革命。
  • 因果關係的複雜,不是簡單的一因一果
    科學家最常見的是追求用簡單的因果關係來解釋現象發生的原因。為什麼會有火?因為氧化反應釋放化學能。為什麼人們要交易?因為對雙方都有利。為什麼會下雨?因為空氣中有太多水氣。但是這些看似簡單的答案再追問下去,會發現它們都是由更多、更複雜的因素造成的。
  • 張江:從圖網絡到因果推斷,複雜系統自動建模五部曲
    隨著算力的提升,人工智慧的研究對象,逐漸由單個個體,發展到了系統,尤其是對複雜系統的研究。而在另一邊的複雜科學領域,對複雜系統進行建模,一直以來都是一個非常重要的科學問題,關乎人們對這個世界的理解和認知。於是,用人工智慧的技術,來對複雜系統進行建模,應勢而生。
  • 論堅持系統觀念-中國社會科學網
    在革命建設改革的各個歷史時期,我們黨一直十分注重運用馬克思主義哲學的系統觀念來指導實踐和推動工作。  ●我們必須堅持系統觀念,進行認真思考,條分縷析,綜合研判,貫通歷史和現實,聯繫國際和國內,結合理論和實際,得出科學的預見和結論。從而做到未雨綢繆、把握主動,精準施策、正確應對。
  • 人類圖線上1對1解讀、萬字全盤解讀報告 訂購須知
    常見應用場景,如原生家庭問題、家人關係及親密關係、親子互動、洞悉天賦、事業選擇、人才篩選、價值觀和動機解讀、消除內耗糾結等等。如想預約解讀,解讀前請思考通過解讀,想要消除的困擾,或者希望了解的內容。有針對性地解讀,事半功倍。4. 由於精力所限,每天只接1-2位1對1解讀,解讀報告則會在訂購1周內發送。
  • 讀書筆記|動態複雜系統的八個特性
    (3)因果互動對於動態系統而言,因果關係並非單方向的運動,而是不斷循環,互相影響。例如,對於人口問題,某一段時間之內的出生量導致人口總量增長——在這裡,出生量是因,人口總量是果;然而,由於人口總量增多,一定時期之後每年的出生量也會增長——在這種情況下,人口總量是因,出生量是果。
  • 堅持系統觀念的理論邏輯
    當前,我國發展環境面臨深刻複雜變化,發展不平衡不充分問題仍然突出。從理論上搞清楚堅持系統觀念的內在邏輯,有助於謀劃和解決經濟社會發展中錯綜複雜的矛盾,全面協調推動各領域工作和社會主義現代化建設。  遵循系統的動力學特性  經濟社會系統是一個動態系統,始終處於運動、變化、發展的過程中。
  • 深入理解「堅持系統觀念」
    全面建設社會主義現代化國家開好局、起好步的必然要求   系統觀念是馬克思主義基本原理的重要內容,強調系統是由相互作用、相互依賴的若干組成部分結合而成的、具有特定功能的有機體;要從事物的總體與全局上、從要素的聯繫與結合上研究事物的運動與發展,找出規律、建立秩序,實現整個系統的優化;用開放的複雜系統的觀點、用從定性到定量的綜合集成方法研究經濟社會問題
  • 徐浩然:堅持系統觀念的理論邏輯
    當前,我國發展環境面臨深刻複雜變化,發展不平衡不充分問題仍然突出。從理論上搞清楚堅持系統觀念的內在邏輯,有助於謀劃和解決經濟社會發展中錯綜複雜的矛盾,全面協調推動各領域工作和社會主義現代化建設。 遵循系統的動力學特性經濟社會系統是一個動態系統,始終處於運動、變化、發展的過程中。那麼,系統演化的動力來自哪兒?
  • 不確定的時間:從複雜系統視角看新冠大流行帶來的「美好未來」
    了解複雜系統的關鍵性特徵有助於我們釐清並應對新出現的全球性挑戰——從流行病到貧窮以及生態崩潰都包含在內。在複雜系統中,我們幾乎無法從之前的事情中預知接下來會發生什麼。世界總是在變化的。究其背後的原因,一是因為存在我們無法控制的因素,二是因為我們自身就會帶來幹預。
  • 林雪萍|數字孿生:第四象限的崛起(萬字長文)
    1989年,當時的仿真公司MDI(後來被MSC收購)最早提出了「虛擬原型「的概念,而其他計算機輔助設計CAD廠家如歐特克、UG、達索系統等,都從各自角度提出了數字原型、主動樣機、數字樣機等概念,其中數字樣機DMU(DigitalMock-Up)的說法被廣泛使用。它將三維模型之間的更多關係和上下文含義都傾注之中,並且進行了複雜的模擬。
  • 複雜系統自動建模綜述:描述、預測與理論發現
    另外,就是NeuralODE開闢了連續動力系統自動數據驅動建模的新領域。由於整個複雜系統是一個動力體系,它的圖結構中的連邊可以看做由因果關係(causal relation)轉化而來,所以我們對圖結構的學習重構也是對整個複雜系統內部的因果關係進行學習發現。
  • 科學革命能夠引發人類生活觀念深刻變化的科學巨變
    科技革命在現代人類文明發展歷程中佔據著特殊位置,它能夠塑造人類的思想觀念、生活方式與生產方式,改變科學技術的結構體系,牽動全球科技中心轉移,推動世界現代化發展進程。更重要的是,它直接影響著國家的興衰以及國家地位在全球競爭格局中的升降。  科技革命的歷史意義  科學革命是能夠引發人類生活觀念深刻變化的科學巨變。
  • 林毅夫1.7萬字長文:我的13個經濟學新見解
    來源:金融界網站由北京大學新結構經濟學研究院主辦的「2019年新結構經濟學優秀學子夏令營」於7月5日-8日於北京大學朗潤園舉行。林毅夫教授做了題為《新結構經濟學:新古典經濟學的結構革命》的開幕演講。理論是社會經濟變量之間因果關係的一個邏輯體系。理論首要的目的是幫助我們「認識世界」,了解現象背後的因果關係。但理論不是一個簡單的邏輯遊戲,我們認識世界,提出理論,更是為了指導行動,幫助我們更好地「改造世界」。因此,如果現有的理論不能幫助我們達成這兩個目標,我們就應該進行反思,提出新的理論。
  • 集智俱樂部學術年會:5場主題報告+3場分論壇,一起因果糾纏!
    一年一度的,讓我們一起加入發生在數據科學與人工智慧領域的因果革命,探索因果糾纏的複雜社會!  同時,我們呼喚天使投資贊助與合作,期待您與我們一起建設「沒有圍牆的研究所」!通過對無樁自行車共享系統記錄每次出行的詳細信息進行分析,為我們揭示隱藏在出行背後的行為模式,存在普遍的標度行為,為共享經濟下的綠色出行有積極的指導意義。  個人簡介:李睿琪,北京化工大學信息科學與技術學院副教授,城市網絡實驗室主任,主要研究方向為城市大數據分析與建模、複雜網絡研究與流行病傳播動力學。
  • 因果關係的新哲學解釋
    既可以從英國的經驗主義和邏輯經驗主義解釋哲學概念的因果論,也可以從德囯的理性主義和辯證理性主義解釋哲學範疇的因果關係,「英式哲學」和「德式哲學」對因果論或因果關係的兩種解釋方式符合解釋哲學方法論和目的論的等效原理。