正如圖靈獎獲得者,貝葉斯網絡之父 Judea Pearl 所言,機器學習不過是在擬合數據和概率分布曲線。變量的內在因果關係不僅沒有被重視,反而被刻意忽略和簡化。如果要真正解決科學問題,甚至開發具有真正意義智能的機器,因果關係是必然要邁過的一道坎。
Judea Pearl 在最新的《The book of Why》中批判了傳統統計學存在的問題,並進一步介紹了使用因果推理的數學工具,研究變量關係的新方法。
今年,該書被翻譯成中文,即將付梓出版。聯合中信出版社,機器之心也將為購票參加市北·GMIS 2019 大會的讀者進行贈書活動,數量有限,先到先得。
Judea Pearl:我們需要一場「因果革命」
提到 Judea Pearl,熟悉機器學習領域的讀者應該不會陌生。他提出了著名的貝葉斯網絡,是 2011 年圖靈獎的獲得者。
雖然 Pearl 已經是領域內知名的學者,但是他自嘲自己是「AI 社區的反叛者」。原因在於,Pearl 對人工智慧的發展方向和主流趨勢持相反意見。Pearl 認為,儘管現有的機器學習模型已經取得了巨大的進步,但遺憾的是,所有的模型不過是對數據的精確曲線擬合。從這一點而言,現有的模型只是在上一代的基礎上提升了性能,在基本的思想方面沒有任何進步。
那麼,怎樣才能推動 AI 社區解決這一問題呢?在之前的採訪中,Pearl 認為,我們需要一場「因果革命」。研究者應該考慮採用因果推斷模型,從因果而非單純的數據角度進行研究。他認為,我們在過去一段時間錯過了對因果推斷的研究機會,這原本是科學研究的核心:尋找變量的因果關係。
圖註:Judea Pearl
然而,當前統計機器學習主要關注對表徵的擬合,尋找的是變量之間的相關性,而非潛在的因果性。這樣的認識會使科學研究停留在較淺的關聯層面,導致模型的魯棒性和可解釋性喪失,阻斷了進一步探究幹預變量,以及反事實推斷(即假設某一變量完全相反而其他變量不變時,該變量對結果的影響)的能力。Pearl 認為,智能的機器應該能夠彼此溝通交流,通過提出反事實對話(如「你應該怎樣做」)而作出更好的表現。
Pearl 感到遺憾的是,當前一部分研究者依然沉浸於機器學習模型帶來的巨大進步中,缺乏對研究的內省。因此,Pearl 和他的同事在 2018 年完成了著作《The Book of Why: The New Science of Cause and Effect》。Pearl 在書中詳細地闡述自己在這一領域的研究成果,希望能夠促進人們反思當前的研究方向。
因果關係這本書都講了啥
Judea Pearl 在書籍前言中表示,整本書主要從三方面描繪因果推斷的全景圖:
首先,用非數學的語言闡述因果革命的知識內涵,說明它將怎樣影響我們的生活和未來。
其次,分享在解決重要的因果問題時,我們的科學家前輩走過的英勇徵程。
最後,回溯因果革命在人工智慧領域的發源地,目的是向你介紹如何開發出用因果語言進行交流的機器人。
因為這本書是科普讀物,所以並不要求讀者擁有非常強的數學基礎。Judea Pearl 會用讀者的語言組織思路,猜測讀者的背景及可能提出的問題。如果讀者想重新審視機器學習的發展歷程和其中存在的問題,並力求尋找一種彌補措施,Pearl 的這本心血之作,值得讀者細細品讀。
內容概要
Pearl 在本書中重點闡述了自己在因果推斷領域的研究和思考,並將這些研究通過讀者能夠理解的數學形式展示出來。總體而言,Pearl 介紹了通向科學分析的路徑:因果之梯。Pearl 表示,科學研究需要從從觀察,到幹預,最終到反事實推理,而整本書的各個章節都圍繞著這三部分展開討論。
首先是底層,指的是對於事物現象的一般性觀察,並根據觀察的現象,發現其中的關聯性。中間一層則是幹預,即通過對變量的改變,研究這一變量對結果的影響,包括是否改變結果的性質,以及改變的強度。最後則是反事實,即通過模擬控制其他變量,僅翻轉被研究的變量,探討可能的發展。
因果之梯的三個層級。每向上前進一層時,下層的問題都可以被上層的結果直接解決。
當前的機器學習模型,在 Pearl 看來,只能停留於第一階段。這是因為,統計機器學習模型僅能夠對現象(數據)進行觀察,並擬合一個可能的概率分布。這種擬合的結果是,模型僅能夠發現兩個變量之間的相關性,而非真正的因果性。
因為統計學關注第一階段觀察,因此獲得的相關性會帶來的一系列研究問題。例如由於無法分離變量「混雜」問題,統計學可能對變量進行錯誤的控制,以致造成錯誤的相關關係推斷。
在最後介紹反事實階段中,Pearl 還重點介紹了自己的相關研究成果:
第一,Pearl 會通過圖的形式,定性、定量地描述變量之間的因果關係和影響程度。
第二,Pearl 闡述了自己在貝葉斯網絡方面的研究,以及在面對複雜因果概率問題中的解決方法。
第三,Pearl 介紹了使用 d-分離的方法,使用因果論領域的數學工具,將統計學中難以剝離和控制的變量,簡單地從變量中分離。
第四,Pearl 談到如何使用結構化因果方程的方式,最終登上因果之梯的最高點:反事實推理。
在本書的最後,Pearl 從數學講解中脫離出來,針對當前的大數據、人工智慧等方面的話題提出了自己的見解。
什麼是因果推斷?
那麼這本書最核心的概念,因果推斷到底是什麼呢?機器之心摘取了第一章節的部分內容,其形象地解釋因果推斷,感興趣的讀者快來試讀吧。
Pearl 在書中認為,因果推斷是一種通過事物的原因推導至某個肯定結果的邏輯方式。通過因果推斷,人類可以很好的解決生活和科學中遇到的問題。而如果能夠完全掌握這一方法,就能夠在計算機上模擬因果推斷,進而設計強大的自動化機器。機器最終可以幫助人類解決科學界懸而未決的問題,並最終從環境中不斷的學習新的因果知識。
為了將語言中的因果關係使用數學形式表達,Pearl 提出了因果圖。因果圖一種圖形式的模擬,代表變量之間存在的因果關係。點代表變量,帶有指向的邊則表示了變量的因果關係影響。這種點-邊的關係圖被稱為因果圖。Pearl 認為因果圖可以良好的展示因果關係。如果每個邊帶有一個權重,則可以表示不同因素對於這一結果的影響強度大小。
成功狩獵長毛象的已知影響因素。假設某個原始人需要狩獵長毛象,則對其成果狩獵的因素(變量)可以用點表示,邊則表示這些因素對結果(狩獵成功與否)具有影響因素。
如果使用因果圖,可以模擬預測某一變量對結果的影響。例如,在明確了一個變量關係的因果圖後,通過刪除某條邊(表示隔離某個變量對結果的影響),則可以清楚地預測在缺失該變量的情況下,它對結果的影響。
假設有一法院對犯人下達死刑命令,通過執行隊長向兩個行刑人下達指令。
上圖展示了法院命令 CO、隊長 C、行刑者 A、行刑者 B 變量對犯人 D 的影響。因果圖表示的是法院下達命令,隊長收到命令,將命令同時傳達給 A、B,A 和 B 收到命令後,同時對犯人執行死刑的完整流程。由於設定 A、B 都必須收到隊長的命令後才能執行,並且必須執行。可以觀察到,AB 執行,D 死亡。關聯關係可以認為,D 的死亡是 AB 一同執行的結果。
本圖是假設了隊長 C 沒有下達命令給 A(移除了 AC 的邊),但 A 依然提前執行的情況下(人為設定 A 為真),犯人是否死亡的因果圖。
通過上圖,可以判斷,即使沒有命令但 A 仍執行(為真)的情況下,犯人 D 依然死亡。但是,這一推理和 B 對 D 的狀態無關,即 A 為真肯定會導致 D(死亡),但 B 的狀態在因果推理中無法說明。作者通過這一例子說明,當 AB 被觀察到同時執行,確實可以看到 D 的死亡。但 D 的死亡,也可能是 A 獨立導致的,而非 AB 同時為真的結果。因此,因果圖相較基於觀察相關性的研究,更能夠發現變量內部的因果關係。
通過因果圖,我們能快速了解變量之間的因果關係,這也就是因果推斷了。如果機器學習也能理解變量的這種關係,那麼預測結果也就天然可解釋了,這樣的機器學習系統才是最穩健的。
全書目錄
如下所示為全書目錄,根據因果之梯,第 2 到 6 章介紹的是第一階段的觀察;第 7 章介紹的是第二階段的幹預;最後第 8 章介紹的就是反事實。了解因果之梯後,再利用新工具與新方法就能嘗試解決以前的難題。
前 言 III
導言:思維勝於數據
第一章 因果關係之梯
第二章 從海盜到豚鼠:因果推斷的起源
第三章 從證據到因:當貝葉斯牧師遇見福爾摩斯先生
第四章 混雜和去混雜:或者,消滅潛伏變量
第五章 煙霧繚繞的爭論:淨化空氣
第六章 大量的悖論!
第七章 超越調整:徵服幹預之峰
第八章 反事實: 挖掘原本可能的世界
第九章 中介: 尋找一種機制
第十章 大數據,人工智慧和大問題
致謝
參考文獻
如何獲贈《The book of Why》?
即日起購買「市北·GMIS 2019」大會門票,並在購票時備註「why」,即可獲贈 Judea Pearl 最新力作《The book of Why》一本,限量 10 本,按購票時間,送完為止。
市北·GMIS 2019全球數據智能峰會於7月19日-20日在上海市靜安區舉行。本次峰會以「數據智能」為主題,聚焦最前沿研究方向,同時更加關注數據智能經濟及其產業生態的發展情況,為技術從研究走向落地提供借鑑。
本次峰會設置主旨演講、主題演講、AI畫展、「AI00」數據智能榜單發布、閉門晚宴等環節,已確認出席嘉賓如下:
大會早鳥票已開售,我們也為廣大學生用戶準備了最高優惠的學生票,點擊閱讀原文即刻報名。