原創 孫澤坤 神經現實 收錄於話題#深度 | Deep-diving142個
想像一下,你獨自置身於一個黑暗、空蕩蕩的房間。這裡寂靜而安定,所有的一切盡在你的覺知和掌握之中(跟我念:unagi~)。這裡沒有什麼無法預測的擾亂源,比如,親戚家熊孩子、突襲查房的老媽、你以為他忘了但他其實沒忘的催稿編輯。
也許你並不覺得這個場景過於魔幻?在全球的社交隔離中,我們或多或少測試了一下自己到底有多喜歡癱著,宅著,或是癱著宅。我們恍然大悟,原來搬磚真的會使我快樂,而且最好是去工地搬。
那麼問題來了,「安靜呆著」怎麼就那麼難?這種「艱難」也許和人類心智的本質有關。
現在,讓我們將人類心智抽象為一系列從接受信息到作出反饋的過程,如果你願意,也可以將這些過程稱為功能或者算法。那麼,是否存在一個更基礎的理論,能夠解釋和指導心智過程所涉及的一切算法呢?如果我們能夠發現這種「大一統理論」,我們無疑會更接近人類智能的本質和起源。
這篇文章,我們要懟談的是近二十年來有望奪得「大一統」桂冠的選手 —— 預測編碼(predictive coding),以及這個編碼和你家沒開燈的臥室到底有什麼關係。
永遠充滿「期待」的大腦
第一次聽到「預測編碼」的人,大概想不到它離我們的生活有多近。雙擊點開一張JPEG圖片,你就會接觸到預測編碼。
你可以想像一副海景照片。現在,我們想用儘可能少的信息量來編碼這張圖片,以便你可以快速地下載和傳送它。我們發現,這張百萬像素的照片太「藍」了,絕大多數鄰近的像素都「藍」的那麼相同!只有少數的地方顏色產生了變化,比如海天相接的地方,或是沙灘的邊緣。
既然如此,我們就不需要一個像素挨著一個像素重複編碼了,我們只需要重點編碼那些「沒有保持隊形」的像素,用預測值和真實值之間的偏離值來編碼特徵部位。比如,如果某個像素周圍的像素均為藍色,那麼這個像素就很大可能也是藍色;但如果它實際卻是黃色的,就嚴重偏離了預測。這裡的「預測誤差」(prediction error)就是我們要編碼的對象。通過這種方式,我們只編碼每個像素與它的預測值之間的差異,就可以壓縮這張圖片的信息量了。
大腦和一張JPEG圖片有什麼關係呢?
雖然「預測編碼」這個術語最早誕生在信息處理領域,但這種「編碼誤差」的思想早在19世紀就出現在認知/大腦相關的研究當中了。畢竟我們的大腦也是一個容量和處理能力都有限的系統。對這樣一個系統而言,壓縮信息、提高效率、以及如何「保真」都至關重要。大腦有可能利用「預測編碼」來提高信息的識別、存儲、輸出嗎?
物理學家赫爾曼·馮·亥姆霍茲(Hermann von Helmholtz)在1860年,將知覺描述為一個概率推斷的過程。根據這種思想,大腦在認識和理解外部世界的時候,並不只是一味地累積外部輸入的信息,更重要的是,大腦根據已有的知識,不斷地對當前的信息進行預測。
當然,大腦編碼信息比計算機編碼JPEG圖片複雜多了,它有可能是一個「多層處理結構」:相對低級的處理層向高級層級傳輸信號,「高層」則根據已有的模型(知識體系)進行「逆向匹配」。也就是說,每個層級都在預測下一級處理層的活動,如果預測信號符合低層傳來的信號(比如,預測信號=真實信號=「藍色」),那麼大腦就無需進一步協調;但是!如果二者不匹配,就會產生我們需要重點編碼的「預測誤差」(prediction error),這個誤差信號會告訴大腦的高級處理層:「喂,你的推測和模型需要調整一下哦!下次長點記性!」
這就是為什麼第一個黃色像素出現的時候,預測誤差非常大,而第一百個黃色像素出現的時候,大腦已經通過前99次的預測調整了「概率模型」,到100個的時候,就能夠頗為準確地預測了。
- Nino Bosikashvili -
預測編碼是怎麼解釋認知過程的呢?讓我們看個例子。視知覺有一個叫做「雙眼競爭」的現象。如果我們用一種特別的機械,向你的左眼呈現一棟房子,向你的右眼呈現一張人臉。在保持雙眼接收刺激不變的狀況下,我們將一會兒看到人臉,一會兒又看到房子。也就是說,我們的視知覺對恆定刺激的解釋在「人臉」和「房子」二者間互相切換。
那麼,大腦用了什麼「算法」,使穩定的「輸入」最終呈現出不穩定的「輸出」呢?預測編碼的描述頗為合理:在一定的時間內,我們的大腦對外界輸入的信息(雙眼刺激)形成一種最佳預測,比如「我看到屏幕上有個房子」,這種預測信號和你左眼傳入的「房子」刺激相符合,預測成功;但同時,這個預測卻無法匹配你右眼傳入的「人臉」刺激,從而產生了預測誤差信號,這種信號促使大腦尋找另一種對於刺激的解釋,也就是「我看到屏幕上有一張人臉」,這時候視知覺切換到了「人臉」模式,但這時,原先「房子」的刺激輸入又造成了新的誤差信號。如此往復,你就一會兒看到人臉,一會兒看到房子。總的來說,這種知覺的不穩定交替現象,其實是房子信號和人臉信號輪番引起「預測誤差」的結果。
至此,我們了解到預測編碼的核心功能:「預測誤差最小化」(prediction error minimization)。預測編碼理論的支持者們認為,對預測誤差的矯正和極小化是人類心智活動的核心目標。換個說法,「降低預測誤差」能夠解釋人類所有的行為和心智過程,包括注意、學習、記憶、行動、情緒和動機在內的一切,本質上都是接受信息、形成假設、矯正誤差的過程。
相當有「大一統理論」的味兒了。
「破解」預測編碼
預測編碼的流行無疑與它的解釋力有關。雅各布·霍威(Jokob Hohwy)在他的著作《作預測的心智》(The predictive mind)中說到:「大腦是一個複雜的假設驗證系統,它所做的就是從外部世界接收信息,並不斷地降低對於這些信息的預測偏差。這一機制旨在解釋從知覺到行動的一切心智活動。」
是不是有點按耐不住內心的興奮?想馬上投身在花式預測模型的汪洋大海中?但等等,好像有什麼不對勁?我們開頭說過什麼來著?
聰明的你發現了一個奇怪的矛盾:如果說大腦的終極任務就是消除一切的預測誤差,那麼,作為「誤差終結者」的我們,為什麼不乾脆找一個黑房間,蜷縮其中呢?在這裡,外部信息恆定不變,不存在任何新刺激,大腦始終處在「符合預期」的舒適狀態之中。
這就是針對預測編碼理論的「黑房間問題」(The Dark Room Problem)。「誤差最小化」的大一統原則導致了一個弔詭的假設:我們應當竭力尋求最無聊的體驗,而規避一切可能的「驚喜」。預測編碼的理論能否克服這個問題,告訴我們,為什麼人無法忍受一塵不變的環境?
- Francesco Bongiorni -
「黑房間問題」是一個嚴肅的提問嗎?也許你和許多人一樣,並不這麼認為。通常有這麼幾種回答「為什麼不呆在黑房間」的方式:
「你肯定是會餓的啊?你必須離開房間去找吃的!」一點都沒錯,但同時這也絲毫沒有回答原本的問題。根據預測編碼,如果有機體的目標僅僅是減小預測誤差,那只有當一種狀態增加了預測誤差(比如,前面的例子中,「人臉」刺激和「房子」知覺之間的信號誤差,導致知覺解釋向人臉轉換),才會促使有機體改變狀態,以達到「預期準確」。然而,對於一個在黑房間裡無所事事的人來說,飢餓信號的可預測性相當高。既然,機體傳入的信號「飢餓」符合大腦預測的信號「飢餓」,有機體就缺乏離開房間的機制。
「我們有好奇心,我們要探索世界啊!」
從長期來看,離開黑房間也許會讓我們更好的預測世界,探索未知或許會提高我們的預測能力。這個回應仍然沒有抓住黑房間問題的本質。但即使預測編碼的代表人物之一安迪·克拉克(Andy Clark)也承認:即使從長遠看,那些驅使我們離開黑房間的動機無法一併歸為「探索的工具性價值」。我們跳舞、坐過山車、援助慈善機構、朗讀詩歌;我們甚至在刻意尋求出人意外的「驚喜」和「刺激」。即使訴諸於更長的時間和空間尺度,預測編碼並不像它預計的那樣,將所有的行為解釋為「降低誤差」的努力。
「難道進化沒有在我們的基因裡錄入固有的動機嗎?也許我們的天性就是尋求新鮮的體驗!」
沒錯,但這個解釋犧牲了預測編碼本身的大部分解釋力。預測編碼理論最令人興奮的地方,莫過於它作為一個獨立且具有強大解釋的心智「萬物理論」 —— 將心智活動極為多樣的各個方面統合在獨一的原則之下。然而,如果這個原則需要訴諸於外部的補充和解釋,那麼它就不再是一個完整的大一統理論了。
除了上面這些不太成功的解釋。預測編碼理論本身能否克服黑房間問題呢?預測編碼的領軍人物,神經科學家卡爾·弗裡斯頓(Karl Friston)也曾回答了這個問題。
弗裡斯頓認為,黑房間問題從一開始就偏離了正確的方向。這是因為,它錯誤地假設黑房間造成的預測偏差很低!「黑房間本身其實十分『出人意料』,因為我們的預測是自己『不會呆在黑房間』。」所以,「呆在黑房間」實際上造成了很高的預測誤差,這時,「最小化誤差」的機制就會驅使我們離開房間。和之前的幾種直覺性回復不同的是,弗裡斯頓的答案似乎解決了這個問題,「預測誤差最小化」本身詮釋了為什麼我們不願身居黑屋。
然而,這個回答卻讓這個「大一統理論」陷入了一個更危險的境地。
自我預測 vs. 自我強化
其實,預測編碼並不是第一個劍指「大一統理論」的選手。它有個非常著名的前輩:強化理論。
半個世紀之前,針對「強化理論能否解釋一切人類行為」這個問題,兩位深刻變革了認知研究領域的科學家——斯金納和喬姆斯基——展開對壘。在喬姆斯基針對行為主義提出的一系列反駁中,有一個並不格外矚目的觀點:喬姆斯基列舉了一系列日常活動,而它們似乎無一源於強化原則,或者說「獎賞」。喬姆斯基說到,無論成人還是孩童,我們會自言自語,會在沒人的時候哼歌,會模仿汽車和飛機的聲音,而做這些並不會有什麼獎賞。那麼,行為主義要怎麼解釋這類行為呢?
斯金納的回答是「自我強化」:我們自言自語是因為這麼做令我們自己感到滿足,也就是說,所謂的「自我獎賞」就能夠強化我們的行為。
對此,喬姆斯基一針見血的指出,訴諸「自我強化」實際上消解了行為主義的解釋力。這類解釋要不是錯的(自言自語的確是自我獎賞嗎?),要不就是沒有意義的萬金油(所有的行為都可以號稱是「自我強化」出來的)。一個能解釋任何事的「機制」最終其實什麼都解釋不了,因為它是空洞且不可證偽的。為什麼一個人會閱讀一本書、彈奏一段音樂、說一些話,等等……?哦!因為他自我強化了這些行為。「強化」這個術語已然喪失了它的解釋力。
弗裡斯頓對於黑房間問題的「自我預測」辯護,會令預測編碼理論落入同樣的境地嗎?有可能。為什麼我們會跳舞?因為我們預測自己並不會靜止不動;為什麼我們會捐贈慈善機構?因為我們預測自己會做好事;為什麼我們需要社交(而討厭社交隔離)?因為我們的大腦存在這樣的預期「啊,我們大腦不喜歡自己呆著。」一方面,這些解釋也許暗示了心智的重要原則,但另一方面,這些答案可能根本不能稱之為解釋或者機制。如果只是訴諸「我們不會逗留在黑房間」的自我預期,來克服「黑房間問題」,那麼,我們可能再也找不到什麼行為是預測編碼無法解釋的了,因為一切的行為都可以被一個反向的自我預測來解釋。
誠然,預測編碼在許多方面推動了我們對人類心智過程的理解,「黑房間問題」並不意在否認這些重要的貢獻。但是,當一個理論試圖作為心智科學的「萬有理論」去解釋有關人類的一切,我們則不得不審慎了。
後記
最後的最後,請允許我為自家實驗室代言,並推薦我們發表在《認知科學趨勢》(Trends in Cognitive Sciences)雜誌的觀點文章The Dark Room Problem。小小的劇透一下,文章有一個這裡沒有談到的有趣論點哦。再大大的劇透一下,我們已經收到了Friston給雜誌的letter,並且正在友好地打嘴仗討論科學問題。對後續情節有興趣的話,敬請持續關注!
參考文獻
Sun, Z., & Firestone, C. (2020). The dark room problem. Trends in Cognitive Sciences, 24, 346–348.
Clark, A. (2013). Whatever next? Predictive brains, situated agents, and the future of cognitive science. Behavioral and brain sciences, 36(3), 181-204.
Clark, A. (2016) Surfing Uncertainty: Prediction, Action, and the Embodied Mind, Oxford University Press, New York
Chomsky, N. (1959) Review of Verbal Behavior by B.F. Skinner. Language 35, 26–58
Friston, K. (2013) Active inference and free energy. Behav. Brain Sci. 36, 212–213
Friston, K. et al. (2012) Free-energy minimization and the dark-room problem. Front. Psychol. 3, 130
Klein, C. (2018) What do predictive coders want? Syn- these 195, 2541–2557
Hohwy, J. (2013) The Predictive Mind, Oxford University Press, Oxford
作者:孫澤坤 | 封面:COCO
原標題:《一個黑房間能劫持你的大腦嗎?》
閱讀原文