一個黑房間能劫持你的大腦嗎?| 預測性編碼

2021-01-13 澎湃新聞

原創 孫澤坤 神經現實 收錄於話題#深度 | Deep-diving142個

想像一下,你獨自置身於一個黑暗、空蕩蕩的房間。這裡寂靜而安定,所有的一切盡在你的覺知和掌握之中(跟我念:unagi~)。這裡沒有什麼無法預測的擾亂源,比如,親戚家熊孩子、突襲查房的老媽、你以為他忘了但他其實沒忘的催稿編輯。

也許你並不覺得這個場景過於魔幻?在全球的社交隔離中,我們或多或少測試了一下自己到底有多喜歡癱著,宅著,或是癱著宅。我們恍然大悟,原來搬磚真的會使我快樂,而且最好是去工地搬。

那麼問題來了,「安靜呆著」怎麼就那麼難?這種「艱難」也許和人類心智的本質有關。

現在,讓我們將人類心智抽象為一系列從接受信息到作出反饋的過程,如果你願意,也可以將這些過程稱為功能或者算法。那麼,是否存在一個更基礎的理論,能夠解釋和指導心智過程所涉及的一切算法呢?如果我們能夠發現這種「大一統理論」,我們無疑會更接近人類智能的本質和起源。

這篇文章,我們要懟談的是近二十年來有望奪得「大一統」桂冠的選手 —— 預測編碼(predictive coding),以及這個編碼和你家沒開燈的臥室到底有什麼關係。

永遠充滿「期待」的大腦

第一次聽到「預測編碼」的人,大概想不到它離我們的生活有多近。雙擊點開一張JPEG圖片,你就會接觸到預測編碼。

你可以想像一副海景照片。現在,我們想用儘可能少的信息量來編碼這張圖片,以便你可以快速地下載和傳送它。我們發現,這張百萬像素的照片太「藍」了,絕大多數鄰近的像素都「藍」的那麼相同!只有少數的地方顏色產生了變化,比如海天相接的地方,或是沙灘的邊緣。

既然如此,我們就不需要一個像素挨著一個像素重複編碼了,我們只需要重點編碼那些「沒有保持隊形」的像素,用預測值和真實值之間的偏離值來編碼特徵部位。比如,如果某個像素周圍的像素均為藍色,那麼這個像素就很大可能也是藍色;但如果它實際卻是黃色的,就嚴重偏離了預測。這裡的「預測誤差」(prediction error)就是我們要編碼的對象。通過這種方式,我們只編碼每個像素與它的預測值之間的差異,就可以壓縮這張圖片的信息量了。

大腦和一張JPEG圖片有什麼關係呢?

雖然「預測編碼」這個術語最早誕生在信息處理領域,但這種「編碼誤差」的思想早在19世紀就出現在認知/大腦相關的研究當中了。畢竟我們的大腦也是一個容量和處理能力都有限的系統。對這樣一個系統而言,壓縮信息、提高效率、以及如何「保真」都至關重要。大腦有可能利用「預測編碼」來提高信息的識別、存儲、輸出嗎?

物理學家赫爾曼·馮·亥姆霍茲(Hermann von Helmholtz)在1860年,將知覺描述為一個概率推斷的過程。根據這種思想,大腦在認識和理解外部世界的時候,並不只是一味地累積外部輸入的信息,更重要的是,大腦根據已有的知識,不斷地對當前的信息進行預測。

當然,大腦編碼信息比計算機編碼JPEG圖片複雜多了,它有可能是一個「多層處理結構」:相對低級的處理層向高級層級傳輸信號,「高層」則根據已有的模型(知識體系)進行「逆向匹配」。也就是說,每個層級都在預測下一級處理層的活動,如果預測信號符合低層傳來的信號(比如,預測信號=真實信號=「藍色」),那麼大腦就無需進一步協調;但是!如果二者不匹配,就會產生我們需要重點編碼的「預測誤差」(prediction error),這個誤差信號會告訴大腦的高級處理層:「喂,你的推測和模型需要調整一下哦!下次長點記性!」

這就是為什麼第一個黃色像素出現的時候,預測誤差非常大,而第一百個黃色像素出現的時候,大腦已經通過前99次的預測調整了「概率模型」,到100個的時候,就能夠頗為準確地預測了。

- Nino Bosikashvili -

預測編碼是怎麼解釋認知過程的呢?讓我們看個例子。視知覺有一個叫做「雙眼競爭」的現象。如果我們用一種特別的機械,向你的左眼呈現一棟房子,向你的右眼呈現一張人臉。在保持雙眼接收刺激不變的狀況下,我們將一會兒看到人臉,一會兒又看到房子。也就是說,我們的視知覺對恆定刺激的解釋在「人臉」和「房子」二者間互相切換。

那麼,大腦用了什麼「算法」,使穩定的「輸入」最終呈現出不穩定的「輸出」呢?預測編碼的描述頗為合理:在一定的時間內,我們的大腦對外界輸入的信息(雙眼刺激)形成一種最佳預測,比如「我看到屏幕上有個房子」,這種預測信號和你左眼傳入的「房子」刺激相符合,預測成功;但同時,這個預測卻無法匹配你右眼傳入的「人臉」刺激,從而產生了預測誤差信號,這種信號促使大腦尋找另一種對於刺激的解釋,也就是「我看到屏幕上有一張人臉」,這時候視知覺切換到了「人臉」模式,但這時,原先「房子」的刺激輸入又造成了新的誤差信號。如此往復,你就一會兒看到人臉,一會兒看到房子。總的來說,這種知覺的不穩定交替現象,其實是房子信號和人臉信號輪番引起「預測誤差」的結果。

至此,我們了解到預測編碼的核心功能:「預測誤差最小化」(prediction error minimization)。預測編碼理論的支持者們認為,對預測誤差的矯正和極小化是人類心智活動的核心目標。換個說法,「降低預測誤差」能夠解釋人類所有的行為和心智過程,包括注意、學習、記憶、行動、情緒和動機在內的一切,本質上都是接受信息、形成假設、矯正誤差的過程。

相當有「大一統理論」的味兒了。

「破解」預測編碼

預測編碼的流行無疑與它的解釋力有關。雅各布·霍威(Jokob Hohwy)在他的著作《作預測的心智》(The predictive mind)中說到:「大腦是一個複雜的假設驗證系統,它所做的就是從外部世界接收信息,並不斷地降低對於這些信息的預測偏差。這一機制旨在解釋從知覺到行動的一切心智活動。」

是不是有點按耐不住內心的興奮?想馬上投身在花式預測模型的汪洋大海中?但等等,好像有什麼不對勁?我們開頭說過什麼來著?

聰明的你發現了一個奇怪的矛盾:如果說大腦的終極任務就是消除一切的預測誤差,那麼,作為「誤差終結者」的我們,為什麼不乾脆找一個黑房間,蜷縮其中呢?在這裡,外部信息恆定不變,不存在任何新刺激,大腦始終處在「符合預期」的舒適狀態之中。

這就是針對預測編碼理論的「黑房間問題」(The Dark Room Problem)。「誤差最小化」的大一統原則導致了一個弔詭的假設:我們應當竭力尋求最無聊的體驗,而規避一切可能的「驚喜」。預測編碼的理論能否克服這個問題,告訴我們,為什麼人無法忍受一塵不變的環境?

- Francesco Bongiorni -

「黑房間問題」是一個嚴肅的提問嗎?也許你和許多人一樣,並不這麼認為。通常有這麼幾種回答「為什麼不呆在黑房間」的方式:

「你肯定是會餓的啊?你必須離開房間去找吃的!」一點都沒錯,但同時這也絲毫沒有回答原本的問題。根據預測編碼,如果有機體的目標僅僅是減小預測誤差,那只有當一種狀態增加了預測誤差(比如,前面的例子中,「人臉」刺激和「房子」知覺之間的信號誤差,導致知覺解釋向人臉轉換),才會促使有機體改變狀態,以達到「預期準確」。然而,對於一個在黑房間裡無所事事的人來說,飢餓信號的可預測性相當高。既然,機體傳入的信號「飢餓」符合大腦預測的信號「飢餓」,有機體就缺乏離開房間的機制。

「我們有好奇心,我們要探索世界啊!」

從長期來看,離開黑房間也許會讓我們更好的預測世界,探索未知或許會提高我們的預測能力。這個回應仍然沒有抓住黑房間問題的本質。但即使預測編碼的代表人物之一安迪·克拉克(Andy Clark)也承認:即使從長遠看,那些驅使我們離開黑房間的動機無法一併歸為「探索的工具性價值」。我們跳舞、坐過山車、援助慈善機構、朗讀詩歌;我們甚至在刻意尋求出人意外的「驚喜」和「刺激」。即使訴諸於更長的時間和空間尺度,預測編碼並不像它預計的那樣,將所有的行為解釋為「降低誤差」的努力。

「難道進化沒有在我們的基因裡錄入固有的動機嗎?也許我們的天性就是尋求新鮮的體驗!」

沒錯,但這個解釋犧牲了預測編碼本身的大部分解釋力。預測編碼理論最令人興奮的地方,莫過於它作為一個獨立且具有強大解釋的心智「萬物理論」 —— 將心智活動極為多樣的各個方面統合在獨一的原則之下。然而,如果這個原則需要訴諸於外部的補充和解釋,那麼它就不再是一個完整的大一統理論了。

除了上面這些不太成功的解釋。預測編碼理論本身能否克服黑房間問題呢?預測編碼的領軍人物,神經科學家卡爾·弗裡斯頓(Karl Friston)也曾回答了這個問題。

弗裡斯頓認為,黑房間問題從一開始就偏離了正確的方向。這是因為,它錯誤地假設黑房間造成的預測偏差很低!「黑房間本身其實十分『出人意料』,因為我們的預測是自己『不會呆在黑房間』。」所以,「呆在黑房間」實際上造成了很高的預測誤差,這時,「最小化誤差」的機制就會驅使我們離開房間。和之前的幾種直覺性回復不同的是,弗裡斯頓的答案似乎解決了這個問題,「預測誤差最小化」本身詮釋了為什麼我們不願身居黑屋。

然而,這個回答卻讓這個「大一統理論」陷入了一個更危險的境地。

自我預測 vs. 自我強化

其實,預測編碼並不是第一個劍指「大一統理論」的選手。它有個非常著名的前輩:強化理論。

半個世紀之前,針對「強化理論能否解釋一切人類行為」這個問題,兩位深刻變革了認知研究領域的科學家——斯金納和喬姆斯基——展開對壘。在喬姆斯基針對行為主義提出的一系列反駁中,有一個並不格外矚目的觀點:喬姆斯基列舉了一系列日常活動,而它們似乎無一源於強化原則,或者說「獎賞」。喬姆斯基說到,無論成人還是孩童,我們會自言自語,會在沒人的時候哼歌,會模仿汽車和飛機的聲音,而做這些並不會有什麼獎賞。那麼,行為主義要怎麼解釋這類行為呢?

斯金納的回答是「自我強化」:我們自言自語是因為這麼做令我們自己感到滿足,也就是說,所謂的「自我獎賞」就能夠強化我們的行為。

對此,喬姆斯基一針見血的指出,訴諸「自我強化」實際上消解了行為主義的解釋力。這類解釋要不是錯的(自言自語的確是自我獎賞嗎?),要不就是沒有意義的萬金油(所有的行為都可以號稱是「自我強化」出來的)。一個能解釋任何事的「機制」最終其實什麼都解釋不了,因為它是空洞且不可證偽的。為什麼一個人會閱讀一本書、彈奏一段音樂、說一些話,等等……?哦!因為他自我強化了這些行為。「強化」這個術語已然喪失了它的解釋力。

弗裡斯頓對於黑房間問題的「自我預測」辯護,會令預測編碼理論落入同樣的境地嗎?有可能。為什麼我們會跳舞?因為我們預測自己並不會靜止不動;為什麼我們會捐贈慈善機構?因為我們預測自己會做好事;為什麼我們需要社交(而討厭社交隔離)?因為我們的大腦存在這樣的預期「啊,我們大腦不喜歡自己呆著。」一方面,這些解釋也許暗示了心智的重要原則,但另一方面,這些答案可能根本不能稱之為解釋或者機制。如果只是訴諸「我們不會逗留在黑房間」的自我預期,來克服「黑房間問題」,那麼,我們可能再也找不到什麼行為是預測編碼無法解釋的了,因為一切的行為都可以被一個反向的自我預測來解釋。

誠然,預測編碼在許多方面推動了我們對人類心智過程的理解,「黑房間問題」並不意在否認這些重要的貢獻。但是,當一個理論試圖作為心智科學的「萬有理論」去解釋有關人類的一切,我們則不得不審慎了。

後記

最後的最後,請允許我為自家實驗室代言,並推薦我們發表在《認知科學趨勢》(Trends in Cognitive Sciences)雜誌的觀點文章The Dark Room Problem。小小的劇透一下,文章有一個這裡沒有談到的有趣論點哦。再大大的劇透一下,我們已經收到了Friston給雜誌的letter,並且正在友好地打嘴仗討論科學問題。對後續情節有興趣的話,敬請持續關注!

參考文獻

Sun, Z., & Firestone, C. (2020). The dark room problem. Trends in Cognitive Sciences, 24, 346–348.

Clark, A. (2013). Whatever next? Predictive brains, situated agents, and the future of cognitive science. Behavioral and brain sciences, 36(3), 181-204.

Clark, A. (2016) Surfing Uncertainty: Prediction, Action, and the Embodied Mind, Oxford University Press, New York

Chomsky, N. (1959) Review of Verbal Behavior by B.F. Skinner. Language 35, 26–58

Friston, K. (2013) Active inference and free energy. Behav. Brain Sci. 36, 212–213

Friston, K. et al. (2012) Free-energy minimization and the dark-room problem. Front. Psychol. 3, 130

Klein, C. (2018) What do predictive coders want? Syn- these 195, 2541–2557

Hohwy, J. (2013) The Predictive Mind, Oxford University Press, Oxford

作者:孫澤坤 | 封面:COCO

原標題:《一個黑房間能劫持你的大腦嗎?》

閱讀原文

相關焦點

  • 自閉症是因為大腦預期出了問題?
    用預測性編碼理論的話說,一個自閉症患者的大腦過分看重預期和實際感覺的差距。當路邊的汽車鳴笛開過,普通的大腦可能只是將它作為城市聽覺背景中的偶然波動;而對自閉症大腦來說,每一次鳴笛聲都會讓它有意識地注意。「這為自閉症的主要特徵提供了非常簡潔的解釋。」倫敦大學學院的神經科學家卡爾·弗裡斯頓(Karl Friston)說。他曾經幫助建立了預測性編碼理論應用於大腦的數學基礎。
  • 一上臺就發抖,你被「杏仁體」劫持了嗎?
    曾經有那麼一刻,你大腦一片空白,非常焦急的在思考等下要說點什麼?要做什麼手勢?還需要使用什麼工具?但怎麼都想不起來,手心都是冷汗,而且身體不聽指揮,只聽見自己心臟快速跳動的聲音。什麼是「杏仁體劫持」上面的情境有沒有覺得很熟悉,不是你一個人會這樣,我們都曾有過。
  • 如何應對運營商插入的廣告、被運營商劫持怎麼辦
    2.理性投訴,不要辱罵客服人員,你說問題,讓他給你記錄反饋即可。 簡要流程為:(工信部投訴之前務必先撥打運營商客服熱線受理)具體流程為:1.撥打運營商客服熱線,提供帳號信息,要求解決問題,答覆解決時限。並要求記錄投訴,告知投訴編碼(這一步很重要)。
  • 你的大腦如何預測未來
    對於觀眾來說,似乎費德勒有第六感使他有可能提前準備他的手眼協調與心靈讀者的洞察力,他可以準確預測球的位置,毫秒之前它實際上在擺動距離內。運動員通常會提到預期計時的重要性,並預測運動中球或冰球的未來軌跡。正如韋恩·格雷茨基(Wayne Gretzky)所說的那樣,「一個優秀的冰球運動員在冰球的位置上打球;一個偉大的冰球運動員在冰球的位置上進行比賽。」
  • 你的大腦能設想平行宇宙嗎?
    年長的孩子不僅理解了事件的不確定性,而且能意識到若是只預測一個出口將有出錯的可能。這種能力目前尚未在非人動物身上發現確實證據。幾個神經科學理論斷定,動物的大腦本質上是預測機器[4-8]。這些理論認為大腦在得到經驗後根據經驗不斷調整行為、讓決策進步,這是一種後驗的方式。通過觀察預期和實際結果之間的差異,大腦得以校準預測參數。然而這種能力並非人類獨有,人類能做的也遠不止這個程度的反事實思考。
  • 像計算機一樣學習——如何將知識「編碼」到我們的大腦當中
    這是單華偉的第一百八十二篇原創文章(2.0)我們如何『 儲存 』信息人類對任何事情的記憶,都會經過大腦獲取信息(編碼,encoding)、 保存信息(存儲,storage)和日後讀取信息(提取,retrieval
  • 顛覆傳統認知:大腦對顏色和形狀視覺信息的編碼方式「大揭秘」
    人類在視覺上可以分辨出成千上萬種不同的顏色和形狀,大腦又是如何處理這些視覺信息的呢?科學家們以前認為視覺系統先通過不同的神經元分別對顏色和形狀編碼,後期再將它們進行組合。以前研究者們認為顏色和形狀信息是分開提取後,僅在大腦的最高級中樞結合,而Salk研究所的新成果表明這種結合出現得更早。
  • 海馬神經元群體活動如何編碼位置信息?用機器學習來加速解碼
    在本文中,作者在海馬齒狀回(dentate gyrus,DG)和CA1亞區中觀察到了這種分布式編碼過程,並通過對自由移動的小鼠進行鈣成像,從數百個細胞的活動中解碼出動物的位置、運動方向和速度。經過分析發現,單個神經元的響應特性僅部分預測了它們對編碼位置的重要性。
  • 你認知膚淺,在於你錯誤的用腦習慣
    而前額葉的作用,就是用來整頓所有這些生活神經元的,使得它能夠按照某種規律存放在大腦裡面,然後根據這些法則與規律,來預測接下來每天可能發生的事情,以此來指導我們的行為,以便可以作出事先的準備,這就是有備無患的大腦原理。我們的大腦,就是一個預測器官,它通過整頓生活經歷得出規律,從而根據規律來預測未來,以便可以作出更準確的判斷。
  • 「思維圖」讀書多≠懂得多,如何讓大腦真正高效閱讀、學習?
    底層知識預測性編碼 | 框架、結構 | 大腦可預知性 | 記憶提取、存儲 | 聯結主義「思維圖」課程筆記1.相信大家也會發現,有些框架思維更成熟的人在表達觀點時,都會加上前綴,第一,是從A角度;第二,是從B角度……讓聽眾能「提前預知」相關的內容是應該再哪個框架裡,這樣聽眾就會覺得很「清晰」。這就是「大腦預測性編碼」所發揮的「可預知性」。
  • 2345網址導航回應「瀏覽器主頁劫持」(「瀏覽器主頁劫持」報導追蹤)
    問:如果劫持情況屬實,請問貴公司有哪些回應,下一步有哪些計劃?答:如果發現這種行為,一經核實,我們會採取以下3點措施:立即聯繫用戶,幫助用戶解決主頁被劫持問題;立即查封該推廣渠道,並停止與該渠道的合作;情節嚴重的,會追究其法律責任。希望發現劫持立即舉報,電話4000002345。問:2345從來不知道自己劫持過他人的瀏覽器主頁嗎?
  • eLife:海馬齒狀回利用不同的細胞群參與新舊記憶的編碼
    你是否曾在一個星期一的早上,絞盡腦汁得回憶你的車鑰匙放在哪了。如果找到了,那你就該感謝一下你的海馬了。海馬是大腦中的一個重要結構,負責對不同環境的記憶進行編碼和提取,比如你把你的車鑰匙忘在了房間的某個角落。
  • 由內而外:大腦如何形成感覺記憶
    我們知道人類的大腦會對我們感官收集的信息進行編碼。然而,為了感知我們的環境並與之進行建設性的互動,這些感官信號需要在我們以前的經驗和當前目標的背景下進行解釋。這是我們對感覺知覺等高級大腦功能的理解中最大的差距之一。這也促使我們的團隊尋找這些自上而下信號的來源。我們和許多其他科學家之前的工作表明,最頂層的大腦皮層很可能是接收攜帶自上而下信息的輸入的關鍵部位。以此為起點,我們可以確定丘腦的一個區域(嵌入前腦深處的大腦區域)作為此類內部信息的關鍵候選來源。」
  • 大腦複雜性的進化:一個關於空間、時間和熵的故事
    摘要/Abstract大腦是如何進化成的複雜系統的,他在未來會走向何方?大腦的存在對現有的理論提出了這樣一個挑戰,眾所周知,熵不可避免地隨著時間的推移而增加,這通常與無序性和簡單性有關*。我們發現進化是一個熵進化的過程:結構的建立(即生命的產生)促進了熵的增加。
  • 買買買時大腦是如何決策的?神經生物學基礎比預想得更複雜
    但買買買背後,你可曾想過,你的大腦是怎樣想的,最先考慮的是商品性價比,還是自己的需求?這究竟藏著怎樣的謎之決定?事實上,不只是一般人不知道,科學家們的研究也剛剛起步。倫敦大學學院研究團隊最近在《美國國家科學院院刊》發表研究稱,購物選擇背後的神經生物學基礎比過去預想得更加複雜。
  • 《自然》:編碼目光的神經元,幫我們區分敵友
    此前的研究表明,直接目光接觸能引起靈長類動物的焦慮情緒,並激發杏仁核(amygdala)活動。杏仁核活動異常與目光迴避(gaze avoidance)有關,後者是許多神經發育障礙和社交障礙的典型症狀。因此,我們有理由推測,大腦對目光與效價的編碼(coding)可能有相似的機制,而目光和結果預測(outcome expectation)可能也有共同的神經元編碼;並且,在這三項認知功能中,杏仁核都應當扮演了重要角色。
  • 大腦如何存儲信息?
    夏洛:大爺,樓上322是馬冬梅家嗎?  大爺:馬冬什麼?  夏洛:馬冬梅。  大爺:什麼冬梅啊?  夏洛:……行,大爺,您先涼快吧。  事實上,電影中這位一個名字聽了多遍仍記不住的「打岔」大爺,就是工作記憶不好的一個典型。  到底什麼是工作記憶?
  • 大腦複雜性的演化:一個空間、時間和熵的故事
    摘要 / Abstract大腦如何演化為如今的複雜系統,它的未來又將走向何處?大腦的存在對現存的理論提出了這樣一個挑戰——我們都知道,熵隨著時間的流逝不可避免的增長,它常常與無序性及簡單性*聯繫起來。這種探測能力可以是與生俱來的,例如昆蟲朝著光亮移動;但這種能力也能從經驗中習得。更複雜的空間表徵則不僅需要自我中心編碼(egocentric coding,編碼外界物體相對於自己身體的位置),還需要非自我中心編碼(allocentric coding,編碼外界物體在世界中的客觀位置)。
  • 自私會有報應,因為大腦有一個因果報應神經元
    而這兩者的目標,都準確的對準了我們的動物腦,而動物腦的自私的強大性與遮蔽性在於,它正是萬物一系演化到人性層面的體現,因此,它幾乎就是人的本身。鏡像神經元細胞也極其像這樣一隻手,當一個大腦看見另外一個大腦痛苦時,鏡像神經元細胞會如實的把這個感受傳遞過去,所有看見的大腦都能感覺得到這些痛苦,這個原理,就是為什麼我們看見一些民眾受災時,我們的內心也會隱隱約約的痛苦的原因,任何一個人都會感覺得到這些感受,鏡像神經元細胞一定會把這些情緒拷貝過去。
  • 玩電子遊戲的神經網絡,告訴我們大腦是如何決策的
    當你開車的時候,你的大腦會接收大量的視覺信息,並用它來做出駕駛的決定,比如什麼時候剎車或者換車道。大腦需要決定在你的視野中哪些信息是做出這些決定所必需的。例如,另一輛車的位置是非常重要的,但是天空中的雲彩或者那輛車的顏色並不會對你的駕駛方式產生影響。這是在複雜的自然環境中做決定的日常例子。在面臨大量感官數據和需要迅速做出決定的情況下,大腦會做什麼?