原創 老喻在加 孤獨大腦
一
讓我們來做一個好玩兒的遊戲:
研究人員把滿滿兩口袋球放在被試面前,每隻口袋裡都有紅黃兩種顏色的球。
一號口袋裡,75%的球是黃色,25%的球是紅色。
二號口袋裡正好相反,75%是紅色,25%是黃色。
你隨機挑選一隻口袋,然後把球一個接一個往外拿,其間不得向袋子裡面看。
每拿出一個球,你都需向研究人員匯報他的猜測:你手中的袋子究竟是黃色球居多,還是紅色球居多?
這是密西根大學沃德·愛德華茲做的研究,主題是:
人類在決策制定過程中,如何對新信息做出反應。
實驗的目的不是測試數學計算,而是測試人類對概率的直覺。
比方說,你摸出了一個紅球,讓你猜,這個球來自一號口袋還是二號口袋?可能性是多大?
聰明如你會說:這很簡單呀,二號口袋裡的紅色球數量比一號口袋裡的多,那這個球來自二號口袋裡的可能性當然更大。
然後你又從同一個口袋裡摸了一個球,還是紅色,你可以再根據這個信息來調整你的猜測。
你會想:嗯,這個口袋是二號口袋的可能性又大了一點兒。
接著,你又從該口袋裡摸了第三個球,還是紅色。
(以上實驗,應該是每次都把抽出的球放回原處。)
注意,實驗的關鍵問題來了:
你覺得摸了三次都是紅色球之後,該口袋是二號口袋的概率是之前估算的多少倍?
請你隨便估一下,記在心裡。
然後,我們再來看一下當年該研究的結果。
研究表明:
當被試從口袋中抽出的是紅色球時,他們更傾向於認為該口袋裡紅色球佔多數。
假如他們抽出的頭三個球都是紅色,那麼他們認為袋中球以紅色為主的概率就變成了之前的3倍。
嗯,你看,人是會根據新信息,對過去的判斷進行更新的。
可惜,這個估算差太遠了。
實際上應該是多少倍呢?
27倍。
(以上案例,來自《思維的發現》,對於倍數表述的含糊之處,我沒有調整。)
這個計算簡單有趣,而且有時候非常令人疑惑。
請允許我畫一下計算過程:
第一個球的計算不難,即使不用所謂貝葉斯也能夠理解,一號口袋裡有1/4的紅球,二號口袋裡有3/4的紅球。這不很簡單嘛,幹嘛還要列個公式?
因為有時候你非用公式不可,尤其是兩個口袋裡的球總數量不一樣的時候。所以,下圖我還是用貝葉斯公式算了一下。
計算結果,來自一號的概率是1/4,來自二號的概率是3/4。
第二個球還是紅球,這相當於連續發生,所以就是概率相乘,如下圖:
第三個球還是紅球,繼續概率相乘,如下圖:
這個實驗表明,人們的判斷方向,以及根據新信息更新判斷的感覺,都是正確的。
問題在於:人們低估了更新的幅度。
連續摸出三個紅球,令該口袋是二號口袋的可能性,是一號口袋的可能性的27倍,而不是我們直覺的3倍。
(請注意,這裡對倍數表述的依然有點兒含糊,但不影響計算和表達觀點。)
根據上面的計算,如果連續摸出三個紅球,來自二號口袋的概率是27/(1+27)=96.42%。
這裡面讓人迷惑的是概率疊加。
人們對一層概率的感覺還是可以的,但是多層概率相乘,就會有點兒繞不過來。
上面這道題,算了三層。
我感興趣的地方,不是計算本身,而是「根據更新的信息,逼近真相的速度」。
也就是貝葉斯計算的預測能力。
大腦在面對信息時,會有一個加工的過程。
這種加工能力,決定了大腦厲害與否,以及一個人能否在現實世界裡做出更聰明的決策。
如上計算,每摸到一個紅球,是二號口袋的概率就會乘上3倍。三次的話,就是3的三次方,也就是27倍。
沒錯,這是一個並不複雜的貝葉斯計算。
但是,你發現沒有,這當中,似乎有某種連續的「槓桿效應」,令隨便抽三個球出來,就達到了如此高的預測精度。
這,也是厲害的人的思維方式。
二
關於槓桿效應,阿基米德說:「給我一個支點,我就可以撬起整個地球。」
可是他不能,因為即使有一個支點,他也需要一個很長很長的槓桿。
大概有多長呢?
假設在與地心引力相同的均勻重力場做這表演,在一端為與地球質量相同的圓球,離支點距離1m,在另一端為70kg質量的實驗者,則實驗者與支點的距離約為900萬光年。這距離大約是仙女座星系與地球之間距離的3.6倍。
只有槓精才能抬得起這麼長的槓桿。
讓我們簡單溫習一下初中的物理:
在力學裡,典型的槓桿是置放連結在一個支撐點上的硬棒,這硬棒可以繞著支撐點旋轉。
當槓桿靜力平衡時,其動力乘以動力臂等於阻力乘以阻力臂,這就是槓桿原理:
根據上面這個簡單的公式,可以透過改變動力臂或阻力臂長度,使輸入力放大或縮小,人類雖然沒有撬動地球,但改變了地球。
原始人用槓桿原理來撬東西,埃及人用之建金字塔,我們用的小小的指甲剪,也是一個複式槓桿(一組耦合在一起的槓桿,你拿出來看看,一個指甲剪至少有兩組槓桿。)
齒輪傳動,則令「槓桿效應」變得具有連續性了。
最常見的如我們的自行車,整個傳動系統,幾乎都是利用了槓桿原理。變速車更是如此。
如上,兩個齒輪傳遞旋轉運動。請注意,小齒輪旋轉速度更快。雖然較大的齒輪轉動較慢,它的扭矩按比例更大。
帕斯卡則實現了用齒輪來計算。
17世紀40年代,法國數學家和哲學家布萊茲·帕斯卡為減輕父親在稅務計算上的工作負擔,在22歲發明了能做六位數加減法的機械計算器。
下面是1652年造的一臺帕斯卡計算器。
後來,萊布尼茲發明了一種甚至能夠進行開方運算的機器,
他構想了一種「分等級的圓柱體」。
直到1948年以前,IBM所製造的手搖計算器,還在採用該類分等級的圓柱體的原理
自然,人們也會在金融領域來使用資金槓桿。
例如你從事某個高利潤行業,年利潤高達20%,於是你到處借錢,願意付出高達15%的利息,實現了財富的槓桿效應。
然而,一旦你的利潤出現了波動,例如降到了12%,負的槓桿效應就出現了。
很多富豪們更是使用了「複式槓桿」--槓桿加槓桿。
然而,一切皆有價。
於是,我們在新聞上看到,一家百億資產的公司,因為還不起幾千萬欠款,導致了整個商業帝國的倒塌。
時間也能起到連續的「槓桿作用」。
例如高頻交易,從那些人們無法利用的、極為短暫的市場變化中尋求獲利,就像鯨魚張開大嘴從大海裡吞食,小魚小蝦肉不多,總量卻很驚人。
中國過去20年開發商為什麼那麼厲害?
因為同時使用了三種槓桿:
1、資金槓桿:銀行的錢,政府的地,地和項目再抵押錢......
2、時間槓桿:賣期房;
3、空間槓桿:一個樣板房,一小片樣板空間,能賣成千上萬套房子。
不消說,槓桿原理還是各種人生道理與成功學的必備良藥。
天下沒有免費的午餐,一切皆有價。
槓桿原理也是如此,由世界上最聰明的一群傢伙組成的長期資本,將資金槓桿和時間槓桿運用得淋漓盡致,又有諾獎理論護航,依然因為極小概率事件發生,被反向作用的槓桿原理砸死了。
那麼,貝葉斯思維的「大腦槓桿」,到底屬於哪一種槓桿呢?
三
讓我們說回貝葉斯的「槓桿效應」。
1968年6月,天蠍號核潛艇在大西洋亞速海海域失蹤了,潛艇上的99名海軍官兵全部杳無音信。
看起來是不是像大海撈針?
就搜尋的難度而言,的確如此。
海軍請來科學家克雷文組織搜尋。
首先,克雷文列出一系列能夠解釋天蠍號事故的場景。
接著,他組建了一個囊括各方面專家的團隊,讓每個成員提供自己對每個可能場景的發生概率的猜測。
在將整個海域被劃分成了很多個小格子,每個小格子有兩個概率值p和q,p是潛艇躺在這個格子裡的概率,q是如果潛艇在這個格子裡,它被搜索到的概率。
每次尋找時,先挑選整個區域內潛艇存在概率值最高的一個格子進行搜索。
如果沒有發現,概率分布圖則會被「洗牌」一次,搜尋船隻就會駛向新的「最可疑格子」進行搜索,這樣一直下去,直到找到天蠍號為止。
克雷文採用的正是貝葉斯法,能夠利用有限的信息進行預測,並且根據搜索「連續更新」。
也就是說,每一次「沒搜到」的遺憾都不會被浪費,也不是簡單被標註為「不在這裡」,而是用於更新調整整體的估算概率。
再回頭看我們開頭的例子:
當你從未知口袋裡摸球的時候,儘管你摸的球的數量非常有限,但是新信息的某種槓桿作用,在連續作用之下,能夠讓你以指數級增加的速度,逼近事物的真相。
當我們添加更多的證據,初始的信念會不斷地被「洗刷」。
有人把天蠍號潛艇案例視為「群體智慧」,也有人將其視為「試錯法」,其實並不精確確。
貝葉斯法,每一次都能利用新信息(哪怕是失敗的信息),對原有信念進行更新。
這就是槓桿作用。
更重要的是,這一過程可以不斷循環,連續作用,從而產生了指數效應。
所以,貝葉斯思維的槓桿,是一種關於「可能性」的槓桿。
四
《貝葉斯方法》一書,開篇就提及了「貝葉斯思維」的奇怪之處:
貝葉斯思維和更傳統的統計推斷不同,貝葉斯推斷會保留不確定性。
在貝葉斯派的世界觀中,概率是被解釋為我們對一件事情發生的相信程度。
換句話說,這表明了我們對此事件發生的信心。
為什麼在這裡會出現有點兒「唯心論」的主觀與信心呢?
對比於貝葉斯派,頻率派認為:
概率是事件在長時間內發生的賠率。
比如你一直扔一個標準的硬幣,你得到正面的概率是50%。
但是,對於天蠍號潛艇失事,歷史上沒有那麼多數據。
怎麼辦呢?
於是,貝葉斯派把概率解釋成是對事件發生的信心,也就是說:
概率是觀點的概述。
認為概率是主觀的,並不意味著貝葉斯派是一群主觀的傢伙。
相反,他們隨時打算更新自己的觀點。
哪怕新的信息(證據)和自己的信念相反,哪怕消息很讓人惱火,很羞辱自己的智商,貝葉斯派們也坦然接受。
如同傳說中凱恩斯說的:「當事實改變,我的觀念也跟著改變,你呢?」
但是他們又不是簡單的見風使舵,他們不會因為新信息徹底拋棄舊的信念,而是通過一個並不複雜的公式,將所有的信息整合在一起。
《貝葉斯方法》對此總結道:
即便獲得了新的證據,我們也並沒有完全地放棄初始的信念。
但我們重新調整了信念使之更符合目前的證據(也就是說,證據讓我們對某些結果更有信心)。
通過引入先驗的不確定性,我們事實上允許了我們的初始信念可能是錯誤的。
在觀察數據、證據或其他信息之後,我們不斷更新我們的信念使得它錯得不那麼離譜。
比起「簡單的」的貝葉斯計算,這些思想的價值才是寶貴的。
在我看來,貝葉斯法,就是一種「大腦槓桿」。
五
為了本文的票房,請允許我再次將計算和人生道理扯在一起,目的是為了反駁那些更糟糕的人生道理。
絕大多數成功學,都是基於「頻率派」的統計結果。
很不幸,由於樣本量過小,以及沒有「雙盲實驗」,絕大多數成功者的經驗和法則,都沒啥作用。
在現實中,那些極其有限的表面上的確定性,會被茫茫人海和時間長河的不確定性徹底淹沒。
「頻率派」成功學,其」榜樣「可能只是倖存者偏差。
那對於我們自己呢?
假如我們願意承認世界是隨機的,也願意不斷嘗試,用於探索,」頻率派「不是很好嗎?
可能還是不行。因為:
每個人作為樣本而言太複雜,而時光又太短暫。
人生的難處,或者說樂趣,都在於不可重複。
試驗次數有限,樣本量極少。
所以,一個人的成長,最好的方法是基於「貝葉斯思維」的試錯法。
高普尼克說,貝葉斯學派認為學習本身很像科學進步的狀況。
我們會考量一系列不同的假設對世界如何運作的不同描繪。
有些假設可能比其他假設更有可能是正確的,但沒有一個是絕對正確的。
當我們說相信一個假設是正確的,我們真正的意思是,到目前為止,這是我們最好的猜測。
高普尼克提及了計算機科學家霍德·利普森的發現:
有一種策略是讓機器人去發展自己身體的內部圖像,然後機器人就可以預測如果身體內部或外部發生變化會怎麼樣了。
她試圖將貝葉斯式的孩子的玩耍,與機器學習聯繫起來:
在試圖做出任何有用的事情之前,利普森的機器人會以一種傻傻的、隨機的方式開始跳舞,就像在婚禮上喝醉酒的表哥一樣。
但是之後,它可以利用在好玩的跳舞階段收集到的信息來決定當意外發生時該如何行動。即使工程師們拆除了其中一個機械臂,它仍然可以行走。那個一開始看起來明顯沒有用處的舞蹈將使機器人在以後更加強大。
從中,我們大概可以看到波普爾試錯法的身影:
1、提出問題;
2、大膽假設(試探性理論);
3、檢驗證偽(排除錯誤);
4、提出新的問題。
當我們使用貝葉斯那個簡單的公式,進而再利用計算機來構建算法,波普爾的「試錯法」就會顯得更加強大。
說回如何變成一個更厲害的人,就像阿爾法狗,後來最厲害的版本,已經不需要向人類的棋譜,完全靠自己學習。
這不是說不該向更厲害的人學習,只是對AI來說人類的棋譜不夠用了,也用不著了。
簡單而言,用窮盡法,把「天下所有厲害招數全部裝在一起隨時調用」的專家模式,對於AI來說,目前並不管用。
對於人類學習的效率而言,可能也是。
再厲害的大腦槓桿,也需要一個支點。
那個支點,就是你自己。
無人能夠替代。
六
人和人之間的差距到底有多大?
這些差距的本質到底是什麼?
我們大概可以總結為:
1、人們在最初的認知、判斷、信念上,不會有太大的差距;
2、厲害的人會不斷根據新的信息,更新自己的信念;
3、尤其是,當某個人建立了自己的「貝葉斯算法」,就擁有了「大腦槓桿」;
4、然後,他在某個領域持續使用這種「大腦槓桿」;
5、如此一來,他就有機會實現指數式的增長。
以我自己有限的社會閱歷看,那些特別牛的牛人,你與他們接觸,會發現很多時候並沒那麼厲害。
例如,對於某個新的問題,你可能會覺得,這傢伙的見識還不如我呢。
但是差別也許在於,那個牛人在不斷地更新,而你還在洋洋自得,或是在維護自己的英明正確。
比如說,我腦海中浮現出幾個牛人,你和他聊天,開始的時候,雙方唇槍舌劍。結果不一會兒,你發現他在引用你的話和觀點了,而且一點兒都不會不好意思。
這就是貝葉斯主義者的特點:信息是用於更新「自己的信念」的,不管這信息是自己的,還是「敵人」的。也不管這信息對自己當下的觀點有利,還是不利。
貝葉斯主義者敢於拋出自己的觀點,也不畏懼質疑和調整自己的觀點。
就像賈伯斯,到處罵別人的觀點是狗屎。
但是假如回過頭來,他發現那玩意兒很香,賈伯斯敢親口把那坨東西吃下去。
所以,人和人之間的差別,不是初始值的差別,而在於「大腦槓桿」的差別,以及是否幸運地在某個領域連續運用「大腦槓桿」。
最後
總結十條:
1、世界不是由「對錯」構成的,而是由可能性構成的。
2、哪裡有什麼「一眼看穿本質」的神人,只有厲害的貝葉斯主義者。
3、而貝葉斯主義者,善於在某個半徑內連續使用「大腦槓桿」,實現指數式進步。
4、好消息和壞消息是等價的,只要你能有效運用於更新信念。
5、「大腦槓桿」不是天生的,與智商無關,與哲學和計算有關。
6、我們需要用逐步消除不確定性來接近確定性,而不是用確定性來證明確定性。
7、作為計算「不確定性」的概率,會基於時間和空間進行疊加,從而產生複式的槓桿效應。
8、所謂「長期主義」,是一個不斷證偽的過程,而非不斷自我說服的過程。
9、槓桿原理需要遵守「力矩平衡」,你省了力就要多走路。一切皆有價。當然,類似於齒輪和滑輪,可以實現機械和計算上的自動化。
10、大腦和孩子也許天生就會貝葉斯。保護好自己孩子般的犯錯勇氣和探索精神。
總之,一個貝葉斯主義者既不會為自己的堅定信念而獻身,也不會因為對這個世界的懷疑而裹足不前。
原標題:《大腦槓桿》
閱讀原文