謎一樣的概率權_詳細解讀_最新資訊_熱點事件_36氪

2020-11-22 36kr

編者按:本文來自微信公眾號「孤獨大腦」(ID:lonelybrain),作者老喻在加,36氪經授權發布。

A部分

A1

故事源自一場豔遇。

《醉漢的腳步》在寫到「貝葉斯推理」時,提到了一部有趣的電影:

一名律師,有著很棒的工作,迷人的妻子,幸福的家庭。他愛妻子和女兒,卻仍然覺得生活中似乎缺少些什麼。

一天晚上,當他乘火車回家時,無意瞥見一個美麗的女人,帶著沉思的表情,從一個舞蹈班的窗口朝外凝望著。

第二天晚上,他的目光追尋著這個女人;

第三天晚上也是如此。

他的火車每多經過一次舞蹈班,他在愛情魔咒中就更陷進一步。

終於,在一個夜晚,他衝動地跳下車,報名參加了舞蹈班,希望能遇到這個女人。

到目前為止,這都像是一部美國片,但接下來,畫風一變,成法國片了。

但當遠處的凝視變成面對面的相對後,她那令人難忘的吸引力逐 漸消失了。

他確實戀愛了:不是和她,而是和舞蹈。

他將這不理智的情感當作秘密保守著,不讓家人和同事們知道,並為他那越來越多不在家中度過的夜晚尋找種種藉口。

終於,妻子發現他並不像所宣稱的那樣經常加班到很晚。妻子想,他有了外遇而用謊言來掩飾下班後的行蹤的可能性,要比他不是因為外遇而撒謊的可能性高得多,所以,她的結論是丈夫有了外遇。

作者寫到:這個結論當然是錯的,但她犯的錯誤卻不僅僅是這個結 論,而是整個推理過程本身:

她搞混了當她丈夫有外遇時表現得鬼鬼祟祟的概率,以及當她丈夫表現得鬼鬼祟祟時,他是在搞外遇的概率。

上面說的兩種概率的區別,本質上是什麼呢?

這個故事,和貝葉斯有什麼關係呢?

說一個貝葉斯定理的問題吧:

如果100%的X症患者都有某症狀,而某人有同樣的症狀,那麼他有多大概率得X症?

這其實是上面電影故事的一個變形。人類的直覺會告訴我們,他極有可能(80%-100%的概率)得X症。

事實並非如此,我們還需要考慮先驗概率。

假設X症的發病率是十萬分之一,而全球有同樣症狀的人有萬分之一,則此人得X症的概率只有十分之一,90%的可能是是假陽性。

讓我們繞開這道題,遠離概念,去找點兒有趣的東西。

A2

概率能救命?說一個真實的故事吧,很遺憾這次救的是一個壞蛋。

這就是著名的辛普森殺妻案。

辛普森是個美式橄欖球明星、演員,他被指控於1994年犯下兩宗謀殺罪,受害人為其前妻及她的好友。

該案被稱為美國歷史上最受公眾關注的刑事審判案件。

在經歷了創加州審判史紀錄的長達九個月的馬拉松式審判後,辛普森被判無罪。

儘管警方在案件現場收集到了很多證據,包括帶血的手套、血跡、現場DNA檢驗,看似辛普森難逃被定罪伏法的命運,可是辯護律師們通過各種方法一一化解。

這其中,就涉及到一個概率問題。

辛普森高價請來了頂級律師團,其中一位是哈佛大學法學院的教授Alan。

Alan在法庭上用概率來為辛普森辯解:

已知:美國400萬被虐待的妻子中只有1432名被其丈夫殺死。 

所以:辛普森殺死妻子的概率只有1432/400萬,即1/2500。

因此:辛普森殺死妻子的概率是非常低的事件,即辛普森幾乎不可能殺死他的妻子。

辯詞聽起來很有道理,檢察官一時無法反駁。

問題出在哪兒呢?

讓我用直觀的方式,來分析一下。

先看下面這個圖,藍色圓圈代表被虐待的美國400萬妻子,紅色代表1432名被丈夫殺死的妻子。

律師的邏輯看起來沒毛病,你看圖中,算下來虐待妻子的老公,只有一小部分(也就是1/2500)謀殺了妻子。

如上圖,1/2500是「紅色面積/藍色圓圈面積」的結果。

但是,律師偷換了概念。

再看下面這個圖,藍色圓圈代表被虐待的美國400萬妻子,紅色代表1432名被丈夫殺死的妻子。

這裡新加了一個綠色的圓圈。其信息如下:

你看看,即使不知道兇手是誰,辛普森的妻子應該在哪個圓圈裡?

是綠色圓圈。

所以,辛普森是兇手的概率,應該是用紅色面積除以綠色面積。

律師的鬼把戲是什麼?

他用藍色替換了綠色,用「紅色/藍色」的虛假概率1/2500,替換了「紅色/綠色」的真實概率。

那麼,這個真實概率應該是多少呢?

據統計,高達90%!

就是如此簡單的一個「小把戲」,居然騙過了法庭!

我們的大腦和直覺怎麼了?

A3

也許檢察官該了解一下貝葉斯公式。

貝葉斯定理是關於隨機事件A和B的條件概率的一則定理。

這個公式簡單得難以置信,簡單描述一下:

讓我們暫停一下,從頭去看看如下概念。

(以下部分內容來自維基百科。)

概率:是數學概率論的基本概念,是一個在0到1之間的實數,是對隨機事件發生之可能性的度量。

對大部分人而言,重要的是了解概率評估的方式以及概率和決策之間的關係。

先驗:在拉丁文中指「來自先前的東西」,或引申為「有經驗之前」。

近代西方傳統中,認為先驗指無需經驗或先於經驗獲得的知識。它通常與後驗知識相比較。

後驗:是「有經驗之後」,即"需要經驗"。

這一區分來自於中世紀邏輯所區分的兩種論證:

  • 從原因到結果的論證稱為「先驗的」;

  • 而從結果到原因的論證稱為「後驗的」。

先驗知識不依賴於經驗,比如:

  • 數學式子2+2=4;

  • 恆真命題「所有的單身漢一定沒有結婚」。

以上兩個都是先驗知識,因為它所表達的內容僅根據理性便可得出。

後驗不能僅根據理性得出,例如:

「喬治五世從1910年至1936年在位」。這就是一個後驗知識。

認識論的基本問題之一是:

究竟是否存在任何重要的先驗知識?

通常來說:

休謨在《人類理智研究》中多次提及:所有先驗知識不過是觀念之間的關係。

先驗概率。是指根據以往經驗和分析得到的概率,它往往作為"由因求果"問題中的"因"。

例如那位哈佛律師說的1/2500,就是一個(虛假的)先驗概率。

後驗概率。是指在得到「結果」的信息後重新修正的概率,是「執果尋因」問題中的"果"。

回到貝葉斯公式。

A和B是兩個隨機事件,二者有重合的地方,示意如下:

藍色圓圈代表A發生的概率,紅色圓圈代表B發生的概率,中間重疊的綠色部分代表A和B同時發生的概率。

我們標記如下:

我們來試著推演一下貝葉斯定理。

這個過程簡單得讓人懷疑,但我強烈建議你自己找張紙畫一遍。

是不是覺得簡直像個小學生的簡單把戲?

的確如此。

然而,正是這樣一個小把戲,令辛普森的律師在法庭上變了一場魔術,扭轉了局面。

我們用貝葉斯定理重新推理一下。

律師談論的條件概率,基於以下兩個事件:

  • 事件A1:妻子被虐待;

  • 事件B1:妻子被丈夫殺害。

所以妻子被丈夫虐待的情況下,被其殺害的條件概率是P(B1|A1)。

律師給出的數字是1/2500。

如上圖,P(B1|A1)=1/2500,也就是「紅色面積/藍色面積」。

但是,律師偷換了概念。

事實上,已知條件是:妻子已經被虐待+(未知原因的)致死。

我們真正該討論的條件概率應該是:

在「妻子被虐待並致死」的條件下,「兇手是丈夫」的概率是多大?

讓我繼續畫一下:

A2:妻子被虐待+(未知原因的)致死;(綠色圓圈的面積)

B2:兇手是丈夫。(紅色色塊裡的面積)

所以正確的計算應該是:

P(B2|A2)=紅色面積/綠色面積。

你發現那位哈佛律師的鬼把戲了嗎?

在分母部分,他用很大的藍色面積(美國有400萬被虐待的妻子),替換了很小的綠色面積(被殺的被虐待妻子),從而大幅拉低了辛普森的犯錯概率。

這等於是悄悄改變了前提條件,也就是製造了一個條件概率謊言。

事實上,根據統計資料,P(B2|A2)的數值約為90%。

這意味著,辛普森是兇手的概率高達90%,而不是1/2500。

律師調換了辛普森的概率權。

概率權是我創造的一個詞。

概率權=概率計算+選擇權。

例如,對於辛普森來說,在謀殺嫌疑犯這件事情上,他的概率權(作為負值)是90%,而非1/2500。

又例如,有些人寧可追求比被雷劈概率還小的中獎機會,也不願意去做有50%把握成功的事情。

在本文中,概率權又多了一重含義:無所不知者對概率的分配權。

例如,流量、IP等等,背後其實都是平臺的概率權分配遊戲。

在貧富差距的關鍵決策點上,「窮人」放棄了自己的概率權益。

A4

貝葉斯公式的確非常簡單,然而辛普森案就告訴我們,假如一個簡單的東西能夠把一大堆聰明人都搞暈,那就說明這個東西不簡單。

好玩兒的是,我寫辛普森案時搜索到了兩篇主要文章,儘管這個案例的源頭都是來自英文資料,但是其中一篇文章居然「編譯」錯了。

我們的大腦不是為概率設計的,尤其是有兩個以上不同的概率疊加在一起的時候。

你之所以對貝葉斯沒有一個直觀的概念,是因為一方面這個概念簡單卻不直觀,一方面人們在生活中很少有意識地去用到這個公式解決問題。

讓我們看一道好玩兒的題:

酒鬼去哪兒?

某酒鬼有90%的日子都會出去喝酒,喝酒只隨機(概率均等)去固定的三家酒吧,也就是說去每家酒吧的概率都是30%。

今天警察想去抓酒鬼,結果找了其中兩家酒吧,都沒有抓到。

請問:酒鬼在第三家酒吧的機率?

答案是:

酒鬼這道題,最讓人疑惑的地方是:

為什麼警察「真的抓」和「假裝抓」會影響酒鬼在第三家酒吧的概率?

也就是說,酒鬼在第三個酒吧是一個物理事件,而且在警察來抓之前就已經客觀存在了,為什麼會因為警察心底的主觀意識而發生改變呢?

難道有心靈感應這回事兒嗎?

請允許我用小白話來把題目分析一遍:

  • 酒鬼去每個酒吧的概率都是30%,這是一個統計結果,也就是說過去100天,酒鬼有30天去酒吧A,30天去酒吧B,30天去酒吧C,10天回家被老婆罵。

  • 那麼具體到今天,他要麼在三個酒吧中的某一個,要麼在家裡。不管他在哪兒,他都是百分之百在那裡的。

  • 既然如此,概率有什麼用呢?是拿來分析可能性的。例如知道概率的大小,警察就知道去任何一家酒吧抓住酒鬼的可能性,都是在家裡抓住他的可能性的3倍。一次未必準,但抓上很多次,就越來越接近這個比例。

但是,因為今天酒鬼到底在哪個酒吧,沒有任何線索,所以他在酒吧A的30%這個概率,是一個「先驗概率」。

我們再來看看「先驗概率」:

在貝葉斯統計中,某一不確定量p的先驗概率分布是在考慮"觀測數據"前,能表達p不確定性的概率分布。

它旨在描述這個不確定量的不確定程度,而不是這個不確定量的隨機性。

也就是說,在沒有「觀測數據」之前,我們對酒鬼的概率描述,只能算「先驗概率」。

既然有先驗概率,那麼當然就有後驗概率:

在貝葉斯統計中,一個隨機事件或者一個不確定事件的後驗概率是在考慮和給出相關證據或數據後所得到的條件概率。

同樣,後驗概率分布是一個未知量(視為隨機變量)基於試驗和調查後得到的概率分布。

「後驗」在這裡代表考慮了被測試事件的相關證據。

在酒鬼這個題目裡,請允許我用小白話翻譯一下先驗概率和後驗概率。

如前所述,酒鬼在任何一個酒吧的先驗概率是30%,酒鬼在三個酒吧的先驗概率是90%。

警察突擊酒吧A和酒吧B,是一個「觀測數據」的過程。但是,只有當警察真的想要抓小偷時,才算有效的「觀測數據」。

假如警察故意想放過酒鬼,那麼這個「觀測數據」的過程就作弊了,是無效的。

先看警察真的想抓酒鬼(且不知道酒鬼在哪兒):

因為連續在兩個酒吧裡都沒有抓到酒鬼,通過如此調查,我們其實是要更新酒鬼在酒吧的概率。

通過貝葉斯公式,計算如下:

這是一個簡化了的計算,目的是為了減少閱讀流失。

如前所述:後驗概率分布是一個未知量(視為隨機變量)基於試驗和調查後得到的概率分布。

警察調查了酒吧A和酒吧B之後,得到了一個後驗概率:75%。

再看警察並非想抓酒鬼(且知道酒鬼在哪兒):

假如酒鬼在酒吧C,警察就會選擇故意去酒吧A和酒吧B;

假如酒鬼在家被老婆罵,警察就隨便選兩個酒吧去查。

總之,因為沒有真正的「觀測數據」,所以酒鬼在酒吧的總體概率仍然是先驗概率的90%,只是被集中分配到酒吧C。

如果用一個不專業、但是更直觀的說法,就是:

抓酒鬼這個案例告訴我們:

「判斷是可以測度的,相關性的判斷就是概率。」

但是,問題往往出現在「相關性的判斷」上。

同樣,酒鬼被抓的可能性,似乎被知情且想包庇他的警察控制了。

這也是概率權。

A5

一位朋友說:要是你能結合一些與生活聯繫緊密的問題,對貝葉斯定理加以說明,再談一下如何應用,慢慢地我會很習慣地也用這種思維去解決問題。

其實,我們的大腦無時無刻不在使用貝葉斯定理。

《嫌疑犯X的獻身》是東野圭吾的長篇推理小說,講述了一個自暴自棄的數學天才「石神」幫助兩母女逃脫誤殺罪行的故事。

警察問三月十日「案發當晚」母女倆在哪兒,女主角答去看電影了,隨後去了KTV。

警察走後,準備為愛獻身的男主角教女主角如何應對調查,他和她對話:

熟悉小說和電影的你,應該知道,還有一個和數學天才演對手戲的物理天才「湯川學」,他最終破解了數學天才「石神」布下的重重迷局。

其中,在討論起犯罪嫌疑人的電影票時,湯川問警察存根的事情:

讓我們把場景簡化一下:

假如母女倆的確是在三月十日當晚誤殺了人,並且打算用找來的電影票存根來欺騙警察,那麼,為什麼石神要讓她們做如下動作?

1、沒有主動拿出電影票存根;

2、警察索要的時候,假裝不確定找得到;

3、把存根夾在電影簡介裡。

拋開演戲和放煙霧彈,這背後有什麼數學原理嗎?

A6

Matrix67在一篇博客裡,做過類似的分析。他的故事是:

室友昨晚可能去開房了,但辯解說自己其實是看電影了。

別人找他要電影票,他說沒有。翻了好一會兒,才找出來。

假如他真的是去開房了,那麼他真的是個用概率論撒謊的高手。

故事很相似。Matrix67用貝葉斯定理做了分析。

若令事件A等於「M同學去開房」,事件B等於「M同學有電影票」,讓我們來看看公式中的各個概率的意義:

P(A):M同學昨晚去開房了的概率

P(B):M同學手中有電影票的概率

P(A|B):M同學手中的電影票被發現後,他昨晚去開房了的概率

P(B|A):如果昨晚M同學真的去開房了,他手中會有電影票的概率

M同學想用電影票作偽證,也就是說要讓室友心目中P(A|B)的數值更小。

你還記得前面的貝葉斯定理吧,那就是:

P(A|B) = P(B|A)·P(A)/P(B)

因為M同學的目的是讓P(A|B)的數值更小,從上面的公式我們可以看到,可以通過減小等號右側的 P(B|A),也就是:

如果昨晚M同學真的去開房了(事件A),他手中會有電影票(事件B)的概率。

如何做到這一點呢?

不要輕易拿出證據(前文所說的策略)。

故意做出沒法給出證據的樣子,讓人越來越堅信在事件A發生後還能給出證據B的概率有多麼小。

我猜你未必對上面的解釋滿意,所以接下來我繼續祭出自己難看但直觀的圖解。

如上圖,小夥伴們其實就是對黃色區域(真開房假買票)表示懷疑,所以M同學要做的就是壓縮黃色區域的面積。

這裡其實暗含著小夥伴們內心底的一個懷疑(在貝葉斯定理裡叫「信念」):

你去開房也可以弄個假票,這不難呀。

請注意,這個假設其實暗含著小夥伴對「開房也能弄假票」的難度的概率期望值。

那麼,假裝沒有票根,隨後再不經意地拿出來,到底有什麼好處呢?

我們還是看圖說話,好處有兩個:

1、M通過示弱,讓小夥伴調整了信念——「你看,也不是那麼容易搞到假票根吧」,這樣一來,降低了小夥伴對「開房也能弄假票」的難度的概率期望值,也就是壓縮了上圖黃色區域的面積;

2、觀察到M開始的時候沒有找到票,強化小夥伴的假設——「你看,你一定是去開房了!」這個時候,小夥伴們被引入到上圖紅色圓圈左側的地方,也就是「真開房而且沒有票」。

接下來,突然不經意地找到了票,會讓小夥伴們一下子產生了較大的落差,覺得自己開始的猜測全是錯的。

舉個例子吧,如何讓你覺得一桶冷水是熱的?

那就是把你的手放進一桶更冷的水裡,再把手放回來,你就會覺得,這桶水變熱了。

這個比喻有點兒繞,但真的很精確。

我們現實中對「一個一直對自己不好的人」的好行為的感知,往往比對「一個一直對自己好的人」的好行為的感知要更強烈。

這就是魔術師的秘密:通過改變期望值,以及轉移視線,來改變基礎概率和條件概率。

你還會覺得貝葉斯定理沒用嗎?

撒謊可是人類社會最重要的底層能力之一了。

厲害的撒謊者,其實就是一個貝葉斯高手。

即使你不懂這個公式,但你早就用得爐火純青。

那些心理大師和情商高手,也是用概率來支配你我的。

A7

貝葉斯公式簡單得離譜,甚至看起來毫無用處。

然而,真正搞懂這個公式的人,1%都不到。

而這1%裡面,又可能只有10%的人能夠「感知」到公式背後的原理。

下面,我試著不用公式來拆解貝葉斯。

先來看一個影院中的貝葉斯推理。

(下面案例的英文出處:Brandon Rohrer)

你前往影院排隊觀影,前面有個小夥伴,長髮披肩,衣著中性,如上圖,請問Ta是女士的概率有多大?

情況A——

我在《生命、宇宙以及任何事情的終極答案》中介紹過類似的計算方法。

如上圖,是一種視覺化的貝葉斯計算法,在《統計學關我什麼事》一書中有詳細解釋。

請注意上面綠色和黃色兩個長方形:

1、「面積」的概念在貝葉斯概率的計算中,起著重要的作用。

2、事件的可能性,由綠色和黃色兩種構成。二者各自的概率,體現為長方形的寬度。例如上圖中,是假設男女比例是1:1。

3、長方形的高度,是指「可能世界」的可能構成。例如上圖,綠色長方形指女性的可能世界,進而該可能世界,是由「一半長發+一半短髮」的假設比例構成。

了解了面積法,開始計算,步驟如下:

第一步:首先假定影院中男女各佔一半,100個人中,50個男人,50個女人。貝葉斯計算的特點,就是可以主觀預測,毛估估一下。

第二步:假設女人中,一半為長發,餘下的25人為短髮。而男人中,48位為短髮,兩位為長發。這同樣是基於常識和主觀預測的毛估估。

第三步:由此可以計算,有25個長發女人和2位長發男人。

第四步:所以,Ta是女士的可能性為「25/(25+2)=92.6%」。

讓我用更加簡單、更加直觀的方法,來描述一下這個計算過程:

還記得我在《為什麼真正聰明的人都是概率高手?(零公式入門篇)》裡提及的平行宇宙法嗎?

這是一個打比方的方式嗎?不全是。後面我會再解釋,這裡我繼續冒著被聰明傢伙嘲諷的風險,用平行宇宙法來代替貝葉斯公式,重現一下上面的計算過程:

第一步:假設「不可知的未來」由100個平行宇宙構成。

假設電影院裡男女各一半(這是一個毛估估的先驗概率),所以,100個平行宇宙裡,有50個是男,50個是女。

第二步:進一步「分裂」50男和50女的平行宇宙。

繼續根據常識(又是一個毛估估的先驗概率),男性極少有人長發,而女性則各有一半。

第三步:根據觀測到的數據來關閉不合理的平行宇宙。

通過實際觀測,前面那位是長發,所以,不符合這個特徵的平行宇宙將被關閉。如下圖被黃線劃掉的部分。

第四步:重新計算現有的平行宇宙的分布概率。

如下圖,剩餘的平行宇宙分布如下:

這一下子變成了一個非常簡單的概率問題。

一共還剩27個平行宇宙,女性佔了25個,所以前面是女性的概率是25/27。

情況B——

現在讓我們增加一個新的信息,你現在排隊是在準備進入男士休息室。依靠這個額外的信息,僅採用常識和背景知識即可完成判斷Ta更可能是男性,無需思考。

但是,貝葉斯推理則能以數學實現形式,做出更加精確的預測。

其意義在於,在某些你無法見簡單靠常識和直覺來做出量化判斷的時候,你就需要精確的算法了。所以讓我們繼續用貝葉斯來計算如下:

如上圖,還是採用面積計算法我們開始推理:

第一步:100個人在男士休息室外排隊,我們主觀猜測毛估估一下,其中98名為男士,有2位陪同的女士。如上圖中的綠色長方形,因為女性極少,所以該長方形很「瘦」。

第二步:假設女人中,一半為長發,一半為短髮。而男人中每50人裡有兩位為長發。和上面的情形一樣,這也是基於常識和主觀預測的毛估估。我們注意到,儘管男性長發的比例很低,但是由於人群基數較大,所以下面計算男性長發人數的(深黃色那個)長方形很「胖」,有4個之多。

第三步:按照以上的假設,短髮男士有94人,長發為4人。而兩位女士則一個長發一個短髮。即,長發人士裡有4男1女。

第四步:Ta是女士的可能性為20%。

我們同樣可以用我所說的平行宇宙法,來計算這種狀況。

這裡再次出現了前面提及的兩個概念:

1、先驗概率。

例如上面長頭髮是男是女的案例裡,開始根據常識,假設人群整體性別比例為1:1。

2、後驗概率。

由於知道了是在男士休息室前的排隊,根據此信息,將人群男女比例調整為98:2。

又由於觀察到前面的那位是長發,所以關閉掉了短髮的平行宇宙,更新了概率分布。

該過程稱為「貝葉斯推理」。貝葉斯推理可以總結為:通過觀察行動(信息),將先驗概率通過貝葉斯更新,轉換為後驗概率。

而這個後驗概率,又可以變成下一次推理的先驗概率。

舉個例子:「地球是圓的」,這句話是先驗知識還是後驗知識?

有人說,「地球是圓的」這句話在所有人都認為地球是平的的時候是後驗知識,在現代的人來看大家都知道地球是圓的,是先驗知識。

貝葉斯推理,像是一個不斷進化的引擎。

貝葉斯算法之所以在人工智慧時代大放異彩,是因為其具有這種學習功能。貝葉斯推理中,修改過的「各個類別的後驗概率」,已經使用了所有的信息。也就是說我們可以將其看作「從信息中學習到的結果」。貝葉斯推理正是具備了「收集信息並自動變聰明」的功能。

A8

你還記得本文開頭那個電影嗎?

是時候說說:「她丈夫有外遇時表現得鬼鬼祟祟的概率」,與「當她丈夫表現得鬼鬼祟祟時他是在搞外遇的概率」,二者之間到底有什麼區別?

我們來溫習一下貝葉斯公式顯得很強大的一個現實場景:

(案例來自維基百科。)

假設一個常規的檢測結果的靈敏度和特異度均為99%,即吸毒者每次檢測呈陽性(+)的概率為99%。而不吸毒者每次檢測呈陰性(-)的概率為99%。

從檢測結果的概率來看,檢測結果是比較準確的,但是貝葉斯定理卻可以揭示一個潛在的問題,幾乎每個第一次看到這個問題的人都會有些意外。

假設某公司對全體僱員進行吸毒檢測,已知0.5%的僱員吸毒。請問每位檢測結果呈陽性的僱員吸毒的概率有多高?

令「D」為僱員吸毒事件,「N」為僱員不吸毒事件,「+」為檢測呈陽性事件。可得:

  • P(D)代表僱員吸毒的概率,不考慮其他情況,該值為0.005。因為公司的預先統計表明該公司的僱員中有0.5%的人吸食毒品,所以這個值就是D的先驗概率。

  • P(N)代表僱員不吸毒的概率,顯然,該值為0.995,也就是1-P(D)。

  • P(+|D)代表吸毒者被驗出為陽性的概率,這是一個條件概率,由於陽性檢測準確性是99%,因此該值為0.99。

  • P(+|N)代表不吸毒者被驗出為陽性的概率,也就是出錯檢測的概率,該值為0.01。因為對於不吸毒者,其檢測為陰性的概率為99%,因此,其被誤檢測成陽性的概率為1 - 0.99 = 0.01。

  • P(+)代表不考慮其他因素的影響的陽性檢出率,白話來說,即該公司有多少比例的檢測結果為陽性。該值為0.0149或者1.49%。我們可以通過全概率公式計算得到:此概率 = 身為吸毒者的概率 x 吸毒被驗出陽性的概率(0.5% x 99% = 0.495%) + 身為不吸毒者的概率 x 不吸毒卻被驗出陽性的概率(99.5% x 1% = 0.995%)。P(+)=0.0149是檢測呈陽性的先驗概率。用數學公式描述為:

根據上述描述,我們可以計算某人檢測呈陽性時確實吸毒的條件概率P(D|+):

儘管吸毒檢測的準確率高達99%,但貝葉斯定理告訴我們:

如果某人檢測呈陽性,其吸毒的概率只有大約33%,不吸毒的可能性比較大。

假陽性高,則檢測的結果不可靠。這是因為該公司不吸毒的人數遠遠大於吸毒人數,所以即使不吸毒者被誤檢為陽性的概率僅為1%,其實際被誤檢人數還是很龐大。

概括而言,某人吸毒而被檢測出呈陽性的概率,與他被檢測出呈陽性而吸毒的概率,是兩回事情。

回到開頭的故事,男主角因為有豔遇而鬼鬼祟祟的概率,與他鬼鬼祟祟而有豔遇的概率,也是兩回事情。

A9

貝葉斯定理有一種非常「奇怪」的態度:概率並非頻率,而是一種主觀程度的信任。

你賦予某個隨機事件一個「先驗概率」,然後通過新證據來修正,得到一個「後驗概率」。然後你把這個「後驗概率」變成新的「先驗概率」,再來一次修正......

比方說,你在街邊見到一個人擺攤兒,與路過的人玩兒扔硬幣遊戲。你很冷靜地在旁邊觀察了一陣子,發現他連續扔出了8次正面。

不懂概率的傻瓜會說:哇,正面的手氣好旺,我要押正面!

堅信「賭徒謬誤」的傢伙會說:下一次是反面的可能性越來越大啦!

懂概率的書呆子會說:蠢!根據大數定律,下一次是正面的概率還是50%!

然而,這三個人都錯了。

前兩個人的錯誤不值一提,我們重點看看懂概率的書呆子錯在哪兒。

在街邊這個「環境條件下」,我們有理由懷疑扔硬幣的莊家作弊了。假如我們持續觀察,並採用貝葉斯算法,可以算出作弊了的硬幣正面朝上的概率。

《統計學關我什麼事》對貝葉斯定理給出了以下描述:

主觀和客觀

通常所說的概率,是一個客觀的概念,答案是唯一的,例如扔一個標準的硬幣,正面朝上的概率是50%。

貝葉斯定理提及的「概率」,是一種「主觀概率」。其解釋為:

你內心描繪的類似「信念程度」這樣的概念。

也就是說,並非「概率是多少」的問題,而應該理解為「你認為概率是多少」。

總經理的概率

貝葉斯推理的強項是「無論在何種條件下,都能得出一個暫時的結果」。

但是,這個結果並不像內曼-皮爾遜統計學那樣,得出一個單方面的判斷(非 A即 B),而是認為兩種可能性都有,並賦予這兩種可能性相應的比例關係,僅此而已。

所以,貝葉斯推理其實需要一個「代理人」,這個代理人需要有個基於信念的初始判斷,通過觀察,然後更新判斷。

貝葉斯推理也常被稱為「總經理的概率」。

極大似然原理

世界上正在發生的事件,之所以發生,是因為它發生的概率大。

學習功能

貝葉斯推理中,修改過的「各個類別的後驗概率」,已經使用了所有的信息。

也就是說我們可以將其看作「從信息中學習到的結果」。

貝葉斯推理正是具備了「收集信息並自動變聰明」的功能。

擁有「人類特性」的功能

迄今為止,大腦如何工作,仍然是個謎。

例如,為什麼孩子的學習速度那麼快?

為什麼機器要學習幾千萬張圖片才能識別貓。而孩子認一次就會了,而且一輩子幾乎都不會忘,不會錯。

就像我們判斷一個人,是不斷地重複「信息」 →「修改印象」 →「遺忘信息」的過程,慢慢地就會形成了對這個人的固定評價。

像這樣通過逐步「修改印象」得出的結果,與「通過迄今為止的所有觀察,一次性形成的印象」之間,並沒有太大的偏差。

因此,我們沒有必要總是「從白紙開始思考」,這樣會耽誤大量的時間和精力。

貝葉斯推理,其實就像我們日常每天都在做的「印象的修改」和「學習」等一樣,只不過是運用了系統的數值來進行計算。

反之,貝葉斯推理也能夠讓我們在信息不足的不確定環境下去思考,去決策,去行動。

A10

貝葉斯公式這類計算,能夠讓我們對某些簡單的大道理有更深刻的理解。只有洞察了背後的原理,真理才能被稱為真理,否則與雞湯無異。

如此,我們便能理解為什麼達利歐說:捲入快速學習的反饋循環之中是件令人興奮的事情。

我們也才算明白了「復盤、飛輪、刷新、升級」的價值與意義。

假如我們僅從時間的某個切片,二維地看貝葉斯公式,其實只是一個簡單的四則運算罷了。

但是,在時間的這個維度加入以後,切片與切片之間建立起聯繫,魔法出現了。

這是一個持續循環的過程。

貝葉斯的神奇之處在於,你在主觀設置先驗概率時,並不需要那麼精確。

我與一些牛人接觸過程中發現,他們並不比別人更聰明,當他們接觸到新鮮事物時,經常因為天賦一般,而不能有領先一步的判斷,你甚至會懷疑這個傢伙如此普通,憑什麼擁有這麼多?

芒格曾在演講裡說:

不少人都能在晉級測試或快速計算中表現得極為機敏,但他們接二連三地犯愚蠢的錯誤,這僅僅因為腦海中層出不窮的瘋狂念頭。

尼採曾說過:「總會有人以自己擁有跛腳為榮。」如果你曾遭受失敗而不思悔改,將以自己的方式滑向淺薄。妒忌、太多的自我憐憫、偏激的思想、強烈的愚忠,所有這些作為一個明顯的標誌,表明你已經失去大腦並將被鐵錘所痛擊。

進而,芒格分析了巴菲特的曠世成功之謎:

具有決定性的因素是沃倫是這個世界上最佳的持續學習機器。

烏龜最終戰勝兔子是持續努力的結果,一旦你停止了學習,整個世界將從你身旁呼嘯而過。

巴菲特這類人,擁有一個強大的貝葉斯大腦。

具有嘲諷意味的是,小孩子天生擁有鮮活的貝葉斯大腦,我們卻用刷題將他們變成機器。

B部分

B1

你想容顏不老、青春永駐嗎?

這兩年,一種叫「二甲雙胍」的神藥悄悄流傳起來。

起初,它是世界上使用最廣泛的降糖藥之一,最重要的作用是治療糖尿病,是2型糖尿病的首選藥物,也是第一個被證明能預防糖尿病或延緩糖尿病發生的藥物。

後來,人們發現,這玩意兒還能減肥。

再後來,人們發現它還能抗癌。

人們還發現,二甲雙胍還能夠延緩衰老......

反正,我知道不少聰明又貪心的朋友,正在悄悄吃這玩意兒。

(聽醫生的,別亂吃藥。)

神藥為什麼這麼厲害?

有些機制我們知道了,有些還不知道。

其實,這類現象,在醫學領域很常見,很多藥物儘管獲得了監管部門的批准,並且被廣泛使用,但實際上也沒人知道它們到底是如何起作用的。

比如,1897年阿司匹林問世,但直到1995年才有人真正解釋了它是如何起作用的。

《紐約客》的一篇文章,把這種先找答案再解釋的方法,稱為:

「智力債務」。

作者認為,人工智慧新技術提高了我們的「智力債務」。

以前的智力債務主要局限於醫學等領域,隨著人工智慧新技術,特別是機器學習的出現,我們的「智力信用額度」被提高了。

機器學習系統越來越擅長解決一些不可思議的模糊開放的問題。它們在數據海洋中識別模式,但並沒有發現因果機制。

就像「貝葉斯網絡之父」朱迪亞·珀爾所擔心的:

機器學習系統只告訴人類結果,但不解釋為什麼。

在人肉智能和人工智慧之間,鴻溝越來越大。

B2

這筆智力債務,和貝葉斯定理有關。

故事要從第一次人工智慧浪潮的危機開始講起。

20世紀80年代,人工智慧領域的研究遇到了麻煩。

《為什麼》這樣介紹道:

「人工智慧的主導機制就一直是所謂的基於規則的系統或專家系統,它將人類知識組織為具體事實和一般事實的集合,並通過推理規則來連接兩者。

例如:蘇格拉底是一個人(具體事實)。所有人都會死(一般事實)。從這個知識庫中,我們(或一臺智能機器)可以使用普遍推理規則推斷出蘇格拉底會死的事實,也就是:如果所有A都是B,x是A,那麼x也是B。」

然而,面對複雜的現實世界,專家系統很難從不確定的知識中做出正確的推斷。

《為什麼》的作者朱迪亞·珀爾在20世紀80年代初開始研究人工智慧,他發現:

  • 不確定性正是人工智慧缺失的關鍵要素。

  • 不確定性應由概率來表示。

朱迪亞·珀爾在1982年提出了一個非常激進的建議:

將概率視作常識的「守護者」,聚焦於修復其在計算方面的缺陷,而不是從頭開始創造一個新的不確定性理論。

更具體地說,我們不能再像以前那樣用一張巨大的表格來表示概率,而是要用一個鬆散耦合的變量網絡來表示概率。

受到神經網絡的先驅大衛·魯梅哈特的啟發,朱迪亞·珀爾確信:

人工智慧必須建立在模擬我們所知道的人類神經信息處理過程的基礎上,並且不確定性下的機器推理必須藉助類似的信息傳遞的體系結構來構建。

隨後,他終於認識到,信息是一個方向上的條件概率和另一個方向上的似然比。

於是,朱迪亞·珀爾創建了一種關於不確定性的推理方法:「貝葉斯網絡」。

貝葉斯網絡用於模擬理想化的、去中心化的人類大腦將概率納入決策的方法,可以根據我們觀察到的某些事實迅速推算出某些其他事實為真或為假的概率。

就像我們前面看到的,這正是簡單的貝葉斯定理不可思議的強大之處。

朱迪亞·珀爾讓貝葉斯網絡成為機器學習的一個切實可行的解決方案。他因此被稱為貝葉斯網絡之父。

貝葉斯網絡,在資訊時代像個神話。

例如我們使用的4G手機,使用的糾錯算法是加拉格的類turbo碼。由於編碼和解碼是手機能耗最大的部分,使用了新代碼的手機能耗大幅降低了。

該靈感來自一位叫貝魯的法國工程師,起初他沒意識到自己使用的是和貝葉斯網絡同樣的算法。

貝葉斯網絡在人工智慧領域流行開來,被視為人工智慧在包含不確定性因素的情況下進行推理的主導範式。

從最早的計算機器開始,計算機都是用來解決精確的計算問題的。我還記得80年代末初學圍棋時,日本超一流棋手石田芳夫的綽號叫「電子計算機」,意思就是說他計算非常精準。

而貝葉斯網絡,則讓計算機能夠在「灰色地帶」進行思考。

是不是有點兒像當年物理學走投無路時向量子力學的驚險一躍?

概率,這個鬼魅的身影,在20世紀的一頭和一尾,幫助人類打開了一個奇異的天空,也把人類帶入了愈發未知的世界。

B3

貝葉斯定理看起來不過是一個簡單的規則:

當你收到新的論據時,它用來改變你對某個假設的信任度。

  • 如果論據和假設一致,假設成立的概率上升;

  • 反之則下降。

通常我們思考一個問題,是先給定原因,然後去找結果。

而貝葉斯定理的價值,在於可以幫助我們「從結果找原因」。

18世紀的神秘牧師託馬斯·貝葉斯這樣表述他簡單卻偉大的思想:

「已知某個未知事件的發生次數和失敗次數,求某一次實驗中該事件的發生概率處於兩個已知概率之間的概率。」

誰能想到,這麼簡單的公式,可以成為統計學和機器學習的基礎?

《終極算法》一書介紹道:

樸素貝葉斯算法就是一個可以用短方程來表達的學習算法。只要提供患者病歷的資料庫,包括病人的症狀、檢查結果,或者他們是否有什麼特殊情況,樸素貝葉斯算法就可在一秒之內做出診斷,而且往往比那些花幾年在醫學院學習的醫生還要強,甚至它還可打敗花費數千小時構建的醫學專家系統。

該書作者佩德羅·多明戈斯做了一個假設:

所有知識,無論是過去的、現在的還是未來的,都有可能通過單個通用學習算法來從數據中獲得。

這就是所謂的「終極算法」。

為了論證這個觀點的可能性,作者提及了一個統計學流派的觀點:

所有形式的學習都是基於一個簡單的公式——貝葉斯定理。

我們在前面幾個簡單卻又讓人疑惑的計算中,了解到貝葉斯定理的小把戲:

每當你看到新的證據後,更新你的想法。

在此基礎上,貝葉斯學習算法對世界進行一系列假設,由此開始進行學習。

當它看到新的數據時,與該數據匹配的假設更有可能會成立(或者不可能成立)。在觀察足夠的數據後,某個假設會成立,或者幾個假設同時成立。

如此一來,貝葉斯定理就是將數據變成知識的機器。

B4

貝葉斯學習算法的優勢在於:

研究者發現:人們學習新的概念,往往能從單一的案例中學習,尤其是孩子。而機器學習則需要成千上萬的數據才能達到類似的精度。人們也可以用更豐富的方式學習概念,例如在行動、想像和解釋層面。

於是科學家們提出了一個計算模型,捕捉到人類的學習能力,為基於字母的手寫體創造出直觀的概念。在這模型背後,研究者使用了簡單的貝葉斯程序完成。在這個具有挑戰性的分類任務中,貝葉斯程序戰勝了深度學習方法,達到了人類的水平。這個模型也通過了圖靈測試。

例如用來識別垃圾郵件:

一個簡單的數學概念為何會產生如此魔力?

研究人員提出以下討論:

B5

然而,沒有多久,貝葉斯網絡之父就「叛變」了。

朱迪亞·珀爾從貝葉斯倡導者變身為「叛教者」。

就像作為量子力學奠基人之一的愛因斯坦,畢生無法接受量子力學的「不確定性」。

一個當年曾經折磨過愛因斯坦的「幽靈」,又漂浮了出來,那就是:

因果論。

這正是「人工智慧」和「人肉智能」之間無法迴避的缺失要素。

30年過去了,人工智慧越來越強大,朱迪亞·珀爾所擔心的「因果」缺失,似乎沒能阻擋什麼。

但朱迪亞·珀爾對人工智慧的「黑盒子」的批評越發強烈,他認為,即使是成果斐然的深度學習,只是讓機器具備了高超能力,但絕非智能,因為其缺少現實模型。

一切都是統計學的擬合把戲。

朱迪亞·珀爾舉例說,機器是不會自己弄明白手裡拿著一瓶威士忌的行人可能對鳴笛做出的不同反應的。

這種靈活性和適應性,對人肉智能來說很容易,對人工智慧來說很難。

當人們用貝葉斯學習算法,解決了一個個不可思議的難題,也會產生一個疑惑:除了概率的計算,那些我們能夠感知到的邏輯在哪兒?

同時,人們也開始反思對人工智慧的過度狂熱,並且質疑通用人工智慧的可能性。

Facebook人工智慧副總裁erome Pesenti認為,AI 這一領域很快就會「碰壁」。

他的觀點是:

  • 有人認為 AGI(人工通用智能)是人類智能。但人類的智力本身就不是一個統一的問題。

  • 有人認為AGI 是一種可以靠自己不斷進化的智力,但是這並沒有真正的模型,即便是人類都不能讓自己變得更聰明。

  • 深度學習和當前的人工智慧有很多局限性。我們離人類智力非常遙遠。

  • 它可以傳播人類的偏見,不容易解釋,它沒有常識,更多的是在模式匹配而不是強大的語義理解的層面上。

  • 但我們在解決其中一些問題上取得了進展,而且這一領域的進展仍然相當快。你可以把深度學習應用到數學上,也可以用它來理解蛋白質,你可以用它做很多事情。

樂觀的科學家則試圖突破這種局限性,對 AGI為人類帶來指數級的幸福提升充滿信心(又或是信仰)。

人工智慧的研究歷史有著一條從以「推理」為重點,到以「知識」為重點,再到以「學習」為重點的自然、清晰的脈絡。

現在,科學家們又試圖找回「人肉推理」。

B6

參與製造了「智力債務」的朱迪亞·珀爾,打算開始清算這筆債務。

作為人工智慧「黑箱」的奠基人之一,他試圖掀起一場因果革命。

朱迪亞·珀爾認為數據不了解因果,而人類了解。

用一句話來概括他在《為什麼》一書中的內容,那就是:

「你比你的數據更聰明」。

因為除了自我模擬,我們沒有更好的方法來了解人類自身了。

創造了AlphaGo的哈薩比斯,曾經說圍棋AI戰勝人類的秘密其實就是「模仿」了人類的直覺。

但在朱迪亞·珀爾看來,AlphaGo缺乏可解釋性是它的硬傷。

他說:

因果關係不能被簡化為概率。

人們經常使用「概率提高」的概念來定義因果關係:如果X提高了Y的概率,那麼我們就說X導致了Y。」

這看起來似乎沒什麼錯,但卻會得出類似於「冰淇淋銷量上升導致淹死的人數增加」這樣奇怪的結論。

問題出在哪兒?

X和Y共同的因,或稱混雜因子。

冰淇淋不是淹死人的兇手,而是因為:夏天天氣炎熱,所以冰淇淋的銷量和遊泳的人數同時提高了。

這看起來很簡單,但無時不刻不在搞暈我們。

朱迪亞·珀爾給出了一個看起來極其簡單的工具:

因果圖。

老鷹在漫長的進化中,發展出了非凡的視力,但為什麼只有人類能夠發明望遠鏡?

朱迪亞·珀爾稱之為「超進化加速」。

那麼人類是如何獲得動物所不具備的計算能力的?答案是:

因果想像力。

對於《人類簡史》所說的人類祖先想像不存在之物的能力,朱迪亞·珀爾在前面加了一個「因果」。

因果想像力幫助智人祖先通過規劃複雜的過程來完成許多事情,例如集體狩獵長毛象。

為了完成這個任務,思維主體需要構建一個模擬現實的心理模型。

有了心理模型,獵人們就可以通過對模塊的修改,來提高成功的概率。

基於這一點,朱迪亞·珀爾搭出了一個因果關係之梯。

B7

假如你跋山涉水看到了這裡,會還記得「抓酒鬼」那道題嗎?

聰明如你一定發現了,這兩道題,是「三門問題」的變形。

概率與因果的關係是怎樣的?

朱迪亞·珀爾在《為什麼》一書中討論了三門問題。

作為一位解題愛好者,我很早就接觸過這道題。有趣的是,我所「糾結」的「為什麼」,和《為什麼》這本書裡所糾結的,非常類似。

已知:在下面三道門中,你選擇了A。

具體規則和過程請看下面。

說這道題太簡單的人都是不誠懇的。當年在美國,這道題搞暈了一大堆大學教授、數學家、博士在內的專業人士和聰明人。

疑惑在於:

1)打開一扇門之後,剩下兩扇門,難道每扇門之後有汽車的概率不是一樣的50%嗎?

2)如果主持人打開一扇門,那扇門原有的1/3可能性,為什麼全部分配到C門了?A和C有什麼區別呢?

3)到底是什麼神秘的力量,導致了概率的重新分配?

即使你知道並理解了這個問題的答案,還是可能忽略了本題的一個關鍵點:

主持人到底是否知道B門的後面沒有汽車。

《不確定世界的理性選擇》對此有精確描述:

主持人的規則至少有三種可能的解釋。

第一種規則:主持人總是隨機打開沒有被參與者選擇的門(例如,在上面的情境中,主持人擲一枚硬幣來決定打開 2號或 3號門)。這表示主持人可能打開一扇門並展示出門後的轎車,然後(和觀眾一起)笑話你選錯了門,遊戲結束。

第二種規則:假設主持人總是挑選後面藏著山羊的門打開,決不打開參與者挑選的門;當參與者已然選中了藏有轎車的門,主持人就隨機打開一扇門。這樣,參與者的選擇和主持人開門之間的關係就更複雜了。

第三種規則:假設主持人總是挑選藏有山羊的門打開,決不打開參與者挑選的門;在參與者已然選中了藏有轎車的門之後,主持人有偏向地挑選剩下兩扇門中序號較小的一扇打開(針對這種規則可能存在其他偏差)。

儘管這三種規則均符合上述問題的表述,但其潛在概率卻各不相同。

在上面的題目裡,我們留意到,主持人前面有個定語:

假如他知曉汽車的下落。

那麼問題來了,假如主持人不知道汽車在哪個門的後面,這時他打開B門,發現後面沒有汽車,那你換不換?

答案是:不換。因為這時A和C後面有汽車的概率,都是1/2。

用貝葉斯定律可以非常簡明地解答三門難題,證明:主持人是否知道實情,會令結果不一樣。

有興趣的同學可以研究下圖(請將盒子換做門,原圖中有些表述也不太精確,但公式和結果都是對的):

(以下是截圖,略有錯字。)

貝葉斯公式可以幫助我們正確地解答出這道題目,但是,能幫助我們真的理解這個問題嗎?

並不能。

即使貝葉斯定理幫助我們正確地計算出了結果,但卻與人的大腦直覺相違背。

否則,當年就不會有那麼多教授和博士被「三門問題」羞辱。

朱迪亞·珀爾想用「因果圖」來找到「三門問題」的可解釋性。

B8

讓我們看看因果圖如何工作。

前面我說過,「三門問題」分作兩種狀況:

A:主持人知道車在哪個門後面,並且刻意選擇了沒有車的門;

B:主持人不知道車在哪個門後面。

先說情況A。繪製因果圖如下:

主持人打開哪個門,這件事情受「你選的門」和「車的位置」這兩個「因」的影響。

順著因果圖,你很容易發現,根據主持人打開的門,你可以順著右側的箭頭,去發現不經意透露給你的「車的位置」這個信息。

所以,你選擇換一個門,概率會提高;

再說情況B。繪製因果圖如下:

因為這種情況下,主持人也不知道車在哪兒,所以右側的因果箭頭消失了。

所以,你最初選的門和另外一扇關著的門的中獎概率事件是一樣的,你沒必要換。

因果圖看起來似乎只是畫箭頭,其實,箭頭背後還隱藏著概率。

為什麼如此簡單的結構,會這麼好用?

因為它承載了因果信息。

這麼「簡單」的一個問題,為什麼會迷惑那麼多聰明人呢?

原因如下:

1、我們的大腦(和直覺)不擅長處理概率,而是擅長處理因果;

2、就像我們的大腦會被「冰淇淋銷量導致淹死的人增加」這類偽因果所迷惑,我們對隱藏的概率關聯也會產生疑惑。

有兩個聰明的傢伙,阿莫斯·特沃斯基和丹尼爾·卡尼曼,發現了概率與心理學的交叉點,開啟了行為科學和行為經濟學。

我喜歡這兩個人,還有塞勒。在他們的研究裡,你能看到各種有趣的基於概率的實驗,人類的認知偏差不僅可笑,而且高度一致。

我們的大腦不是為概率設計的,但概率卻是這個世界運轉的秘密。

當我們依賴祖傳的直覺而非概率來做決策,非常容易幹蠢事。

即使我們懂得概率,也儘量按照概率的程序來思考和決策,仍然會受到「框架效應」的限制。

我的分析是:

這就是為什麼類似於「三門問題」這類極其簡單的問題,會搞暈那麼多聰明人。

聰明決策,處理風險,很多時候需要「反人性」的知識與情緒。

對於這個偉大的研究方向,從結構的完整性來說,我必須提一下。但也要儘快結束掉。且用《波爾–羅亞爾邏輯》第16章「關於未來事件我們應該做出的判斷」的一段文字:

為了避惡趨善,我們必須對自己應該做什麼加以判斷。我們不僅需要考慮善與惡本身,也要考慮它們發生或不發生的概率,還要直觀地考慮它們在整體中所佔的比例。

這些考慮可能看似微不足道,如果僅此而已,那麼確實如此。但是,我們可以讓它們發揮重要作用,其中最主要的作用就是讓我們更合理地面對希望與恐懼。

(摘錄來自: 佩爾西·戴康尼斯. 「10堂極簡概率課)

B9

相關性對因果性的幹擾,僅僅通過觀察,還遠遠不能解決。

所以,《為什麼》這本書提出:

「觀察、幹預和反事實這三個臺階組合成因果關係之梯」。

因果關係之梯的每一層級都有一種代表性生物。大多數動物和當前的學習機器都處於第一層級,它們通過關聯進行學習。像早期人類這樣的工具使用者則處於第二層級,前提是他們是有計劃地採取行動而非僅靠模仿行事。我們也可以通過實驗來習得幹預的效果,這大概也是嬰兒獲取大多數因果知識的方式。反事實的學習者處於階梯的頂級,他們可以想像並不存在的世界,並推測觀察到的現象的原因為何。

(資料來源:馬雅·哈雷爾繪圖)

朱迪亞·珀爾解釋道:

貝葉斯網絡適用於一個所有問題都被簡化為概率或者(用本章的術語來說就是)變量間的關聯程度的世界,它無法自動升級到因果關係之梯的第二層級或第三層級。

幸運的是,我們只需要對其進行兩次修正就可以實現它的升級。

朱迪亞·珀爾不甘心陷入因果蒙昧,而是試圖跳出統計學的黑箱,藉助因果關係之梯,闡明事物的本質。

他試圖表達:

概率能將我們對靜態世界的信念進行編碼,而因果論則告訴我們,當世界被改變時,無論改變是通過幹預還是通過想像實現的,概率是否會發生改變以及如何改變。

當然,貝葉斯網絡仍然是人工智慧領域的一個非常重要的工具,因為其涵蓋了因果圖的大部分數學基礎。

B10

人們再一次站在了「因果論」的十字路口。

往回追溯,因果論和黑盒子經過4次值得一提的交鋒。

第一次是巴比倫和古希臘之間的科學競爭。

哲學家Stephen Toulmin認為:

基於模型與盲模型的二分法,是理解巴比倫與古希臘科學之間競爭的關鍵。

他的解釋非常有趣:

巴比倫天文學家是黑箱預測的高手,在準確性和一致性方面遠遠超過了古希臘人。

然而科學卻青睞希臘天文學家的創造性思辨戰略。

古希臘的埃拉託斯特尼測量出了地球的半徑。這絕對不會發生在巴比倫。

第二次是牛頓為人類帶來光明。

凱恩斯通過研究牛頓的手稿,發現牛頓並非理性時代的第一人,而是最後的魔法師。

牛頓對玫瑰十字會、佔星術和命理學著迷。他相信摩西早就認識到哥白尼的日心說和自己的重力理論。

  • 一方面,牛頓視上 帝為造物主;

  • 另一方面,牛頓認為無需幹涉人間的雜事兒。

於是,牛頓「發現」了上 帝創造這個世界所「使用」的理性和普遍原理。

《思想史》一書寫到:令人驚奇的是,最近的學術界發現指出,如果牛頓沒有在鍊金術方面做研究,「就可能不會取得那些改變世界的發現」。

他的基於自然和可理性認知法則的宇宙觀,為人類提供了一個基於因果的解釋框架,改變了整個世界。

牛頓的世界裡沒有概率。當一個骰子被扔出去的時候,理論上我們只要知道初始數值,一切皆可計算。

「法國牛頓」拉普拉斯更是將這種決定論延展至整個宇宙,「我們可以把宇宙現在的狀態視為其過去的果以及未來的因」,某個超級智者,也就是拉普拉斯妖,他如果知道所有的因,就能預測任何事物。

在牛頓追隨者的眼中,概率是人類無知的產物。

我們這個時代,絕大多數人的思維仍然停留在牛頓時代,但又不具備牛頓在物理和數學方面的理性,然後口頭上又在談量子力學。

不管他們對量子力學如何葉公好龍,他們的骨子裡相信「決定論」。但又是虛無主義的那種決定論。

第三次是愛因斯坦與玻爾的爭論。

儘管量子理論是基於自己的理論發展而來,愛因斯坦卻拒絕接受一個過於隨機的解釋:

用概率去解釋電子的位置。

愛因斯坦不贊同量子力學的統計性質,他表示:

「我仍舊相信我們能夠給出一個實在模型來直接描述事件本身,而不是它們發生的概率。」

他討厭「量子糾纏」這類超距的、沒有因果的鬼魅之力。

玻爾則反擊:「沒有量子世界,只有抽象量子力學描述。我們不應該以為物理學的工作是發現大自然的本質。物理只涉及我們怎樣描述大自然。」

就哲學層面而言,我偏向於玻爾。物理科學在描述自然秩序方面的地位,必然是有限度的。

第四次則是當下人工智慧的「黑箱之爭」。

以前,AI的大部分從業者仍是通過邏輯來處理AI技術。例如深藍的團隊裡,還是需要職業棋手的介入。

現在呢?受益於計算力的大幅提升,通過龐大的神經網絡,用巨大的矢量來表示內部含義,不再採用邏輯推理的方法,人們讓神經網絡自己學習。

一切都變了。

與傳統機器學習不同,深度學習是由AI直接從事物原始特徵出發,自動學習,生成高級的認知結果。

在輸入的數據和其輸出的答案之間,存在著「隱層」,即所謂「黑箱」。

這個黑箱既無法觀察,亦無法理解。

即使AI能夠解釋,我們也不懂。哥倫比亞大學的機器人學家 Hod Lipson稱之為:

「這就像是向一條狗解釋莎士比亞是誰。」

中國科學院院士、智源研究院學術委員會主席張鈸將人工智慧劃分為如下三個時代:

  • 第一代人工智慧,以知識和經驗為基礎的推理模型,以失敗告終;

  • 第二代人工智慧,是利用基於大數據的深度學習,獲得了意想不到的成就,但算法不可解釋(因果缺失);

  • 第三代人工智慧,是在目前第二代人工智慧的基礎上,加進人類的常識、知識,建立一個可解釋的、魯棒的人工智慧理論,發展可信、安全和可靠的人工智慧技術。

到目前為止,第三代還是一個設想。

科學家們正在為之努力。

哈薩比斯的野心是發明通用人工智慧,假如實現了,因果與黑箱之爭會不會就煙消雲散了?

他認為深度學習是解決通用AI的一個組成部分,也許還需要更多類似深度學習的突破。需要更多的創新。

哈薩比斯對人工智慧有著超人的洞察和極其樂觀的態度。他有一個計算機學士學位,和一個認知神經科學的博士學位。

他用人類的大腦來做比喻:

大腦是一個綜合系統,但大腦的不同部分負責不同的任務。

哈薩比斯率領的團隊,正在研究的項目是:

人工智慧對人肉智能的模仿,還有很長的路要走。

C部分

本文的A部分,關於錯覺和概率計算;

本文的B部分,關於因果論和人工智慧;

本文的C部分,是概率權和物理世界的關聯。

C1

我們再來看本文最後一道題目:

誰是幸運的罪犯?

三個死刑犯被關押在監獄的單人間裡。法官赦免了其中一個,看守知道是誰,但不能說。

犯人A對看守說:我知道你盡忠職守,所以我也不為難你問你被赦免的人到底是誰,但請你告訴我,B和C誰會被執行死刑?

看守想了一下,覺得有道理,因為B和C裡面至少有一個人仍會被執行死刑,所以告訴A有啥關係呢?

於是看守說:B會被處死。

犯人A很開心,因為:

此前被赦免的一個名額(可能性),是被三個人分享的,自己分到的概率是1/3。

現在呢?因為確認B肯定被處死,所以自己活下來的可能性從1/3提升到了1/2。

A將這件事情告訴了犯人C。

C更高興了,他認為:

自己被赦免的概率從1/3變成了2/3,而A活下來的概率並非1/2,而是1/3。

請問A和C到底誰對?

答案是:C對。

那麼,A的邏輯到底錯在哪兒呢?

C2

你一定會發現,這還是一個「三門問題」。

原理一樣。

但我不打算再令人生厭地再做一遍題目。

有沒有覺得,即使在本文中我不厭其煩地拿出了三個幾乎一樣的問題:三門,酒鬼,罪犯,即使你知道每一道題的解法,你必須承認:

總覺得哪裡怪怪的。

還是說回三門問題吧,儘管我介紹了平行宇宙法,貝葉斯定理法,因果圖法,我們大腦的直覺對此還是深表疑惑:

不管主持人是否知道B門後面沒有汽車,他都是做的相同的動作(打開B門),並且得到了相同的結果(B門後面沒有汽車),為什麼會有截然不同的答案?

又比如說:假如主持人知道哪個門後面有汽車,但是開門的時候如果他假裝自己真的不知道,只是隨機地開門,會怎麼樣?

難道僅用意識,就能驅動這個世界?

這不是反科學嗎?

我是一個物理愛好者,我必須從「力」的角度,找到某個「實在」的因,才能接受那個果。

我的思考是:假如主持人知道車在哪裡,對比不知道,即使做了相同的動作,他引入了額外的信息。

這是一個在大腦中做功的過程。

做功是能量由一種形式轉化為另一種的形式的過程。做功的兩個必要因素:作用在物體上的力和物體在力的方向上通過的距離。

經典力學的定義是:當一個力作用在物體上,並使物體在力的方向上通過了一段距離,力學中就說這個力對物體做了功。

那麼,在大腦中如何做功呢?

重新分配概率。

主持人假如知道門後面是否有車,以及主動選擇了沒有車的門,那麼,他就在做功了。

C3

我不相信任何鬼魅之力。

儘管我喜歡神秘的體驗,但我不喜歡神秘主義的解釋。

即使我們在現實或者假想中,總是會遇到各種妖魔鬼怪。

例如麥克斯韋妖。

(以下來自維基百科。)

麥克斯韋妖,是在物理學中假想的妖,能探測並控制單個分子的運動,於1871年由英國物理學家詹姆斯·麥克斯韋為了說明違反熱力學第二定律的可能性而設想的。

如圖,一個絕熱容器被分成相等的兩格,中間是由綠色的「妖」控制的一扇小「門」,容器中的空氣分子作無規則熱運動時會向門上撞擊,「門」可以選擇性地將速度較快的分子放入一格,而較慢的分子放入另一格,這樣,其中的一格就會比另外一格溫度高,可以利用此溫差,驅動熱機做功。

這是第二類永動機的一個範例。

也就是說,假如我們忽略開門關門的做功,這個綠色的小妖怪,「成功」地造出了一臺永動機。

我們知道,這是不可能的。問題出在哪兒呢?

張天蓉在博客中描寫了人類揭開「麥克斯韋妖」的面紗的過程。

這隻妖怪是神人麥克斯韋的一個思想實驗。

另外一個叫希拉德的神人,於1929年也做了一個聰明絕頂的思想實驗。

希拉德的單分子引擎

如上圖,希拉德根據麥克斯韋的模型,構造了一個只管理「一個」分子的簡化妖精系統。

麥克斯韋妖操控一個單分子熱機。小妖精通過測量,了解分子所處的位置是在左側還是右側:

希拉德更加生動地製造出了一個違背第二定律的永動機,這可能嗎?

說到這裡,你也許會理解,我為什麼要在一篇關於概率的文章裡,說到一個關於熱力學的思想實驗。

希拉德想要思考的是:

如果我們允許一個智慧生物對熱力學系統進行幹預的話,在何種情況下能夠成立一種第二類永動機?

回想一下「三門問題」,主持人在打開第二扇門時,如果他知情並且刻意避開有車的那個門,他其實就是那個「幹預」的智慧生物。

回到希拉德的思想實驗。他的解釋是:

問題出在「測量」上。

小妖精進行測量的目的是為了獲得信息,即在每次完成循環回復系統原狀的過程中至少需要獲得二進位中一個比特的信息。信息的獲取需要付出代價,就是使得周邊環境的熵增加。

因此,系統「熱熵」的減少是來自於小妖精測量過程中「信息熵」的增加。

系統總熵值因而也增加,熱力學第二定律仍然成立。

儘管要在近20年之後,才由怪人香農提出資訊理論,但是希拉德第一次認識到信息的物理本質,將信息與能量消耗聯繫起來:

信息就是熵。

1961年,物理學家羅夫·蘭道爾提出並證明了蘭道爾原理:

計算機在刪除信息的過程中會對環境釋放出極少的熱量。

1981年,貝內特的一篇論文表明,麥克斯韋妖控制「門」使分子從一格進入另一格中的耗散過程,並不是發生在衡量過程中,而是發生在妖的對上個分子判斷「記憶」的去除過程,且這個過程是邏輯不可逆的。

2012年,德國奧格斯堡大學的魯茲(Eric Lutz)和他的同事,用實驗驗證蘭道爾的信息擦除原理,根據實驗結果得出信息的消除具體需要多少能量,證明了蘭道爾的理論確實是正確的。

所以,信息是一個物理實體嗎?

C4

讓我們回到三門問題。

現在我的興趣已經不是概率計算,而是概率如何幹預這個實在的物理世界。

當主持人知情並刻意選擇,他其實是「指定」了B門。

當可憐的觀眾們要面臨一個未知的世界,做出不確定的選擇的時候,主持人其實是一個無所不知的智能生物。

他幹預了「不確定性」的分配。

主持人通過做功,重新分配了概率。

不管主持人是否知道B後面是否有車,他其實都引入了新的信息(B門後面沒車)。

  • 當他知道的時候,是主動幹預;

  • 當他不知道的時候,是被動刷新。

這二種情況的結果是不一樣的。

這意味著:

獲取信息的方式,和信息本身一樣重要。

讓我們繞開「先驗概率」和「貝葉斯定律」這些知識和公式,用一種人的大腦直覺可以理解的因果邏輯來思考:

你要是願意去畫一個平行宇宙圖,會更直觀地理解這一點。

那個知道底牌的主持人,就是「麥克斯韋妖」。

C5

儘管我個人喜歡用「平行宇宙」的可視方法,來解釋不那麼可視的概率問題,但不代表我喜歡這個概念。

平行宇宙(多重宇宙)論,稱我們的宇宙之外,很可能還存在著其他的宇宙,而這些宇宙是宇宙的可能狀態的一種反應,這些宇宙可能其基本物理常數和我們所認知的宇宙相同,也可能不同。

平行宇宙經常被用以說明:一個事件不同的過程或一個不同的決定的後續發展是存在於不同的平行宇宙中的。

舉個例子,一個隨機的骰子被扔起來,在空中高速旋轉(快到牛頓力學的攝像機和拉普拉斯妖都無法計算),哪個數字會落在上面?

從概率角度看,每個數字朝上的機會是一樣的。既然如此,用平行宇宙法,我們可以想像在某個瞬間,未來分裂成六個平行宇宙。

最後猜測哪個數字朝上,其實是確認觀察者落在了哪個平行宇宙。觀察中所獲取的信息,用於關閉那些不符合的平行宇宙(或是縮小概率),確認那些符合的(或是增大概率)。

弦理論物理學家布賴恩·格林在《宇宙的結構:空間、時間以及真實性的意義》一書裡說:

時間並不是我們通常所說的河流,不斷地從過去流向未來;

時間的河流實際更像一塊巨大的冰塊,每一刻都凍結了所有的宇宙事件;

人類的意識,或者說記憶就像電影院裡放映機的光,不斷地照射到冰塊上,照亮的那一幀就成為現實,冰塊的其它部分沒有被照亮,那就是過去或未來。

這段話很詩意,但似乎混淆了一個人類的困境:

困擾我們的是,到底哪些是現實?哪些只是人類的謬誤投射在現實之上的幻覺?

C6

以物理世界的發明創造徵服了矽谷的埃隆•馬斯克,直接跳過了「觀念論」和「實在論」的對立,他聲稱,我們生活在真實現實世界的可能性只有10億分之一。

埃隆•馬斯克稱,宇宙的絕對年齡是138億年,這意味著外星文明有足夠的時間來開發一套複雜系統。

「假設以任何速度的發展,遊戲都將與現實無異,否則一個文明將會被終結,二者必然發生其一。因此,我們很可能生活在虛擬世界中。」

「我認為最有可能的是,有很多虛擬世界存在,這只是概率問題,你也可以稱其為現實,或者也可以稱其為多元宇宙。」

麻省理工學院Play Labs負責人、計算機科學家Rizwan Virk也是一個「模擬理論」的信徒。

Virk表示,我們周圍的一切,包括地球和宇宙,都是一個非常複雜的MMORPG (大型多人在線角色扮演遊戲)的一部分,而我們都是這個遊戲的玩家。

人間也許是無所不能的神們營造的一個沉浸式遊戲,這個遊戲提供了神所沒有、所嚮往的不可知、不可逆和隨機性。

因為無所不能的神們自己的一切盡在控制的日子是徒勞而絕望的。

那麼,我想問:這個遊戲的秘訣是什麼?

  • 我們到底只是為了贏?

  • 還是超級物種僅僅為了體驗低級物種的無助和隨機?

假如我們的世界真的只是一個遊戲,它太真實了。

正如埃隆•馬斯克所說,

「如果生命是電子遊戲,那麼畫面就很棒,但是情節令人困惑,而且教程太長了。」

C7

事實上,我們無需幻想,虛擬世界已經在覆蓋現實世界。

一個最直觀的指標是:

錢。

商業世界的權力,正在快速向虛擬世界轉移。那些只生產「數字」的公司,開始統治世界。

物理世界和人的行為,越來越數位化。人和人之間的關係,人和物之間的關係,被投影到一個虛幻的世界。

我稱之為數位化殖民地的建立。

人類歷史上最有錢的公司,以前是物理殖民地公司,現在是數位化殖民地公司。

凱文•凱利對未來的科技發展趨勢進行了預測,關鍵詞就是:

鏡像世界。

他認為,鏡像世界是未來20年將出現的一次重大變革,這種變革將當今存在的數字世界(如物聯網、3D模型、SLAM等)層層疊加到現實的物理世界中。

就像人與人之間的連接(社交媒體),以及世界上所有信息的連接(網際網路)一樣,鏡像世界將物理世界與虛擬的數字信息連結起來,在人與計算機之間創造出一種無縫的交互體驗。

在未來世界裡,真實世界裡的每個東西都會有一個晶片,整個世界都將被數位化,一切都將在虛擬數字世界裡有一個複製品,像是現實世界的一面鏡子。

這意味著什麼?

虛擬世界的商業統治者,將比現實世界的商業統治者更能夠分配成員之間的概率權。

我的這個觀點的推理邏輯如下:

1、在鏡像世界,商業統治者僅僅通過驅動你的「數位化投影」,就能驅動你物理世界和銀行帳戶的一切;

2、商業統治者在數字世界,僅僅通過分配概率權,就能夠獲取被統治者的臣服、歡愉和奉獻;

3、矽谷模式,精益創業,都是數位化時代的產物。

數字商業世界的流量買賣,IP價值,網紅經濟,量化交易,都是「分配概率權」的商業遊戲。

當主持人猶如掌握魔法般,重新分配了大門之後汽車的中獎概率,象徵著虛擬(數字)世界的麥克斯韋妖,只需藉助一點點信息,就能比無所不能的拉普拉斯妖更輕巧地改變一個個體的命運。

C8

我很好奇,假如我只是一個遊戲玩家,完全不自知地沉浸在「我」的這個角色中,假如我醒來,會在哪裡?

醒來之後我要說的第一句話是:誰設計的這麼糟糕的遊戲?

當然,我無法想像,假如這個遊戲去除了愚蠢、貪婪、殘忍,會變成怎樣。

無論這個世界是真是假,無論我是一個虛擬的角色,還是一個沉浸在角色中的玩家自己,至少在此刻,我是存在的。

「被感知的是不存在的,存在的只是感知它的心靈。」

如此一來,這個世界是真是假,其實無所謂了。

在休謨看來,「本體」是否存在並不重要,重要的是:

各種感覺之間的因果關係、串連、以及彼此之間的類似。

對於因果關係,休謨主張:

「我們無從得知因果之間的關係,只能得知某些事物總是會連結在一起,而這些事物在過去的經驗裡又是從不曾分開過的。

我們並不能看透連結這些事物背後的理性為何,我們只能觀察到這些事物的本身,並且發現這些事物總是透過一種經常的連結而被我們在想像中歸類。」

在拋棄了對因果關係的「必然性」的信仰之後,休謨神奇般地逃離了哲學家們在自由意志上的困境:

假如所有的事件都由原因「因果分明」地「決定」,我們的自由意志在哪兒?

就像假如拉普拉斯妖真的存在,它能夠知道組成你我的每一個分子原子電子,能夠知道每個人必然的命運。

幸好不是如此。

《經驗主義》一書說:

因此,人類行為沒有「必然性」。但人類還是自由的,因為他們自己就是其行為的原因。

這意味著,儘管我們每個人的命運像一個翻轉著的骰子,但是仍然擁有這個骰子的概率權。

這真是一個奇妙的設計。

C9

沒有證據表明,貝葉斯是為了反駁休謨,而提出了貝葉斯公式。

但極有可能,休謨啟發了貝葉斯(的反駁)。

休謨在1748年出版的《人類理解研究》中寫道:

  • 儘管世界上並不存在概率這種事物,但由於我們不知道任何事件的真實原因,因此我們的無知對理解產生了同樣的影響,並產生了一種類似的信念或觀點。

  • 我們在做一切推斷時,都會在習慣的支配下將過去的經驗套用到將來的頭上。

  • 雖然我們會傾向於最常見的結果,並且相信這種結果肯定會發生,但我們也不應當忽略其他結果。

  • 當然,我們必須按照它們發生頻率的多少,賦予每個結果或多或少的權重和信度。

貝葉斯在他那篇神秘的文章裡,找到了一種判斷概率的方法:

假設對於某個事件,我們只知道它在某些情況下發生的次數和失敗的次數。藉助他設計的方法,我們就可以判斷出在相同情況下該事件發生的概率。

也沒有證據表明,貝葉斯公式是為了證明上 帝的存在。

然而,這個公式驚人的簡潔,和強大的力量,卻仿佛是上 帝的作品。

C10

關於貝葉斯公式在現實世界所創造的奇蹟,很多看起來都像是神跡般的傳說。

例如圖靈二戰期間破解德軍的密碼,就運用了貝葉斯的理念。

所有這些故事裡,我喜歡下面這個搜救船員的傳奇。

2013年7月的一個晚上,一個捕蝦船的船員失蹤了。海岸警衛隊發現自己要面對的是一項不可能的任務:

  • 沒有確切的失蹤時間和失蹤地點;

  • 要在4000平方公裡的海域裡找到一個人。

這就像是大海撈針。

警衛隊採用了一個叫做「搜救優化計劃系統」的神奇工具,這其實是一個算法,根據模糊的線索,結合當地條件等因素,大幅縮小搜救範圍。

類似的案例不止一個,開始的時候看起來很不靠譜,但是,算法根據搜索結果,不斷更新路線。

希望有時在毫無希望的地方孕育而生,是因為「毫無希望」剔除掉了對那些「看起來似乎可以依附的希望」的幻想。

在這個故事裡,7個小時過去了,搜救人員一無所獲,決定返回基地加油。

這時副駕駛突然大喊起來。他們調轉方向,發現失蹤船員正被裹挾在洶湧的大海中,拼命向飛機揮手。

簡單的貝葉斯公式,很少的信息,就可以在汪洋大海中,救起一個人--這是一個關於命運、信念和算法的隱喻:

我們的人生絕大多數時候,都猶如置身無邊無際的大海,只擁有極少的已知條件。

但絕大多數時候,我們有限的努力,笨拙的推理,都能令自己脫離險境。

生活通過(對你以為的「真相」)說不的方式,幫助你一步步逼近真相。

那個相信上 帝的貝葉斯牧師創造出來的公式,仿佛在告訴我們:

你的自由意志,恰恰存在於你在這個世界的每一次探索和掙扎中,存在於你永不放棄的概率權。

最後

如果我叫喊,誰將在天使的序列中 

聽到我?即使他們之中有一位突然 

把我擁到他胸前,我也將在他那更強大的 

存在的力量中消失。因為美不是什麼 

而是我們剛好可以承受的恐怖的開始, 

而我們之所以這樣讚許它是因為它安詳地 

不屑於毀滅我們。每一位天使都是可怕的。 

因此我抑制自己,吞下深處黑暗的 

嗚咽的叫聲。啊,我們需要時 

可以求助於誰?不是天使,不是人; 

就連那些知道的野獸也意識到 

在這個被解釋的世界我們 

並不感到很安全。

我格外喜歡《裡爾克·杜伊諾哀歌:第一首哀歌》開篇的這一段充滿張力的詩句。

貝葉斯公式也有某種莫名的張力。例如信念與計算,模糊與精確,過去與未來,實在與幻覺。

類似於先驗概率和後驗概率的飛輪轉動,我們似乎是(且只能)在比較和改變中感知並理解這個世界。

藉助於條件變化和時間差,我們在溫差中感知到冷暖,在愛恨中體驗到情感,在得失中感受到擁有,在起伏中觸碰到意義。

從理性的角度,貝葉斯告訴我們,哪怕初始細微而孱弱,你依然可以通過永不放棄的微小努力,一步步逼近真相;

從感性的角度,貝葉斯幫助我們避免陷入「一切命中注定」的虛無,讓每個人在自己的觸碰中平等地「自我存在」。

假如真有一個造物主,祂為何如此設計?

有人說,上 帝是個程式設計師,祂通過調節參數,來調整每個人的命運。

假如果真如此,祂一定不會親力親為地控制每個人的參數,而只會設計一套算法,把旋鈕交給每個人自己。

這套算法中,也許會有這樣一個參數:

概率權。

我好奇已知和未知的尺度,好奇人類與地球、地球與宇宙之間的尺度比例,更好奇此刻與生命、生命與永恆之間的尺度比例。

有天早晨,我看見陽光從百葉窗間斜射入書房,不由得寫下:

「這個世界只給我很小的一個角落,

很短的一段時間,

遇見很少一些人,

經歷很簡單的事,

卻令我產生如此真實的感知了整個世界的幻覺。」

相關焦點

  • _詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「亂翻書」(ID:luanbooks),作者 潘亂,36氪經授權發布。 今年頭條生機大會,沒有發布希麼大的戰略和產品,朱文佳只是說要練好基本功:「無非是內容做得更好一點,推薦做得更準一點,創作者服務做得更到位一點。」 大會的主題是「致敬真知灼見」,代表著頭條內容生態進入了專業、聚焦的階段。
  • 人生贏家的撲克牌_詳細解讀_最新資訊_熱點事件_36氪
    36氪經授權轉載。 本文將探討在不確定世界中,關於實力和運氣之間的秘密。 開 始 為什麼好運氣的人運氣會越來越好? 為什麼大多數人的大多數努力毫無意義? 天賦、實力、努力、運氣之間的內在邏輯是什麼? 這個話題是在我的上一篇《概率屠宰場》發布後的討論。 先回顧一下:概率屠宰場 在該文的「屏幕上的智慧錯覺」這一段,我提及了三個「謬誤」: 1、賭徒謬誤 如果長期扔硬幣,正反比例是一樣的。硬幣沒有記憶,因此,再次拋出硬幣時,正面朝上的概率仍然是 50%。
  • 殺死電影院_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「格隆匯財經熱點」(ID:glh_finance),作者:電飯鍋,36氪經授權發布。 酹酒一觴,敬這個波譎雲詭的電影江湖,也敬在這場刀光劍影中終將倒下的犧牲者——電影院。 01 死裡逃生 「過去的事就過去了,永遠別回頭。」
  • 股市從無「鍊金術」_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「錦緞」(ID:jinduan006),作者:愚老頭,36氪經授權發布。 本文基於公開資料撰寫,僅作為信息交流之用,不構成任何投資建議。 我承認我最近有些膨脹,因為找出了曼德爾布羅特的《市場的(錯誤)行為》這本書,指望自己能夠從中能夠找到股市的鍊金術。對,就是下面這本。
  • GPU大廠英偉達的AI造夢空間_詳細解讀_最新資訊_熱點事件_36氪
    寶箱二:硬核家族DGX部署更快、性能更強的AI超級計算機系列 數據科學家和人工智慧研究人員,依賴高性能的計算能力來獲取最新研究成果。在今年雲棲大會上,家族成員紛紛亮相,包括最新推出的DGX POD超級計算機。 今年6月, DGX SuperPOD對外發布,其強大的運算能力位列全球最快超級計算機第22名。此次帶來的DGX POD,可以說是DGX SuperPOD的「年輕版」。
  • _詳細解讀_最新資訊_熱點事件_36氪
    36氪遼寧——讓遼寧看見世界,也讓世界看見遼寧。 36氪遼寧專注於發掘優秀遼寧企業,深度挖掘創投底層邏輯,搭建產業對接通道,連結創業者與投資人資本生態平臺。如果你希望得到36氪遼寧的報導,請將你的需求和BP發送至指定郵箱:liaoning@36kr.com。我們會及時回復。
  • 穿JK制服的炒股女孩_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「靠譜二次元」(ID:kpACGN),作者:靠譜ACG編輯部,36氪經授權發布。 一茬又一茬。 作者 / 時臣 十五歲的現役JK女孩冉冉不懂,為什麼原價100元的裙子轉手就可以賣到500元,穿過再轉手也可以賣到三四百。
  • 海底撈直面中年危機_詳細解讀_最新資訊_熱點事件_36氪
    繼「十八汆」之後,海底撈又開出了一家麵館。 這家叫「撈派有面兒」的麵館開在成都,均價8元。但根據大眾點評的評價時間推算,最早於去年11月就已經開業了。首先,當前的火鍋消費熱點地區,還是在消費單價高的一二線城市。其次,受疫情影響,中小餐企大批倒閉,反而騰出部分優質物業給海底撈這樣的企業。 目前在二三線及以下城市,海底撈主打中端火鍋的定位,共開出了324家店,客單價在95元左右,翻臺率為4.7左右,基本與一線城市持平,且穩中有升。再疊加選址、房租優勢和品牌影響力優勢,在低線城市,海底撈是有進一步深挖的可行性的。
  • ACG行業事件Top100,重新發現2019_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「靠譜二次元」(ID:kpACGN),作者靠譜ACG編輯部,36氪經授權發布。 2019年真是不平凡的一年。 17、騰訊UP2019大會發布20餘款新遊戲動態,動漫將探索輕量化 「事件回顧」UP2019騰訊新文創生態大會於3月24日在北京舉行,主題為「一花一世界」。騰訊遊戲公布20餘款遊戲的最新動態。
  • 比失業更嚴重:人工智慧的最新進展_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「L先生說」(ID:lxianshengmiao),作者 Lachel,36氪經授權發布。 劉慈欣有一部短篇小說,叫做《鏡子》,講了這麼一個故事: 一位氣象局的軟體工程師,意外用超弦計算機開發出了一款模擬軟體,可以模擬一個宇宙從誕生到演變的過程。
  • _詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「懂懂筆記」(ID:dongdong_note),作者:懂懂本尊,36氪經授權發布。 「感覺還是不能抄底,害怕。」很多人知道這個名字其實並非因為玩過這款遊戲,而是和《傳奇霸業》一樣,被它在網上無處不在的洗腦廣告轟炸的結果。 試問哪個網上衝浪的同學沒聽過那兩句蹩腳的廣普:「大嘎好,我系軲天樂,我四渣渣輝,探挽懶月,介四裡沒有挽過的船新版本。」 魔性廣告的轟炸,是它們獲取流量的最主要手段,而這種廣告策略的背後,則是開發商們無盡的野路子。
  • _詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「未來主議」(ID:futuretalking),作者:顧貝妮,36氪經授權發布。 與傳統肉產品加工相比,植物基蛋白質的生產更加自動化,對勞動力的依賴程度也更低,因此比較不容易受到人員短缺的影響。美國因傳統肉類加工企業工人大量感染肺炎停工,導致肉價大幅上漲有感,這給植物肉帶來了可乘之機。
  • _詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「錦緞」(ID:jinduan006),作者:投資研究院,36氪經授權發布。 本文基於公開資料撰寫,僅作為信息交流之用,不構成任何投資建議。 過去若干年,中國醫藥產業存在一條顯著暗線:「20年效應」。 具體來說,從仿製藥、原研藥到生物藥的躍遷過程中,中國和西方尤其是美國的差距大致都是20年。
  • 搶灘動力電池_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「子彈財經」(ID:wwwhygc),36氪經授權發布。換句話說,特斯拉即將開展的動力電池業務,不僅提供給自己使用,還將與比亞迪一樣對外出售。 馬斯克做動力電池並非一時心血來潮。 2015年以來,特斯拉就通過扶持鋰電技術研究、收購電池製造廠商等方式,一步步切入動力電池領域。年初有媒體報導,特斯拉在弗裡蒙特建造一條試點電池生產線,並設計電池生產設備。今年9月,特斯拉還將舉辦「電池日」活動,公布其「百萬英裡」電池的更多細節。
  • 視頻號:機會和商業化_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「藍鯨渾水」(ID:hunwatermedia),作者:hunwater,36氪經授權發布。 微信視頻號又雙叒叕有新動作了。 有網友表示,錯過了抖音快手,不能再錯過視頻號了。 近兩年,電商直播飛速發展不斷出圈,以淘寶直播、抖音快手為代表的平臺方衝在前線,B站、小紅書、知乎等也先後上線並不斷完善直播功能。
  • 香港導演「請就位」_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「NOWNESS現在」(ID:NOWNESS_OFFICIAL),作者:Luc,編輯:Svet,排版:小左,36氪經授權發布。 聊一聊你認識的不認識的那些香港導演們 因為直言和互懟,《演員請就位 2》再次成為最近的熱點話題,除了「仗義執言」的李誠儒,大家的目光還集中在了「有理有據」的爾冬陞身上。
  • 找到電影院的「第二增長曲線」_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「東西文娛」(ID:EW-Entertainment),36氪經授權發布。 撰文:EW 研究|劉婉瑩 顏巍 審閱:顏巍 在復工復產恢復觀影的大基調下,即使沒有這場疫情,影院都要面對受眾已然分流的這一既定的事實。
  • 姻緣算法:聰明人的21條愛情公式_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「孤獨大腦」(ID:lonelybrain),作者老喻在加,36氪經授權發布。 比如人們知道擲硬幣的概率是兩面各50% ,於是在連續擲出5個正面之後,就傾向於判斷下一次出現反面的概率較大。其實下一次出現反面的概率還是50%。 這一點已被大量的實驗和證券市場上的錯誤預測所證實。 大多數人在判斷不確定事件發生的概率時,往往會違背概率理論中的大數定律,而不由自主地使用「小數定律」,即濫用「典型事件」,忘記「基本概率」。
  • 諮詢顧問的十大底層邏輯_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「貓爺戰略」(ID:IP_strategy),作者:貓爺先生,36氪經授權發布 雖然沒真正在頂級管理諮詢公司麥肯錫裡工作過,但由於我打交道的人大多都有些諮詢背景——如,大老闆是前麥肯錫合伙人,有個同事是美國麥肯錫工作2年多——慢慢地,我也從他們身上學到了很多。 麥肯錫的人一般自帶光環。
  • 科技公司闖年關_詳細解讀_最新資訊_熱點事件_36氪
    編者按:本文來自微信公眾號「甲子光年」(ID:jazzyear),作者:王與桐 楊逍 程丹,編輯:火柴Q,36氪經授權發布 UCloud  賽道:雲計算 成立時間:2012年3月 輪次:已上市 公司規模:1000+人 核心管理層人數:11人 受訪者:創始人兼CEO 季昕華 下一個案例,是剛剛在2020年1月20日以「A股市場同股不同權第一股」及國內資本市場「雲計算第一股」雙重身份登陸科創板的UCloud