而你也許聽見過類似這樣的回答和反問:
「因為數學在工程、科學上都有用啊,你現在用的手機裡都包含了數學。」
「那是工程師、科學家這些人的事情吧?我幹嗎要知道呢?」
「你喜歡籃球、足球吧,男孩子都喜歡這類體育活動,他們中只有極少的一部分人會成為職業運動員,但是參加這些活動可以讓他們的耐力、體力和柔韌性都獲得提高。在以後的生活裡面,就算被女朋友打的時候,跪搓衣板的時候也能提高自己的『生存率』。其實,學數學也是一樣的。學好數學本質上可以為你提供一個全新的思維維度。讓你能從一個全新的角度去看待世界,解釋這個世界,就好像給你的思維加上了 X 光一樣,讓你能從紛繁複雜的日常世界中看到規律。」
「你說的這些聽起來還是蠻有道理的,但是太抽象了,你能給我舉個例子嗎?」
好,我這裡舉個例子,是亞伯拉罕 · 瓦爾德(Abraham Wald)的故事。他是一個數學天才,「二戰」的時候他加入了哥倫比亞大學的「統計研究小組」,這是一項為「二戰」服務的計劃,類似於曼哈頓計劃。這個小組裡面有控制論的奠基人維納(Wiener),有哈佛統計系的創始人莫斯特勒(Mosteller),有決策理論的先驅薩維奇(Savage),有諾貝爾經濟學獎得主弗裡德曼(Friedman)。其中,瓦爾德算是研究領域最理論的一個人。這個小組有一次的任務是提高戰鬥機的生存率。美軍發現戰場上飛回的那些飛機上的彈孔分布是不均的,機身比引擎上多,他們不能強化整個飛機,因為這樣飛機會過重,於是他們覺得要強化受攻擊率最高的部位。瓦爾德的建議是強化那些沒有彈孔的位置。瓦爾德是這樣想的:飛機各個部分的中彈概率是差不多的,那麼為什麼統計那些飛回來的飛機後發現某些部分彈孔比較多呢?為什麼引擎上彈孔比較少呢?因為那些失蹤的彈孔在沒飛回來的飛機上。軍方聽從了他的建議,飛機的生存率確實提高了。在這個問題中,瓦爾德實質上運用了數學期望、相關性等數學概念,我會在後面具體解釋。
《魔鬼數學》這本書的主要內容就是幫助大家理解「線性關係」、「顯著性檢驗」、「期望」、「回歸平均值」等等陌生的數學概念,是如何在社會生活的各個方面具體應用的,通過一個個生動的例子和故事,讓數學增加我們認識世界的維度。
全書第一個重點是「線性和非線性」的關係。
不是所有的線都是直線,即使你只是個小學生,你似乎也能理解這個道理。但可惜的是,很多人,甚至是很多專業人士在生活和工作中都非常容易陷入「線性思維」的陷阱。線性思維的錯誤幾乎無處不在。
舉個例子,讓我們看看《外交》(Foreign affairs)雜誌列出的一段話:「以色列軍方報告,從第二次巴基斯坦大起義到 2005 年 10 月底,有 1074 個以色列人死亡,7520 人受傷。對於以色列這樣的小國,這個數字很大,按照比例來算,相當於美國 5 萬人死亡,30 萬人受傷」。這種按照比例算的方式隨處可見,但是這種「線性推理」是有問題的,非常容易產生謬誤。為什麼呢?設想一下,如果你下課後把同桌打趴在地,甚至你下手很重,讓他進了醫院,是不是等於全中國7億人每天被打扒在地了呢?顯然不對吧。
我們再舉一個現實的例子說明為什麼這種線性類比是有問題的。2004 年西班牙馬德裡火車站發生了恐怖襲擊,200 人喪生,按照比例算是全國人口的百萬分之 4。按此比例,美國發生類似案件會死 1300 人嘍。如果按照城市人口比例計算,200 人對於馬德裡相當於 463 人之於紐約。但是,我們知道美國火車站恐襲不少,但是從來不會達到這個數字。
當然了,我不是要全盤否定「比例換算」這種方法,方法本身沒錯,重點是你得用對地方。比如在著名的認知心理學家和科普作家史蒂芬 · 平克的名著《人性中的善良天使》中,平克就計算了17世紀歐洲「三十年戰爭」的死亡率,在那次戰爭中全世界人口的 1% 死亡,按照比例換算是現代社會的 7000 萬人,比兩次世界大戰中死亡的人口都多。他通過計算此類暴力死亡人口的比例發現,人類歷史上的暴力水平是下降的。
比例計算能否可靠得看自變量和因變量之間是否是「線性關係」,你當然可以通過嚴格的邏輯和理論去推理出兩個東西是否是線性關係。但是,只是依靠數據也有可能發掘線性關係,其中的一種具體方法叫「線性回歸」。比如,我們把北卡萊納 31 所私立高校的入學考試分數和學費體現在一張圖上。每個點是一個學校,縱坐標代表學費,橫坐標是入學考試平均分。於是你會發現大部分的點分布在一條直線附近。傾斜比為 28 比 1,意味著每增長一個平均分,需要多繳納學費 28 美元。由此可見,考試輔導是多麼昂貴啊!
雖然線性關係簡單,但是現實中大部分關係都是非線性的。比如稅率和政府財政收入的關係,如果稅率很低,當然政府收入就低了,但是一味提高稅率會降低整體社會的經濟活力,因為你不管多辛苦賺錢,你賺來的錢都進了政府口袋,所以你要麼忍受這種不公平要麼設法避稅。客觀結果就是,最後政府的稅收一樣很低。畫成一條曲線就是一個先遞增然後下降的曲線。這條曲線在經濟學上叫「拉芙曲線」(Laffer curve)。對於從小被辯證法薰陶的人來說,這種辯證關係應該是很好理解的。現實中最大的麻煩是弄清楚我們在曲線的哪個斜坡上,因為那會影響政府未來會提高還是降低稅率。
好,現在我們來談全書的第二個概念「顯著性檢驗」。
這一段,讓我們先從一個 1994 年的搞笑諾貝爾獎開始,這個獎項頒給了 3 個統計學家和一個記者,他們宣稱從《聖經》中發現了隱藏的秘密,他們宣傳「希伯來文的聖經」包含了以色列 32 個拉比的出生日期,以及總理拉賓被刺殺的時間。這裡的拉比你理解成某種宗教領袖就好。是不是感覺特別魔幻?
那麼,他們是怎麼發現的呢?首先,他們把「希伯來文的聖經」抹去任何間隔,包括空格和標點符號,得到一串幾十萬字的純粹的希伯來字母串。然後他們設定「算法」,形成小字符串,然後設定一些規則,形成有意義的單詞。通過複雜的算法,這幾個人宣稱《聖經》中蘊藏了很多未來的信息。
這個結果,發表在非常權威的期刊《統計科學》上,讓學術界炸鍋了,大家覺得這個正經期刊怎麼能刊登這些亂七八糟的東西呢?最後這個期刊發了聲明,說之所以發表這篇文章不是肯定它的結論,而是讓大家知道湊出如此不可思議的巧合只需要猜謎語一樣的工作就可以。
一個美國記者靠著這個結果寫了本書叫《聖經密碼》,搞笑的是這書還成了暢銷書。這件事其實很簡單,因為用 30 萬個字符串和特殊算法算出這些東西其實不難。這告訴我們「小概率事件並不少見」。有一位叫馬凱的人用類似的方法在《戰爭與和平》中也提取出了拉比的出生日期和總理拉賓的被刺殺日期。他還從《白鯨記》中提取出了約翰 · 甘迺迪、甘地、列夫 · 託爾斯泰等人遇刺的信息。
這裡,我們再舉一個有趣的例子。2009 年,在舊金山人腦成像會議上一個專家做了個報告——《大西洋死鮭魚對人類神經活動的觀察——論多重比較修正的重要性」。在研究過程中,作者把一張照片放在死魚前,然後通過核磁共振裝置發現這條死魚能夠讀出照片中人物的情緒。這條魚為什麼有如此的能力呢?這當然是一個冷笑話了,它實際上是在批評:某些神經成像技術研究人員不夠嚴謹,忽略了「小概率事件並不少見」。神經科學家會把核磁共振圖像分解成成千上萬個細小的體素,每個體素對應大腦的一個區域。掃描大腦的時候,即使是死魚的腦也會有隨機噪音。因為神經系統非常龐大,可以提供的體素很多,這些體素可能會有幾個剛好和照片吻合而已。這篇文章發現,其實大量研究沒有考慮「小概率事件」的普遍存在性。科研人員可以通過各種修正方法讓自己的成果看起來很可信。
具體的修正方法這裡不提,我們通過一個經典的騙術來說明背後的原理。假設你某一天收到一個股票經紀人的郵件,它預言第二周某支股票會漲,然後預言應驗了,緊接著你收到了同一個人發來的郵件說這支股票下一周會跌。一周之後,它又應驗了,你同時收到了下一個預言。一直到第 10 個星期,他的預言都是準確的。這個概率多低啊,每次有 50% 猜中的概率,那麼對你來說這件事的概率也只有 1024 分之一。但是,對於發郵件的人來說,準確的概率是 100% 。為什麼?因為他同時給 1024 個人發郵件,然後在第一次的郵件中告訴 512 個人某支股票會漲,告訴剩下的人這支股票會跌。第二周的時候看哪一波和現實符合,再給這波人的一半人預測會漲,一半預測會跌,以此類推。總有那麼一個人,在這個人眼裡,發郵件的人簡直是神預測。「聖經密碼」的操作本質上也是這麼回事,它的算法過於「複雜」,可以調整的地方很多,加上本來字符串又長,最後的結果是只要調整好算法,就能得到想要的結果。
不只是科學研究,在現實的生活中會發生各種奇怪的現象,那麼我們怎麼判斷哪些是確實有趣的,哪些完全不需要大驚小怪呢?如果讓一個數學家去解決這個問題,他會怎麼去解決呢?科研中很多問題簡化為發生或者不發生兩種情況。比如某種藥是有效或者無效。這種無效的情況屬於「零假設」,如何推翻「零假設」呢?我們依靠的方法就是「顯著性差異」。
有人覺得這不難啊,我們找 100 個人,一半吃藥,另一半吃安慰劑。然後只要吃藥的人1年後的死亡率低於吃安慰劑的人,我們就能知道這個藥有效了。這個方法的錯誤在於:即使藥壓根無效,也有相當的概率,比如 40%,吃藥的人存活率高於吃安慰劑的人。真正的檢驗方法應該考慮極端情況。比如,通過計算我們發現,如果不吃藥,50 個病人 1 年後存活的概率低於 200 分之一。但是服藥後50個病人確實在一年後活了下來,這個時候你說藥物靠譜的說服力就高了,藥物無效這個零假設將被推翻。
概括起來,第一步,我們開始試驗;第二步,我們假定零假設為真,而 p 為觀察結果中出現極端情況的概率;第三步,如果 p 的概率很小,但是我們確實觀察到這個現象出現了,那麼我們認為零假設被推翻,它不是真的。否則零假設依然成立。
那麼 p 多小才算小呢?這麼說吧,只有那些成立的概率高於 99.99996%的結論我們才相信。真正了解科學的人才知道科學有多嚴格。
本書的第三個重點是「期望」。
有人說,買彩票就是繳智商稅,但是曾經有一群麻省理工學院的學生,他們組織起來集體購買彩票。從 2005 年開始,這群學生組成了「隨機策略」小組,系統性地大量購買一種彩票,最後還獲得了百萬的收益。這背後的原理其實就是「數學期望」的簡單應用。
彩票是怎麼來的呢?最早在熱那亞,人們要從 120 個議員中選舉出兩個總督,他們靠的不是選票,而是直接抓鬮。於是這個城市的賭徒就拿這個來賭博,不同的是他們直接用數字代表議員。賭徒努力選取 5 個數字,猜中的越多,獎金越高。
亞當 · 斯密在《國富論》裡面批評說:賣彩票都能賺錢說明人們高估了自己中獎的概率,從數學上講買得越多,遭受損失的可能性越大,買進所有彩票 100%虧錢。
那麼亞當 · 斯密的說法對嗎?亞當 · 斯密當然是一代大師,但是我們也不能盲目相信他的每句話。他犯的錯誤就是我們一開始提及的「線性思維」,事實上,如果你購買兩張彩票,相比一張彩票,你的中獎概率是提高的,你買的彩票越多,你中獎的概率當然是越高的。問題是,你買得越多,你花的錢也越多。所以你必須同時考慮兩種因素:獲獎的概率和獲獎的金額。數學上簡單易行的方式就是數學期望,也就是一個加權平均數。假設我們總共有 1000 萬張彩票,只有一張能獲獎,獎金是 600 萬美元。那麼每張彩票的「數學期望」是 0.6 美元。一個理性的選擇是,如果購買彩票的價格低於其數學期望,你就應該選擇購買;如果別人以高於數學期望的價格問你買彩票,你就應該賣給他。比如有人願意拿1.2美元買你的彩票,你就該賣給他。當然了,是在開獎前。事實上,彩票的販賣者壓根不會以低於 0.6 美元的價格販賣這個彩票。
如果彩票規則設置有問題會造成賣票的人虧死。你覺得,會有賣彩票的人傻到不算算就賣票嗎?
答案是:還真的有過。
在 2005 年秋季的時候,美國一家彩票中心的人發現原來的彩票賣不出去,於是發布了一種新規則,這個規則規定,如果一周內沒有人贏走獎金,獎金不會累計,只要獎金高於 200 萬美元,獎金就會向下分配,增加不那麼容易獲獎的獎項的金額。根據這個新規則,麻省理工學院的一群學生發現,在一定條件下,彩票的期望會大於其價格,導致在數學上購買它變成了非常合理的事情。當然了,即使這個時候,數學期望值也不是說你買一張賺一張,而是當你大量購買的時候,你的每張彩票價值才能真的趨於期望。於是,以詹姆斯 · 哈維為首的學生一次性購買了 1000 張彩票,獲獎 2000 美元,大約是其投資金額的 3 倍。哈維自然不可能就此收手,他們組成了「隨機策略」小組,草擬了通過這個彩票賺錢的計劃。有意思的是,除了他們還有美國東北大學以張姓博士為首的人也在用這個彩票賺錢。這群人更厲害,每次出手都購買 30 萬美元的彩票,獲得了高額的利潤。在七年的時間裡,哈維的團隊通過這個彩票獲利 350 萬美元。
當然了,這種有漏洞的彩票其實並不多,即使存在漏洞,你也必須一次性大量買進才能真的獲利,那麼為什麼有那麼多人還是會去購買彩票呢?這個問題讓懂數學的經濟學家很費解,他們希望解釋為什麼博彩行業那麼發達。經濟學家弗裡德曼和薩維奇給了一個解釋。在他們的解釋中,計算彩票的收益不再只是考慮客觀上的金錢,而是「效用」。同樣的 100 美元,對於不同的人來說效用是不一樣的。對於某些人,這是足以讓人心動的一個數目,對於另一些人,他們可能只是隨便玩玩。對於一個中低階層的人來說,每周花 5 美元買彩票不是什麼大錢,損失幾乎為 0,但是一旦中獎,會直接進入一個新的階層。按照這種效用來計算,你會發現一張彩票的數學期望就會很高。更別提,無論輸贏,買彩票都能給一部分人帶來生活的樂趣。考慮到這些,彩票業的發達就不是多奇怪的事情了。很多退休老大爺,每天拿著本子計算哪個號碼最好也是他們晚年的一大享受。
本書的第四重點是「回歸效應」和「相關性」。
你是否有喜歡的歌手,你發現他的第一張專輯特別有才華,但是第二張、第三張就突然平平了。或者你發現某些作家在第一部小說大獲成功之後,第二部作品的受歡迎程度明顯下降了。他們真的是所謂「江郎才盡」嗎?如果你問「優生學之父」高爾頓這兩個問題,他會告訴你,這種現象叫「回歸平均值」。
高爾頓是一個對遺傳有濃厚興趣的人。他曾經致力於研究遺傳和身高的關係。包括他在內,大部分人都知道父母個子高的話,孩子個子往往也高。如果一名一米八的大漢和一米五五的小個子女孩兒生孩子的話,他們的孩子的身高很可能超過他們的平均值。但是他發現了一個異常現象:當父母的身高都矮的時候,情況相反,他們孩子的身高雖然也比較矮,但是不會比他們的父母矮。他認為,從整體上看,成年子女的身高和他們父母相比更加趨於平均水平。這個現象叫「回歸平均值」。他同時考察了智力和遺傳的關係。偉大的科學家和作曲家的孩子往往也有相當的突出表現,但是很少有超越其父母的。優秀的品質很難持續,隨著時間的平移,平庸就會到來。高爾頓認為,智力、成功和身高這些東西往往是由內部和外部因素共同決定的,外部因素包括成長環境和純粹的運氣。這些因素往往是偶然的、波動的,不會總是有利於某人,導致的結果就是「回歸平均值」,成為一種常態。比如,歌手和作家的成功自然是因為有才華,但是也有很多偶然的因素,當這些偶然因素有利於他們的時候,你能看到燦爛的成果,但是當這些偶然不眷顧他們的時候,他們的表現就不那麼突出了,這不是什麼「江郎才盡」,這是生活的一個必然罷了。殘酷的是,只有那些「超常發揮」的人才能真的成功並且被給予更多的機會和資源。數學家霍特靈指出:只要研究的變量同時受到穩定因素和隨機性的影響,那麼平庸狀態的勝利或多或少是一種必然。
高爾頓的研究雖然指出了只要研究對象受到隨機性的影響,就容易發現回歸平均值的現象,但是他沒有指出隨機力有多大。要明白這個,數學家發明了一個概念:「相關性」。這是一種刻畫兩個變量相互影響程度的量。相關性越高,兩者會越發表現得像「線性關係」,反之則相關程度越差。定量的好處在於我們利用這個數學概念把語言上的「無關、有關係、相當有關係」變成了某種定量的數字。利用相關性,我們能很好地簡化記錄信息的方式。如果 A 和 B 高度相關,我們其實只要記錄 A 就可以了,B 可以被簡單地推導出來。這個原理也是數字壓縮技術的一個核心想法。比如我們記錄一張數碼照片,完整地記錄每個像素的信息需要百萬個數字串,比如 400 萬,但是這些數字串有時候往往具有很大的相關性。比如,一個像素是綠色的,那麼下一個很可能也是綠色的,實際上你就能用遠遠少於 400 萬個數字串來表達完整信息。這套技術的數學原理後來得到了飛速發展,現在已經是熱門的研究領域,叫「壓縮感知技術」,天才數學家陶哲軒就是其中的翹楚。
好了,這本書的主要內容介紹得差不多了,我們回頭用所學的知識解釋一下開頭的瓦爾德改進飛機的思路。為什麼軍方認為應該給中彈多的部分加防護呢?因為他們認為返航飛機就是所有飛機的一個隨機樣本,這些返航飛機就能代表所有飛機的中彈情況。瓦爾德作為數學家敏銳地質疑了這個基本假設,因為不能認為飛機不管什麼部位中彈,倖存率都是一樣高。他認為飛機的倖存率和彈孔的位置具有高度相關性。在這個問題中,雖然擊中不同部位的概率是差不多的,但是擊中後飛機墜毀的可能性不同,如果引擎被擊中,飛機一定墜毀,那麼返航的飛機中你壓根不可能找到引擎上有彈孔的飛機,因為它們已經沉在海底了。這其實就是經典的「幸運者偏差」效應。所以瓦爾德建議加護那些沒有中彈的部位。
在本書中我們還了解了其他四個數學概念:
我們先學習了「線性思維」的誤導性;然後通過「顯著性差異」,我們知道有些看似神奇的結論其實平平無奇,只是單純的巧合,而「小概率事件並不少見」;接著,我們知道了在面對概率和獲利的時候我們應該考慮的是期望,在獲利這點上,我們得考慮它的效用而不是單純的金錢;最後,我們明白了對於由多種隨機因素決定的現象,它們很可能會歸於平均值。
那麼在這個時代,這些數學知識還有什麼啟示呢?這裡我談一點個人的見解:我們生活在信息和媒體高度發達的年代,所以我們壓根兒不需要擔心信息不足,我們需要擔心的是自己是否被媒體信息誤導了。
媒體人有時候會有意無意地使用簡單的「線性類比」製造聳動的標題和內容,但是我們知道這種類比不是總能成立的,往往最多只是修辭手法罷了,不能當真。媒體總是關注和放大那些特例,但是我們要知道小概率事件並不少見,只要基數夠大,什麼事情都有可能發生。
我們必須小心分辨它們是否能通過顯著性檢驗。那些所謂的靈異、詭異的巧合其實真的只是巧合罷了。這個時代最吸引眼球的,仍然還是那些「成功學」的故事,有些媒體會放大其中個別因素,有意無意地忽略那些環境和隨機因素。他們往往會吹捧某人,然而當「回歸平均值」現象發生在此人身上時,再輕易地給出「江郎才盡」的結論。通過今天的講解,如果你明白了「回歸平均值」理論,希望大家不要再去神化那些所謂的「大神」,更不要和別人一樣落井下石。
當你真的懂得了一些數學原理後,你就能在嘈雜的世界中多保持一份理性。