這裡面到底哪裡出了問題?這其中的關鍵是,如何解釋真實情況和理想中的概率之間的偏差。
現實和理想概率有偏差
幾百年前,法國數學家伯努利等人為了回答這個問題,就開始做一些最簡單的隨機試驗,這種試驗簡單到只有兩種結果,非A即B,沒有第三種狀態,而且在同樣條件下重複這種試驗,A和B發生的概率需要一致。於是,我們就得到這樣一個結論:有關不確定性的規律,只有在大量隨機試驗時才顯現出來,當試驗的次數不足,它則顯現出偶然性和隨意性。
找出這個偏差的本質
當然,在數學上我們不能用「曲線比較鼓」,或者「比較平」之類不嚴格的語言來描述一種規律。我們需要用兩個非常準確的概念來定量描述「鼓」和「平」的差別。第一個概念就是平均值或者叫做數學期望值,也就是N*p,因為概率是p的事件進行N次試驗後,平均發生的次數,也是最可能發生的次數,好,這是N*p。接下來我們再用平方差(簡稱方差)這個概念來描述曲線的「鼓」與「平」。「方差」這個詞你可能並不陌生,那麼什麼是方差,它是如何計算的呢?我們下面就簡單地說一說。方差其實是對誤差的一種度量,既然是誤差,就要有可對比的基點,在概率中,這個基準點就是數學期望值(簡稱期望值),也就是我們通常說的平均值。比如說,做10次拋硬幣的試驗,平均值就是5次正面朝上,5就是基點。如果我們做10次試驗只出現4次正面朝上的情況,就有了誤差,誤差是1。如果9次正面朝上,那麼誤差就大了,就是4。好了,接下來我們就把各種誤差,和產生那些誤差的可能性一起考慮,做一個加權平均,算出來的「誤差」就是平方差。之所以使用「平方」這個詞,是因為計算方差這種誤差時用到了平方,為了進一步方便誤差和平均值的比較,我們通常會對方差開根號一次,這樣得到的結果被稱為標準差(嚴格來講,方差開根號後和標準差還是略有差別,但是這個差別很小,為了便於理解,我們就假定標準差是方差開根號的結果)。關於方差和標準差的公式我們就省略了,大家只要記住下面這個結論就可以了:伯努利試驗或者其它類似的試驗,試驗的次數越多,方差和標準差越小,概率的分布越往平均值N*p的位置集中。顯然,在這種情況下,你用A發生的次數,除以試驗次數N,當作A發生的概率,就比較準確。反之,試驗的次數越少,概率分布的曲線就越平,也就是說A發生多少次的可能性都存在,這時你用A發生的次數,除以試驗次數N,當作A發生的概率,誤差可能會很大。具體到拋硬幣的試驗,進行100次試驗,標準差大約是5次,也就是誤差相比平均值50,大約是10%。但是如果我們做10000次試驗,標準差大約只有50,因此和平均值相比,降到了1%左右。
有了方差的概念,我們就能定量分析「理想」和現實的差距了。什麼是理想呢?我們進行N次伯努利試驗,每一次事件A發生的概率為p,N次下來發生了N*p次,這就是理想。那麼什麼是現實呢?由於標準差的影響,使得實際發生的次數嚴重偏離N*p,這就是現實。
比如,在生活中,很多人覺得某件事有1/N發生的概率,只要他做N次,就會有一次發生,這只是理想。比如說一件事發生的概率為1%,雖然進行100次試驗後它的數學期望值達到了1,但是這時它的標準差大約也是1,也就是說誤差大約是100%,因此試了100次下來,可能一次也沒有成功。如果你想確保獲得一次成功怎麼辦呢?你大約要做260次左右的試驗,而不是100次。這裡面的數學細節我們就不講了,大家記住這個結論就好,就是越是小概率事件,你如果想確保它發生,需要試驗的次數比理想的次數越要多得多。比如買彩票這種事情。你中獎的概率是一百萬分之一,你如果要想確保成功一次,恐怕要買260萬次彩票。你即使中一回大獎,花的錢要遠比獲得的多得多。因此,了解了標準差,就該懂得人為什麼不要去賭。這算是我們今天在認知方面要了解的第一個知識點。我們要了解的第二個知識點是,提高單次成功率要遠比多做試驗更重要。假如你有50%的成功可能性,你基本上嘗試4次,就能確保成功一次,當然理想狀態是嘗試兩次。為了保險起見,要多做100%的工作。但是如果你只有5%的成功可能性,大約需要50次才能確保成功一次,而不是理想狀態中的20次。為了保險起見,要多做150%的工作。很多人喜歡賭小概率事件,覺得它成本低,大不了多來幾次,其實由於誤差的作用,要確保小概率事件發生,成本要比確保大概率事件的發生高得多。關於概率論和統計學的規律,還有很多和大家直覺不相符的地方。比如我們前面所說的各種大量的隨機試驗,需要在相同條件下進行,而且前後各次試驗是彼此不會相互影響的。這兩件事在現實中,還真不容易滿足。就拿擲骰子來說吧,看似擲N次不過是擲一次的多次重複,但實際上擲的次數多了骰子會磨損,桌面也會砸出坑,這些細微的差異累積下來就會產生不同的結果,我們原以為試幾次就能發生的事情,可能沒有發生,這就要我們事先考慮更多的餘量。
小 結
▽ 戳此入手
雙12年終盛典今日開搶,全場5折起,每滿300減30,上天貓搜「羅輯思維旗艦店」,立即搶購。