美國有個人叫迪克·科帕肯,畢業於哈佛法學院,工作後在律所為法律客戶分析數字,從法律行業退休以後,他開了家叫埃帕戈吉克斯的公司,這個公司的不同之處在於,它是專門根據劇本等因素預測電影收入的。
說到公司預測收入,大多數公司都會在年底或年初做年度規劃,預測個收入並不稀奇。實際上,電影公司傳統預測盈利情況的準確率大概在30%。
但是,這個公司牛掰就牛掰在:
第一它預測的準確率高達60%。
第二大電影製作工作室,如果能獲得並遵循他們的建議,每年大概至少能增加10億美元的淨收入。
第三工作室可以預測出花費幾百萬美元製作的電影是否值得。
第四工作室能知道具體該如何提高電影的預期總收入。
那麼,他們是怎麼做到的是呢,主要是因為這公司訓練了一個神經網絡。簡單來說,就是通過神經網絡,優化、過濾劇本以符合大眾的需求,對拍攝地點評估節省製作的成本,還可以篩選演員以最小的成本獲得最大的收益。
如果照著這個案例來說,對電影製作公司來說,真的是巨大的商機,如果舉一反三,能用在電影領域,其他領域是不是也可以,這麼一想,我就覺得它真的太逆天了。
那麼,什麼是神經網絡呢?
在《魔鬼統計學》一書裡,作者伊恩·艾瑞斯介紹說,神經網絡是一種新的統計方法,它很靈活,很微妙,它試圖讓計算機像人類神經一樣處理信息。
神經網絡未來會不會真的會像人類神經一樣,這點我一點都不懷疑。說起來,現今我們都處在資訊時代,無論是生活還是工作,處處都朝著電子化的方向前進。
總的來說,無論是神經網絡,還是其他的統計方法,所有的基礎都是用數據分析。
那麼,數據分析跟我們有什麼關係?我們會受到數據分析的影響嗎?它到底都有哪些用處?
很顯然,上面這個案例裡,我們就是切身利益相關者,因為我們就是花錢看電影的人。這些問題也正是《魔鬼統計學》要告訴我們的。在書裡,作者會講述超級數據分析在企業、政府、醫療、教育等社會各領域的興起和影響,還會介紹幾種基本的統計方法。這麼做的目的,是想告訴我們超級數據分析已經能影響現實的決策,並且數據分析得到的預測結果更加準確。
作者還強調,隨著基於數據的決策變得越來越多,未來,最優秀最聰明的人,是既了解統計學,又擁有專業知識的人。
《魔鬼統計學》的作者就是數據分析師,他在耶魯大學教法律,在麻省理工讀博士的時候學過計量經濟學,曾為各種事情做過數據分析,他還是嚴肅期刊的編輯。
需要說的是,這本書裡所謂的數據分析指的是超級數據分析。簡單來說,超級數據用的單位是太字節或拍字節。1拍字節等於1000太字節,1太字節等於1000G,更形象一點來說,一所圖書館大概有個幾太字節,或幾十太字節。沃爾瑪的資料庫有超過570太字節數據,谷歌有大概4拍字節存儲量。
這麼說,相信大家都會有直觀的概念了。
作者幾年前曾和史蒂文·萊維特(《魔鬼經濟學》的作者之一)合作,研究路捷對汽車盜竊的影響。路捷是能隱藏在汽車內部的定位器,車子被偷後,不但可以定位找到,還可以順藤摸瓜抓到偷車賊。
因為偷車的人並不知道哪輛車上有安裝了陸傑,所以他們就想,它是否有助於降低整體汽車的失竊率呢?也就是,是否能產生經濟學家所說的正外部效應呢?
於是,他們拿到路捷的銷售數據後,考察了56座城市14年的汽車盜竊數據。他們發現,路捷可以降低整體汽車的失竊率。換句話說,如果有人能花500美元裝一個路捷定位器,就能讓沒裝的車主減少5000美元的損失。
自從他們這篇論文發布以後,路捷公司的股價上漲了2.4%。
這就是數據的優勢。
《魔鬼統計學》裡說,通過數據分析可以調查偏好,進而就能做出改善個人決策的有力途徑。
有些企業就利用了這點,有些企業在往滿足客戶需求的方向努力,而另一些企業已經走在了預測需求的道路上。當然,後者是一些大企業。
比如,沃爾瑪。
沃爾瑪利用超級數據分析來預測需求,簡單來說,就是通過數據預測哪些商品何時會短缺,何時不會短缺。這樣能降低成本,尤其是滯銷庫存成本。
舉個例子,貨架上有六罐蜂蜜,如果只剩下三罐,立即就會有人知道這件事,並及時補貨。這就不用存庫存。
沃爾瑪還善於通過消費者過去的行為預測未來。比如,2004年美國發生的一次颶風事件。沃爾瑪在颶風到達佛羅裡達前,就已經根據颶風的路徑,提前給門店緊急配送了大量的草莓玉米餅。為什麼是這個產品?因為數據顯示,颶風到來時,人們喜歡這種不用烹飪、冷藏的食物。
數據分析還能預測顧客的流失,公司就能在顧客流失前,採取行動來挽留。
比如,量化賭徒的痛點。
哈拉斯賭場的顧客是刷卡結帳的,因此他們可以獲取顧客每場遊戲的信息,他們把這些數據跟顧客的年齡和所在地的平均收入等信息結合在一起,就能很精準地預測出,每個顧客在輸錢後仍然還會再來的輸錢金額,這個輸錢金額,就是所謂的賭徒痛點。
有了這個痛點,賭場就能在顧客痛點到來前主動出面幹預,然後用所謂的幸運服務讓顧客愉快的離開。
具體怎麼做呢?
舉個例子,張三的痛點損失是1萬,當張三在賭場輸的錢快到1萬的時候,賭場就會有個幸運大使出現,TA會告訴張三,您今天手氣不大好,您不是喜歡我們這的牛排店嘛,現在我們請您和家人免費吃牛排。張三一聽立馬就開心了,於是吃完牛排開開心心地回去了。
最後,張三成了回頭客。
這就是典型的利用數據分析的操作。有很多公司發現了這個秘訣,如果用它來提高顧客滿意度和忠誠度,我覺得挺好的,但是如果用來讓消費者持續掏腰包,我總覺得哪裡不對勁吶!
《魔鬼經濟學》裡說,數據挖掘不但能更好的預測痛點,還能準確的預測消費者具有的行為。
因此,企業就能做出個性化的服務,或者給出不同的價格。
比如,2000年媒體報導了一個事,就是亞馬遜的一個消費者刪除插件後,發現有款產品的價格一下降了近4美元。這個消費者突然就意識到,亞馬遜可能是根據顧客特徵設置了不同的價格的。也就是說,同一款產品,每個人的價格可能都不一樣。
亞馬遜的老闆貝佐斯立馬就發聲道歉,並表示他們沒有這麼做,並表示未來也不會那麼做。
但是,這個事很明顯說明,很多公司可以這麼做。
說了這么半天,是想跟大家說,超級數據分析真的太強大了,不光能預測我們想買什麼產品,還能預測我們對產品的反應。
那這是不是說,傳統的經驗就沒用了呢?
在《魔鬼統計學》這本書裡,作者表達的意思是,因為我們人類有認知缺陷,認知偏差,又普遍過度自信,所以相對而言,做決策的時候,超級數據分析是很有優勢的。
但是,超級數據分析是由數據驅動的,所以如果沒有足夠多的歷史數據,做出的決策準確度就會大打折扣。
未來當然兩者結合是最好的。
現在再想想我們當下的生活,似乎都是網際網路行為。這個世界正在迅速的電子化,這就意味著,我們的行為會被記錄成電子數據。
我媽一個農村老太太,已經通過直播下過好多次單了,她出門買東西現在也都是用微信付錢,我的侄女們還是小學生,她們已經跟手機分不開了,我毫不懷疑,等她們有了自己的手機和身份證後,會立刻就綁定信息。
農村尚且如此,更何況城市。
我也毫不懷疑,現在越來越多的公司想要預測顧客的痛點,可能網際網路比我們更了解我們自己,它們可能比我還清楚明年夏天我會做什麼。
總的來說,我覺得作者這兩句話總結的非常好,就是「當公司對質量進行超級數據分析時,他們往往會幫助消費者。當公司對價格進行超級數據分析時,我們應該捂緊錢包。」
想想這些,其實有點可怕。但是,我們就是生活在這樣的時代,就像作者說的,與其盲目反對這種強大的新技術,不如學習和參與這場革命。換個思路想一下,那是不是說,未來從事數據工作或掌握數據分析能力的人,就走在了時代的前沿,掌握了先機。
這也就是作者之所以寫《魔鬼統計學》的初衷,他希望可以向大眾灌輸基本的統計學觀念。「我的建議是,你應該用超級數據分析的基本工具武裝頭腦,而不是把腦袋埋進開始書籍的沙堆裡。」
所以,從這個角度來說,這本書還是讓我學到了不少東西的。以上也就是網際網路比你更了解自己,電商更懂你的需求的答案。