每周一本書丨簡單統計學:如何識破一本正經的胡說八道

2020-12-04 一迦之言

第127篇讀書筆記

28/52(2019)

一看這本書,就被書名所吸引。特別是它的副標題——如何識破一本正經的胡說八道。

現在自媒體流行,信息傳播非常迅速。其中,有一種對大家危害特別大。這就是偽科學的流行。證偽的成本是如此之大,所以,偽科學很難識破。對於我們普通人來說,如何聽信了那些偽科學或者是謠言,那麼,輕則影響我們的判斷,重則影響我們的健康,甚至生命。

前段時間有個人特別出名,伊莉莎白·霍爾姆斯,名字你可能不熟悉,但是提起「美國版權健」,你可能有所耳聞,這位全球有名的女騙子靠著「即時驗血」這種子虛烏有的技術,騙過了很多大咖,甚至美國前總統歐巴馬都命她為「美國全球創業大使」,柯林頓等曾和她一起出席訪談,談笑風生。就因為她的公司擁有一種技術,可以只抽一滴血,就能檢驗出300項生理指標,大大提高當代醫療服務的效率。

這個騙局影響了很多人,讓很多人損失慘重,甚至延誤了病情。

我們應該如何提高識破騙局的能力呢?作者的答案是懂點簡單統計學。

《簡單統計學》一書,就是一本幫助我們輕鬆拆穿日常生活中的數字謊言的防騙指南。

作者加裡·史密斯在書中為我們列舉了10餘種數據作假方式,比如當年轟動世界的神算子——章魚保羅的騙局、比如癌症發病率與居住地關係等。其中與我們關係最為密切的三個騙局分別是:數據選擇過程中存在自選偏差;數據統計中存在不可避免的偶然性,以及人們會根據自己的理想對數據進行別有用心地處理。

一、這些騙局大致可以分為兩類:

一類是由於不可避免的自然原因或數據樣本採集過程中不可避免的局限性而導致的數據欺騙,比如偶然性因素對數據的影響;另一類則是人們為了達到某種目的或實現某種目標而對數據進行別有用心地收集和解讀,比如忽略掉不符合自己期望的數據。

二、出現統計結論錯誤的原因

1、 低估隨機事件的發生概率。2、 被數據欺騙。3、 我們有產出錯誤結論的動機。

三 、常見的統計錯誤結論

1、自選擇偏差。指的是在研究過程中因樣本選擇的非隨機性而導致得到的結論存在偏差。如果我們在比較做出不同選擇的人,同時不去考慮他們為什麼做出這些選擇的時候就會出現自選擇偏差。比如參加體育活動的孩子比較自信,並不能說明體育運動能增強自信,也許有自信的孩子更願意參加競爭性的活動;大學生的平均工資高於高中生,可能有一部分原因是他們更加聰明更加有抱負。

2、倖存者偏差。我們會觀察人們的工作、遊戲和生活,而且我們會自然而然地根據我們看到的現象得出結論。我們的結論可能會失真,因為這些人所做的事情是他們自己選擇的。我們觀察到的特點可能並非源於活動,而是反映了選擇這種活動的人的個性。

3、變形的圖像。圖像可能會扭曲和破壞數據。圖像可以揭示某種模式,比如收入隨時間的變化以及收入與支出的相互關係。圖像也會扭曲數據,誤導讀者。當心將數軸上的零點忽略掉的圖像。這種忽略可以將圖像放大,顯示出之前由於解析度問題而無法發覺的模式。不過,這種做法也會放大數據的波動性,可能產生誤導效果。最糟糕的是數軸上沒有數字的圖像,因為我們無法判斷數據的波動性得到了怎樣的放大。

四、如何識辨和避免這些錯誤

1、保持懷疑。當某人向你展示某種模式時,不管這個人的履歷多麼令人震撼,你都應該保持懷疑,問一問「為什麼」。不管遇到怎樣的模式,你都應該思考:為什麼會出現這種模式?特別是對於天馬行空的反直覺的理論,應抱有極為謹慎的懷疑態度。另外如果兩種事物之間沒有合理的聯繫,那麼即便他們數據上呈現相關性,也不能證明有因果關係。

2、注意數據的完整性和真實性。在研究中遺漏數據是一個危險信號,因為一些數據被丟棄或者「調整」,可能是因為他們對理想結果相矛盾。

3.比較是實證研究的生命線。在與某種替代方案進行比較之前,我們無法確定某種藥物、療法、政策或策略的有效性。不過,請當心膚淺的比較,包括對於大數和小數百分比變化的比較,對於除了隨時間增長以外沒有其他共同點的事物的比較,以及對於無關數據的比較。這些比較就像蘋果和李子幹之間的比較一樣。

4.具有爭議性的論斷之所以具有爭議性,是因為它們違反直覺——這是一個很好的懷疑理由。當你聽到這樣的說法時,不要輕易認為自己是錯誤的。具有爭議性的論斷很可能應當被丟棄。考慮數據是否存在問題,比如自選擇偏差。考慮因果關係是否應該顛倒過來。哦,對了,還要考慮出現錯誤的可能性(比如人們讓計算機計算 196 的平方根,而不是 169 的平方根。即使是最優秀、最誠實的研究人員也是人),而人總會犯錯誤。

5.仔細觀察並考慮混雜因素,如果一項研究支持你的觀點,你會自然傾向於會意地點點頭,認為你的觀點得到了證實。更加明智的做法是進行仔細觀察並考慮混雜因素。當一項研究看上去不合理時,你也應當採取這種做法。例如,伯克利研究生錄取政策歧視女性的說法看上去是合理的。不過,當人們開展深入調查,以確定問題最嚴重的院系時,他們發現了意想不到的現象——實際上,這些院系傾向於優待女性申請人。女性的總體錄取率之所以偏低,是因為她們更喜歡申請錄取率較低的教育計劃。由於潛在的自選擇偏差和混雜因素,觀測性研究存在固有的挑戰性。應時刻對利用數據發現理論的研究保持警惕。

6.我們喜歡在數據中尋找模式並為我們所看到的模式編造一些理由,這是無法避免的事情。因此,我們很容易相信好手感和差手感的說法是真實的,相信成功率會出現極大的波動。記住,即使在隨機的拋硬幣實驗中,也會出現僅僅來自巧合的、引人注目的連續成功和連續失敗現象。好手感和差手感很可能的確存在,但它比我們想像的要小得多。

7.均值回歸。當學術能力或運動能力等特點得到不完美測量時,觀測到的表現差異會誇大實際能力差異。表現最優秀的人與平均水平的距離很可能不像看上去那樣遙遠,表現最為糟糕的人也是如此。因此,他們隨後的表現將會朝著均值回歸。均值回歸也不意味著能力向均值收斂、大家很快就會具有平均水平,它僅僅意味著極端表現在經歷好運和黴運的群體之間輪換。

8.我們經歷糟糕的運氣時,我們希望自己能夠轉運。我們的黴運不可能永遠持續,但發生在我們身上的壞事並不會自動提高發生好事的可能性。要想改變運氣,我們通常需要改變自己的行為。例如,如果我們在找工作時不斷遭到拒絕,我們應當考慮如何更好地表現自己,或者考慮申請不同的工作。正負相抵只是一個笑話,不是值得信賴的規律。

9.某種理論與數據聚集現象相符並不是一種具有說服力的證據。人們發現的解釋需要言之有理,而且需要得到新數據的檢驗。

10.對於看上去天馬行空的理論,應當抱有極為謹慎的懷疑態度。

11.不要把資金押在歷史模式以及幾乎沒有合理解釋的關係上。

12.我們既需要理論,也需要數據。不要僅僅被其中的一種事物說服。如果有人通過搜刮數據發現了某種模式,我們還需要一種合理的理論。另一方面,在經過令人信服的數據檢驗之前,理論僅僅是理論而已。不管一項研究是誰做的,它都需要通過常識性檢驗,而且需要通過沒有被數據挖掘所汙染的無偏數據的檢驗。

總結一下:

三條防騙指南

第一條:要讀數據,更要讀數據背後的原因 ;第二條:要有意識地尋找兩種事物之間的合理聯繫;第三條:無論什麼時候,都要記得對拿到的數據進行檢驗。

思考200個問題:26/200,持續寫作,思考人生。

你點的每個贊,我都認真當成了喜歡

相關焦點

  • 竟然還能這樣一本正經地胡說八道!
    竟然還能這樣一本正經地胡說八道!高鐵確實輻射嚴重,未婚女性少坐》,國務院國資委回應「竟然還能這樣一本正經地胡說八道」。  熱評丨遏制網絡謠言 打擊網絡造謠者的囂張氣焰  雖然這是一則徹頭徹尾的謠言,但還是在社交媒體傳播開來。而且這樣的謠言並非首次出現,隔一段時間,便會「換湯不換藥」再次出現。  網絡謠言往往傳播迅速,一旦在網絡上形成傳播,往往措手不及。
  • 偽科學假說大賽:一本正經的胡說八道,順便搞個大新聞
    如果你只是不經意路過時瞟了一眼,也許會認為這是一場一本正經的科普活動、演講或者發布會吧。那你可就錯了。科學倒是真有,智慧也不少(從某種意義上來講更多)——不過,看看演講的題目:「為了更好地奴役人類,貓兒會演化出第六個腳趾」,「要讓物理實驗更穩定,我們應該暫停地球自轉」,「如何利用音樂節的人流規律進行超高效率的計算」,以及「人們進化出現在的體型,是為了更有效率地擠在一起」……毫無疑問,這些都是偽科學,不過都是光明正大的偽科學。
  • 如何讀好一本書?「樊登讀書」創始人的秘訣是……丨21讀書
    來源:21世紀經濟報導每周一本書讓閱讀,豐滿人生面對大量書籍和信息,怎樣挑選值得閱讀的書、怎樣高效閱讀圖書,從中提取自己需要的信息成了我們不得不思考的問題。21讀書來源丨本文內容綜合選自《讀懂一本書:樊登讀書法 》編輯丨阿巷;實習生 思純圖片來源丨《讀懂一本書:樊登讀書法 》,網絡每本書都有自己的使命,而讀書的過程就是人為地弄清楚一本書解決了什麼問題,抓住一本書的脈絡和重點
  • 一本正經的胡說八道,這劇為了八卦名人也是蠻拼的!
    學長說的是腐國SKY臺出品的短劇——《都市傳說》看這個畫風就知道是不同尋常的故事,全程都在一本正經的胡說八道。塞繆爾·貝克特要建一所別墅,請來包工頭來規劃說,三個月可以完工。後面幾集還沒出來,靜待···《都市傳說》是那種上來一臉懵逼,然後越看越有趣的劇。世界名人非同尋常的故事,多數應該是編劇的惡搞,像是挖掘名人的軼聞趣事。
  • 統計學是什麼?| 統計學七支柱
    此外,本書還有一個目的:闡釋統計推理的核心思想。將這七個原則稱作「統計學的七大支柱」之前,我先強調,它們是七根「支撐」的柱子,是統計學的學科基礎,而不是完整的體系。一方面,這七根支柱都有古老的起源;另一方面,現代學科通過自身結構的偉大獨創性,以及華麗承諾不斷產生的精彩的新思想,將統計學構建為多元化的科學。
  • 看完這29條神回復,我終於確信易烊千璽是一本正經地胡說八道!
    這只在臺上脫衣、露肉、熱舞、頂胯的大帥哥,在臺下最愛幹的事竟是一本正經的胡說八道!!在微博上,千璽有事沒事就喜歡扮演高冷逗比。一說話小刀就從嘴裡嗖嗖飛出去,走過路過的姐姐阿姨們可要多留神哦!千璽的小段子還有很多,而且一直在增多!比如:- 平常生活中喜歡做什麼?- 呼吸啊!- 粉絲的什麼行為會讓你感動?- 提醒我穿秋褲。- 形容一下火車吧?- 上面臥鋪,下面臥軌。- 千璽你弟弟的名字是什麼?- 也姓易。
  • 一本正經胡說八道--SCP基金會
    可能很多人和我一樣,打開網站後一臉懵逼,所以在介紹幾篇SCP最出名的文章之前,先簡單講一些SCP中常見的名詞和梗,方便大家入坑。1.O5議會(OverseerLevel 5 Council,監督者五級議會)O5議會是基金會的最高權力機構,其中的成員被編號為O5-1到O5-13。
  • 一本正經的胡說!國外驚現神話生物解剖著作
    【環球科技綜合報導】「一本正經的胡說八道」出自對日漫《約會大作戰》開場旁白的吐槽:以第一季TV未放送話#13 OVA配信之後開始廣為流傳。通俗來說的話,就是胡說八道說的像真的一樣,讓人看不出來。
  • 如何識破越南鐵木菜板騙局
    但是要是說到如何去識破越南鐵木菜板的話,還是有著非常多的方式。首先來說去了解一些關於越南鐵木菜板的知識,當自己都用的越南鐵木菜板的方方面面有著非常清楚的了解之後,就能夠知道自己所購買到的越南鐵木菜板是不是真的,比如說在購買的時候可以從它的外觀去辯解。
  • 被當作貶義詞的胡說八道其實是正能量,你知道具體是哪八道嗎?
    胡說八道承蒙各位看官不嫌棄,小弟不才,在此胡說八道,若是胡說的好呢,就給小弟我來個三連,關注、點讚、收藏,若是小弟說的不好,您就當看了一篇胡說八道的塗鴉,別傷了您看文章的雅興。#佛教文化#一本正經的胡說八道
  • 《如何閱讀一本書》:超詳細閱讀聖經,解決你所有的閱讀難題
    最近一直在讀莫提默·艾德勒和查爾斯·范多倫合著的《如何閱讀一本書》。艾德勒曾擔任1974年第十五版《大英百科全書》的編輯指導,並因此聞名於世。查爾斯與艾德勒一起共事後,一邊幫助艾德勒編輯《大英百科全書》,一邊對《如何閱讀一本書》1940年初版內容進行改寫修訂。
  • 做數據分析不懂統計學很可怕!
    原標題:做數據分析不懂統計學很可怕! 做數據分析最最最基礎的就是統計學,工具的操作只是幫你快速業務流程梳理出關鍵性的分析和指標體系,那麼這些體系和指標的度量和之間的關係就要依靠統計學去界定和規範 我們經常看到某某行業,某某公司的平均工資是每年20萬什麼的,然後如果恰恰自己又在這個行業中,看看自己的工資條,有些人會不會感到有點迷惑和不滿?
  • 萊大《物理學腦洞雜誌》你們感受下什麼叫一本正經的胡說八道...
    當然要是說人話的話,也可以把它翻譯成「物理學腦洞雜誌」 裡面刊登的文章,都是各種各樣的腦洞話題…比如【三隻小豬裡的大灰狼要吹多大的氣才能吹到最後一棟房子】最後由編輯委員會決定今年這一期的最終內容,形成一本正經的科學雜誌。 在這個過程中,學生將經歷選定研究方向,論證研究內容,編寫研究報告,同業審查,發表科研成果這一系列作為專業物理學者真正要經歷的幾個階段。
  • Justin一本正經「造謠」,Tin寶生了四隻小貓?NANA的回答很一致
    Justin和主持人一同走向了舞臺中央,主持人也是很幽默,一開口就在吐槽Justin了,原來臺下NANA們的尖叫聲並不是送給Justin的,而是送給tin寶的,看來Justin的「地位」已經沒有tin寶重要了!哈哈哈~當然,對於粉絲們喜愛的Tin 寶,主持人肯定不會放過這個機會,便開口問Justintin寶現在怎麼樣呢?
  • 《諸天之開局被識破》:穿越本源洪荒世界,遮天盤龍只是投影而已
    《諸天之開局被識破》,老老炮兒,4級作者。分類:科幻-時空穿梭。【簡介】無。【簡評】主角古坤,之前是一個網文作者。鎮元子識破主角的身份,知道凡是穿越者必自帶系統。主角的系統激活,需要綁定金手指。鎮元子直接拿出四個可以綁定系統的金手指,給主角的是青銅門。也就是類似《盤龍》世界的一個東西。
  • 「超智·挖坑」簡單談談統計學
    我日常的工作,就是在超智星球上,挖坑、撒種、埋土、澆水、收穫等一系列開荒工作(學習分享,整理知識資料)本期,我挖的坑是"統計學",它將是我們超級智能欄目-《人工智慧STEM》系列的第一門課程。我挖了坑。總會先講下為什麼挖這個坑,然後開始播種。至於要不要澆水、種植、收穫,全由您個人判斷。本文的目的,就是希望能幫助您簡單判斷下,您會不會對統計學這個坑有興趣。
  • 好逸惡勞,不是你的本性|每周一本書
    在總裁讀書會精品課上,楊秀龍為我們推薦了《幹法》這本書,這周小書僮陪你一起來精讀這本書。《幹法》是稻盛和夫以78歲高齡出任日航CEO之後推出的第一本書,也是稻盛和夫首次與讀者分享自己在工作上的做法和心得。該書在日本一經出版,不到一年再版19次,月銷量最高達到20萬冊。
  • 就業篇丨統計學類:開啟數字人生新篇章
    這一講我們開始介紹統計學的就業情況。在大數據的推動下,統計學專業受到追捧,今天我們就向大家具體介紹統計學本科畢業未來可選擇的就業方向。  在美國,統計學專業屬於熱門專業之一,尤其是統計學的碩士和博士。根據美國統計協會的數據來看,統計學畢業生主要在醫藥健康、公共健康、商業、計算機科學、經濟、工程、金融、保險、製造業、市場、質量改進和風險評估等行業工作,加州大學伯克利分校的統計學碩士畢業生平均工資達到80,871美元。
  • 統計學知識大梳理(終極篇)
    目標一:構建出統計學需要掌握的知識框架,讓讀者對這個知識體系一覽無餘。目標二:儘量闡述統計學每個知識在數據分析工作中的使用場景以及邊界條件。我的理解,《概率論與數理統計》更專業一些,偏理工科,會有大量公式的推導,知其然,知其所以然;而統計學這本書更基礎,側重於概念現象的解釋,一般會直接給出結論,而不要求掌握結論的數理推導過程,文理科皆可用。但不管是哪門課程,前期都是先講概率和概率分布。概率論是統計學的基礎,而隨機事件的概率是概率論研究的基本內容。