近日國家統計局數據顯示中國目前有4億人在健身鍛鍊身體,據《2019運動消費趨勢報告》和公開數據測算,還有一億人在假裝健身。相信這兩個公開的數據引起了不少人心中的疑惑——為什麼我身邊10個人裡面最多只有兩三個人在健身,同時健身房裡明明還有一半的人不是在吹水就是在自拍,這難道不算是在假裝健身?
統計是怎麼一回事?
統計在國家經濟生產和人民生活中具有信息、諮詢和監督三大職能:信息職能是指統計機構或工作者根據統計研究對象的特點,採用科學的方法採集、整理、分析、儲存、傳遞大量的反映客觀現象數量特徵和發展規律性的信息資料,為國家管理、企業經營和科學研究提供基礎資料;諮詢職能是指統計機構或工作者對其所掌握的豐富信息資源,根據國家管理、企業經營和科學研究等需要進行深度開發,提供各種可供選擇的諮詢建議和對策方案;監督職能是指統計機構或工作者通過對客觀現象的數量採集和分析研究,及時、準確地反映社會發展和企事業單位的經營與管理狀態,並依據國家、部門及有關單位的政策、規劃、管理措施和評價標準,對其實行全面、系統的定量檢查、監測和預警,以促進社會經濟和企事業單位的經營與管理按照客觀規律的要求快速、持續、健康地發展。
了解過統計的基本職能也就能理解為什麼國家統計局會關心中國14億人口有多少人在健身的問題了,至於如何得出4億人在健身的數據就要看統計工作的四個基本程序:統計設計、統計調查、統計整理、統計分析。四個基本程序也就是一個從定性認知開始,經過定量認知,再到定性認知和定量認知相結合的過程,這屬於認知論的範疇。
不是說好了聊統計嘛,怎麼又扯上認知論了呢?
這裡簡單的說明一下,統計是一門科學。科學講究嚴謹,統計的研究方法是嚴謹的科學但是統計數據的來源及其質量可是不那麼「嚴謹」的。
統計數據的直接來源一個是專門組織的調查另一個就是科學實驗。科學實驗這個好說,這樣的數據是來自於客觀存在的事實,專門組織的調查是一種人為設計的數據採集方式主要分為重點調查、抽樣調查和典型調查。
重點調查:通過對重點單位進行調查,掌握總體的基本情況;這種方式無法推斷出總體全面的情況。
抽樣調查:通過對部分單位進行調查來推斷總體的數量特徵;由於對部分單位的調查採取隨機原則,就會存在給定概率和誤差範圍。典型調查與此類似並且還存在人為判斷典型單位出現的主觀因素造成的影響。
另外統計數據還有間接來源的獲取途徑,這主要是指通過一定的渠道去獲取別人調查或者科學實驗所取得的統計數據。個人認為本來別人的統計數據就因為調查方法不同以及調查的局限存在各種各樣的問題,這樣的間接數據往往只能說是收集起來方便、快捷其他的意義不大。
總的來說不管是國家統計局還是哪個研究機構作出的中國14億人口4億在健身的數據這一定是通過對部分數據進行抽樣調查結合其他數據來源及手段進行綜合統計分析得出的,這個數據只是對現實情況的大致判斷。
這種統計調查的誤差是不可避免的只能修正,當然也存在這樣一種極端情況——對所有中國人一個不落下地進行實地觀察——那我就無話可說了。
統計數據不準確你的感覺就對了嗎?
1997年8月的一個夜晚,亨利·保羅駕車從麗茲酒店的後門駛出,隨後沿塞納河方向的巴黎高速公路行駛。車上的乘客是黛安娜王妃和她的伴侶法耶德以及他們的保鏢,汽車行駛得飛快,在進入一條隧道的時候發生了嚴重的車禍。隨後的幾周時間裡,人們無休止地分析和爭論,到底是什麼原因導致這場車禍?大批的民眾及新聞媒體都將矛頭指向了狗仔隊,甚至有的人還明確指出就是狗仔隊拍照時的閃光燈影響了亨利·保羅。然後經過仔細的調查發現,亨利·保羅從麗茲酒店出來時已經酩酊大醉。
這是一個典型的基本歸因錯誤案例,相信大家看完都能夠了解到什麼是基本歸因錯誤。
現在我們反過來思考這樣的一個問題,依據主流社會學及心理學觀點我們每個人的人際交往圈子一般在150人以內,一旦超出這個範圍往往會逐漸喪失交往的密度。國民級社交應用APP微信好友上限也就是5000人,我們大多數普通人一般微信好友是不會加滿的。我們能否以個人的人際交往圈子來判斷整個國家的統計數據呢?
以個人人際交往圈子的體量來判斷國家統計數據不準確這是基本歸因錯誤,統計數據的不準確這是統計調查自身的誤差造成的這是兩個不同維度的問題。