北上收入中位數6500,數據沒有反映出教育的意義,德國這樣做統計

2021-01-15 騰訊網

最近在網上面瀏覽信息的朋友應該都有看到過這張圖片:

在收入統計中採用「中位數」這個統計方法是這幾年比較流行的方法,也相對來說比平均數要更加的科學。

以北京為例,北京有2,300萬人,收入的中位數是6.9k,就意味著第1150萬人的收入是6.9k。

大家應該也有看過相關的科普視頻,在相關的統計學科普視頻中,專家經常舉的例子就是,馬雲收入一年一個億,你的收入1w,結果你跟他的平均收入是5億零5千。

當然實際的平均收入並沒有那麼的誇張,以北京為例,平均收入達到1.6w,也就是說按照平均水平,北京人人都高出中產階級標準1k多。

每次在新聞中看到這樣的數據,大家都驚呼自己被平均。但是,大家不知道從這兩個數據的差異中有沒有看出,不同教育水平的人群可能存在的收入差異。但是偏偏統計數據裡面就沒有詳細的分析出各個學歷階層的收入差距。

還是以北京為例,在北京高中錄取率約在50%,如果採用中位數來進行統計,覆蓋到的收入人群恰恰是沒有上過高中的人群的收入。北京有大學本科以上學歷的人群在總人口的比例,不超過25%,也就是說這樣的統計數據永遠覆蓋不到高學歷人群。

於是這種統計數據就變得非常的不討好,底層勞動者覺得自己被平均,中產階級看不明白自己到底處在什麼樣的位置,這兩個階層還特別關心讀書到底有沒有用,數據卻沒有反映出來。

做有意義的數據統計,看看德國是怎麼做的

我以前在做接待工作的時候,接待了德國各行各業的不同收入群體,不同教育階層的人。我發現一個有趣的現象,德國人對於自己收入階層的人的平均收入,或者收入中位數非常的了解。

比如具有博士學歷的德國人,他會非常明白,在德國具備博士學歷的人的收入中位數和平均數據。也非常了解擁有博士學歷的人,在德國的最低工資標準是多少。

這些數據肯定不是這些德國博士自己統計出來的,肯定是德國相關的統計部門,以及媒體公開出來的。

我也接待過很多學歷比較低的德國年輕人,通過和他們的交流,我發現他們對於職業教育的需求非常的旺盛。他們非常清楚自己目前缺乏職業教育的情況下,能夠拿到的收入,以及自己在獲得職業教育培訓之後,從事工作可能提升的收入標準。

這也反映出統計數據給這些低學歷的德國年輕人的職業提升點出了方向,在一定程度上促進了德國年輕人在教育上面的自我提升。

我們來看一下兩張圖片:

這張圖片反映的是德國本科學歷的人群和研究生學歷的人群,在就業後第1年以及第2年薪資的變化以及收入的差距。

左邊是本科學歷的人的收入,第1年是大概3.8W歐,右邊是研究生畢業第1年的收入,大概4.5W歐,兩個學歷之間的年收入差距大概7K歐,也就是相當於大約人民幣5W元。

工作1~2年後,本科學歷的德國人收入增加大約3.2K歐,研究生學歷的德國人大約增加1.8K歐。這反映出了工作經驗在收入提升上對學歷間收入差距的彌補作用。

德國的年輕人可以根據這樣的統計數據,對於自己要達到什麼樣的學歷,需要的付出等等,做一個預期的評估。

第2張圖是反映出德國高收入階層所在的行業的年收入中位數,這種數據詳細到每一個行業。

我們看到收入最高的標著橘黃色的是醫生年收入達到9.2W歐,約合人民幣60多萬,從這個數據我們就可以看出為什麼德國人最喜歡做醫生。第2名是搞金融的,第3名是做律師的,第4名是做銀行業的,第5名是工程師,第6名是企業諮詢師,第7名是IT。德國做IT的收入中位數大約是45萬人民幣,好像和國內大廠P7的水平差不多。其實這個數據還非常的詳細,涉及到各行各業,但是篇幅原因被我省略掉了。

從這樣細緻的統計數據,德國的年輕人就可以結合自己的興趣愛好,在選擇專業的時候對自己的未來的收入產生一個良好的預期。他們可以知道自己讀完本科或者研究生之後,可以獲得的大概收入。

德國的統計數據甚至可以避免大家盲目追求高學歷

德國各行各業的統計數據是非常詳細的,甚至詳細到某一個行業,每個學歷人群的就業率。德國有一個中國人可能不太好理解的規定,這個規定日本也模仿了。

那就是:不同學歷的人群有不同的最低工資標準,高學歷人群不得從事低學歷人群的職業。

這個時候各個學歷階層在不同行業裡面的就業率就顯得非常重要了。有些行業的老闆他不需要為高學歷的人支付那麼多的費用。對某些工作他可能會更多的使用本科學歷或者研究生學歷的群體。那麼該行業就會出現讀到博士生學歷以後,雖然工資標準更高,但是就業比例下降的情況。

這時候一部分大學生就有可能會考慮只讀到本科或者研究生就去就業,而不是一直讀到博士畢業,卻面臨更高的失業風險。

中國各行各業統計數據的現狀

目前中國各行各業以及各學歷階層的統計數據,是沒有官方數據的標準的,很多時候是由招聘服務平臺,根據企業發布的用工薪酬數據來做爬蟲分析。但是企業發布出來的薪資標準,通常是起薪或者是談判價格,這樣就會造成統計數據不準確。

比如說大家普遍認為中國的程式設計師月均收入應該在3萬元左右。但是根據某就業平臺的數據,程式設計師的平均收入只有區區1.2萬元左右。這就讓大家感到統計數據的不真實,和自己的直觀感受有很大的區別。

既然數據不真實,那麼這樣的數據就沒有辦法給正在讀書的大學生,以及家裡有學生的家長,起到指南的作用。

大家想看到什麼數據?

根據我在網際網路跟網友和粉絲們的交流,我總結出以下大家希望看到的數據:

1、各個學歷階層人群的收入中位數

比如本科畢業於985大學的人群,收入中位數能夠達到多少?本科畢業於211大學的人群收入中位數可以達到多少?本科畢業於一般一本的大學生收入中位數可以達到多少?

這個數據的價值在於可以讓學生知道一心拼985或者211,可以帶來的收入差距到底有多大?假如價值不大,那麼可以最大限度的避免,某些同學為了考985和211,在高中年復一年復讀而浪費青春的事情發生。

2、各個專業研究生和本科生收入的差距

這個數據在某些私人平臺上可以找到,但是也是根據企業發布的招聘信息來抓取的數據並不準確。某一個專業進行學歷再深造,它的價值有多大?能夠獲得多大的收入差距優勢?是非常有指導意義的。

比如,本人所讀的小語種專業,獲得等級證書的作用比研究生學歷的作用要大得多, 這就直接導致了考研人數非常的少。讀IT相關專業的同學,年齡優勢會比學歷優勢要大的多,所以學成之後儘早就業能夠獲得更大的利益。有了相關的統計數據,每一個專業的同學決定要不要考研,決定本科要不要工作的時候會有更好的參照。

3、本科以上學歷人群的收入中位數和高中以下學歷人群收入中位數之間的差距:

這個統計數據是我覺得最有意義的一個統計數據,這個數據就直接反映出了讀書到底有沒有用?

家長花很多的錢給孩子報各種各樣的培訓班,在教育上投入大量的資金,這樣的投入到底能夠換來多大的回報?孩子考上本科以後能夠獲得的薪資水平會和只有高中學歷或者高中以下學歷獲得的收入水平的差距有多大?從這樣的數據就可以看得明明白白。

4、各行業土鱉和海龜的收入差統計

各行業在國內本科畢業就業和在國外讀本科畢業就業兩者之間的收入差距,以及各行業在國內考研就業和在國外考研就業兩者之間的收入差距,這是國內中產階級家庭最想要了解的問題之一。

中產階級家庭普遍有能力把孩子送到國外去讀書,但是為了支付孩子的學費,經常會割皮掉肉,有些家庭甚至會返貧。做這麼大的付出,到底值不值得?孩子留學歸來之後,收入能不能夠有質的飛躍,從這樣的統計數據就能夠看得明明白白。

大家還希望看到什麼樣的數據?也可以在評論區留言,畢竟本人的思路也不是非常的全面。把你對於行業以及社會的數據的需求寫出來,說不定哪天這樣的呼聲就會被看到,然後你就能夠看到自己想看的數據了。本人相信輿論是有力量的。

相關焦點

  • 地學統計中的算術平均值、幾何平均值、中位數、標準偏差和標準誤差的意義和用法有何不同
    在處理分析實驗數據或採樣數據時,經常會遇到對相同採樣或相同實驗條件下同一隨機變量的多個不同取值進行統計處理的問題。此時,多數人會不假思索地直接使用算術平均值和標準差。顯然,這種做法是不嚴謹的。那麼在地學統計中不同的平均值和誤差計算方法的概念在意義和使用上有何不同呢?
  • 統計數據沒有告訴你的那些事兒
    許多人覺得統計數據就是存在於新聞裡的抽象派。統計數據?不就是每隔幾年的人口普查?是每年的GDP增幅?CPI指數?這就是文章的漏洞——看似科學的數據深究下來則是不攻自破的謠言。原來統計數據也會說謊???這麼一來,下次再買買買之前要擦亮眼睛了:那些號稱具有N年「科學臨床數據」的產品說不定也是騙人的陷阱呢。美國統計學家達萊爾哈夫在《統計數據會說謊》中,從10個方面說明了統計數據的陷阱和如何反駁看似科學的統計數據。
  • 中位數與平均數能夠直接對比嗎?
    在統計學中,中位數、平均數、眾數、總數等是不同的概念,它們分別代表了不同的數據含義。
  • 全國平均月薪和中位數月薪差別這麼大說明什麼?你到中位數了嗎?
    全國平均月薪數據出來後,很多人都說拖了大家後腿!你有沒有拖後腿呢?2020年受疫情影響,各行各業不景氣,那我們就看看2020年統計的2019年全年平均工資水平吧!由於篇幅就選擇兩張圖吧!從上面可以看出,相對而言,非私營單位平均工資要高出私營單位平均工資很多。主要是因為私營單位高低收入差距很大。很多富豪老闆屬於私營企業,而普通打工者臨時工等也屬於私營單位,這樣一平均相對數據就下來了!以上是按照年薪算的,再來看看恆大研究的80後平均月薪數據。看到這樣的月薪,很多8090後也說拖了大家的後腿。
  • 學統計:掌握統計數據描述指標,構建數據分析的基礎
    中位數:按從小到大排序,位置在中間的那個數。 幾何平均數:描述等比資料(後面取值是前面數據的倍數),變量值的乘積後,開n次方。 眾數:出現頻數最多的那個數。
  • 統計基礎概念及數據分析方法
    描述性統計:分析數據集中度和分散度推斷統計:通過樣本對整體情況作出推斷數據分析方法:聚類、回歸、分類及組件差異。描述數據的兩個關鍵點:數據的中心度,數據集中在哪個區域。常用均值,中位數和眾數來反映均值:也稱為平均數,所有數據除以數據條數,缺點,容易被極大極小值幹擾,難以反饋真實的數據情況。中位數:將數據按照大小排序處於中間位置的數字,比均值更好的反應數據的中心。眾數:數據種出現最多的數字。
  • 數據分析中『平均數』其實並不準確,是時候開始使用『中位數』了
    為了體現群眾的無知,他算出了所有猜測的平均數(而不是當時統計學家常用的中位數):1197磅。得知實際重量後他嚇了一跳:1198磅。在如今的世界裡,我們只能見到平均數的身影:紐約4月均溫為52華氏度;庫裡場均拿到30分……只有在某些統計裡(美國家庭年收入中位數為51939美金)中位數才會露下頭角。那麼,中位數是如何消失的?平均數又是如何成為了當今世界最流行的量數?
  • 一名合格的數據分析師,統計基礎不可或缺!
    數據分析的前提就是要學會觀察數據,了解數據,統計描述包括對數據的圖表描述和統計量描述,它能讓我們對數據有一個直觀的認識,比如數據是否完整、是否存在異常、服從什麼分布、存在什麼規律等,為數據預處理和數據分析做準備。內容框架一. 圖表描述1.
  • 全國居民收入排行榜出爐!你拖後腿了嗎?
    上海、北京人均可支配收入最高  在全國省份中,也就是上海、北京的人均可支配收入超過5萬元。  這點毫無疑問,作為老牌一線城市,北上廣深一定是收入最高的城市。  不過,因為是按照省份統計,所以沒有廣州和深圳的數據。
  • 初中數學統計:平均數、加權平均數、中位數、眾數、方差的計算
    平均數的計算平均數是描述一組數據的常用指標,它反映了這組數據中各數據的平均大小或是集中趨勢。一組數據的平均數只有一個。點撥:當所給的數據組比較離散時,一般選用基本方法中的公式計算算術平均數;當所給的數據有多個重複出現時,一般選用加權平均數公式計算平均數;當數據較大、較多且在某一個常數a附近擺動時,用新數據法中公式計算平均數比較容易.中位數的計算一般地,n個數據按大小順序排列,處於最中間位置的一個數據(或最中間的兩個數據的平均數)叫做這組數據的中位數。
  • 2019年上半年全國居民人均可支配收入中位數13281元 增長9.0%
    其中,城鎮居民人均可支配收入21342元,增長(以下如無特別說明,均為同比名義增長)8.0%,扣除價格因素,實際增長5.7%;農村居民人均可支配收入7778元,增長8.9%,扣除價格因素,實際增長6.6%。 上半年,全國居民人均可支配收入中位數13281元,增長9.0%,中位數是平均數的86.8%。
  • 10分鐘讀完《統計數字會撒謊》
    事實上,平均數不僅是簡單意義上的算術平均數,還包括了中位數和眾數:算術平均數:又稱均值,是將所有數據加總後除以樣本數得來的結果(合伙人和職工的工資加總進行平均),也是平常意義上的平均數。中位數:它指這樣一個數,在所有的樣本裡,一半的值在它之上,而另一半在它之下(高收入的所有者和低收入的職工中位於中間的、相對較小的收入值)。
  • 中國城鎮居民收入34年實增10.5倍 年均實增7.4%
    >   近日有媒體援引數據稱,城鎮居民收入34年增長了71倍。馮怡琳強調,反映居民收入實際增長情況要扣除價格上漲影響,在分析居民收入數據時,不但要看名義增長率,而且更應關注同時發布的實際增長率。  據馮怡琳介紹,國家統計局每年會對十幾萬戶居民家庭直接調查,從1978年到2012年,扣除物價上漲因素後,全國城鎮居民人均可支配收入實際增長10.5倍,年均實際增長7.4%。此外,全國農村居民人均純收入實際增長10.8倍,年均實際增長7.5%。
  • 數字困惑——統計與我們的生活
    二戰時,有位數學家被關進了集中營,德國士兵奪走了他的一切,卻意外地留給了他一枚硬幣,或許這是對他數學家身份的「優待」。作為一個數學家,在集中營裡他能做什麼呢?「死」也躲不開的統計統計就是通過大量的數據在某些看似沒有規律的事件中找出運行的規律,準確的統計數據能幫助我們對紛繁複雜的社會現象進行定量分析,從而為我們在做預測時提供參考。正因為如此,統計已經進入人類社會生活的方方面面。我國每10年會進行一次全國人口普查,到時候會有大量的志願者敲開各家各戶的大門,讓他們填寫表格。
  • 統計學之描述性統計 | Descriptive Statistics
    常用的集中趨勢統計量(statistics)有:§ 算數均值§ 中位數§ 眾數再強調下,在統計學中,這三個統計量都有 average(平均) 的含義。現在假設你要對兩家公司員工的收入水平進行對比,你會如何做呢?
  • 數據不滿足正態分布——如何計算中位數(四分位數間距)
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • 中國人的收入有多「灰」?
    這與記者在歐洲工作時了解到的情況異曲同工——說起「灰色收入」,法國人首先想起的是非法勞工的報酬,而且主要是中國人。而德國科隆大學的經濟學教授馬加特甚至向記者提供了一個精確的數字——因為非法勞工的工資都不申報,德國每年損失的稅收和社保支出約70億歐元(德國給非法入境者也提供最低保障,如果他還沒有獲得合法收入的話)。
  • 數據不滿足正態分布--如何計算中位數(四分位數間距)
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用
  • 你可能會遇到的平均數、中位數和眾數
    統計數據無處不在,我們每天都會遇到。無論喜歡與否我們都要用到統計數據。要知道你到底在說什麼已故統計天才漢斯·羅斯林(Hans Rosling,1948—2017) 指出,在瑞典生活的人平均擁有不到 2 條腿。所有人的腿都不超過 2 條,少數人少於 2 條,所以平均之後略低於 2 條。
  • 統計學入門級-描述性統計理論
    在高斯分布(正態分布)中,眾數位於峰值,和平均數、中位數相同。一般情況下,只有在數據量比較大的情況下,眾數才有意義。四分位數是一組數據排序後處於25%(下四分位數)和75%(上四分位數)位置上的值。箱線圖就是利用數據中的五個統計量:最小值、上四分位數、中位數、下四分位數與最大值來描述數據的一種圖。額,箱線圖經常應用在識別檢測異常值方面。