淺談生活中的正態分布和二八法則

2020-11-22 騰訊網

在上篇文章《生活中的偶然性和均值回歸》中提到,生活中充滿了偶然性,但隨著時間的延長會發生均值回歸現象。那麼具體到某一時間點上,生活中的某個具體事情,社會上所有人的情況會是怎麼樣的呢?例如T1時間點上,所有家庭的財富情況是怎樣的呢?

偶然性和均值回歸

關於社會現象的分析研究,從17世紀以來,一直是很多人的夢想,他們嘗試著把物理天文等領域的研究方法,應用在社會領域,從而發展出了統計學。「統計」一詞源自德語單Statistik,1770年被翻譯引人英語的,「被稱為統計的這門科學告訴我們,在已經探知的世界中,所有現代國家的政治組成是如何的」。1828年,諾亞·韋伯斯特的《美國詞典》中統計學的定義是「有關社會狀態、民族或國家中人們的情況、他們的健康狀況、壽命、國內經濟、藝術、財產與政治影響力以及國家的狀態等事實的集合」。在幾百年的統計研究中,發現關於生活中各類「值」的分布有很多種,但影響最大最普遍的是兩種分布,一個是正態分布,一個是冪次分布,也就是二八法則。

正態分布是最早進入研究人員視野的,拉普拉斯、奎特雷、巴卡爾等人發現人的身高、體重,壽命,胸圍等等都符合正態分布的規律,一度試圖用「平均人」的概念來解釋整個社會,雖然沒有完全成功,但深遠的影響了很多後來學者,例如達爾文等。正態分布正如下圖所示,在均值附近的數量最多,偏離均值越遠,數量越少。

正態分布

這種現象,在工作和生活中隨處可見,例如你每天早上在門口早餐店買的包子,每天不可能相等,某天稍大一點,某天稍小一些,但總在一個均值附近徘徊,特別大或特別小的時候很少。大量可重複的很多事情大都符合這種分布,比如,在工業生產中的M16螺絲的直徑,45#鋼的含碳量,每個工人的日產量等等;在生活中的每天喝水量,每個人的飯量、睡眠時長等等;在經濟領域的普通工薪階層的收入、外賣小哥的日送單量、計程車司機的日裡程數等等。無論在哪個領域,符合正態分布的這些事情,都滿足一個條件:有標準。例如身高的標準是人類的基因,45#鋼的標準含碳量是0.45%,睡眠的標準是8小時,不管科不科學,大家會有意無意的參考;普通工薪階層的收入就是生產力水平的體現,而且普通工薪階層的工作都是相對比較標準的,換個員工一樣能夠幹好,說不準還幹的更好,沒有哪個普通工薪者的工作是不可替代的。有標準了,就可以大量重複,自然就符合正態分布。因為有標準,所以這類事情有兩個特點:1、可預期,2、可替代性強,最後的結局是:大家都差不多。一個叉車工的工資是另外一個叉車工的10倍,這是不可能的。

二八定律又稱冪次分布,是19世紀末20世紀初義大利經濟學家帕累託發現的,所以在經濟領域也叫做帕累託分布。帕累託最早發現:社會上20%的人佔有80%的社會財富,進一步的研究,他發現在很多領域都符合這種現象:如下圖所示,在任何一組東西中,最重要的只佔其中一小部分,約20%,其餘80%儘管是多數,卻是次要的,因此又稱二八定律。

二八分布

生活中這種現象也隨處可見,比如餐飲飯店,如果仔細觀察,就會發現生意很火的餐飲飯店只佔20%,但卻掙取了餐飲行業80%的利潤。剩餘的80%餐飲飯店都是生意一般或慘澹。生活中不可重複的很多事情都符合這種分布:比如工業生產中的質量問題,20%的因素導致了80%的質量問題,如果這20%的因素被發現並解決了,這些因素也就不會發生了,但下次出現質量問題,可能是另外不一樣的20%關鍵因素導致的;生活中20%的決定影響了您80%的生活,這些決定一但做出就過去了,不會再有機會;20%的歌手賺取了80%的收入,歌手一但成名,收入飛速上漲,對絕大部分歌手來說,沒有機會成名,即使對成名的歌手來說,一生也就一次成名的機會,一但沒落了,就很難再次成名;經濟領域20%的企業賺取的80%的利潤,企業一但佔據領先優勢,依靠著資金、運營或品牌優勢,不斷地打壓對手,市場份額和收益越來越高,隨著網際網路的發展,這種趨勢越來越嚴重,出現了一九分布,甚至是贏者通吃的現象。但對很多企業來說,成功也只有一次機會,再次複製,很難成功,這也就是為什麼很多成功企業,死在了多元化的道路上。符合二八分布的事件都滿足一個條件:影響因素眾多且不明了。因為影響因素眾多,很難對所有因素進行全面的把握,但憑藉著相對實力和運氣,有些競爭者會脫穎而出,佔據了相對優勢,越來越強,從而收割了80%的行業收益。所以這類事情有兩個特點:1、不可預期,2、可重複性差,強者愈強。一個當紅歌手的收入是一個普通酒吧歌手收入的幾萬倍,也是完全可能的。

我們做事情的時候,首先要知道我們做的事情是符合什麼分布的,在此基礎上,給予合理的預期,這樣才能保持心理平衡,愉悅的生活。比如我們從事一份穩定的工作,其收入符合正態分布,大概率我們只能維持普通中產的水平,但如果我們想靠穩定的工作發財,很有可能就會走上犯罪的道路了。如果我們想從事「作家」這份職業,其收入符合二八分布,大概率我們的收入很悽慘,很可能僅靠稿費,連基本生活都很難保障,所以我們要想好收入很低狀況下的對策,是靠有錢的爹?還是靠另找一份穩定的工作?當然一但成名,收入還是非常不錯的。對於初出社會的普通人,最好從符合正態分布的穩定事情做起,等做好穩定了以後,有條件了,再嘗試符合冪次分布的有挑戰性的事情。但是,隨著社會越來越富足,基本生存已經不再是挑戰,甚至社會福利就可以養著您,這時候尋找到自己想要挑戰的事情,就顯得很重要了,因為生存是生命最有意義的事情,當這件事不再有意義了,那麼尋找其他有意義的事情就非常重要了。

相關焦點

  • 神奇的正態分布
    1733年,為了回答賭徒提出的賭場掙錢期望問題,棣莫弗基於兩位賭徒的獲勝概率,就二項分布的計算方法和隨機變量X落在二項分布中心點一定範圍的概率問題進行了數學推導(由於惠更斯(christiaan huygens)、帕斯卡(Blaise Pascal)等人研究了平均情況下一個賭徒期望自己能夠贏得多少錢,故總體均值也被稱為數學期望)。
  • 內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布
    內容範圍:正態分布,泊松分布,多項分布,二項分布,伯努利分布簡述:正態分布是上述分布趨於極限的分布,屬於連續分布。其它屬於離散分布。伯努利分布(兩點分布/0-1分布):伯努利試驗指的是只有兩種可能結果的單次隨機試驗。如果對伯努利試驗獨立重複n次則為n重伯努利試驗。
  • 大自然遵循正態分布 隨機佛系存在規律
    今天和大家聊下正態分布,自然界的一個普遍規律。隨機佛系我們知道生活中存在很多隨機事件,比如路邊行人的身高,拋硬幣時出現的正反面,彩票中獎等等。正態分布的英文是 Normal Distribution,英文原意取 Normal 意思就是正常的,自然的分布。正態分布也稱常態分布,由於高斯對正態分布的貢獻及影響極大,正態分布又名高斯分布。
  • 冪次法則(power law) 在生活中的應用
    當二邊均取對數(log)時,公式成為log(R(x)) = log(a) – b˙log(x)。若以log(R(x))為X軸,log(x)為Y軸,其分布圖呈直線,斜率為負。斜率之絕對值越小,代表規模差異越小。彼得·蒂爾的冪次法則也有大家熟知的另外一種表述:用80%的精力做20%的事。
  • 最接近神的數學公式—正態分布
    為什麼那麼多關於數據科學和機器學習的文章都圍繞正態分布展開?本文作者專門寫了一篇文章,試著用易於理解的方式闡明正態分布的概念。機器學習的世界是以概率分布為中心的,而概率分布的核心是正態分布。本文說明了什麼是正態分布,以及為什么正態分布的使用如此廣泛,尤其是對數據科學家和機器學習專家來說。我會從最基礎的內容開始解釋,以便讀者們理解為什么正態分布如此重要。
  • 高中就開始學的正態分布,原來如此重要
    為什麼那麼多關於數據科學和機器學習的文章都圍繞正態分布展開?本文作者專門寫了一篇文章,試著用易於理解的方式闡明正態分布的概念。機器學習的世界是以概率分布為中心的,而概率分布的核心是正態分布。本文說明了什麼是正態分布,以及為什么正態分布的使用如此廣泛,尤其是對數據科學家和機器學習專家來說。
  • 多個變量結果的正態分布 - CSDN
    多元正態分布也稱多元高斯分布。如同正態分布在單變量分析中的地位類似,在對多個因變量(多元)同時進行分析時,常常假設因變量組合成的向量服從一個多元正態分布。比如重複測量數據將重複的測量結果(比如各個時間點上的測量結果)視為不同的因變量,可以採用多元方差分析,此時就要求各個因變量的組合向量服從多元正態分布。對多元正態分布的判斷通常採用的邊際分布來判斷,即每個因變量的分布呈正態或近似正態。
  • 為什麼數據科學家都鍾情於最常見的正態分布?
    高斯分布(Gaussian distribution),也稱正態分布,最早由A.棣莫弗在求二項分布的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度導出了它。P.S.拉普拉斯和高斯研究了它的性質。是一個在數學、物理及工程等領域都非常重要的概率分布,在統計學的許多方面有著重大的影響力。
  • 到底什麼是二八法則,對我們有什麼啟示?
    近來讀書看報,屢屢看到二八法則的說法,那麼究竟什麼是二八法則,我們怎麼認識,怎麼運用?談一下本人的認識和體會。一、二八法則。1897年,義大利經濟學家帕累託偶然注意到英國人的財富和收益模式,於是潛心研究這一模式,並於後來提出了著名的20/80法則,即二八法則。帕累託研究發現,社會上的大部分財富被少數人佔有人,而且這一部分人口佔總人口的比例與這些人所擁有的財富數量,具有極不平衡的關係。帕累託還發現,這種不平衡的模式會重複出現,而且也是可以提前預測的。
  • 哈佛商業評論:AI算法和機器學習改變二八法則
    新智元編譯來源: HBR編譯:張易 文強  二八法則是不少企業奉行的金科玉律,這條最早由義大利工程師和經濟學家Vilfredo Pareto提出的法則是說,80%的工作成效(比如利潤、銷售業績等等),都來自20%的動因(比如說產品、僱員等等),而其他80%的動因,則只產生20%的效益。
  • 神說,要有正態分布,於是高斯就創造了正態分布 - 徐曉亞然
    我們現在很容易看出來,賭徒的問題是一個簡單的二項分布,這裡就不再做二項分布的科普了。簡單說下,就是一個概率事件中,只有兩種結果,並且結果互斥,我們分析的就是這兩種情況的期望值。因此,正態分布跟最小二乘法的關係實在非比尋常!由於高斯的傑出工作,正態分布又叫高斯分布。高斯基於正態分布給出的最小二乘法,大大拓寬了正態分布的應用,這個密度函數在整個數理統計領域遠遠要超過其他任何分布。實際上正態分布也是存在最廣泛的分布,甚至可以沒有之一!
  • 精品圖表|Excel繪製直方圖與正態分布曲線
    今日更新:Excel繪製直方圖與正態分布曲線老樣子,還是先上幾幅不同配色的圖來看一下:作圖思路先對原始的數據進行分割(組),計算每個分組的頻數與正態分布後。然後插入柱形圖與折線圖,調整柱形的分類間距與折線的平滑度即可。
  • 常識·正態分布·二八定律
    因為常識告訴我們,我們在日常生活中所遇見的天才和騙子的比例極少,而絕大多數為凡夫俗子、普通人,基本符合正態分布。這家菜館興起速度如此之快,味道如此之好,不是天才即是騙子。而目前,我既沒有證據證明它是騙子,放了如鴉片渣之類的玩意兒,也不必冒險相信它是天才。因此,暫少去吃當然是最佳選擇。
  • 不符合正態分布 - CSDN
    本期「科研加油站」欄目,我們討論一下不符合正態分布兩組數據的非參數檢驗。對問題的分析本問題是探討男性患者組和女性患者組之間的接受度評分是否相同,因為此數據不符合正態分布,不能採用獨立樣本t檢驗方法,因此選用Mann-Whitney
  • 伯努利分布、二項分布與負二項分布
    如果隨機變量X的發生只有兩個值:A和B,且在一次實驗中A發生的概率p(0<p<1), B發生的概率為1-p,則認為隨便變量X取值的概率服從伯努利分布。如擲硬幣的正反面,疾病是否發生等。數學表達時這樣表述:之所以稱之為二項分布,是因為概率分布函數的係數為二項式係數。當n趨於∞,p很小時,二項分布趨於泊松分布。在100次試驗中,恰好出現50次的概率是多少?
  • 2014考研數學:認識正態分布標準化的重要性
    2014考研數學:認識正態分布標準化的重要性 http://kaoyan.eol.cn      2013-05-28  大 中 小   考研數學指導:認識正態分布標準化的重要性
  • 重回數學:統計與分布之伯努利分布與二項分布
    首先看「n 重伯努利試驗」的定義:如果隨機變量序列 Xn(n=1, 2, …) 中的隨機變量均服從與參數為 p 的伯努利分布,那麼隨機變量序列 Xn 就形成了參數為 p 的 n 重伯努利試驗。例如,假定重複拋擲一枚均勻硬幣 n 次,如果在第 i 次拋擲中出現正面,令 Xi=1;如果出現反面,則令 Xi=0。
  • 當你一貧如洗,親戚都奚落你時,請記住猶太的二八法則
    當你一貧如洗,親戚都奚落你時,請記住猶太的二八法則在工作和生活中,誰都難免會有倒黴、運氣不好的時候,而且往往屋漏偏逢連夜雨,當自己沒錢的時候,少不了親人的看不起,倍嘗人情冷暖,世態炎涼。這個時候,千萬不要自甘墮落,自暴自棄,不妨試一試猶太人的思維和方法,去東山再起。
  • 冪律分布
    前幾天我們聊了正態分布,今天我們來聊另一種重要的分布,這就是冪律分布。而這個二八法則,正是冪律分布最為直觀的表現。冪律分布的曲線圖十分簡單,橫坐標代表隨機變量的取值,縱坐標代表發生的概率,而冪律分布就是一條向下延伸的曲線,就好像拖著一條長長的尾巴,所以它告訴我們的就是,在隨機變量中,越小的數值,出現的概率就越大,越大的數值,出現的概率就越小。
  • 為什麼說正態分布的標準化很重要
    為什麼說正態分布的標準化很重要 http://kaoyan.eol.cn  中國教育在線考研頻道    2006-10-31  大 中 小