正態分布密度函數 - 描繪自然的常態

2021-02-20 龍數視界

顧名思義,正態乃常態之意,正態分布是描述自然界中大多數事物整體分布存在普遍性的一種概率分布,現實生活的許多數據——比如智力、考試成績、工資收入、股價變動等等都服從正態分布,微小粒子的無規則運動也不例外。正態分布在統計學的許多方面有著重大的影響力,因而在數據分析界佔據著非常重要的地位。

正態分布又被稱為高斯分布。在那個年代,正態分布還不是叫「正態分布」。

約翰·卡爾·弗裡德裡希·高斯,是近代數學奠基者之一,和前篇出場過的歐拉、阿基米德以及仍在候場的牛頓並列為世界四大數學家

1777年4月30日,高斯出生於德國一個貧窮的猶太人家庭,但出色的數學天賦使他年少成名,成就了這位「數學王子」碩果纍纍的一生,享年77歲,以「高斯」命名的成果達110個,涵蓋數學和物理學的多個分支。

1801年1月,一顆叫「穀神星」的小行星被觀測到,但很快就逃離了天文學家們的視線,年僅24歲的高斯憑藉少量的觀測數據便能準確地預測該行星再次出現的位置,震驚了整個歐洲。他在對觀測數據進行分析時,從最小二乘法的角度研究測量誤差,利用極大似然估計推導出該誤差服從的便是正態分布,從而解決了對誤差大小的統計度量問題,因此「高斯分布」得以冠名,也因此在前聯邦德國流通貨幣上還能看到高斯的大頭照和正態分布密度曲線。

雖然以「高斯分布」為名,但正態分布最早是由棣莫弗在求二項分布的漸近公式中發現,在拉普拉斯對此進行了一番擴展性的研究分析之後,它最終以二項分布的極限分布的形式被推導了出來(所以那個時候正態分布在法國曾被稱為「拉普拉斯分布」),也就是在高等數學中的棣莫弗-拉普拉斯中心極限定理

中心極限定理描述的是在自然界與生產中,一些現象受到許多相互獨立的隨機因素的影響,當每個因素所產生的影響都很微小時,總的影響可以看作是服從正態分布的。這就是自然規律,萬物相互聯繫而且相互作用,正態分布所表達的就是這種相互影響的結果。

正態分布的密度函數看似複雜,實則不然,最重要的兩個數學常量π和e都包含在公式之中,另外兩個變量μ和δ分別代表了正態分布的期望標準差,便足以描繪出大千世界之中事物相互作用而形成的最終形態,一目了然。其標準化後的公式更為簡潔漂亮。

其函數曲線呈鐘形形狀,左右對稱,十分美觀,從正中間的期望峰值根據誤差大小同時向左右兩端逐漸下降,誤差越小,峰值越高,下降速度越快,反映了向平均值中心靠攏的密集程度。

簡單來說,數據分析可以是對世界上所有事物身上的數字進行研究。所以在數據分析的領域裡,正態分布是許多統計方法的理論基礎,檢驗、方差分析、相關和回歸分析等均要求分析的指標服從正態分布,應用於頻數分布的估計、參考值範圍的確定和產品質量的控制等等。

儘管一些數據本身並不服從正態分布,但在做足夠大的樣本分析時更加要求相應的統計量近似正態分布,正是因為中心極限定理,當越多個因素影響疊加時,總的分布越接近正態分布。

注: 本文部分圖片來自網絡,若有侵權請聯繫刪除。

聲明: 龍數視界原創文章,轉載請註明出處。

相關焦點

  • 從微積分角度證明「正態分布密度函數」
    沒錯如下和正態分布中概率密度函數很像。但我們僅從積分學的角度來分析正面它。·證明它靈活的數學技巧,你準備好了嗎?因為e^-x^2是關於x的偶函數,所以我們明顯可以想到所以你只需要證明,學過概率論與數理統計的朋友,應該很熟悉這個式子根據泰勒公式我們得到所以當x不等於0時,e^>1+x,將x換成x^2或者-x^2可得,可得
  • 標準正態分布
    標準正態分布有很多特殊性,其概率密度函數有很好的性質,其大小可以通過查表獲得(見分享圖片),所以在處理一般正態分布的問題的時候往往先轉化為標準正態分布. 預備知識分布函數是概率密度函數的自變量從負無窮到某定值對應因變量取值累加的結果,又叫累計概率函數,常用F(x)表示. 於是
  • 關於正態分布和貝塔分布的案例介紹
    正態分布 正態分布,是一種非常常見的連續概率分布,其也叫做常態分布(normal distribution),或者根據其前期的研究貢獻者之一高斯的名字來稱呼,高斯分布(Gaussian distribution)。正態分布是自然科學與行為科學中的定量現象的一個方便模型。
  • 密度函數、分布函數與生存函數
    數據探索時涉及到的三個函數為密度函數、分布函數與生存函數,其中樣本的分布函數的形態、生存函數的形態基本沒有太大變化,然而樣本的密度函數分布形態卻有著很大的差異,所以一般在進行數據分析領域提到分布時,指的都是直方圖所描述的
  • 如何用excel批量生成正態分布的隨機數?
    英文叫normal distribution,也就是「正常」狀態下的分布,大陸取一個「正」字,翻譯為「正態分布」,臺灣取一個「常」字,翻譯為「常態分布」,我覺得還是臺灣翻譯得好,「常態分布」一看就知道是什麼意思,而「正態分布」故弄玄虛,英文中文裡不存在正態這個詞,我也是後來看到英文normal distribution才知道原來這麼簡單。
  • 終於搞清楚正態分布、指數分布到底是啥了!
    首先要提到的一個概念就是:概率密度函數概率密度函數用來描述連續型隨機變量的概率分布,用函數f(x)表示連續型隨機變量,將f(x)就稱為概率密度函數,概率密度並非概率,只是一種表示概率的方法,大家不要混淆,其曲線下面的面積表示概率
  • 正態分布圖形的編輯
    分布密度=正態分布概率函數,分布密度=正態分布函數,最後一個參數給到0,=NORM.DIST(A7,$B$1,$B$2,FALSE)選擇0通俗的含義是,我們給到圖形中的高度.這個時候,你可以選擇分布密度的整個系列,插入一個堆積面積圖,則會得到:然後我們需要在這個面積圖的基礎之上,再給它一個面積堆積,達到自由切換的效果,而上圖藍色的部分則是基於我們的基本數據給出來的底層正態模型,自己切換或者變化的面積也必須要在這個藍色的面積範圍以內.
  • 概率|無處不在的高斯分布(1)——標準正態分布
    說到高斯分布,大家心裡想的一定是下面這張圖:這是標準正態分布(Standard Normal Distribution)的概率密度函數(Probability Density Function, pdf)。讓我們一起練習看圖說話,從這張圖裡我們能看到什麼?
  • 相關知識考點:標準正態分布
    1概率密度函數  當μ=0,σ=1時,稱X服從標準正態分布,記作X~N(0,1)。  服從標準正態分布的隨機變量記為U,它的概率密度函數記為。  若X~N(μ,σ2),則~N(0,1)。  實際中很少有一個質量特性(隨機變量)的均值恰好為0,方差與標準差恰好為1.一些質量特性的不合格品率均要通過標準正態分布才能算得,這一點將在後面敘述。  2標準正態分布表  標準正態分布函數表,它可用來計算形如「」的隨機事件發生的概率,記為。  正態分布N(0,1)的分位數。
  • 一文搞懂「正態分布」所有重要知識點
    從名字說起為什麼叫「正態分布」,也有地方叫「常態分布」,這兩個名字都不太直觀,但如果我們各取一字變為「正常分布」,就很白話了,而這正是「正態分布」的本質含義,Normal Distribution。它太常見了,基本上能描述所有常見的事物和現象:正常人群的身高、體重、考試成績、家庭收入等等。這裡的描述是什麼意思呢?
  • 數學|正態分布(1):正態分布發展史
    正態分布(Normal distribution),也稱「常態分布」,又名高斯分布(Gaussian distribution)。若隨機變量X服從一個數學期望為μ、方差為σ^2的正態分布,記為,那麼其概率密度函數為:
  • 正態分布在機器學習中為何如此重要?
    從中心極限定理到正態分布眾所周知 :一顆骰子每個面的概率相等兩個骰子面值之和的概率,是兩個骰子獨立事件的概率的和。根據中心極限定理,如果一個事物受到多種因素的影響,不管每個因素本身是什麼分布,它們加總後,結果的平均值就是正態分布。
  • 正態分布的應用——基於描述性統計與分布的推論
    分布的類型:上期主要給大家介紹了正態分布,其實除了正態分布,還有很多的分布類型,今天就給大家科普一下。標準的二分布、均勻分布這樣的古典概型產生的分布,在這裡就不給大家介紹了。本次介紹的分布,也是統計中較為常用的類型。
  • 方差、標準差、正態分布、超幾何分布、卡方檢驗、t檢驗基礎概念
    正態分布正態分布(Normal distribution),也稱「常態分布」,又名高斯分布,正態曲線呈鍾型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線。若隨機變量X服從一個數學期望為μ、方差為σ^2的正態分布,記為N(μ,σ^2)。其概率密度函數為正態分布的期望值μ決定了其位置,其標準差標準差σ決定了分布的幅度。當μ = 0,σ = 1時的正態分布是標準正態分布。
  • 【教育統計答疑】如何理解正態分布、均值分布、χ^2分布、t分布和F分布
    正態分布的特徵表明被測事物處於穩定的狀態下,測量數據的波動是由於偶然因素引起的,所以在實踐中有廣泛的應用。在穩定的系統環境(如自然、人類社會等),許多事物和現象都會服從正態分布,例如人的身高、體重和智商;各種商品的尺寸和質量;自然環境的溫度、溼度和降雨量;考試的成績等。
  • 標準正態分布函數數值表怎麼查?
    最近在整理數據時,忽然想到數理統計的其中一種分布,相信作為質量人一定不陌生,我們常常提到數據的分布是否服從正態分布,這是對一組連續數據分布一種描述
  • R統計-正態性分布檢驗[Translation]
    包括相關、回歸、t檢驗和方差分析在內的許多統計方法都假設數據服從正態分布或高斯分布。這些測試被稱為參數檢驗,因為它們的有效性取決於數據的分布。
  • 正態分布的常用數據 - CSDN
    #尋找真知派#如上一篇文章所述,樣本所屬總體服從正態分布是數據分析和數據挖掘等數據處理的重要前提。如果我們採集的樣本並不能確認其總體是否服從正態分布,那麼數據處理的結果就是不可靠的。因此,對樣本數據進行正態分布檢驗十分必要。
  • 神說,要有正態分布,於是高斯就創造了正態分布 - 徐曉亞然
    可能有的老師上課的時候會跟學生們強調這個概率分布很重要,但是沒有形象的案例來做支撐,總是讓人覺得莫名其妙。棣莫弗得出的這個分布函數也是正態分布第一次出現在人類的數學成果裡。雖然棣莫弗第一個得出了這個密度分布函數,但是他並沒有對這個分布再進行深入研究,棣莫弗本質上並不是一個數理統計學家,他認為這只是一種看起來優美的概率分布曲線。他完全沒有想到這個分布與誤差分析有什麼關係。
  • 怎麼通過標準正態分布函數表查的?
    怎麼通過標準正態分布函數表查的?   【提問】請問:老師在手寫板1102-2中講的標準正態分布,X=1.645這個值怎麼通過標準正態分布函數表查的?  【回答】學員yqye,您好!您的問題答覆如下:  從教材472頁的附表4中查得,這張表的第一行表示的是x值的小數點後第二位數的數值。