R語言的各種統計分布函數,你應該了解的都在這!

2021-02-18 生信技能樹
 

正在學習R語言統計學的小夥伴,可能會被各種專有名詞所困擾,小編為大家梳理了一下,話不多說,進入正題。

下圖是截取自[《An Introduction to R》包含了R中所有的概率函數

 1.簡單介紹:

R中的概率函數有統一的命名格式:即前綴+分布函數名

q 表示分位數函數,能夠返回特定分布的分位數(quantile);2.舉個例子

正態分布的意義:理論上可以證明如果把許多小作用加起來看做一個變量,那麼這個變量服從正態分布

以正態分布(函數norm)公式:

其中

調用形式:

norm(mean,sd)

隨機分布函數調用:
rnorm(n,mean=0,sd=1)

密度函數調用
dnorm(x,mean,sd)

畫出正態分布概率密度函數的大致圖形:

x<-seq(-3,3,0.1)
# 注意:plot中的x,y要有相關關係才會形成函數圖。
plot(x,dnorm(x))

分位數函數調用形式:
qnorm(p,mean,sd)

如qnorm(0.05)=-1.644854,即x<=這個數的累計概率(-1.644854)小於0.05分布函數的調用:
# pnorm()默認的參數與dnorm()一樣,都是標準正態分布,即平均數為0,標準差為1的正態分布
pnorm(0)
# [1] 0.5

3.sigma法則:

對於正態分布的x,x取值在(mean-3sd,mean+3sd)幾乎就是極端值啦,因為pnorm(3)-pnorm(-3)=0.9973002,這個概率外的事情基本上不可能發生!

以上就是本期的主要內容,以正態分布為例子,我們學習了4個函數的使用。感興趣的小夥伴總結一下其他的概率分布函數,舉一反三,觸類旁通,如果能加上一些生物信息學案例就更好了。

下面附上R語言內置數據包供大家練習使用 。

 後起之秀奔湧而至,歡迎大家在《生信技能樹》的舞臺分享自己的心得體會!

不點讚也不打賞,為什麼呢?

相關焦點

  • R語言的各種統計分布函數
    概率函數為f(k;r,p)=choose(k+r-1,r-1)*p^r*(1-p)^k, 當r=1時這個特例分布是幾何分布rnbinom(n,size,prob,mu) 其中n是需要產生的隨機數個數,size是概率函數中的r,即連續成功的次數,prob是單詞成功的概率,mu未知..
  • R學習用R語言做分析(3)——統計分布
    一、各種統計分布在R中的名稱       R給出了詳盡的統計表。這張表取自《An Introduction to R》中概率分布一章,基本涵蓋了R中所有的概率函數。      在R中各種概率函數都有統一的形式,即一套統一的前綴+分布函數名:      d 表示密度函數(density);      p 表示累積分布函數,(cumulative distribution function,CDF);      q 表示分位數函數,能夠返回特定分布的分位數(quantile);
  • R函數了解一下?
    R函數是什麼?其實就是對一些程式語言的封裝,編寫函數可以減少重複代碼的書寫,讓R腳本可以簡潔運行,並且可以快速進行傳播。一般一個函數可以完成一項特定功能,統計中的函數比如sum、var、mean等,都有自己的工作範圍查看函數原始碼沒有被封裝的:敲函數名不加括號就可以查看自定義的函數myfunc <- function (選項參數) {    函數體}一定會用到的循環判斷常用的格式if條件判斷,如score=70
  • R語言統計相關函數總結
    R語言在統計分析方面起了很大的作用,並且其開開放性更是促進了大量分析R包的出現。
  • R語言 | 推論性統計
    R: The R Project for Statistical Computinghttps://www.r-project.org/RStudio:https://rstudio.com/之前我們提到過,統計可以分為描述性統計和推論性統計(inferential statistics)。
  • 基於Python腳本的R語言的函數
    本文介紹了採用創建一個Python腳本,用該腳本模仿R風格的函數的方法來方便地進行統計。 是用R語言還是用Python語言?這是一個曠日持久的爭論。在此,我們可以嘗試採用折中路線:創建一個Python腳本,用該腳本模仿R風格的函數,來方便地進行統計!
  • R語言 | 描述性統計(上)
    R: The R Project for Statistical Computinghttps://www.r-project.org/RStudio:https://rstudio.com/從本文開始,我們將正式進入使用R進行統計分析的路程,在此期間我們會同時對統計分析方法和R語言實現進行詳細解釋,並加入相應的繪圖方式。
  • R語言從入門到精通:Day6-R語言數據操作進階及控制結構
    圖1:均值和標準差的兩種實現實際上我們還是借用了求和函數,就算如此,代碼量也有所增加。上面這些簡單而重要的統計函數將會伴隨你使用R語言的全部旅程。概率函數(了解)數學課上,概率和統計都是放在一起學習的,有一門課程就叫做概統,但是這裡我們把概率函數和統計函數分開講解。
  • R語言:用R計算各種統計值
    (normal distribution)標準正態分布(standard normal distribution)使用R語言的內建實例數據框:faithfulhead(faithful)## eruptions waiting## 1 3.600 79## 2 1.800 54##
  • R語言從入門到精通:Day12--R語言統計--回歸分析
    回歸作為一個廣義的概念,涵蓋了許多變種,R語言中也為其提供了強大而豐富的函數和選項(但顯然選項越多,對初學者越不友好),早在2005年,R中就有200多種關於回歸分析的函數 (https://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf,這個文檔提供了部分回歸分析函數列表,供大家參考)。
  • R語言實戰(7)——基本統計分析
    R語言實戰(4)——數據管理R語言實戰(5) ——高級數據管理R語言實戰(6)——基本圖形引言:在前幾章中,我們學習了將數據導入R的幾種方法中,以及使用各種函數組織數據並將其轉換成為可用的格式。在完成前面2步後,我們下一步通常就是使用數值描述每個變量的分布,接下來則是兩兩探索變量之間的關係。本章,我們將學習用於生成基本的描述性統計量和推斷統計量的R函數。首先,我們初步學習定量變量的位置和尺度的衡量方式。然後我們進一步學習生成類別型變量的頻數表和列聯表的方法(以及連帶的卡方檢驗)。接下來,我們將考察連續型和有序型變量相關係數的多種形式。
  • R語言從入門到精通:Day10-R語言統計入門代碼大全
    到目前為止,R語言的數據操作和基礎繪圖部分已經講解完畢,換句話說,大家應該已經能將數據導入R中,並運用各種函數處理數據使其成為可用的格式,然後將數據用各種基礎圖形展示
  • 醫學統計與R語言:標準Z值一定服從標準正態分布?
    將原始分數轉換成對應的Z分數不會改變其分布狀況,也不會改變其相對位置,所改變的只是分數值。對於任何形狀分布都可以計算Z值,所得的Z分數將會呈現原始分數的形狀。若原始數據為非正態分布,標準正態分布表不再適用。
  • 什麼是R語言
    書中給出了大量的範例代碼,是深入學習實踐R語言的良師益友,對R語言初學小白比較友好。什麼是R語言?我們猜想它是一種程式語言,類似C語言,Visual Basic等。既然已經有那麼多程式語言了,R語言究竟有什麼過人之處呢。我們為什麼要學習R語言?R語言以能夠創建漂亮的圖形而聞名,可以處理各種統計問題。很多強大的功能來自社區開發的數以千計的擴展(包)。
  • 蒙特卡洛方法-累積分布函數
    就拿我們先前推導概率密度函數一樣,我們在那裡一通解定積分之後,得到了結果,這部分同學就很滿足了:噢耶,搞定了一個大傢伙。他們忘了他們的初心是要解出pdf(r)這個函數。我們一而再再而三的在這裡提示同學們,我們的初心不是去炒股、不是去做原子彈,我們的初心是去做渲染,具體點就是做PBR或者PBS渲染。
  • R語言:Newton法、似然函數
    hello,大家好,上一篇分享了如何用R語言實現蒙特卡洛模擬,並用蒙特卡洛模擬計算了分布的均值和方差,今天給大家分享如何用R語言來進行矩估計和似然函數的求解。因為在求解矩估計和似然函數時,可能會遇到非線性方程組,所以先給大家介紹一下如何用Newton法來求解非線性方程組。
  • Python+統計學 | 探索常用的數據分析統計分布
    本文用Python統計模擬的方法,介紹四種常用的統計分布,包括離散分布:二項分布和泊松分布,以及連續分布,指數分布和正態分布,最後查看人群的身高和體重數據所符合的分布。蒙特卡洛方法的名字來源也頗為有趣,相傳另一位發明者烏拉姆的叔叔經常在摩洛哥的蒙特卡洛賭場輸錢,賭博是一場概率的遊戲,故而以概率為基礎的統計模擬方法就以這一賭城命名了。使用統計模擬,首先要產生隨機數,在Python中,numpy.random 模塊提供了豐富的隨機數生成函數。
  • 乾貨 掌握R語言中的apply函數族
    前言剛開始接觸R語言時,會聽到各種的R語言使用技巧,其中最重要的一條就是不要用循環,效率特別低,
  • 【R函數學習】R語言時間序列函數整理
    #arma模型library(fUnitRoots) #進行單位根檢驗library(FinTS) #調用其中的自回歸檢驗函數library(fGarch) #GARCH模型library(nlme) #調用其中的gls函數library(fArma) #進行擬合和檢驗【基本函數
  • R 與 Python 雙語解讀統計分析基礎
    本系列文章的主要目的是結合 R 和 Python 兩種語言的代碼來理解統計分析中的一些概念和方法。主要是理解相關數學概念,不偏倚語言。為了讓掌握或學習不同語言的讀者都能閱讀,本號特提供兩種語言版本。在進行數據集的實際統計建模和分析之前,使用概要統計信息以及繪製數據的統計圖形進行一些簡單的探索通常會很有用。