R語言中計算樣本中位數的方法

2020-12-25 翔宇亭IT樂園

中位數的定義

中位數是統計中描述數據集中趨勢的一個指標。

簡單講中位數就是數據排序位於中間位置的值,記為Me,計算公式如下:

計算中位數的公式

中位數在統計學中的意義

中位數描述數據中心位置,對於對稱分布的數據,均值接近中位數;偏態分布式指頻數分布不對稱,集中位置偏向一側,數據的均值則與中位數不同。它的顯著特點在於不受異常值的影響,具有穩健性。

R中計算中位數的函數

在R中,使用median()函數計算一組數據的中位數。其形式如下:

median(x, na.rm = FALSE, ...)

其中,參數x為計算對象,可以是向量、矩陣、數組或數據框;

na.rm為邏輯值,指示是否允許有缺失值(NA)的情況,默認為FALSE(不允許);

...為附加參數

R中計算中位數的例子

某班級20名學生的英語成績為88,78,67,69,62,100, 73, 45, 70, 60, 93, 97, 84, 82,81,73,68,76,77,92。

計算其中位數。

R程序如下:

median(x)

結果為:76.5

該案例的樣本均值為76.75,已在前面的文章中介紹過。從均值稍大於中位數,可以初步判斷,所給樣本數據呈右偏分布。

本文【完】

如果你喜歡本文章,請關注我的百家號。我會定期更新有關R語言,Python,SPSS,Excel等數據分析方面的文章。當前一段時間著重介紹R語言,從R基礎到深入分析,步步推進。共同學習,共同進步。

相關焦點

  • R中計算樣本均值的方法
    樣本均值的概念樣本均值是統計學中考量一組數據的集中趨勢的統計量之一。設X1, X2, ..., Xn是總體X中的一個樣本,則統計量樣本均值的計算方法如下:樣本均值計算公式R中計算樣本均值的函數在R中,mean()函數用於計算樣本的均值,其使用格式為:mean
  • R與生物專題 | 第五十四講 R-樣本量及實驗效能計算
    設計實驗中一個重要的問題是「我需要多大的樣本量?」 較大的樣本能提供更準確的結果,同時也能減少假陰性率,但要付出一定的代價,比如需要更多的成本進行實驗。使用太少的樣本,可能會得出不確定的結果。而樣本太大,會浪費資源。所以,我們需要在實驗設計時,便計算好實驗所需的樣本量。
  • 自助法(bootstrap)在統計檢驗中的應用及R語言實現過程
    1.1 Bootstrap和常規統計方法的比較Bootstrap和常規統計方法都使用給定樣本來推斷總體。為了實現這一目標,這些程序將研究中獲得的少數樣本視為該研究可能收集的眾多樣本中的一個隨機子集。通過該子集,可以獲得各樣本的均值、中位數和標準偏差等統計信息。假設對某項研究重複了很多次,這種情況下,樣本的均值將隨樣本的不同而變化,並獲得樣本均值的分布。統計學家把這種分布稱為抽樣分布,抽樣分布是至關重要的,因為它們將樣本統計值置於許多其它可能值的更廣泛分布中。
  • R語言 | 描述性統計(上)
    R: The R Project for Statistical Computinghttps://www.r-project.org/RStudio:https://rstudio.com/從本文開始,我們將正式進入使用R進行統計分析的路程,在此期間我們會同時對統計分析方法和R語言實現進行詳細解釋,並加入相應的繪圖方式。
  • R中計算樣本值分位數的方法
    統計上,分位數亦稱分位點,是指將一個隨機變量的概率分布範圍分為幾個等份的數值點,常用的有中位數(即二分位數)、四分位數、百分位數等。在統計學中,p分位數的計算使用如下公式計算:p分位數R中使用quantile()計算分位數,其形式如下:quantile(x, probs = seq(0, 1, 0.25), na.rm
  • 第九講 R-單樣本Wilcoxon檢驗
    在第八講中,我們講到了單樣本t檢驗的假設條件是樣本分布需要符合正態性。但是,當樣本分布非正態,且經過一定的數值轉換嘗試後,仍然無法滿足正態性要求時,單樣本的Wilcoxon符號秩檢驗成為備選方法。它將非正態樣本的中位數與已知標準(或理論/假設)值(總體中位數)進行比較。
  • 基於R語言的主成分和因子分析
    >)3)提取主成分4)主成分旋轉,當提取多個主成分時,對它們進行旋轉可使結果更具解釋性5)解釋結果6)計算主成分得分應用主成分分析使用psych包中的principal()函數,以下是該函數中參數的解釋:principal(r, nfactors
  • 初中數學統計:平均數、加權平均數、中位數、眾數、方差的計算
    點撥:當所給的數據組比較離散時,一般選用基本方法中的公式計算算術平均數;當所給的數據有多個重複出現時,一般選用加權平均數公式計算平均數;當數據較大、較多且在某一個常數a附近擺動時,用新數據法中公式計算平均數比較容易.
  • R語言:用R計算各種統計值
    percentile)四分位間距(quartile range)方差(variance)標準差(standard deviation)變異係數(coefficient of variance)正態分布(normal distribution)標準正態分布(standard normal distribution)使用R語言的內建實例數據框
  • 數據不滿足正態分布——如何計算中位數(四分位數間距)
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • R語言 | 推論性統計
    推論性統計指的是由隨機取得的樣本來推斷總體屬性的一種統計方法,我們需要保證三個方面的基本要求:觀察的獨立性,方差同質性,以及數據正態性,這在我們之後具體的推論統計方法中會逐一介紹。推論性統計主要通過兩種方法來實現對總體的推斷:估計(estimation)和假設檢驗(hypothesis testing)。
  • 2014.07:中位數房價指數編制方法研究(董莉娟)
    中位數房價指數編制方法研究董莉娟  內容摘要:房價指數是我國價格指數體系的重要組成部分。由於房屋的唯一性,在採價過程中常常難以找到完全同質可比的樣本,房價指數編制要剔除外部影響反映純價格變動難度較大。本文對利用中位數編制房價指數的方法進行研究,通過按面積分類加權計算中位數房價指數,並根據某城市的網籤數據進行實證分析,提出主要結論和建議。
  • 值得一看,「中位數」的三種計算方法,總會用得到
    中位數是數據分析中的重要指標,下面介紹三種計算中位數的方法。一、從一組數據中手動計算中位數(適用於數據較少的情況)二、在EXCEL中計算中位數例:計算下圖中「購買人數」的中位數1、對數據進行排序2、對排序後的數據通過拖動填充柄進行編號,目的是判斷數據的個數,並為後續計算中位數做準備。
  • 數據不滿足正態分布--如何計算中位數(四分位數間距)
    四分位距(interquartile range, IQR)是描述統計學中的一種方法,但由於四分位距不受極大值或極小值的影響,常用於描述非正態分布資料的離散程度,其數值越大,變異度越大,反之,變異度越小。
  • R語言中的數學計算
    前言R是作為統計語言,生來就對數學有良好的支持,一個函數就能實現一種數學計算,所以用R語言做數學計算題特別方便
  • R語言從入門到精通:Day10-R語言統計入門代碼大全
    完成前面這些步驟之後,我們接下來要探索數據中變量的分布以及各組變量之間的關係。在課題或者項目中,你往往會遇到這樣的問題:參與本次實驗的病人的年齡的分布如何(均值、、標準差、中位數等)?實驗中不同組病人的生存時間有沒有差異?病人性別對實驗結果有無影響?
  • R語言——交叉驗證法計算線性回歸模型擬合優度的第三種R方
    R方的缺點很明顯,當我們在回歸模型中加入更多的回歸自變量時,不管這個回歸自變量能否解釋因變量,R方都會增加。為了克服這個缺點,引入了調整R方。兩者的計算方法如下,其中分子為擬合值和實際值的差值的平方的和。大部分的初級和中級的計量課本都只會介紹這兩種R方,但實際上,還存在第三種R方。
  • R語言實現統計分析——非參數假設檢驗
    因此,假設樣本來自的總體服從某個期望分布或理論分布集的實際觀察頻數同時獲得樣本數據各子集的實際觀察頻數,並依據下面的公式計算統計量 :其中,Qi表示觀察頻數;Ei表示期望頻數或理論頻數。可見Q值越大,表示觀察頻數和理論頻數越不接近;Q值越小,說明觀察頻數和理論頻數越接近。
  • Hotelling's t-squared test及在R語言中的計算
    Hotelling's t-squared test及在R語言中的計算有同學後臺留言諮詢Hotelling's t-squared test,本篇簡單梳理下這種方法。Hotelling's t-squared test是T檢驗(t-test)的多元形式,「多元」表示每個對象具有多組變量(Hotelling, 1931)。
  • 如何計算均值(平均數,中位數,眾數)
    [集中趨勢一共有三種計算指標,分別是平均數、中位數和眾數。人們最熟悉的自然是平均數,但有時中位數和眾數可以更好地描述一組數字。計算平均數的最佳方法就是將所有數字加起來,然後除以這組數字的個數。方法1計算平均數1.確定你是否需要計算平均數。