無論是均數±標準差,還是中位數(四分位數間距),還是頻數(百分比...

2021-01-08 言爸說育兒

我們標準的分析流程是這樣的:

對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性且兩組間方差相等,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數Wilcoxon秩和檢驗進行組間比較。對於分類變量,採用例數(百分比)的形式描述,組間比較採用χ2檢驗。

我們做統計分析的時候,統計量的整理總是免不了抄來抄去,總是禁不住想,有沒有一鍵生成的方法,雖然暫時還沒有那麼快捷的辦法,但是通過幾行命令就搞定,也算是方便極了。

下面我們一起來看看,如何通過R的Table1包實現統計量表格的自動生成。

#安裝包install.packages('table1')install.packages('lubridate')install.packages("ggplot2")

#調用包library(table1)library(lubridate)library(ggplot2)

#查看案例數據集??diamonds

輸入:

head(diamonds)

輸出:

輸入:

str(diamonds)

輸出:

輸入:

table1(~ carat+price+depth+table+x+y+z +cut+color+clarity, data=diamonds,render.continuous=c(.="Mean±SD",.="Median [Min, Max]",.="Median [Q3-Q1]",.="Median[IQR]"))

輸出:

輸入:

table1(~ carat+price+depth+table+x+y+z +cut+clarity | color, data=diamonds, render.continuous=c(.="Mean±SD", .="Median [Min, Max]",.="Median [Q3-Q1]",.="Median [IQR]"))

輸出:

看到我們想要的統計量都出來了,是不是很高興,但是不知道怎麼導出到excel裡,還是沒有完成萬裡長徵的最後一步。具體導出方法如下圖所示:

相關焦點

  • 數據不滿足正態分布——如何計算中位數(四分位數間距)
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • 數據不滿足正態分布--如何計算中位數(四分位數間距)
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,採用
  • 離散程度的度量:異眾比率、四分位差和標準差
    上一期文章 數據的集中趨勢:眾數、中位數和平均數 中,我們講了可以代表集中數值的,有三個數:眾數、中數、平均數。如果你的老闆讓你匯報上個季度的銷量表現,而他趕著開一個會,讓你只用一個指標來概括。那你可以使用眾數、中數、平均數,反映上個季度的銷量的集中位置,來代替整體水平。
  • 實習九 均數、標準差、標準誤
    實習九 均數、標準差、標準誤   一、目的要求   1.明確平均數、標準差、標準誤的概念的意義。   2.學會平均數、標準差、標準誤計算的基本方法。   3.正確應用平均數、標準差、標準誤進行統計分析。
  • 箱線圖--四分位數
    定義:四分位數(Quartile)應用於統計學中的箱線圖繪製,是統計學中分位數的一種,即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數