我們標準的分析流程是這樣的:
對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性且兩組間方差相等,採用均數(標準差)進行統計描述,採用t檢驗進行組間比較;否則採用中位數(四分位數間距)進行統計描述,採用非參數Wilcoxon秩和檢驗進行組間比較。對於分類變量,採用例數(百分比)的形式描述,組間比較採用χ2檢驗。
我們做統計分析的時候,統計量的整理總是免不了抄來抄去,總是禁不住想,有沒有一鍵生成的方法,雖然暫時還沒有那麼快捷的辦法,但是通過幾行命令就搞定,也算是方便極了。
下面我們一起來看看,如何通過R的Table1包實現統計量表格的自動生成。
#安裝包install.packages('table1')install.packages('lubridate')install.packages("ggplot2")
#調用包library(table1)library(lubridate)library(ggplot2)
#查看案例數據集??diamonds
輸入:
head(diamonds)
輸出:
輸入:
str(diamonds)
輸出:
輸入:
table1(~ carat+price+depth+table+x+y+z +cut+color+clarity, data=diamonds,render.continuous=c(.="Mean±SD",.="Median [Min, Max]",.="Median [Q3-Q1]",.="Median[IQR]"))
輸出:
輸入:
table1(~ carat+price+depth+table+x+y+z +cut+clarity | color, data=diamonds, render.continuous=c(.="Mean±SD", .="Median [Min, Max]",.="Median [Q3-Q1]",.="Median [IQR]"))
輸出:
看到我們想要的統計量都出來了,是不是很高興,但是不知道怎麼導出到excel裡,還是沒有完成萬裡長徵的最後一步。具體導出方法如下圖所示: