前言
在Stata的初學者進行實證研究時,會遇到各種各樣的小問題,而如何對手中的數據進行分組描述性統計應該是大多數初學者都會頭疼的問題。在中文網際網路上,關於這個問題有不少的解決方法,其中最方便的就是使用tabstat命令。但是,tabstat命令不能把結果輸出到外部的文件之中,所以今天我們要介紹一個很好用的命令--astx命令,來幫助實現結果輸出。astx命令由來自巴基斯坦的大神Attaullah Shah編寫,它能夠根據你設置的分組進行描述性統計計算和t檢驗,並將結果輸出到excel表格之中。在查看astx命令的ado文件之後,小編發現該命令是基於tabstat命令編寫的,tabstat命令是Stata自帶的命令,這樣就保證了結果的準確性。astx命令上傳於2017年,可惜的是三年的時光過去了,在中文網際網路上竟然還無法找到該命令的詳細介紹。為了不使明珠蒙塵,文章接下來就來介紹該命令的用法。一、命令安裝astx命令的安裝極其簡單,使用以下程序安裝即可:
ssc install astx ,replace
二、語法
astx命令的語法簡單明了,具體如下:
astx varlist, stat(options) by(varlist)
varlist:指需要進行描述性統計的變量名。(可同時輸入多個變量名,但不推薦,原因在下文說明)stat(options) :在此輸入你需要的各種指標,該命令可以輸出的指標如下表所示:選項名說明sd標準差mean平均值semean標準誤差平均值median中位數count非缺失的觀測值個數sum求和range極差(範圍誤差、全距)min最小值max最大值cv變異係數skewness偏度kurtosis峰度iqr四分位距(四分差)p1第1百分位數p5第5百分位數p10第10百分位數p25第25百分位數p50第50百分位p75第75百分位數p99第99百分位數tstatt檢驗三、案例下面我們用一個具體的案例來展示astx命令的魅力。在數據上,我們仍然使用Stata自帶的auto數據集,由於該數據集中變量foreign裡已經根據汽車是否國產對數據進行的分組,國產取值為0,進口取值為1。下面就直接對變量price進行操作。
sysuse auto.dta, clear
astx price,stat(sd mean median max min) by(foreign)
我們可以看到描述性統計結果已經分組展現在我們面前,並且輸出到了名為Summary Statistics by foreign.xlsx的文件之中,你可以直接點擊紅框中的藍色字體打開該文件,也可以在Stata當前指定的路徑下找到該文件打開。文件打開如下:
在本例中,是按照變量foreign進行分組的,所以文件名稱為Summary Statistics by foreign.xlsx 。如果按照變量XXX進行分組,那麼文件名就會是Summary Statistics by XXX.xlsx 。當然,astx命令還可以輸出分組t檢驗的結果。具體如下:
astx price, stat(sd mean median max min tstat) by(foreign)
最後,astx命令是可以同時輸出多個變量的分組描述性統計結果的,但是會有一些瑕疵。這次,我們對price weight rep78三個變量同時進行分組描述性統計,具體如下:
astx price weight rep78,stat(sd mean median max min) by(foreign)
可以看到,當對多個變量同時進行描述性統計輸出時,在輸出的結果之中,無法正確顯示分組情況。我看可以看到紅框之中顯示為0、1、1、1、1、1,這裡實際上是錯誤的。根據小編驗證,前三行是price weight rep78三個變量在foreign = 0時的描述性統計結果,後三行是price weight rep78三個變量在foreign = 1時的描述性統計結果,所以紅框之中正確的顯示應該是0、0、0、1、1、1。還有就是,多個變量時,該命令無法進行t檢驗。所以,在使用astx命令時小編並不推薦同時對多個變量進行分組的描述性統計。四、其他注意事項1、在分組變量by()那一欄,astx命令只能識別數值型的變量作為分組依據。2、在輸出之前,無法對即將輸出的excel文件進行設置,如更改文件名稱、更改字體格式等等。好了,以上就是astx命令的全部介紹了。關於結果輸出,我們爬蟲俱樂部也開發了
sum2docx、
reg2docx、
t2docx、
corr2docx等命令。感興趣的讀者可以閱讀以下推文了解。
對我們的推文累計打賞超過1000元,我們即可給您開具發票,發票類別為「諮詢費」。用心做事,不負您的支持!微信公眾號「Stata and Python數據分析」分享實用的stata、python等軟體的數據處理知識,歡迎轉載、打賞。我們是由李春濤教授領導下的研究生及本科生組成的大數據處理和分析團隊。
此外,歡迎大家踴躍投稿,介紹一些關於stata和python的數據處理和分析技巧。投稿郵箱:statatraining@163.com投稿要求:
1)必須原創,禁止抄襲;
2)必須準確,詳細,有例子,有截圖;
注意事項:
1)所有投稿都會經過本公眾號運營團隊成員的審核,審核通過才可錄用,一經錄用,會在該推文裡為作者署名,並有賞金分成。
2)郵件請註明投稿,郵件名稱為「投稿+推文名稱」。
3)應廣大讀者要求,現開通有償問答服務,如果大家遇到有關數據處理、分析等問題,可以在公眾號中提出,只需支付少量賞金,我們會在後期的推文裡給予解答。