Stata第五章多組計量資料比較的非參數檢驗命令與輸出結果說明

2021-01-10 生物谷

本節STATA 命令摘要

ranksum觀察變量,by(分組變量)

kwallis 觀察變量,by(分組變量)

·       秩 和檢驗(Mann,WhitneyandWilcoxon非參數檢驗)

 對於計量資料不滿足正態分布要求或方差不齊性,但樣本資料之間是獨立抽取的,則可以應用秩和檢驗方法進行比較兩組資料的中位數是否有差異。STATA命令為:

ranksum  觀察變量,by(分組變量)

 例:研究不同飼料對雌鼠體重增加的關係(摘自醫學統計方法,金丕煥主編,p218)。表中用x表示雌鼠體重增加(克),用group=1表示高蛋白飼料組以及用group=2表示低蛋白飼料組。

x

134

146

104

119

124

161

107

83

113

129

group

1

1

1

1

1

1

1

1

1

1

x

97

123

70

118

101

85

107

132

94

 

group

1

1

2

2

2

2

2

2

2

無效假設Ho:兩組增加體重的中位數相同。

ranksumx,by(group)

Test:Equalityofmedians(Two-SampleWilcoxonRank-Sum)

①                                                                

SumofRanks:49.5(group==2)

ExpectedSum:70②                                                                                                  

③           

z-statistic-1.73

Prob>|z|0.0832④                                                                                                

①為第二組(低飼料組)的秩的和;②若無效假設成立,則第二組的秩的和期望值為70;③秩和統計檢驗量z;④對於無效假設Ho對應的p值。

 在本例中,雖然第二組的秩和為49.5而期望值估計為70,但p值為0.0832,所以根據該資料和統計結果一般不能認為 用高蛋白飼料餵養能明顯增加雌鼠的體重。

·       多組資料中位數比較(完全隨機化設計資料的檢驗)

 對於完全隨機化設計資料的比較,若各組資料不全服從正態分布(即:至少有一組的資料均不服從正態分布)或各組的資料方差不齊性,則可以用KruskalandWallis方法進行檢驗(Ho:各組的中位數相同)。STATA命令為:

kwallis 觀察變量,by(分組變量)

例:50隻小鼠隨機分配到5個不同飼料組,每組10隻小鼠。在餵養一定時間後,測定鼠肝中的鐵的含量(mg/g)如表所示:試比較各組鼠肝中鐵的含量是否有顯著性差別(摘自醫學統計方法,金丕煥主編,p220)。用x表示鼠肝中鐵的含量以及用group=1,2,3,4,5分別表示對應的5個組。

x:

2.23

1.14

2.63

1

1.35

2.01

1.64

1.13

1.01

1.70

group:

1

1

1

1

1

1

1

1

1

1

x:

5.59

0.96

6.96

1.23

1.61

2.94

1.96

3.68

1.54

2.59

group:

2

2

2

2

2

2

2

2

2

2

x:

4.5

3.92

10.33

8.23

2.07

4.9

6.84

6.42

3.72

6

group:

3

3

3

3

3

3

3

3

3

3

x:

1.35

1.06

0.74

0.96

1.16

2.08

0.69

0.68

0.84

1.34

group:

4

4

4

4

4

4

4

4

4

4

x:

1.4

1.51

2.49

1.74

1.59

1.36

3

4.81

5.21

5.12

group:

5

5

5

5

5

5

5

5

5

5

kwallis x,by(group)

Test:Equalityofpopulations(Kruskal-WallisTest)

①                                            

group_Obs_RankSum

110188.50

210280.50

310420.00

41095.00

510291.00

chi-squared=27.856with4d.f.②                                    

probability=0.0001③                              

①為各組的秩和值;②為該統計量的c2檢驗值;③為無效假設檢驗所對應的p值。

 本例結果表明:5組的中位數有顯著的差異。即:5 個不同飼料組的小鼠肝臟中鐵的含量有顯著差異,說明小鼠肝臟中鐵的含量與餵養的飼料有關。

相關焦點

  • LR檢驗、Wald檢驗、LM檢驗什麼鬼?怎麼在Stata實現
    LR檢驗應用的一個前提條件是這兩個待比較的模型應該是分級的巢式模型。也就是說,相對於簡單模型,複雜模型僅僅是多了一個或者多個附加參數。LR檢驗統計量的計算公式為:Stata命令和檢驗結果如下所示: Wald 檢驗是先對原方程(無約束模型)進行估計,得到參數的估計值,再代入約束條件檢查約束條件是否成立。
  • Stata:格蘭傑因果檢驗
    ;所用的命令就是test特別說明,此處p和q的取值完全可以不同,而且應該不同,這樣才能獲得最有說服力的結果,這也是該方法與其他兩個方法相比的最大優點,該方法缺點是命令過於繁瑣。與BIC 取值,以便選擇最佳滯後期)特別說明,在選定滯後期後,對於因果關係檢驗,該方法提供F檢驗和卡方檢驗。
  • Stata結果輸出:Yes, Yes, No 回歸結果中不報告年度、行業虛擬變量的係數
    簡言之,在估計模型時,我們需要加入這些虛擬變量,而在最終呈現結果時,只在表格中進行標註,說明我們已經控制了這些虛擬變量,而受限於篇幅,沒有呈現這些變量的估計係數。解決方法 1事實上,Stata 裡有多個命令可以幫我們處理這種情形。這裡以 esttab 命令為例進行說明。2.1 esttab 命令輸出結果的原理所有這些輸出結果的命令,背後的基本原理都是相同的。
  • 多個獨立樣本的非參數檢驗
    多個獨立樣本的非參數檢驗多組定量數據的比較用什麼檢驗方法?
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • Stata第九章 多因素方差分析命令與輸出結果說明
    本節STATA命令摘要:anova  觀察變量 分組變量1  分組變量2… 分組變量mtabulate 分組變量1 分組變量2,summarize(觀察變量) 在anova命令中分組變量可以是其它分組變量的乘積表達式,如:分組變量1*分組變量2。
  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 王群勇教授《給小白的計量入門課》答疑分享
    xtbalance命令的具體用法:xtbalance, range(numlist) [ miss(varlist) ] Husman檢驗結果如果為隨機效應模型,說明你的數據更適合建立隨機效應模型,一般如果可以建立固定效應模型的要求高於隨機效應模型,通常來說固定效應模型使用的更多。
  • 零基礎的同學如何用stata做一元線性回歸模型?
    stata軟體越來越受研究生的喜歡,很多研究生在做統計研究、學術分析的時候,也多選用此軟體。網上有關stata的教程有很多,但對於沒有基礎的同學來說,學起來稍微就有些吃力了。那麼,零基礎的同學應該如何學習呢?如何用stata做出滿意的一元線性回歸模型呢 ?
  • 似然比檢驗、Wald檢驗和拉格朗日檢驗的Stata實現 討論
    似然比檢驗(LR)、Wald檢驗、拉格朗日檢驗(LM)都基於最大似然估計(MLE),本文以logit模型為例討論三類檢驗的
  • 多組比較的非參數檢驗——K-W檢驗
    作者:丁點helper來源:丁點幫你前面我們已經講完兩組比較的非參數檢驗,類似t檢驗與方差分析,當比較的數據超過兩組時,我們就需要換一個方法了。非參數K-W檢驗,相比前文講解的Mann-Whitney 檢驗就是這樣,我們可以把它理解為「非參數檢驗的方差分析」。K-W檢驗的全稱為,Kruskal-Wallis檢驗,它是用於正態分布條件不滿足情況下,多組獨立樣本方差分析的替代。
  • 2019-2020(1)學期計量經濟學倒數第2課:5分鐘構建面板數據模型:原理要點、操作視頻與流行問題命令精選匯總
    輸入命令:xtreg ln_wage grade age age2 ttl_exp exp2 tenure tenure2 black not_smsa south, mle//其中,選項mle表明用極大似然估計法進行隨機效應回歸分析。•4 Hausman檢驗
  • 【廣州站】Stata空間計量與結構模型研討會開始報名啦!
    ,SLX模型,SAC模型,空間Durbin模型,空間Durbin誤差模型)5.空間效應的Moran檢驗6.空間權數矩陣的選擇7.空間面板模型(固定效應和隨機效應)第三天:非參數方法和模擬方法案例1:非參數回歸案例2:部分線性模型案例3:分位數回歸案例
  • 廣州站|中國經濟與STATA教學高級研討會
    報名參加我們的微觀數據處理與計量方法、空間計量經濟模型、非參數和模擬方法、結構方程模型(SEM)等內容的Stata應用課程。1.描述統計分析2.回歸分析(線性回歸,穩健回歸)3.內生性與工具變量法4.處理效應(傾向得分法、匹配法等)5.輸出分析結果到Word文件第二天:空間計量經濟模型
  • 單變量計量資料的分析
    Step6 是否滿足檢驗方法所需的條件。那麼今天我們就開始講講常用的單變量計量資料的分析方法的選擇!反應變量為單變量→計量資料→單因素→樣本與總體均數比較→如服從正態分布選用單樣本t檢驗,如不服從考慮非參數檢驗方法。
  • 非參數檢驗 之 k個相關樣本檢驗
    >配伍組設計定量或等級資料的一種非參數檢驗方法。參數選擇  (1)選擇 分析—非參數檢驗—舊對話框—k個相關樣本    示例2:具體數據同示例1,仍是分析治療不同的結果之間差異。  1.參數選擇  (1)選擇 分析—非參數檢驗—相關樣本
  • 【ECON-01】貿易引力模型及其Stata實現
    stata提供一個檢驗個體效應的LM檢驗(LM test for individual-specific effects),命令:xttest0接下來,將進行OECD成員國樣本回歸、只考慮歐盟27國樣本回歸,並把剛剛的全樣本回歸再執行一遍,並將結果導出,命令:*全樣本回歸qui xtreg lexp lgdp1 lgdp2 ldistwces contig lang colony landlock lpop1 lpop2 lnrer, reest store m1* OECD樣本回歸qui
  • 一篇概全:非參數檢驗思路總結
    ② 檢驗效能:如果數據滿足參數分布,應該優先選擇參數檢驗方法。願因在於參數檢驗的檢驗效能要高於非參數檢驗。尤其是在樣本數較大的情況下,參數檢驗結果較為穩健,所以即使不服從正態分布,也會選擇參數檢驗。參數檢驗參數檢驗用平均值及標準差描述樣本分布請況。非參數檢驗非參數檢驗結果中使用的是中位數描述差異。
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。分析--描述統計--探索,將指標全部放進因變量列表裡,將組放進因子列表裡,單擊 圖 ,勾選含檢驗的正態圖--繼續--確定。輸出結果,看正態性檢驗。一般情況下(樣本量比較少)看夏皮諾威爾克檢驗結果。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    已經有成熟的研究經驗,方差分析對正態分布的要求有一定耐性,並不過分敏感,(微小偏態)近似正態分布的數據繼續採取ANOVA單因素方差分析是可以的,結果仍然可靠。遇到偏態嚴重的數據怎麼辦呢?此時可以嘗試非參數檢驗方法:Kruskal-Wallis 單因素 ANOVA(k 個樣本)檢驗。