均值T檢驗

2021-03-01 經管學苑

對於一篇實證論文來說,再怎麼關注描述性統計都不為過。通常的描述性統計主要用來呈現清洗完畢後的數據的統計特徵,比如樣本量、均值、中位數、標準差、最小值和最大值。

今天要講的是描述性統計中描述數據特徵的另一種方式:分組均值T檢驗。所謂均值T檢驗,直白點說就是通過t檢驗來判斷兩組樣本的均值在統計上是否有差異。比如我們在研究稅收優惠與企業稅負問題時,就可以用t檢驗來看一看稅收優惠企業與非稅收優惠企業之間的稅負是否存在顯著差異。再比如企業問題研究中通常涉及的產權異質性,我們可以先用t檢驗來看一看關鍵變量在國有企業和非國有企業之間是否存在明顯區別。

相較於通常的描述性統計,均值T檢驗則進一步提供了不同組別之間的差異信息,並能夠為接下來通過實證考察組別異質性提供一定依據——以分組回歸考察異質性為例,我們之所以進行分組回歸,是因為預期關鍵變量的回歸表現(符號、係數或顯著性)在不同組別具有差異性。換言之,如果在不同組別中關鍵變量的表現一致,那麼分組回歸的意義便不大。因此,我們可以提前在描述性統計部分利用均值T檢驗看一看關鍵變量在組別間是否具有顯著的統計差別。(要說明一下的是,均值T檢驗下組別之間無差異並不必然表示分組回歸沒有差異和意義,這是因為做均值T檢驗時並未考慮其他因素的影響。)

在Stata中,可以很容易地實現均值T檢驗,用命令ttest即可,命令格式為:


其中,varname為感興趣的關鍵變量,groupvar為分組變量。以Stata自帶的數據集為例,我們想看一看國產車和外國車價格之間是否存在顯著差異,命令便可以寫成:


結果如下表所示:


由結果可知,國產車的均價為6072.423,外國車的均價為6384.682,兩者之間的差價為-312.2587,t值為-0.4139表示兩者之間的差異在統計上並不顯著。

命令ttest的操作很簡單,不過缺點在於一次只能執行一個關鍵變量,當我們想同時看一看多個變量在不同組別之間的差異時,需要重複執行多次,既不效率,也不利於多個結果的匯總。因此這裡介紹一個蠻好用的命令ttable3,這個命令由連玉君老師編寫,可以一次性執行多個變量,並可以實現中位數T檢驗。

由於該命令目前尚未被Stata官方收錄,需要手動下載並放至相應的根目錄位置,具體的下載連結為:http://bbs.pinggu.org/thread-2765062-1-1.html 。ttable3的介紹與語法如下,默認的是均值檢驗:


還是以Stata自帶的數據集為例,同時執行多個變量的命令可以寫成:


結果如下所示:


表的最後1列展示了國產車和外國車在各個變量上的均值差異,並給出了顯著性標識。如果我們想得到中位數差異,只需要在by後面加上median選項即可。事實上,我們還可以利用logout命令很方便的把上述結果導出到excel或rtf等文檔中:

由南開大學數量經濟研究所所長王群勇教授及其學術團隊主辦,旨在定期與大家分享計量經濟學的相關理論及軟體使用技巧,覆蓋經濟學、管理學、社會學等學科,為廣大學友提供優質學術內容。

▲長按二維碼關注

相關焦點

  • 參數估計與假設檢驗(七)-- 獨立雙樣本均值T檢驗
    本文對獨立雙樣本均值T檢驗做進一步的介紹。在雙樣本條件下,也可以通過構造t統計量利用T分布理論來比較兩樣本所代表的總體的均值是否有顯著差異,如果兩個樣本是完全獨立的,該檢驗就叫做獨立雙樣本均值T檢驗(如圖10.18所示)。
  • 只有均值、標準差、樣本量可以進行獨立樣本t檢驗和方差分析嗎?
    在實際工作和學習中,經常有非統計學專業的審稿老師諮詢,沒有原始數據只有樣本量、均值和標準差可以進行兩組獨立樣本t檢驗,方差分析以及組間兩兩比較嗎
  • 一篇文章看懂t檢驗
    比如:分析某大學女生的平均身高是否達到全國女大學生的平均身高水平。在下面的這個案例中,我想以95%的置信度(對應的顯著水平為0.05)判斷這組數據的均值是否等於250,同時輸出這組數據90%的置信區間。
  • 假設檢驗、Z檢驗與T檢驗
    單樣本t檢驗雙樣本t檢驗Z檢驗和t檢驗的決定案例研究:Python冠狀病毒的假設檢驗假設檢驗基礎讓我們舉一個例子來理解假設檢驗的概念。一個人因刑事犯罪正在接受審判,法官需要對他的案件作出判決。單樣本Z檢驗當我們想比較樣本均值和總體均值時,我們執行單樣本Z檢驗。下面是一個了解單樣本Z檢驗的示例假設我們需要確定女生在考試中的平均分是否高於600分。我們得到的信息是女生成績的標準差是100。
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    如何利用SPSS計算單樣本t檢驗step1:數據源舉例:某機器自動化裝食品袋重量服從正態分布,均值為10g,現從中抽樣10袋,測得每袋重量如下:10.110910.310.8119.89.3109.9Cosset在1908年以筆名「" student」發表的,因此亦稱 student t檢驗( Student' s t test)。
  • Python數據科學:正態分布與t檢驗
    02 單樣本t檢驗單樣本t檢驗是最基礎的假設檢驗,其利用來自總體的樣本數據,推斷總體均值是否與假設的檢驗值之間存在顯著差異。P值大於顯著性水平,則無法拒絕原假設。P值小於顯著性水平,則拒絕原假設。下面在Python中進行單樣本t檢驗,使用電影評分數據,假設均值為8.8分。
  • 「spss數據分析系列」t檢驗
    一、t統計量及t檢驗本人介紹spss數據分析中的t檢驗,我們平時分析數據時經常對比均值,其中兩分類的均值對比採用的t檢驗,這裡強調一下的是兩分類的對比,其他還有獨立樣本t檢驗,配對t檢驗,我們在下面spss軟體部分再做說明
  • 卡方檢驗,T檢驗和F檢驗
    t檢驗為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,一般是小樣本,n<30。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。這裡主要舉例說明雙總體檢驗(即獨立樣本t檢驗),雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。獨立樣本t檢驗統計量為:
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    若是單組設計,必須給出一個標準值或總體均值,同時,提供一組定量的觀測結果,應用t檢驗的前提條件就是該組資料必須服從正態分布;若是配對設計, 每對數據的差值必須服從正態分布;若是成組設計,個體之間相互獨立,兩組資料均取自正態分布的總體,並滿足方差齊性。之所以需要這些前提條件,是因為必須 在這樣的前提下所計算出的t統計量才服從t分布,而t檢驗正是以t分布作為其理論依據的檢驗方法。
  • 統計學基礎-t檢驗基本原理
    t檢驗主要分類    t 檢驗可分為單樣本(單總體)檢驗和兩獨立樣本檢驗以及配對樣本檢驗單樣本t 檢驗    樣本均數與總體均數比較的t檢驗,叫做單樣本資料的t檢驗。,即假設樣本均數等於總體均值備擇假設H1:
  • 【實例】Excel數據分析之假設檢驗中的t-檢驗應用
    (建議查看統計學相關知識)t-檢驗:T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分布資料。t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。
  • t檢驗的效應量
    t檢驗的效應量,我們用Cohen's d表示,簡寫為d,反映兩個均數之間的標準差異:其中分母是兩個獨立樣本的聯合標準差,計算方法為兩個樣本標準差的平方平均數,即不過注意了,這是獨立樣本的計算方法,配對樣本中共同標準差採用配對數據差值的標準差即可,不用這一公式。
  • 淺入淺出 | 學生t檢驗 (附qPCR計算升級版)
    假設檢驗假設檢驗這個東西,我們顧名思義,就是檢驗某一個假設,所以,這就很自然地引出兩個重點,欸對,兩個重點就是:我們可以這麼理解student t檢驗這個東西:我有兩組數據,A和B。這裡有兩個統計學的術語:除了T檢驗,還有別的檢驗,不同的檢驗都有對應的假設和檢驗方法,比如F-檢驗,卡方檢驗,秩和檢驗等,適用於不同的情況,有不同的目的,使用前要搞清楚。
  • 三種T檢驗的詳細區分
    概念T檢驗是通過比較不同數據的均值,研究兩組數據之間是否存在顯著差異。 02. t檢驗的前提條件無論是單樣本T檢驗、獨立樣本T檢驗還是配對樣本T檢驗,都有幾個基本前提:(1)T檢驗屬於參數檢驗,用於檢驗定量數據(數字有比較意義的),若數據均為定類數據則使用非參數檢驗。(2)樣本數據服從正態或近似正態分布,若不滿足,則可考慮使用非參數檢驗。
  • 理解 t 檢驗與 F 檢驗的區別
    它主要用於:均數差別的顯著性檢驗、分離各有關因素並估計其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗等情況。t檢驗過程,是對兩樣本均數(mean)差別的顯著性進行檢驗。惟t檢驗須知道兩個總體的方差(Variances)是否相等;t檢驗值的計算會因方差是否相等而有所不同。
  • SAS、SPSS、JMP、Excel四種統計分析軟體實現t檢驗
    先填一口知識糧:什麼是t檢驗?數據統計分析的一種基本方法。 t檢驗能做什麼?常用於兩組定量資料均值比較,以推斷總體均值差異是否有統計學意義。如比較兩個班級學生的身高差異是否有統計學意義,如比較某公司兩個地區的管理成本差異是否有統計學意義等。
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。可以看到,只有E指標被試組和健康組2組都符合正態性(2組中只有一組符合正態性也不能使用獨立樣本t檢驗)。所以,A指標,B指標,C指標,D指標使用非參數秩和檢驗,E指標使用獨立樣本t檢驗。非參數檢驗:分析--非參數檢驗--舊對話框--2個獨立樣本。
  • 兩樣本t檢驗原理與R語言實現
    t檢驗也稱為student t檢驗,可以用來比較兩個均值的差異是否顯著,可分為單總體檢驗、雙總體檢驗、配對樣本檢驗。1.1歷史要了解t檢驗,就不得不提及他的發明者威廉·西利·戈塞特(William Sealy Gosset)。
  • 你知道T檢驗與F檢驗嗎?
    為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。2. 另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。單樣本t檢驗:是用樣本均數代表的未知總體均數和已知總體均數進行比較,來觀察此組樣本與總體的差異性。
  • T檢驗的實踐運用(二)
    本文作者將用最精煉的語言和簡單的案例,讓你能夠快速將T檢驗運用到實戰當中。因此不用糾結過多的統計學理論而不能自拔,知道怎麼運用即可。本文是T檢驗的實踐運用系列第二篇-相依樣本T檢驗。上一篇我們講到了單樣本T檢驗,我們回顧一下它是用來做什麼的:如果我們只有一個樣本,假設樣本均值為,總體的均值為μ,我們想知道,這個樣本來自的總體是否與具有這個均值的總體顯著不同?通俗的來講,就是想知道我們手裡的這個樣本與總體的差距,它比總體表現好,還是表現差。那麼,假如我們有兩個版本的方案設計,如何簡單的判斷兩個版本的方案誰好誰壞呢?