等級變量的假設檢驗怎麼做?

2020-12-06 CDA數據分析師

作者:丁點helper

來源:丁點幫你

今天,我們講等級變量的假設檢驗。首先,回顧一下,什麼叫等級變量,也稱有序變量。

一般而言,等級變量屬於分類變量(如上)的一種,與之相對的就是無序變量。大家生活中經常碰到的「滿意程度」就是一個等級變量。

當我們比較兩組人群,比如男女,對某項服務的滿意程度時,就會用到秩和檢驗。這其中的緣由是什麼呢?

我們先把「等級變量」好好研究一番。

假設有8名顧客對某個餐廳的服務用「非常滿意」、「滿意」、「不滿意」和「非常不滿意」進行評分,一般來講,我們會把這些結果分別用「1」到「4」的數字進行編碼。

比如,這8名顧客的打分結果為「1、2、2、3、1、4、3、2」。單從數字上看,大部分人應該比較「滿意(2)」或「非常滿意(1)」。

可是,如何衡量平均的服務滿意程度?很顯然,可以算個平均數。上述8個數計算出來:平均數是「2.6」。

仔細想想,這裡的2.6到底代表什麼,是「比較滿意」還是「比較不滿意」?好像都說得通,但仍然很含糊。

所以,在對等級變量求均數時,難以避免出現小數,而一旦出現小數,就會難以解釋。

這時,採用秩和檢驗,使用秩代替原始數據,通過比較總體分布的形態來進行統計推斷,就避免了等級變量不同級別的均值無法解釋的困境。

而我們之前所講的t檢驗、方差分析等,叫做「依賴參數」進行的統計檢驗,即參數檢驗。

比如用總體均數這個參數,通過樣本數據構造統計量,最後結論的專業解釋或含義,也常常通過樣本均數的大小進行闡述。

下面,我們通過一個案例來具體看看如何用SPSS進行相關檢驗的操作。

某研究團隊2007年7月至11月對西藏拉薩市和山南地區大骨節病進行流行病學調查,獲得了兩個地區受檢人群大骨節病不同臨床分度的數據,見下表。現比較兩個地區的大骨節病臨床分度是否具有統計學差異?

上表中的「臨床分度」就是一個等級變量,本例想要比較的就是兩個地區(拉薩和山南)大骨節病患者的臨床分度是否有差異,屬於兩獨立兩本的非參數檢驗。

上表同時給出了秩和檢驗求秩和的具體步驟,感興趣的同學可以對照表格每列前面的序號了解一下。

不過我們現在主要採用軟體檢驗,所以也可以不用完全搞明白背後的數學邏輯。

SPSS的操作步驟截圖如下:

兩獨立樣本非參數檢驗

默認選用Mann-Whitney U 檢驗

檢驗結果

根據上表檢驗的P值(Asmp.Sig.)來看,P=0.883>0.05,差異無統計學意義。α=0.05水準不拒絕H0,尚不能認為拉薩和山南地區的大骨節病臨床分度的差異有統計學意義。

相關焦點

  • 一文讀懂假設檢驗怎麼做
    假設檢驗定義假設檢驗是先對總體參數提出一個假設值,然後利用樣本信息判斷這一假設是否成立。假設檢驗的假設由定義可知,我們需要對結果進行假設,然後拿樣本數據去驗證這個假設。所以做假設檢驗時會設置兩個假設:一種叫原假設,也叫零假設,用H0表示。
  • excel假設檢驗 - CSDN
    原假設與備用假設H0:原假設,零假設----零是相關係數為0,說明兩個變量無關係H1:備用假設如何設置原假設:1)H0與H1是完備事件組,相互對立,有且只有一個成立2)在確立假設時,先確定備設H1,然後再確定H0,且保證「=」總在H0上3)原H0一般是需要反駁的,而H1是需要支持的4)假設檢驗只提供原假設不利證據即使「假設」設置嚴密,檢驗方法「精確」;假設檢驗始終是建立在一定概率基礎上的,所以我們常會犯兩類錯誤;第一類:原H0是真,卻拒絕原假設;犯
  • 等級分組資料常用假設檢驗方法
    Ridit分析Ridit分析(Ridit analysis)是Bross在1956年提出的一種非參數統計檢驗方法,檢驗效能較高,可用於等級分組資料的分析處理.其特點是通過Ridit轉換,把原本不適宜用t檢驗和u檢驗處理的離散型的等級資料轉換成連續型的計量資料。
  • 假設檢驗學習筆記
    假設檢驗分析思路為了得到用戶的年齡情況,參數估計,基於用戶樣本數據估計整體用戶年齡。假設檢驗思路根據經驗或者其他方面的信息假設一個總體用戶的年齡的可能值,在根據樣本情況,使用工具來驗證假設是否正確。假設檢驗的主要步驟設定初始假設初始假設:用戶的平均年齡32驗證結果:接受或者拒絕這個假設雙尾檢驗:默認假設=,對應假設為>或<有2個默認拒絕假設的空間。
  • 統計:如何用Excel完成雙樣本假設檢驗
    在 Excel中,選擇z-檢驗:從「數據分析」菜單中選擇「雙樣本平均差檢驗」。這一檢驗使用的檢驗統計量,基於標準正態分布。2.母體方差未知並假設相異。從「數據分析」菜單中選擇「t檢驗雙樣本異方差假設」。這種情況下的檢驗統計量具有t分布。3.母體方差未知並假設相等。
  • SPSS教程:3個及以上觀察者的一致性檢驗(Kendall's W檢驗)
    對於這種存在3位及以上觀察者、結局變量為連續變量或有序分類變量的一致性檢驗,推薦使用Kendall's W檢驗。一般來說,採用Kendall's W 檢驗的研究設計需要滿足以下3項假設:  假設1:觀察者不少於3人,判定結果是連續變量或有序分類變量。
  • 數據分析必備統計學(二):假設檢驗
    講完概率分布,再來講講統計學的最後一個知識點——假設檢驗。假設檢驗是數理統計學中根據一定假設條件由樣本推斷總體的一種方法。事先對總體參數或分布形式作出某種假設,然後利用樣本信息來判斷原假設是否成立,採用邏輯上的反證法,依據統計上的小概率原理。為了更好的解釋,這裡舉個例子。
  • 什麼是好的研究假設?——順談與自變量、因變量的關係
    ,這個關係裡包含一個自變量和一個因變量, 這個研究假設需要提出了一個自變量是如何解釋該因變量的。仔細看這個定義我們能看出這麼幾層意思:只討論了一個變量的假設並不是研究假設。比如,「明天天氣會變暖」---這裡面只有一個變量,就是「天氣」,它沒有提出兩個變量之間的關係,變暖這個事情是天氣的特徵值(value),而不是variable;研究假設裡面要提出自變量和因變量的關係,將自變量和因變量進行「聯結」。
  • 假設檢驗:使用p值來接受或拒絕你的假設
    介紹檢驗是統計學中最基本的概念之一。不僅在數據科學中,假設檢驗在各個領域都很重要。想知道怎麼做?讓我們舉個例子。現在有一個lifebuoy沐浴露。沐浴露廠商聲稱,它殺死99.9%的細菌。他們怎麼能這麼說呢?必須有一種測試技術來證明這種說法是正確的。所以假設檢驗用來證明一個主張或任何假設。
  • 線性回歸假設檢驗專題及常見問題 - CSDN
    比如 04/01 和 04/02 兩天的玩偶個數都是10,但前者成本為7.7,後者成本為9.87.這說明變量 y 似乎帶有某種隨機性。並且在散點圖中,我們同樣得到 x 與 y 似乎存在某種線性關係。在上面公式的基礎上,進一步假設。其中假設的 第二點 和 第三點 可能與現實情況衝突。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。
  • 多元線性回歸的模型解釋、假設檢驗、特徵選擇
    最後,我們將深入學習線性回歸,學習共線性、假設檢驗、特徵選擇等內容。現在有人可能會想,我們也可以用簡單的線性回歸來分別研究我們對所有自變量的輸出。為什麼需要線性回歸從多個輸入變量預測結果。但是,真的是這樣嗎?
  • 什麼是好的研究假設(Hypothesis)?——順談與自變量、因變量的關係
    可驗證的關係的假設,這個關係裡包含一個自變量和一個因變量, 這個研究假設需要提出了一個自變量是如何解釋該因變量的。比如,「明天天氣會變暖」---這裡面只有一個變量,就是「天氣」,它沒有提出兩個變量之間的關係,變暖這個事情是天氣的特徵值(value),而不是variable;研究假設裡面要提出自變量和因變量的關係,將自變量和因變量進行「聯結」。
  • 卡方檢驗在實際工作中的應用
    卡方檢驗是以χ2分布為基礎的一種常用假設檢驗方法,統計樣本的實際觀測值與理論推斷值之間的偏離程度,主要在分類數據資料統計推斷中應用,如兩個或多個率/構成比之間的比較以及分類資料的相關分析等。基於這個定義,我們了解到卡方檢驗的適用範圍是「分類數據」,即說明事物類別名稱的數據,比如「性別」是一個分類變量,其變量值是「男」或「女」,兩者之間無法進行運算或比較。此案例為什麼合適?
  • 1分鐘操作視頻:趨勢性檢驗 P for trend,當Y為連續變量時
    趨勢性檢驗是論文中常出現的分析方法。結局指標Y是連續變量時,如何做趨勢性檢驗?
  • 假設檢驗的邏輯
    科學研究是去偽存真的過程,假設檢驗則是實現這一過程的基本方法。
  • 管理心理學之統計(25)獨立性卡方檢驗的效應假設限定與特殊應用
    2.卡方檢驗的假設與限定使用擬合度卡方檢驗或獨立性卡方檢驗必須滿足幾個條件。否則犯第一類錯誤的可能性就會出現偏差。3.卡方檢驗的特殊應用卡方檢驗是一種非參數檢驗。雖然非參數檢驗有自己的獨特功能,但也可以被看作是參數檢驗的一個代替方法。3.1卡方與皮爾遜相關獨立性卡方檢驗與皮爾遜相關都是用來評估兩個變量間關係的統計技術。
  • 統計學中的假設檢驗
    假設檢驗的特點就是採用邏輯上的反證法和依據統計上 的小概率原理。小概率事件在單獨一次的試驗中基本上不會發生,可以不予考慮。在假設檢驗中,我們做出判斷時所依據的邏輯是:如果在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬於小概率事件,那麼可以認為原假設不可信,從而否定它,轉而接受備擇假設。
  • 假設檢驗的區別 - CSDN
    作為一個統計愛好者,所有這些問題都挖掘了我對假設檢驗基本原理的舊知識。本文將討論假設檢驗的概念以及Z檢驗與t檢驗的區別。然後,我們將使用COVID-19案例研究總結我們的假設檢驗學習。目錄假設檢驗基礎基本概念-零假設、替代假設、類型1錯誤、類型2錯誤和顯著性水平進行假設檢驗的步驟定向假設非定向假設檢驗什麼是Z檢驗?什麼是t檢驗?
  • 假設檢驗的基本步驟
    假設檢驗的基本步驟  假設檢驗的基本思想是:根據所獲樣本,運用統計分析方法,對總體X的某種假設 做出接受或拒絕的判斷。在這裡,備擇假設還可能有兩種設置形式,它們是:  : <1.40或 : >1.40  備擇假設的不同將會影響下面拒絕域的形式,今後稱  對 的檢驗問題是雙側假設檢驗問題  對 的檢驗問題是單側假設檢驗問題  對 的檢驗問題也是單側假設檢驗問題  註:若假設是關於總體參數的某個命題