管理心理學之統計(25)獨立性卡方檢驗的效應假設限定與特殊應用

2020-11-29 百家號

1. 測量獨立性卡方檢驗的效應大小

對於兩個二元變量,即卡方檢驗形成的2x2矩陣,我們可以計算相關φ,計算公式如下:

φ係數的值完全由2x2數據矩陣的比例決定,與頻數大小的絕對值完全無關。對φ的解釋與評估相關的標準相同:0.10是小效應,0.30是中效應,0.50是大效應。φ值的平方與r2一樣可以用作解釋方差的百分比。

當卡方檢驗涉及比2x2大的矩陣時,需要調整φ係數,可以用Cramer’s V來衡量效應大小。

df*與卡方檢驗的自由度不完全相同,是(R-1)或(C-1)當中較小的那個數。因此當df*=1時,解釋V的標準與φ係數完全相同。

2.卡方檢驗的假設與限定

使用擬合度卡方檢驗或獨立性卡方檢驗必須滿足幾個條件。否則犯第一類錯誤的可能性就會出現偏差。

A.觀察的獨立性

獨立觀察是指一個結果是每個觀察頻數都是從不同的被試中得到的。如果一個人的答案可以被歸入多個類別或者在一個類別中可以被技術多次,則不適合使用卡方檢驗。

B.期望頻數的大小

任意一個單元的期望頻數小於5時,不應該使用卡方檢驗。較小的分母fe值會對總卡方值造成較大印象。避免的方法是使用較大的樣本。

3.卡方檢驗的特殊應用

卡方檢驗是一種非參數檢驗。雖然非參數檢驗有自己的獨特功能,但也可以被看作是參數檢驗的一個代替方法。

3.1卡方與皮爾遜相關

獨立性卡方檢驗與皮爾遜相關都是用來評估兩個變量間關係的統計技術。當兩個變量由等距或等比量表得到的數值組成時,應使用皮爾遜相關。如果數據是由將個體歸類到類別中得到的稱名或順序量表的測量數據,應使用獨立性卡方檢驗。

這兩個統計過程的目的也不同。獨立性卡方檢驗評估的是關係的顯著性,即樣本數據中觀察到的關係是否顯著大於偶然的隨機期望。皮爾遜相關的主要目的是測量相關的強度。平方相關提供了對效應大小的測量。它描述了一個變量的方差中由它與另一個變量的關係決定的那部分的比例。

3.2 φ係數

二元變量之間的關係可以用φ係數或2x2獨立性卡方檢驗來評估。φ係數表明了關係的強度,卡方檢驗評估了關係的顯著性

3.3 獨立測量t檢驗與ANOVA

獨立測量t檢驗與ANOVA是檢驗自變量與因變量之間關係的統計過程。要求因變量的分數由等距或等比數值組成。獨立性卡方檢驗常常可以被用來代替t檢驗,特別是在以下情況中:

A.自變量是準自變量組成。例如性別,年齡。

B.因變量包含稱名或順序數據

3.4 獨立樣本的中數檢驗

中數檢驗是獨立測量t檢驗的非參數代替。它能確定在兩個或多個獨立樣本之間是否存在顯著差異。中數的虛無假設為:來自總體的不同樣本具有相同的中數。備擇假設為:樣本來自不同總體,它們的中數不同。

中數檢驗的邏輯是從同一個總體分布中取出幾個不同的樣本,每個樣本應該有大約一半數據大於總體中數,一半小於總體中數。也就是說所有不同的樣本應該分布在同樣的中數附近。而如果樣本來自具有不同中數的總體,那麼樣本數據會偏大或偏小。

中數檢驗需要構建一個矩陣,每個樣本組成一列兩行,一行是大於中數的個體,一行是小於中數的個體。用獨立性卡方檢驗評估這個頻數分布的矩陣。期望頻數和卡方值的計算公式不變。

對於中數檢驗的解釋需要注意:

A.中數檢驗不是平均數差異檢驗,不受極端值的影響。分布的平均數與中數並不總是相同的,甚至它們可以毫無關係。

B.中數檢驗比較的是一個樣本分布與另一個樣本分布之間是否存在顯著差異,如果得出顯著的結果,最好的解釋是樣本的分布間存在差異。它不是直接比較一個樣本的中數與另一個樣本的中數。

參考書目:行為科學統計,現代心理與教育統計學

相關焦點

  • 管理心理學之統計(24)獨立性的卡方檢驗
    1.獨立性檢驗的虛無假設獨立性卡方檢驗的虛無假設為:被測量的兩個變量是獨立的。這個假設可以被分成兩個不同的概念形式A. 數據被看作一個樣本,每個個體都有在兩個變量上的測量值。例如,H0:對於學生的一般總體,在顏色喜好與性格之間不存在關係。
  • 管理心理學之統計(23)擬合度卡方檢驗
    什麼是卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇。其根本思想在於使用樣本頻數與比例來檢驗關於相應總體值的假設。當實驗數據不是等距或等比數據時,實驗不符合參數檢驗的要求,實驗者可以使用擬合度卡方檢驗與獨立性卡方檢驗這兩種方法作為替代,使用樣本數據來評估關於總體內部的比例或關係。這兩種卡方檢驗和多數非參數檢驗一樣,沒有陳述關於特定參數的假設,也很少對總體分布做出假設,因此非參數檢驗有時被稱為任意分布檢驗。
  • 卡方檢驗原理與應用實例
    本期推送的另外幾篇文章,來自微信公眾號「amegroups  」,長按下方二維碼,關注該公眾號。關注後,回復「卡方檢驗」即可看原文,給出出處,以防止轉載過程中,關鍵信息丟失影響閱讀時,找不到原文。怎麼理解這句話呢,拿一個群體的身高來說,理論上身高低於1米5的佔10%,高於2.0的佔10%,中間的佔80%,現在我們抽取了這個群體中的一群人,那麼對應這三個身高段的人數的比例關係是不是1:8:1呢?卡方分析就是解決這類問題。2)卡方檢驗的原理:上面已經提到卡方檢驗是檢驗實際的分布於理論的分布時候一致的檢驗,那麼用什麼統計量來衡量呢!
  • 管理心理學之統計(9)效應與效能
    方向性(單尾)假設檢驗標準的假設檢驗又稱為雙尾檢驗。雙尾這個詞來自於臨界區域位於分布的兩個尾端的這個事實。如果研究者對處理效應有一個具體的方向性的預測,通常會被稱為單尾檢驗。在單尾檢驗中,統計假設H0和H1規定了總體平均數的增加或減少,臨界區域只位於分布的一個尾端。方向性檢測的不同之處在於:A. 在假設檢驗第一步中,方向性預測被加入到了假設的陳述中。B.
  • 卡方檢驗在實際工作中的應用
    卡方檢驗是以χ2分布為基礎的一種常用假設檢驗方法,統計樣本的實際觀測值與理論推斷值之間的偏離程度,主要在分類數據資料統計推斷中應用。在電商平臺中,廣告圖到處可見,引起用戶興趣,為商品或者店鋪帶去流量。表徵廣告圖是否「優秀」的關鍵數據就是CTR(Click-Through-Rate,點擊通過率)。
  • 生物統計專題:用R進行獨立性檢驗的4種方法
    上期內容回顧上期介紹了一維列聯表、二維列聯表及多維列聯表的生成方法,對本期獨立性檢驗和卡方檢驗有重要意義,下面一起回顧一下吧:1、一維列聯表:調用table()函數,還可以使用prop.table()函數獲取頻率統計表
  • 卡方分布與卡方檢驗
    本文轉載自CSDNsselssbh的卡方分布與卡方檢驗 https://blog.csdn.net/bitcarmanlee
  • 六西格工具之卡方(Chi-square)檢驗
    什麼是卡方(Chi-square)檢驗     卡方(Chi-Square)檢驗,被譽為二十世紀科學技術所有分支中的20大發明之一,它的發明者是英國的數學家卡爾·皮爾遜(Karl Pearson)。     卡方(Chi-Square)檢驗是當影響因子(X)和結果(Y)是分類/屬性數據時的一種假設檢驗。
  • T檢驗、F檢驗和卡方檢驗
    T檢驗、F檢驗、卡方檢驗是統計學中常見的假設檢驗,今天記錄下這幾個假設檢驗的原理和應用場景。
  • 卡方檢驗,T檢驗和F檢驗
    卡方檢驗、T-test、F檢驗區別卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    混合模型設計概述:由於傳統的重複測量方差分析假設任意組內因子的協方差矩陣為球形,並且任意組內因子兩水平間的方差之差都相等。本章中將學習如何對多種統計檢驗進行功效分析,包括比例檢驗、t檢驗、卡方檢驗、平衡的單因素ANOVA、相關性分析,以及線性模型分析。由於功效分析針對的是假設檢驗,我們將首先簡單回顧零假設顯著性檢驗(NHST)過程,然後學習如何用R進行功效分析,主要關注於pwr包。
  • python卡方檢驗 - CSDN
    卡方檢驗可以用於判斷兩個類別變量的相關性是否顯著。在分類的應用場景中可以用卡方檢驗選擇特徵,特徵與目標變量的相關性越顯著說明特徵越重要,預測力越強。      一、先簡單介紹一下卡方檢驗的步驟。假設y為目標變量,取值為好和壞,x為特徵變量取值為高、中、低。
  • 反思統計方法在心理學領域的應用
    統計推斷,主要包括假設檢驗、預測、統計回歸及統計建模等。其中應用最為廣泛的是奈曼(Jerzy Neyman)、皮爾遜(Egon S. Pearson)等人提出的以客觀概率為基礎的假設檢驗,這通常又是其他統計推斷理論的基礎。假設檢驗在心理學研究的應用中,有一個極為重要的指標——p值,即統計顯著性。
  • 1151期-3:【統計】卡方檢驗詳細講解
    1四格表資料的卡方檢驗用於進行兩個率或兩個構成比的比較應用條件:要求樣本含量應大於40且每個格子中的理論頻數不應小於5。當有T<1或1<T<5的格子較多時,可採用並行並列、刪行刪列、增大樣本含量的辦法使其符合行×列表資料卡方檢驗的應用條件。
  • spss卡方_spss卡方檢驗 - CSDN
    8、先看到的第一個表格就是交叉表,性別為行、選擇的讀物為列   9、卡方檢驗結果:主要看pearson卡方檢驗,sig值小於0.05,因此認為不同的性別的人對周末讀物的選擇有顯著的差別   ,數值小於0.1說明關係不緊密,即性別與周末讀物的選擇沒有明顯的關係,這個結論和上面的卡方檢驗有出入,所以需要進一步進行兩兩比較。
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    t檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現有的醫學期刊多在統計學方面作出了要求,研究結論需要統計學支持;傳統的醫學統計教學都把t檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫學研究人員最熟悉的方法;t檢驗方法簡單,其結果便於解釋。簡單、熟悉加上外界的要求,促成了t檢驗的流行。
  • python 卡方檢驗專題及常見問題 - CSDN
    卡方檢驗可以用於判斷兩個類別變量的相關性是否顯著。在分類的應用場景中可以用卡方檢驗選擇特徵,特徵與目標變量的相關性越顯著說明特徵越重要,預測力越強。      一、先簡單介紹一下卡方檢驗的步驟。假設y為目標變量,取值為好和壞,x為特徵變量取值為高、中、低。
  • 卡方檢驗相關性專題及常見問題 - CSDN
    卡方檢驗和卡方分布卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。
  • 抽樣分布之卡方分布01
    前面的步驟驗證了卡方分布的期望E(X)和方差Var(X)的特點,而且自由度越大越接近於正態分布。我們再通過Minitab生成自由度更高(ν = 100, 500,1000)的卡方數據列來檢驗正態性:,卡方分布的正態性檢驗P-value值就越大了。
  • 卡方檢驗講解
    這個時候就不可以使用方差分析了,就需要使用專門用於分類變量比較的卡方檢驗。接下來我們具體看一下卡方分析是怎麼做的。現在某個研究機構為了驗證一下吸菸與肺病的關係,通過抽樣調查得到如下數據:卡方檢驗的值用來反映理論頻數和實際頻數的差異大小。理論頻數和實際頻數差別越大(分子越大),卡方檢驗值越大;反之,卡方檢驗值越小。如果只是由於抽樣誤差造成的實際頻數和理論頻數的差異,那卡方檢驗的值應該很小,因為我們相信我們的抽樣還是比較合理的,所以誤差不會特別大;如果卡方檢驗值太大,就不太能夠用誤差來解釋,只能說明原假設不成立,即各組之間的數據本來就有差異。