SPSS操作:一致性檢驗,如何計算Kappa值?

2021-01-10 網易

  一、問題與數據

  通過分析受試者進入超市後的行為,判斷其是否存在盜竊嫌疑是警察的基本技能。現某研究者擬分析不同警察判斷的一致性,隨機抽取100段超市錄像,每段分別記錄1位受試者從進入超市到離開超市的全過程,再分別請兩位警察觀看這些錄像,判斷受試者的行為是「正常」(編碼1)還是「可疑」(編碼2)。這兩位警察觀看的是同一組錄像,編號統一,部分研究數據如下:

  

  二、問題的分析

  在本研究中,研究者擬探討兩位警察對受試者行為判斷的一致性,我們推薦使用 Cohen's kappa係數分析。一般來說,採用Cohen's kappa係數的研究設計需要滿足以下5項假設:

  假設1:判定結果是分類變量且互斥。如本研究中受試者行為的判定結果為「正常」或「可疑」,屬於分類變量,並且相互排斥。

  假設2:要求進行觀測變量配對,即不同觀測者判定的對象相同。如本研究中,兩位警察觀看的是同一組錄像,編號統一。

  假設3:每個觀察對象可能被判定的結果種類相同。如本研究中每位受試者的行為都可能被判定為「正常」或「可疑」。

  假設4:觀測者之間相互獨立。這要求不同觀測者獨立完成結果判定,相互不幹擾。

  假設5:由固定的兩位觀測者完成所有判定。如本研究中由兩位警察分別觀看100段錄像,中途不換人。

  根據研究設計,我們認為本研究符合Cohen's kappa係數的5項假設,可以採用該分析方法進行一致性評價

  三、SPSS操作

  1. 在主菜單點擊Analyze→DescriptiveStatistics→Crosstabs

  

  出現下圖:

  

  2. 分別將Officer1和Officer2變量放入Row(s)和Column(s)欄

  

  3. 點擊Statistics

  

  4. 點選Kappa

  

  5. 點擊Continue→Cells

  

  6. 點擊Observed→Continue→OK

  注釋:如果大家想要得到頻率的預測值,可以點擊Counts欄中的Expected;若大家還想得到百分比值,可以點擊Percentages欄中的Row、Column和Total

  

  四、結果解釋

  1. 一般結果

  在分析Cohen's kappa係數之前,我們有必要了解一下研究數據的基本情況,如下:

  

  從上表可以看出,本研究共有100對有效數據(Valid欄),沒有缺失(Missing欄),總數據為100例(Total欄)。Officer1和Officer2的交叉表,如下:

  

  SPSS根據數據錄入情況,分別輸出Officer1和Officer2認為「正常」和「可疑」的數量。其中,左上和右下的數據是經Officer1和Officer2判斷一致的,如下標黃的部分:

  

  從上表可以看出,兩位警察都認為其中85位受試者行為「正常」,7位受試者行為「可疑」,即這兩位警察在92位受試者的行為上判斷一致。從另一個角度來說,Officer1認為87位受試者行為「正常」,而Officer2認為91位受試者行為「正常」,如下標黃部分:

  

  同理,這個表也輸出了Officer1和Officer2判斷不一致的數據,如下標黃部分:

  

  從上表可知,在本研究中,兩位警察對6+2=8為受試者的行為判斷不一致。根據這些數據,我們可知Officer1和Officer2在對92÷100×100%=92%的受試者行為判斷上一致。但是這種一致率沒有考慮機遇因素的影響,我們還要依據Cohen's kappa係數具體分析。

  2. Cohen's kappa係數

  與直接計算的一致率不同的是,Cohen's kappa係數考慮了機遇一致率對結果的影響。具體來說,在本研究中即使兩位警察並不依據專業經驗,而是隨意評價受試者的行為,他們也會在對一些判斷上出現一致結果。但是,這些由於機遇因素導致的一致結果並不是我們想要的,會高估實際一致率。因此,我們需要在計算Cohen's kappa係數時,剔除機遇一致率,公式如下:

  

  經過之前的SPSS操作,SPSS輸出的Cohen's kappa結果如下:

  

  Value欄提示Cohen's kappa係數值,如下標黃部分:

  

  從上表可知,本研究的Cohen's kappa=0.593。一般來說,Cohen's kappa係數分布在-1到1之間。若Cohen's kappa係數小於0,說明觀察一致率小於機遇一致率,在實際研究中很少出現。若Cohen's kappa係數等於0,說明觀察一致率等於機遇一致率,結果完全由機遇因素導致。若Cohen's kappa係數大於0,說明研究對象之間存在一定的一致性,Cohen's kappa係數越接近1,一致性越大。

  那麼,本研究中Cohen's kappa係數為0.593,說明一致性如何呢?Cohen's kappa係數值反映的一致性強度,如下:

  表1. Cohen's kappa係數的一致性含義

  

  從上表可知,本研究中Cohen's kappa係數0.593,說明具有中等強度一致性。但是,值得注意的是,我們並不能輕易地根據表1直接對比不同研究的Cohen's kappa係數。因為Cohen's kappa係數在計算過程中剔除了機遇一致率,也因此受到研究數據邊際分布程度的影響。所以,我們只能比較具有相同邊際分布數據的Cohen's kappa係數,而不能直接對比數據邊際分布不同的研究。

  此外,SPSS輸出Symmetric Measures表格,提示Cohen's kappa係數的統計檢驗結果,如下標黃部分:

  

  提示,本研究的Cohen's kappa係數與0的差異具有統計學意義(P<0.001)。同時,我們也可以根據該表格計算Cohen's kappa係數的95%置信區間,如下標黃部分:

  

  可見,本研究中Cohen's kappa係數的標準誤為0.129。鑑於本研究樣本量較大,我們認為研究數據接近正態分布。從而計算Cohen's kappa係數的95%置信區間為0.593±1.96×0.129=0.593±0.253。即,本研究Cohen's kappa係數為0.593(95% CI為0.340 -0.846)。

  五、撰寫結論

  本研究採用Cohen's kappa係數分析兩位警察對100位受試者行為判斷的一致性。結果顯示,這兩位警察都認為其中85位受試者行為「正常」,7位受試者行為「可疑」。但同時有6位受試者被警察1認定為「可疑」,而被警察2認定為「正常」;也有2位受試者被警察1認定為「正常」,而被警察2認定為「可疑」。

  總的來說,這兩位警察判斷結果的Cohen's kappa係數為0.593(95% CI為0.340 -0.846),P<0.001,具有中等強度一致性。

  相關閱讀

  1. 診斷試驗之Kappa值該怎麼算?

  2. SPSS詳細操作:一致性檢驗和配對卡方檢驗

  3. 如何比較兩種方法的靈敏度和特異度?來看實例教程!

  醫咖會微信:medieco-ykh

  

  關注醫咖會,輕鬆學習統計學!

  我們建了一個微信群,有臨床研究設計或統計學方面的難題?快加小咖個人微信(xys2016ykf),拉你進群和其他小夥伴們一起交流學習。

  點擊左下角「閱讀原文」,看看醫咖會既往推送了哪些研究設計或統計學文章。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • kappa一致性檢驗教程 - CSDN
    Cohen於1960年提出Kappa分析,Kappa係數是一個用於一致性檢驗的指標,在考慮了機遇因素對診斷結果一致性的影響。二、軟體操作數據準備下面我們通過一組模擬數據來進行演示。某醫生用a、b兩種方法診斷結石,想檢驗這兩種方法的診斷結果是否一致,此時需要用Kappa一致性檢驗。
  • Kappa一致性檢驗:兩種診斷方法的結果是否一致?
    Cohen於1960年提出Kappa分析,Kappa係數是一個用於一致性檢驗的指標,在考慮了機遇因素對診斷結果一致性的影響。二、軟體操作數據準備下面我們通過一組模擬數據來進行演示。某醫生用a、b兩種方法診斷結石,想檢驗這兩種方法的診斷結果是否一致,此時需要用Kappa一致性檢驗。
  • SPSS信度分析內部一致性a係數為負數是怎麼回事?
  • 「spss數據分析系列」t檢驗
    一、t統計量及t檢驗本人介紹spss數據分析中的t檢驗,我們平時分析數據時經常對比均值,其中兩分類的均值對比採用的t檢驗,這裡強調一下的是兩分類的對比,其他還有獨立樣本t檢驗,配對t檢驗,我們在下面spss軟體部分再做說明
  • SPSS教程:3個及以上觀察者的一致性檢驗(Kendall's W檢驗)
    根據研究設計,我們認為本研究符合Kendall's W 檢驗的3項假設,可以採用該方法進行一致性評價。  三、SPSS操作  在主界面點擊Analyze→NonparametricTests→Related Samples,確認What is your objective?
  • SPSS教程:分層卡方檢驗(各層的OR值如何計算?咋報告結果?)
    OR值進行合併,從而計算調整後的OR值。針對這個問題,有小夥伴在留言中問到,如何判斷層間OR值是否一致呢?是否有相關的統計學方法來進行檢驗呢?如果層間OR值同質,又該如何計算合併的OR值呢?這個時候,卡方檢驗家族就要派「分層卡方檢驗」上場了,本期內容就來向大家進行詳細介紹。
  • spss卡方_spss卡方檢驗 - CSDN
    spss中交叉分析主要用來檢驗兩個變量之間是否存在關係,或者說是否獨立,其零假設為兩個變量之間沒有關係。在實際工作中,經常用交叉表來分析比例是否相等。例如分析不同的性別對不同的報紙的選擇有什麼不同。
  • 「spss數據分析系列」卡方檢驗-2x2
    前面的t檢驗都是對均值的分析,這類分析主要是針對於連續性變量,比如身高,溫度,降雨量等,但是如果針對於分類變量的差異分析怎麼分析呢,這裡就用到了我們所說的卡方檢驗,但是卡方檢驗對應的情況有很多種,這裡我將第一種,就是2x2的表格,2x2意思就是兩個變量都是2分類的變量。
  • spss是什麼軟體?spss軟體是用來做什麼的?
    很多人看到有人在用spss,好奇spss是什麼軟體?spss是用來做什麼的? spss是一個非常好用的統計分析軟體, spss用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟體產品及相關服務軟體哦,下面小編就來詳細介紹一下吧!
  • 數據分析基礎相關性分析,SPSS實操
    在一般情況下,總體相關係數p是未知的,我們往往是用樣本相關係數 r作為總體相關係數p的估計值。但由於存在樣本抽樣的隨機性。樣本相關係數並不能直接反映總體的相關程度。為了判斷r對ρ 的代表性大小,需要對相關係數進行假設檢驗。(1)首先假設總體相關性為零,即H0為兩總體無顯著的線性相關關係。
  • 急診檢驗的生物安全、TAT、結果一致性、質量管理如何保證?
    下面就讓我們結合本次共識,一起來看一下新冠疫情下的急診檢驗面臨的問題,以及如何應對。  急診檢驗室空間有限,生物安全如何保障?  急診檢驗室不僅為全院急、危重患者服務,新冠疫情之下還是發熱患者快速診斷的綠色通道,因此完善的生物安全防護尤為重要!急診檢驗室的布局的安全、合理是滿足醫院感染控制和生物安全要求的首要因素。
  • 檢驗一致性,你用哪種方法?
    一致性檢驗的目的在於比較不同方法得到的結果是否具有一致性。檢驗一致性的方法有很多比如:Kappa檢驗、ICC組內相關係數、Kendall W協調係數等。ICC組內相關係數檢驗,用於分析多次數據的一致性情況,功能上與Kappa係數基本一致。ICC分析定量或定類數據均可;但是Kappa一致性係數通常要求數據是定類數據。Kendall W協調係數,是分析多個數據之間關聯性的方法,適用於定量數據,尤其是定序等級數據。
  • 如何用SPSS做單因素和多因素方差分析
    前段時間明明同學推送了一篇「如何用Excel做方差分析」,今天就講講如何用SPSS為大家展示常用的3種分析方法使用技巧即:單因素方差分析、雙因素方差分析(無交互效應和有交互效應)。讓大家對方差分析有一個更深的了解。首先,我們來了解一下什麼是方差分析。方差分析是對多個樣本平均數差異顯著性檢驗的一種方法,也就是推斷對多個樣本均數是否相等的方法。
  • SPSS中的正態性檢驗之二:計算法
    ,這一節,我們介紹用計算法來檢驗樣本的正態分布性。一、偏度係數和峰度係數的計算我們知道,偏度係數和峰度係數是了解資料正態分布的指標,兩者越接近0,資料就越接近正態分布。在SPSS中,很多過程都可以完成偏度係數和峰度係數的計算,我們介紹用「描述統計」功能計算偏度係數和峰度係數。1. 建立數據集2. 操作步驟,點擊「選項」-「峰度」-「偏度」
  • 【物理師科研小助手】SPSS統計軟體基本操作——卡方檢驗
    卡方檢驗主要應用於無序分類變量的假設檢驗,用於比較分類變量在不同分組中的分布是否相同,其核心思想就是比較觀察頻數和期望頻數之間是否存在差異
  • SPSS因子分析案例
    所以,有必要確定綜合評價指標,便於對比。因子分析是一個不錯的選擇,5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。下圖是spss因子分析的操作界面,主要包括5方面的選項,變量區只能選擇數值型變量,分類型變量不能進入該模型。
  • spss 非線性回歸 - CSDN
    可以看到這4個變量都為分組分類變量,不能直接作為自變量進行回歸分析,必須先進行虛擬化,下面就來講解如何虛擬化的spss操作步驟。【杏花開生物醫藥統計】微信公眾號(xhkdata)【杏花開生物醫藥統計】相關文章:· SPSS進行中介效應檢驗的實戰操作與分析· AMOS結構方程教程,SPSS調節效應分析操作與結果的詳細解讀
  • 基本數據統計分析--spss
    而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。spss描述統計分析一、定義:其中均值、中位數、眾數將不再介紹;方差是所有變量值與平均數偏差平方的平均值,它表示了一組數據分布的離散程度的平均值。
  • 科研SPSS統計思維實戰研討會
    課程特色:1、 本課程重在傳輸科研工作中的統計思維與邏輯,當需要進行操作時,使用SPSS進行講解操作,避免將時間浪費在可能一生都不會用到的偏專軟體操作上。33) 如何將偏態分布的數據合理分為幾大類?34) 如何處理缺失值,有哪些原則?
  • spss 方法 線性回歸專題及常見問題 - CSDN
    方差檢驗表中F值對應的概率P值為0.000,小於顯著度0.05,因此應拒絕原假設,說明自變量和因變量之間存在顯著的線性關係。參數檢驗表中只有自變量X2和常數項的概率P值為0.000,小於顯著度0.05,而自變量X1和X3的概率P值大於顯著度0.05,說明只有自變量X2對因變量在總體中存在顯著的線性關係,X1、X3和因變量在總體中不存在顯著的線性關係。