評分者信度

2021-03-02 SPSS學堂

前言:

我們知道,客觀性測驗一般都有固定的答案,無論誰評分差異都極小,所以誤差都較小,因而無需考慮評分者之間的一致性問題。但是,當測驗是主觀性試題時,不同評分者的評分便會存在差異,這時, 評分者信度就顯得尤為重要。

評分者信度(scorer reliability)指的是多個評分者給同一批人的答卷評分的一致性程度。

評分者信度分為評分者內信度評分者間信度 。前者是對同一個分者對同一樣本在不同場合出現是否判定為同樣分數的指標;後者是測量不同評分者對同一樣本是否給出同一個正確的分數的指標。在實際應用過程中,最常測評評分者間信度。

在由客觀性試題組成的心理測驗中,答案具體而固定,無需考察評分者信度。但在投射測驗、道德判斷測驗、創造性思維測驗等測驗的評分中,答案並不固定,評分時必然摻雜有主觀判斷因素,因此,需要考察評分者信度。評分越一致, 評分者信度越高。

評分者信度的估計與評分者人數的多少有關,若只有兩人參加,評N份試卷,或一人先後兩次評N份試卷,則最常用Spearman等級相關係數來求信度;若三人或三人以上的評分者評N份試卷時,常用肯德爾和諧係數來求信度。下面我們用案例來具體說明求取這兩個係數的操作。

【問題】甲乙兩位教師評閱10份作文試卷,他們對每個學生評定的分數和等級如下表所示。請問兩位教師評分的一致性如何?

Step 1:打開數據,選擇【分析】——【相關】——【雙變量】。

Step 2:將左側「甲評分」、「乙評分」選入右側【變量】中,在「斯皮爾曼」處打鉤,點擊【確定】。

Step 3:結果分析。斯皮爾曼(Spearman)相關係數為0.841(結果中帶有兩個*的,下面有說明,相關性顯著),評分者一致性很高。

【注】上表中的甲乙等級是按照秩次的排列規則得到的,在Spearman檢驗中,直接用數據以及用相應的等級數據進行計算,最終的結果是相同的。

【問題】有5位教師對7篇作文進行等級評定,評定結果如下表所示。請問,5位教師評定結果是否一致?

Step 1:打開文件,選擇【分析】——【非參數檢驗】——【舊對話框】——【K個相關樣本】。

Step 2:將「作文一~七」全部選入右側【檢驗變量】中,並在下方【肯德爾】處打鉤,點擊【確定】。

Step 3:結果分析。我們可以得到傅萊德曼檢驗的相關統計量和肯德爾W檢驗的相關統計量,我們主要關注後者。

如下圖,肯德爾和諧係數W值為0.891,卡方值為0.891,P值<0.01,因此可以看出,不同評分者的一致性非常高。

【注意】若被評對象的數目N>7,則要先將W值轉化成卡方值,再對卡方值進行顯著性檢驗。X2=K(N-1)W。

大家學會了嗎,多多練習哦~

相關焦點

  • 新傳名詞解釋全整理:概念的具體化/概念的操作化/信度/再測信度複本信度/折半信度/評分者信度
    折半信度(Split half reliability)7.評分者信度1.這樣的複本信度又稱穩定與等值係數。複本信度可以避免再測信度的缺點,但它要求使用的複本和原本在形式、內容、難度等方面需要完全一致。然而,在實際研究中,問卷或其他類似的測量工具往往很難達到這一要求。 6.
  • 信度概述
    信度的分類通常可以分為以下4大類:●重測信度( Test-retest Reliability)●複本信度( Alternate- orm reliability)●內部一致性信度( Internal Consistency Reliability)●評分者信度 Scorer Reliability重測信度是指用同樣的測量工具
  • 數據分析技術:信度與效度;信度和效度代表什麼?
    評分者信度和效度;因為評分者的打分數據直接關係到運動員或學生等的比賽名次或考試成績,因此評分者的信度和效度分析異常重要。這裡的評分者包括各種打分裁判(跳水、花樣遊泳、公務員面試等)和改卷老師等。其實是有的,這就是評分者的信度和效度分析。 評分者信度主要考察評分者的打分尺度是否統一,不希望出現有些評分者的打分尺度寬鬆,而有些評分者的打分尺度嚴格,或者有些裁判對自己國家的運動員打高分,而對競爭對手打低分的現象。關於評分者信度分析的內容前面推送過專門的文章,可以點擊下方連結回顧:SPSS分析技術:裁判(打分者)的信度分析。
  • 教招-信度效度的區分
    2.信度信度主要指測驗結果的前後一致性程度。效度是對測量的準確性程度的估計,而信度則是對測量的一致性或可靠性程度的估計。多次施測,如果得到的結果一致,那就是信度高,比如一份試卷讓同一個學生做三次,三次分數分別是88、88、88,三次分數一致,信度高,如果三次測驗成績波動極大,那就是信度低。
  • 其他信度分析方法
    由於重測信度需要對同一樣本試測兩次,而被測容易受到各種事件、活動的影響,所以間隔時間需要適當。較常用者為間隔二星期或一個月。由於這種方法要求兩個複本除表達方式不同外,在內容、格式、難度和對應題項的提問方式等方面都要完全一致,所以複本信度屬於等值係數。在實際的調查中,問卷很難達到這種要求,這種方法較少被採用。
  • 筆記|《心測》C4 測量信度
    C4 測量信度一、信度概述信度定義及作用1.定義:信度是指測量結果的穩定性程度,即用同一測量工具反覆測量某人的同一種心理特質,則其多次測量結果間的--致性程度就叫作信度,也叫測量的可靠性。(五)評分者信度1.含義是指多個評分者給同一批人的答卷進行評分的一致性程度。2.計算當評分者人數為兩個時,評分者信度等於兩個評分者給同一批被試的答卷所給分數的相關係數(積差相關或等級相關)。當評分者人數多於兩個時,評分者信度可用肯德爾和諧係數進行估計。
  • 沒有信度和效度,還能叫問卷嗎?
    也有人提出,測量工具的重測信度可以接受的標準是兩次測試相關係數在0.7以上途徑2:對兩次重複測試結果進行兩個相關樣本差異的統計檢驗,如果差異有統計學意義,則認為測量工具的信度低,否則,信度高。2、複本信度複本信度法是讓同一組被調査者一次填答兩份問卷複本,計算兩個複本的相關係數。
  • 測驗的效度和信度
    二、信度(一)信度的涵義測驗的信度又叫做測驗的可靠性,指的是測驗的一致性程度,即多次測驗結果要保持一致。信度指標通常以相關係數表示,即用同一被試樣本所得的兩組資料的相關係數作為測量一致性的指標,成為信度係數。例如:想要測量小明的性格是什麼樣的,測驗結果發現,第一次測驗是內向,第二次測驗是外向,第三次測驗是中性的,那麼它的信度比較低。
  • 心理學2016考研專業課心理測量知識點:信度
    (2)複本信度:考慮的誤差來源是內容取樣。   (3)分半信度:它考慮的誤差來源也是內容取樣,它與複本信度的差別是:分半信度考查一個測驗內容的兩半題目測量的是否是同一個心理特點行為。   (4)同質性信度(內部一致性係數):考慮的是測驗內容是否異質。   (5)評分者信度:考慮的誤差來源是評分者間的差別。
  • 教師招聘常考知識點信度與效度
    設計和編制任何一種測驗,都必須使其在效度、信度、難度和區分度方面達到一定要求,即起碼達到有效、可信,具有一定難度和區分度。此部分的知識點,考察相對較少,但是較難理解。一、信度信度是指測驗結果的穩定性或可靠性,即某一測驗在多次施測後得到的分數的穩定、一致程度。它既包括時間上的一致性,也包括內容和不同評分者之間的一致性。
  • 信度分析:克隆巴赫信度係數(Cronbach's α)
    它具有以下特性:信度是指測驗所得到結果的一致性或穩定性,而非測驗或量表本身(效度);信度值是指在某一特定類型下的一致性,非泛指一般的一致性,信度係數會因不同時間、不同受試者或不同評分者而出現不同的結果;信度是效度的必要條件,非充分條件,即:信度低效度一定低,但信度高未必表示效度也高。
  • 科研方法:問卷的信度和效度
    【問卷的信度】是指通過問卷調查所得到的資料的可靠性程度,即調查結果反映調查對象實際情況的可靠、真實性程度。它用相關係數表示,又稱信度係數。    信度係數常用兩種方法求得:第一種是採用再測法,求穩定性係數。第二種是求問卷的內部一致性係數,採用分半信度法求得。問卷的信度主要是以重複調查所得結果的一致性程度為尺度來衡量的。
  • ——信度分析
    信度分析用於測量樣本回答結果是否可靠,即樣本有沒有真實作答量表類題項(重要提示:信度分析僅僅是針對量表數據,非量表數據一般不進行信度分析);信度分析僅針對連續數據。●重測信度:用同樣的測量工具,對同一組被調查者間隔一定時間重複測試,兩次測試結果的相關程度。●複本信度:讓同一組被調査者一次填答兩份問卷複本,計算兩個複本的相關係數。
  • 信度|20北大滙豐深財真題解析18
    2020北大滙豐財經440名詞解釋:信度答題思路 >需要包括信度的定義、類型以及與效度的關係。答題內容 信度(Reliability):即可靠性,它指的是採取同樣的方法對同一對象重複進行測量時,其所得結果相一致的程度。換句話說,信度是測量結果的一致性或穩定性,即測量工具能否穩定地測量所測量的事物或變量。包括再測信度、複本信度、折半信度、評分者信度等。
  • 重慶教師招聘教育基礎知識:測驗的效度和信度
    二、信度(一)信度的涵義測驗的信度又叫做測驗的可靠性,指的是測驗的一致性程度,即多次測驗結果要保持一致。信度指標通常以相關係數表示,即用同一被試樣本所得的兩組資料的相關係數作為測量一致性的指標,成為信度係數。例如:想要測量小明的性格是什麼樣的,測驗結果發現,第一次測驗是內向,第二次測驗是外向,第三次測驗是中性的,那麼它的信度比較低。
  • 信度分析
    為了保證問卷具有較高的可靠性和有效性,在形成正式問卷之 前,應當對問卷進行試測,並對試測結果進行信度和效度分析,根據分析結果篩選問卷題項,調整問卷結構,從而提高問卷的 信度和效度。本節主要討論——信度。信度分析是一種測度綜合評價體系是否具有一定穩定性和可靠性的有效分析方法。採用同樣的方法對同一對象重複測量時所得結果的一致性程度。
  • 概念辨析|你知道信度和效度分別怎麼用嗎?
    >1.影響因素:Tips:信效度可通用的(1) 主試方面:①施測者不按規定施測,故意製造緊張氣氛,或給考生一定的暗示,協助等,則測量信效度會大大降低;②評分者評分標準掌握不一2.改進方法:通用(1)主試方面:主試嚴格執行實測規程,評分者要嚴格按標準給分。(2)被試方面:選取恰當的被試團體,提高測驗在各同質性較強的亞團體上的信度。
  • 教師招聘考試:信度、效度的區分辨別
    它既包括在時間上的一致性,也包括內容和不同評分者之間的一致性。2、效度:是指測量的正確性,即一個測驗能夠測量出其所要測量的東西的程度。就一個測驗的優劣而言,效度是一個比信度更為重要的指標。簡單點來說信度:一致性、穩定性、可靠性。效度:測不測的出來、有效、可行、合理。好比一群人測驗打靶,分甲乙丙三組。
  • 數據分析技術:信度與效度分析;信度和效度不僅僅能用於問卷分析!
    如果說一個人不僅可靠而且讓人滿意,那麼這個人應該是不僅能夠及時完成工作,而且工作能夠完成得很好,超出預期,也就是信度和效度都很好。信度針對是的行為或結果的重複性,效度針對的是行為或結果的有效性。 信度與效度的用途知道了信度與效度的現實含義以後,相信大家可以想到信度與效度的很多用途。我這裡列舉三個重要用途:A.
  • 高頻考點:信度、效度、區分度及難度
    考情分析:教學測驗的信度、效度、區分度及難度,一般考查形式:首先可以考察多選題,其次可以結合每一個考察含義或例子型單選。最後也可以結合相互之間的關係進行考察。結合學員的學習情況來看,大家經常會混淆信度和效度,但這兩個又是考察頻率最高的,所以在掌握時一定要理解這四個,並且能夠區分信度和效度。