單維測驗合成信度三種區間估計的比較

2021-02-20 科教學院

FOLLOWUS = Achievements+Happiness

科教學院倡導:學術卓越+教學幸福,拒絕科教亞健康

作者:葉寶娟 溫忠麟

來源:《心理學報》

摘 要 已有許多研究建議使用合成信度來估計測驗信度, 並報告其置信區間。有三種方法或途徑可以計算單維測驗合成信度的置信區間, 包括 Bootstrap 法、Delta 法和直接用統計軟體(如 LISREL)輸出的標準誤進行計算。本文通過模擬研究進行比較, 發現 Delta 法與 Bootstrap 法得到的置信區間相當接近, 但用 LISREL輸出的標準誤計算的與 Bootstrap 法得到的結果相差很大。推薦用 Delta 法估計合成信度的置信區間(使用Mplus 容易實現), 但不能直接用 LISREL 輸出的標準誤來計算。舉例說明了如何計算單維測驗的合成信度以及用 Delta 法計算其置信區間。 

關鍵詞 合成信度; 置信區間; Bootstrap 法; Delta 法; LISREL

心理與教育測驗中, 信度(reliability)是衡量測驗可靠性的指標, 人們習慣用α 係數作為測驗信度的估計。如果測驗滿足下面兩個條件:(1)誤差不相關; (2)測驗是基本τ 等價測驗(即任意兩個題目的真分數隻相差一個常數, Graham, 2006), 則α 係數等於測驗信度(Novick & Lewis, 1967)。但實際上很少有測驗能滿足第二個條件。如果條件不成立, α係數通常是低估測驗信度 (Biemer, Christ, &Wiesen, 2009; 劉紅雲, 2008; Sijtsma, 2009a, 2009b;屠金路, 王庭照, 金瑜, 2010), 但有些情況下也可能高估測驗信度(Green & Yang, 2009; Raykov,Dimitrov, & Asparouhov, 2010; Revelle & Zinbarg,2009; Yang & Green, 2010)。比較好的方法是, 利用驗證性因子模型, 用合成信度(composite reliability,即合成分數的信度, 有的文獻譯為組合信度)來估計測驗信度(Bentler, 2009; Brown, 2006; 邱皓政,林碧芳, 2009; Raykov, 1998, 2002)。同時, 信度的置信區間(confidence interval)也受到重視(Duhachek& Iacobucci, 2004), 因為通過置信區間可以了解估計的誤差範圍。本文的目的是比較單維測驗合成信度的三種區間估計。首先, 簡單介紹合成信度及其計算公式, 和合成信度三種區間估計; 然後用 4(題目個數)×3(因子負荷)×4(樣本容量)×3(估計方法)的實驗設計進行模擬比較; 接著, 根據比較結果推薦Delta 法, 並給出用 Delta 法估計合成信度的置信區間的例子和程序; 最後對有關的問題進行討論並得出結論。

 

----

來源:《心理學報》。我們尊重原作者版權,這裡僅作學術分享之用。如有不妥請聯繫告知刪除。投稿與合作微信:x_wangzi123



編輯不易,點個在看

                           



閱讀有困難?你該充電啦!

       點擊閱讀原文, 獲取新春課程資訊

相關焦點

  • 測驗的效度和信度
    一、效度(一)效度的涵義測驗的效度指的是測驗的正確性和有效性。換言之,效度指的是測驗能在多大程度上實現測驗的目的。效度是科學測驗工具最重要的質量指標。能測出來想測量東西的程度,則效度高;測不出來,則效度低。例如:想要測量小明的身高,測量工具是秤,那麼,測量不出想要測量的東西,則效度低。
  • 筆記|《心測》C4 測量信度
    三種等價的信度定義:(1)信度(信度係數)是一個被測團體真分數的變異數與實得分數的變異數之比。即:(2)信度是一個被試團體的真分數與實得分數的相關係數的平方。即:(3)信度是一個測驗x(A卷)與它的任意一個「平行測驗」x』(B卷)的相關係數。
  • 教基每日一練:測驗的信度和效度(1.4)
    一、效度(一)效度的涵義測驗的效度指的是測驗的正確性和有效性。換言之,效度指的是測驗能在多大程度上實現測驗的目的。效度是科學測驗工具最重要的質量指標。能測出來想測量東西的程度,則效度高;測不出來,則效度低。例如:想要測量小明的身高,測量工具是秤,那麼,測量不出想要測量的東西,則效度低。
  • 2020年甘肅教師招聘教育學知識點:測驗的效度和信度
    為了讓大家更好的備戰甘肅中小學教師招聘考試,甘肅中公教育為廣大考生準備了教師招聘教育學公共基礎知識:測驗的效度和信度,望各位考生及時查看。一、效度(一)效度的涵義測驗的效度指的是測驗的正確性和有效性。換言之,效度指的是測驗能在多大程度上實現測驗的目的。效度是科學測驗工具最重要的質量指標。
  • 信度與效度的理論溯源
    一、測驗的效度(一)效度的涵義測驗的效度指的是測驗的正確性和有效性。換言之,效度指的是測驗能在多大程度上實現測驗的目的。效度是科學測驗工具最重要的質量指標。(二)效度的類型考察效度的方法很多,根據測量的問題不同,可以分為三類,即內容效度、構想效度、實證效度。
  • 心理學2016考研專業課心理測量知識點:信度
    6、信度的作用:   (1)解釋預測個人分數的意義。   (2)解釋真實分數與實得分數間的關係,明確告訴我們測驗誤差大小。   (3)新編的測驗信度應高於原有的同類測驗或相似測驗。   (4)下結論說某測驗比較可靠,必須是依據情境的,經多次證實的。   (5)它是確定測驗好壞的一個指標。
  • 如何區分信度與效度之間的關係
    信度與效度兩者間的關係是歷年來的重要考點也是同學們做題時候的難點,常以單選、填空和簡答來考察大家,理解性去做題就比較容易得分,那麼今天就來為大家解讀一下這部分知識點
  • 信度和效度的關係和區別
    信度是什麼?效度是什麼?信度和效度的關係和區別是怎樣的呢?下面小編為大家一一介紹:【什麼是信度】信度指測驗結果的一致性、穩定性及可靠性,一般多以內部一致性來加以表示該測驗信度的高低。信度係數愈高即表示該測驗的結果愈一致、穩定與可靠。
  • SPSS統計分析案例:信度分析之複本信度
    複本信度是以兩個內容等值但題目不同的測驗(複本)來測量同一群體,然後求得的被試在兩個測驗上得分的相關係數,這個相關係數就代表了複本信度的高低。
  • 教學測驗的指標及其關係
    所謂效度是指一個測驗或測量工具能真實地測量出所要測量的事物的程度。這個是學理上的定義,用通俗易懂的話語可以表達為,效度即測驗的正確性,如用秤來測量人的體重,這一測驗方法正確,則說明這一測驗的效度高,反之如果用秤來測量人的身高,這一測驗方法錯誤,則說明這一測驗的效度低。所謂信度主要指測驗結果的前後一致性程度。
  • 區間估計、置信區間
    點估計與區間估計刮獎猜測點估計就是單猜某一張彩票是大獎,區間估計就是將點估計的範圍擴大,可以一盒一盒、一個區域、一座城市,說白了就是設置一個半徑。下面採用置信區間構造區間估計但是這個區間多大會影響到所有估計中包含真值的比例,比如由樣本均值的抽樣分布可知,在重複抽樣或者無限總體抽樣的情況下,樣本均值的期望等於總體均值。無數個樣本均值最終可以構造成下面的圖形,但是實際中只能有有限個數據。均值與單個值的距離是相對的,如果某個值在均值的半徑範圍內,則均值也在這個值的對應半徑範圍內。
  • 考研心理測量知識點小結:信度
    1、信度是指:測量結果的可靠性和一致性。因為心理測驗通常測量人的行為,行為會由於各種各樣的原因,因時、因事、因地而產生變動,這些因素有些是偶然的,有些是固有的,人在完成心理測驗時的行為也會受上述因素的影響,從而使測驗結果與真實結果不完全一致,所以我們要用信度來衡量測驗的可靠性和一致性。
  • 沒有信度和效度,還能叫問卷嗎?
    1、重測信度重測信度是指用同樣的測量工具,對同一組被調查者間隔一定時間重複測試,兩次測試結果的相關程度。重測信度可以通過兩種途徑進行考察:途徑1:計算兩次測試結果的相關係數,如果經過統計檢驗,相關關係有統計學意義,則認為測量工具的信度高,否則信度低。
  • 乾貨分享:問卷信度分析及其SPSS實現
    除Alpha信度係數外,還有一些常用的信度係數,它們多數都可以在信度分析主對話框的「模型」下拉列表中找到,只要選擇相應的項,運行後就可以得到相應的結果。1.重測信度重測信度指的是用同樣的量表,對同一組受測者重複進行測量。
  • 教學測驗指標簡析
    教學測驗的指標在歷次考試中出現頻率都較高,考生的正確率卻不高,為了讓大家更好的區別信度、效度、難度、區分度,在這裡給大家介紹一種簡單的區分方式,希望能幫助到廣大考生。設計和編制任何一種測驗,都必須使其在效度、信度、難度和區分度方面達到一定要求,即起碼達到有效、可信,具有一定難度和區分度。
  • 教學測驗指標的「四大天王」
    教學測驗有四大指標:信度、效度、難度、區分度。在歷年教師招聘考試中佔據一席之地,主要考查大家對這四個概念的區分以及關係,所以我們一起來認識這「四大天王」。一、信度信度是指一個測驗經過多次重複測量之後結果的一致性和穩定性。例如,數學老師重複兩次在一年級四班測驗同一份試卷,發現兩次測驗結果一樣,說明這個試卷的信度高。
  • 信度、效度、難度、區分度之間有何不同?
    知識點在考試中通常以客觀題的形式出現,但是幾乎沒有識記類的考法,基本以概念反選、事例反選類單選題或判斷題為主,接下來就讓我們一起來走進這個知識:信度——是指測驗結果的穩定性或可靠性,即某一測驗在多次進行後所得到的分數的穩定、一致程度。它即包括在時間上的一致性,也包括內容和不同評分這之間的一致性。如,在不同時間測兩次相同的試卷,如果成績基本相當,那麼我們就認為測驗的信度較高。
  • 參數估計之點估計和區間估計
    它是統計推斷的一種基本形式,分為點估計和區間估計兩部分。一、點估計點估計是依據樣本估計總體分布中所含的未知參數或未知參數的函數。簡單的來說,指直接以樣本指標來估計總體指標,也叫定值估計。通常它們是總體的某個特徵值,如數學期望、方差和相關係數等。