FOLLOWUS = Achievements+Happiness
科教學院倡導:學術卓越+教學幸福,拒絕科教亞健康
作者:葉寶娟 溫忠麟
來源:《心理學報》
摘 要 已有許多研究建議使用合成信度來估計測驗信度, 並報告其置信區間。有三種方法或途徑可以計算單維測驗合成信度的置信區間, 包括 Bootstrap 法、Delta 法和直接用統計軟體(如 LISREL)輸出的標準誤進行計算。本文通過模擬研究進行比較, 發現 Delta 法與 Bootstrap 法得到的置信區間相當接近, 但用 LISREL輸出的標準誤計算的與 Bootstrap 法得到的結果相差很大。推薦用 Delta 法估計合成信度的置信區間(使用Mplus 容易實現), 但不能直接用 LISREL 輸出的標準誤來計算。舉例說明了如何計算單維測驗的合成信度以及用 Delta 法計算其置信區間。
關鍵詞 合成信度; 置信區間; Bootstrap 法; Delta 法; LISREL
心理與教育測驗中, 信度(reliability)是衡量測驗可靠性的指標, 人們習慣用α 係數作為測驗信度的估計。如果測驗滿足下面兩個條件:(1)誤差不相關; (2)測驗是基本τ 等價測驗(即任意兩個題目的真分數隻相差一個常數, Graham, 2006), 則α 係數等於測驗信度(Novick & Lewis, 1967)。但實際上很少有測驗能滿足第二個條件。如果條件不成立, α係數通常是低估測驗信度 (Biemer, Christ, &Wiesen, 2009; 劉紅雲, 2008; Sijtsma, 2009a, 2009b;屠金路, 王庭照, 金瑜, 2010), 但有些情況下也可能高估測驗信度(Green & Yang, 2009; Raykov,Dimitrov, & Asparouhov, 2010; Revelle & Zinbarg,2009; Yang & Green, 2010)。比較好的方法是, 利用驗證性因子模型, 用合成信度(composite reliability,即合成分數的信度, 有的文獻譯為組合信度)來估計測驗信度(Bentler, 2009; Brown, 2006; 邱皓政,林碧芳, 2009; Raykov, 1998, 2002)。同時, 信度的置信區間(confidence interval)也受到重視(Duhachek& Iacobucci, 2004), 因為通過置信區間可以了解估計的誤差範圍。本文的目的是比較單維測驗合成信度的三種區間估計。首先, 簡單介紹合成信度及其計算公式, 和合成信度三種區間估計; 然後用 4(題目個數)×3(因子負荷)×4(樣本容量)×3(估計方法)的實驗設計進行模擬比較; 接著, 根據比較結果推薦Delta 法, 並給出用 Delta 法估計合成信度的置信區間的例子和程序; 最後對有關的問題進行討論並得出結論。
----
來源:《心理學報》。我們尊重原作者版權,這裡僅作學術分享之用。如有不妥請聯繫告知刪除。投稿與合作微信:x_wangzi123
編輯不易,點個在看
閱讀有困難?你該充電啦!
點擊閱讀原文, 獲取新春課程資訊