信度、效度、難度、區分度之間有何不同?

2020-12-26 中公教師網

衡量測驗質量的四個指標,即信度、效度、難度、區分度,在考試中通常以客觀題的形式出現,具體來說主要包括概念反選、例子反選題或判斷題。而一直以來由於知識內容有一定的相似性和關聯度,考生們常常區分不清產生混淆。因此,為了幫助考生們解決這一問題,我們就一同來梳理一下該知識點。

信度是指測驗結果的穩定性或可靠性,即某一測驗在多次進行後所得到的分數的穩定、一致程度。它即包括在時間上的一致性,也包括內容和不同評分這之間的一致性。如,在不同時間測兩次相同的試卷,如果成績基本相當,那麼我們就認為測驗的信度較高。

效度是指測量的正確性,即一個測驗能夠策略出其索要測量的東西的程度,也就是我們常說的準確度。故而通常效度考慮的問題是:測驗測量什麼?測驗對測量目標的策略精確性和真實性有多大?就一個測驗的優劣而言,效度是一個比信度更為重要的指標。如,我想測量初一年級的數學成績,但是給他們做了一套小學四年紀的數學試卷,此時不能測量出我原本想要測量的東西,我們認為測驗的效度不高。

難度是指測驗包含的試題難易程度。一般來說,難度可以用:「P(通過率)=通過人數/總人數」

的公式來表示,可見P(通過率)值越低難度越大,兩者間呈反比關係。

區分度是指測驗對考生的不同水平能夠區分的程度,即具有區分不同水平考生的能力。如,一次測驗之後,能夠明確分清不同學生的水平,我們就認為該測驗的區分度較高。

在我們明確了這四個指標的含義之後,我們會發現這四個指標都是用來衡量測驗質量高低的,那麼它們之間有沒有什麼關係呢?那當然是有的,四個指標之間既有聯繫又有區別,考生們既要能夠區分有得了解他們之間的相互影響關係:

首先是區別,重點在於信度與效度之間的區別,要明確信度是衡量測驗的可信程度而非試題內容的質量,因而才會運用多次測驗的方式;而效度是衡量測驗的有效程度更加注重試題內容的有效性,是評價試題是否能達到預期效果。因此,我們認為在衡量測驗本身質量時,效度是比信度更重要的指標。

其次是四個指標之間的相互影響。第一信信度與效度都是衡量測驗質量的重要指標,兩者之間的關係我們用一句話就可以總結:「信度低效度低,效度高信度高」。第二難度與區分度,測試題目難度過高或過低都會導致測驗無法鑑別出學生的真實水平導致區分度較低。因此,只有在試卷中包含有不同層次的試題,保證整套題目的難度適中,才能真正鑑別出不同層次的學生,提高區分度。

到這裡,相信同學們對信度、效度、難度、區分度已經有了一定程度的理解,接下來讓我們來通過幾個練習題來鞏固一下:

【習題回顧】

1.高水平學生在測驗中能得高分,而低水平學生只能得低分,說明該測驗( )質量指標高。

A.效度 B.信度 C.區分度 D.難度

【答案】C。解析:區分度是能夠鑑別學生真實水平的指標,能夠使高水平學生得高分,低水平學生得低分。

2.當一個測驗信度較低時,它的效度一定低。( )

【答案】√。解析:信度和效度之間的關係為,信度低效度一定低,效度高信度一定高。

中公講師解析

關注微信公眾號「中公教師招聘考試

回復【時政】即可查看每日時政新聞+時政模擬

回復【資料】即可免費獲取各省備考資料

註:本文章用於訪問者個人學習、研究或欣賞,版權為「中公教師網」所有,未經本網授權不得轉載或摘編。已經本網授權使用作品的,應在授權範圍內使用,並註明"來源:中公教師網"。違反上述聲明者,本網將追究其相關法律責任。

本文來自中公教師網未經允許 禁止轉載

相關焦點

  • 測驗的效度和信度
    一、效度(一)效度的涵義測驗的效度指的是測驗的正確性和有效性。換言之,效度指的是測驗能在多大程度上實現測驗的目的。效度是科學測驗工具最重要的質量指標。能測出來想測量東西的程度,則效度高;測不出來,則效度低。例如:想要測量小明的身高,測量工具是秤,那麼,測量不出想要測量的東西,則效度低。
  • 問卷信效度分析的步驟
    2.3點量表限制了溫和意見與強烈意見的表達,五點量表則正好可以表示溫和意見與強烈意見之間的區別。3.由於人口變量的異質性關係,對於沒有足夠辨別力的人而言,使用7 點量表法,會導致信度的喪失;對於具有足夠辨別力的人而言,使用5 點量表,又令人有受限的不適感。
  • 【乾貨分享】效度分析的幾點思考
    效度分析在學術研究中非常常見,其用於分析『測量項是否真實有效的測量自己希望測量的變量』,效度分析的研究方式有多種,通常包括內容效度,結構效度(探索性因子分析法)和區分效度或聚合效度
  • 百科|問卷的信度是什麼?信度檢驗又該如何實施?
    這就需要信度分析方法來評價問卷的可靠性或穩定性,它可檢測用某量表對同一事物進行重複測量後,所得結果的一致性。 1.什麼是信度 這是任何一種測量的必要條件,但不是唯一條件。信度分析主要是考察問卷的可靠性,指測量所得結果的內部一致性程度。
  • 一項新的評估力量舉技術中深蹲和硬拉內容效度和信度指數的方案
    點擊上方藍色字體,關注中國體育科學學會摘要:這項研究的目的是建立一項方案,該方案涵蓋深蹲和硬拉力量舉技術指標,並且這些指標與受傷風險的效度和信度有關
  • 量表寶庫:【04】了解不同形式的量表
    在社會科學中,還需要使用量表來測量各種不同的潛在構念,例如:感知風險、滿意度、無聊傾向、人生意義、自尊等,對這些潛在構念進行測量後,還會進一步使用量表所採集的數據探究不同潛在構念間的關係。 依據不同的分類標準,量表可以分成很多類別,這裡筆者以思維導圖的方式展示了不同分類依據之下的量表種類。
  • SPSS分析技術:裁判(打分者)的信度分析
    為了比賽的公平,奧運會的組委會會以合適的比例選擇來自不同地區和國家的裁判組成裁判小組,避免裁判有意識或無意識的傾向於來自於同一地區或國家的運動員。除了這樣人為安排以外,有沒有數據分析技術從數據的角度對裁判的打分進行監督和評價,從而保證比賽公平呢?其實是有的,這就是評分者的信度分析。評分者信度分析評分者信度分析是指多個評分者對同一批受考核者進行評分時的一致性程度。
  • 中考有變?2021年河南省中招考試《道德與法治》多項選擇取消!
    2021年與2021年題型變化:變化一:多項選擇取消變化二:非選擇題的主觀題由5小題變至4小題,減少1題題型變化原因:知識覆蓋面加寬、分值比例設定更均衡,評價更科學,有利於在適當降低難度的情況下,提高試卷的信度