一個測驗的好壞,取決於該測驗的標準化水平.

2021-12-30 Education測試測量與評價

一、所謂標準化是指測驗的編制、施測、評分以及解釋測驗分數的程序的一致性。具體地說,測驗標準化包括下列內容∶

(一)測驗內容

標準化的首要前提,是對所有受測者施測相同的或等值的題目,測驗內容不同,所測得的結果就無法進行比較。

(二)施測過程

標準化的第二個條件是所有受測者必須在相同的條件下施測。其中包括;

(1)相同的測驗情境。如統一的採光條件、統一的桌椅高度、統一的桌面面積、統一的房間布置等。

(2)相同的指導語。指導語一般包括兩部分∶ 一是向受測者說明測驗的目的,以便解除受測者的顧慮;二是向受測者說明如何對測驗項目做出反應。指導語必須事先擬好,印在測驗項目的前面,並且力求清晰、簡單、明了,不致引起誤解。如果受測者對測驗不熟悉,應當有一至兩個例題。

(3)相同的測驗時限。測驗的時間限制是測驗程序中的重要方面,不過,不同的測驗對時限要求也不相同。一般來說,人格測驗對時限的要求不太嚴格,甚至不要求時間限制;但能力測驗和學績測驗必須考慮時限問題。確定時限一般採用嘗試法,即通過預測來決定。通常的時限定為大約 90% 的受測者在預定的時間內完成全部測驗項目即可。

(三)測驗評分

評分的客觀性是標準化測驗的第三個條件,評分的客觀性意味著兩個或兩個以上的評分者對同一份測驗試卷的評定是一致的。只有當評分客觀的時候,才能將分數的差異歸於受測者本身的差異。但要做到完全客觀(一致)地評分是困難的。一般來說,不同評分者之間的一致性在 90% 以上,便可認為評分是客觀的。客觀性評分要求;

(1)對反應要及時清楚地記錄,以免由於記憶喪失造成混亂,在口頭測驗和操作測驗中尤為如此。

(2)要有一張記錄標準答案或正確反應的表格,即記分鍵。選擇題的記分鍵包括每一測驗項目正確反應的號碼或字母;問答題的記分鍵包括一系列的正確答案和容許變化的範圍;論文題的記分鍵包括一致可接受答案的要點;人格測驗沒有正確答案,記分鍵上指明的是具有或缺少某種人格特徵者的典型反應。

(3)將受測者的反應與記分鍵比較,確定受測者反應應得的分數。

(四) 測驗分數的解釋

一個標準化的測驗,不僅要求測驗內容、施測過程和評分程序標準化,而且要求對測驗結果的解釋標準化。如果對同一測驗結果(分數)可做出不同的解釋,那麼測驗便失去了客觀性。

某一測驗分數只有與一定的參照標準相比較,才能顯現出它所代表的意義。在心理測驗中,建立參照標準的過程也就是建立常模的過程。建立常模的方法,是在將來要施測的全體受測者中選擇有代表性的一部分受測者(稱為標準化樣本)進行測驗。將所得結果加以統計分析,得出這個標準化樣本的平均數,即為常模。對某一受測者分數的解釋要與這一受測者所屬團體的常模作比較,才能說明該受測者分數所代表的意義。

二、鑑定測驗

測驗編好後,必須對其可靠性和有效性進行鑑定,以便確定該測驗是否可用。對測驗的鑑定,主要是確定其信度係數和效度係數。

(一)信度

信度是指測驗的可靠性,即用同一測驗多次測量同一團體,所得測驗結果之間具有一致性。我們用鋼片捲尺去測量一木桿的長度,所得結果是可靠的,因為無論是由一個人數次測量,還是由數個人分別去測量,所測得的結果都是一致的。如果改用橡皮軟尺去測量木桿,多次或多人測得的結果就難以—致。也就是說,這一測量工具是缺乏信度的。由此可見,信度是衡量測驗的最基本的指標,因而測驗編好後首先要鑑定該測驗的信度。

(二)效度

效度是指測驗的有效性,即一個測驗在多大程度上能夠測得它所要檢測的內容。如果一個測驗的效度很低,那麼說明該測驗所檢測的不是它所要檢測的內容。例如,智力測驗所要測的內容應是智力,假如它測得的是知識或人格,那麼說明這個智力測驗對於測量智力是無效的。因此,測驗編好後,還必須鑑定該測驗的效度。

(三)測驗量表與常模

任何測量都是以數量化的形式來表達測量結果的。心理測量是以心理測驗為測量工具的,它必須採用一定的量表作為標準化的記分制度來實現測驗結果的數量化。所以,測驗編制者為了說明和解釋測驗結果,必須根據測驗的性質、用途以及所要達到的測量量表的水平,按照統計學的原理,把某一標準化樣本的測驗分數轉化為具有一定參照點、等值單位的導出分數,這就是所謂的測量量表。在心理測驗中,常見的測驗量表有百分等級量表、標準分數量表、T量表、發展量表、智力商數量表等。如果將標準化樣本的測驗分數與相應的某個或幾個測驗量表分數一起用表格的形式呈現出來,就是測驗的常模表,標準化的心理測驗都在測驗手冊中提供可供解釋測驗分數的常模表

八、編寫測驗說明書

測驗說明書向測驗使用者說明如何使用該測驗,以保證測驗的信度和效度。

包括下列內容∶

(1)本測驗的目的與功用。

(2))本測驗的理論依據。

(3)實施測驗的方法,包括∶ ①何種測驗; ②內分幾部分; ③)每部分有多少個測驗項目;④答案如何做,等等。

(4)測驗的標準答案和評分方法。

(5)關於測驗的信度、效度資料的說明。

(6)常模表,即如何依據常模解釋測驗結果。

相關焦點

  • 教師資格小學教育學複習資料:第七章教育測驗
    在一個段落或一門課結束後,教師會編制一套試題,全面考察學生的掌握情況。現行小學學科測驗多採用閉卷形式,有時候也要求學生完成實踐性課題。(二)標準化測驗和教師自編測驗標準化測驗在試題編制、施測和評分過程中有著嚴格的規範。標準化測驗是由測驗專家和教師共同編制的,試題質量較有保障。最典型的標準化測驗是智力測驗,如「比奈智力量表」。
  • 「趣味心理測驗」測的是什麼?
    這些圖片也是兩歧圖形,不同人找到的不同人頭個數,只能反映出知覺水平的差異當然,測量潛意識因素的羅夏墨跡測驗、主題統覺測驗、語句補充測驗等除外,這些測驗自由度高,也各具趣味。應用最廣泛、最經典的明尼蘇達多相人格測驗(MMPI)用於篩查精神疾病和人格障礙,包括十個臨床量表,四個效度量表。
  • 心理學2016考研專業課知識點:常用心理測驗大盤點
    編寫說明書   3.標準化:與一般心理測驗標準化程序相同,只是在分數解釋的標準化時,不是要編制好常模,而是要認真研究教材和教學大綱,分析合格標準的確切含義、調整試題難度和結構、準確劃分合格分數線。
  • 第八章 常模參照測驗 筆記
    如果解釋測驗分數的參照體系是社會在所測特徵上的客觀要求或某個指定的外在標準,該參照體系就稱作「標準」,參照著外在的客觀標準來解釋測驗分數意義的測驗稱作「標準參照測驗」;如果解釋測驗分數的參照體系是被試所屬團體被測特徵的一般水平或水平分布狀態,該參照體系就稱作「常模」,參照某個特定被試群體的常模來解釋測驗分數的測驗稱作「常模參照測驗」。
  • 筆記|《心測》C7 心理與教育測驗的編制與實施 之一、編制心理與...
    2.編題計劃的用途(1)指明了應該編哪些方面的測驗項目以及編多少個項目;(2)記分時可按計劃中百分比確定每類測驗項目的分數標準。(三)編輯測驗項目1.收集測驗資料。一個測驗是否有效,取決於該測驗是否能夠測得研究者所要測得的東西,為此,就需要收集適當的測驗資料。
  • 筆記|《心測》C10 測驗等值 & C12 能力測驗(上)
    同質性:被等值的不同測驗形式所測的必須是同一種心理品質,測驗的內容與範圍也應該基本相同;2.等信度:被等值的不同測驗形式必須有相等的測驗信度;3.公平性:指考生參加被等值的不同測驗形式中的任何一個,等值後的結果都是一樣的;4.
  • 【智力測驗】瑞文標準推理測驗
    瑞文測驗的編制在理論上依據斯皮爾曼(C Spearman)的智力二因素論,該理論認為智力主要由兩個因素構成,其一是一般因素,又稱「g」因素,它可以滲入所有的智力活動中,每個人都具有這種能力,但水平上有差異,另一個因素是特殊因素,可用「s」表示,這類因素種類多,與特定任務有高相關。
  • 測驗對學習提高的有效性----測驗效應
    在以往的生活中,人們總是將測驗當做檢驗學習效果的一種手段。尤其在學校學習中,測驗成績被用作評估學習好壞的直接指標,而導致部分學生對測驗成績的偏度重視。實驗中,研究者要求被試先學習40對外語詞對,並進行測試,隨後區分四種條件:(1)不論測驗結果如何,重複學習-測驗程序;(2)對於測驗正確的詞對,隨後不重複學習此類詞對,但仍然對他們進行測驗;(3)對於測驗正確的詞對,隨後仍然學習這些詞對,但不進行測驗;(4)對於測驗正確的詞對,既不進行學習,也不進行測驗。最後,要求被試自由回憶這些詞對。
  • 筆記|《心測》C8 常模參照測驗 之三、常模參照測驗分數的解釋與...
    三、常模參照測驗分數的解釋與應用主要的常模參照分數1.發展量表(1)年齡常模:年齡量表最基本的假設是所測量的特質隨年齡作系統的改變。年齡量表的基本要素:①一組可區分不同年齡組的題目;②一個常模團體;③常模對照表。
  • 周周帶背57·測量⑥:測驗常模/標準參照測驗
    之所以把這兩部分給大家放在一起帶背是因為常模參照測驗和標準參照測驗這兩個是比較相似的概念,在文章的最後我也有對這兩個測驗的不同點和相同點做了一個總結,所以結合起來一起背誦更有利於對這兩種測驗的理解。首先,我們需要了解常模的含義,常模即指根據標準化樣本(也即常模團體)的測驗分數經過統計處理而建立起來的具有參照點和單位的測驗量表。
  • 真實的心理測試才有效,了解心理測驗的標準、信度和效度
    但是實際上,這些所謂的測試結果多為模稜兩可的句子,不體現測試者的真實水平也沒有任何實際作用,充其量就是一個社交遊戲而已。那麼真正的心理測試是什麼樣子呢?心理測試應該具備哪些基本條件呢?本文就從測驗的分類講起,帶你了解真實的心理測驗的三個標準:標準化、信度 和效度。
  • Graphic Notes--常模參照測驗(上篇) | 心理測量學
    常模參照測驗:如果解釋測驗分數的參照體系是被試所屬團體被測特徵的一般水平或水平分布狀態,該參照體系就稱為常模。參照某個特定被試群體的常模來解釋測驗分數的測驗稱為常模參照測驗。常模參照測驗是一種測驗,是對行為樣本進行客觀、標準化的測量,其操作過程是標準化的(標準化不再贅述)。
  • 《教育與心理測驗標準》選譯:測驗設計與開發標準
    標準4.2除明確測驗的特定用途外,測驗規範應確定測驗的內容、測驗長度、試題題型、試題和測驗的教育測量學指標、試題和模塊次序。測驗規範還應明確測驗時長、考生須知、參加測驗時可使用的材料;明確測驗實施的流程,以及測驗設計機構認可的流程變通;明確評分和分數報告流程。計算機化測驗的規範應明確硬體和軟體需求。
  • 測評03:筆試與心理測驗
    二是間接性,心理特質像一個暗箱,只能通過測量個體對測驗題目的反應,進而來推論其心理特質。三是相對性,在對行為作比較時,只是在一個連續尺度上的行為序列,沒有絕對零點和標準。▍心理測驗的三要素(1)行為樣組。心理測驗測的是人的行為,但並非測量所有行為,而是測量被抽取出來的、有代表性的行為樣本組成的行為樣組。
  • 韋氏智力測驗
    任何一項一試背得正確,便繼續進行下一項,如果有錯誤便進行同項的二試,兩試均失敗則停止該部分測驗。兩部分念出數目的速度均按每一秒鐘一個數字,也不得將長數目分組念出,因為分組容易記憶。(6)詞彙:包括40個詞彙,按難度排列,要求被試者解釋詞意。言語能力較差的被試者從第1題開始做,一般被試者從第4題開始,如果4~8項內有一個得0分,便回頭測1~3個詞。
  • 2020福建教師招聘備考:人格測驗和其測驗的編制方法
    一、自陳量表1.明尼蘇達多相人格測驗(1)明尼蘇達多相人格測驗,簡稱 MMPI,是現今國外最流行的人格測驗之一,此量表是由美國明尼蘇達大學教授哈薩威和麥克金裡所編制的,適用於 16 歲以上具有小學文化水平以上的群體。所有題目均採用「是、否、不一定」來回答。
  • 比內-西蒙智力測驗(中國比內測驗)
    本測驗共包括51個試題,從易到難排列,均印在測驗指導手冊上,並準備下列必備的測驗材料: ⑴兩個1寸半×2寸半的長方形(最好用卡片紙),把其中一個剪成兩個三角形。 ⑵黑(或灰色)鈕扣13個。 ⑶三張卡片分別寫上桌子、餅、老鼠,汽車、工人河,媽媽、老師、我。 ⑷3寸見方白紙若干張(每人用一張)。
  • 不靠譜的繪畫測驗為什麼有人追捧?︱投射測驗的悖論
    由於受到精神分析人格理論很大的影響,羅夏 (Rorschach) 在1921年發表了著名的墨跡測驗。在1905年,比奈開發了主題統覺技術,來測量智力水平,測驗中,被測者需要對照圖片講一個故事。上述的這些測驗形成了現代投射測驗的雛形。
  • 一套測驗就下心理問題診斷?心理測驗不是那樣用的,不是神乎其神
    心理測驗有用,但不是決定性的作用在心理諮詢這個領域內,一個合格的諮詢師要具備諮詢技能、診斷技能、測量技能。所以心理測驗只是作為諮詢師了解來訪者的一個工具,而不是給來訪者扣帽子或是貼標籤的決定性手段。既然是工具,那麼就只是提供參考,心理測驗在心理諮詢領域更多是作為評估依據。就像我們去檢查身體,各種各樣的生化指標是為醫生提供診斷依據,要經過醫生的綜合判斷後才會有一個確定的結果。
  • 學業成就測驗在教育質量監測中的作用
    美國、澳大利亞、德國、法國、日本和中國港臺地區在其各自教育質量評估目的中明確表明要對本國家(地區)學生的學業成績進行監測,評估學生學業發展水平的變化情況。學業成就測驗是測驗法的一種,可以對學生的學業水平進行量化的評價。目前,學業成就測驗被廣泛應用於各大型國際教育質量評估項目和國家(地區)教育質量監測工具中。