我們在之前的文章裡討論了量表的定義和功能,了解了歐洲共同語言參考框架(CEFR)、基於CEFR開發的培生球英語等級量表(Global Scale of English)和劍橋英語等級量表(Cambridge English Scale),以及正在建設中的「萬能」的中國英語能力等級量表(China’s Standards of English)。還沒有讀過的新朋友請點擊下方的文章連結:
關於語言考試你需要知道的——量表(一)
關於語言考試你需要知道的——量表(二)
今天騎士要跟大家聊聊英語考試。有的朋友可能會覺得納悶:今天文章的標題還是關於「量表」的,為什麼講起考試來了?原因很簡單,因為測試本身就是量表!!!
之前的文章裡說過,所謂的量表其實就是測量工具。語言能力測試就是用來測量受試者的語言能力水平的,當然也是一種量表了。我們之前大談特談的CEFR也好,GSE也好,CES和CSE也罷,都是描述性的量表,無法直接用來進行測量,而只能用作制定其他量表/測試的依據。
在上述的幾個量表中,學習目標和能力描述最多,刻度最精準的量表是培生的Global Scale ofEnglish。在這個刻度為10-90的量表中,幾乎聽說讀寫每一項能力在每一個刻度上都有具體的描述。
上面的截圖展示的是GSE量表中Speaking能力59級所需要掌握的學習目標(後面標CA的條目來自CEFR,標P的是培生的GSE新添加的,前面的AC標註意思是Academic,說明這個條目裡包含的學習目標屬於學術英語的範疇)。這個描述相比CEFR已經精細了很多,但是裡面所描述的這些能力卻不像身高體重那樣能夠直接進行觀察和評價。這就相當於有的事物我們可以靠肉眼進行觀測,有些則需要藉助顯微鏡等更加精細的工具和儀器。在語言測評領域,在CEFR等量表的基礎上,我們需要開發更為精細的量表來評價測量對象是否具備這些「Can-do」描述。這些量表就是我們熟悉的語言測試(Language Assessment)。
為了理解方便,我們可以把CEFR和GSE這類描述性的語言能力等級量表稱作「一級量表」 ,將基於上述量表制定的語言測試稱作「二級量表」。一級量表追求的是「大而全」,而二級量表推崇的則是「小而精」,具體表現在以下兩個方面:
a) 二級量表一般只用到一級量表的部分內容
語言能力測試按照其測量的語言能力範疇可以分為以下幾種類型:
YLE(Young Learners』 English,少兒英語)。通常為6-13歲的少兒英語學習者設計,比如培生的PTE-YL和劍橋的CYLE。
GE(General English,通用英語),在某些一級量表比如GSE裡面也叫成人英語(Adult English)。比如培生的PTE-G和劍橋的通用五級考試(MSE)。這些考試只參照對應的一級量表中的通用英語部分。
ESP(English for Specific Purpose,特殊用途英語)。包括
EAP(English for Academic Purpose,學術英語)。如劍橋雅思(IELTS)、ETS託福(TOEFL)和培生的PTE-Academic。這些考試會用到對應的一級量表中的GE和EAP部分;
BE(BusinessEnglish,商務英語),也叫EIC(English for International Communications),如劍橋的BEC和ETS的託業(TOEIC)。這些考試會用到對應的一級量表中的GE和BE部分
EOP/ EVP(Englishfor Occupational/ Vocational Purposes,職業英語),如澳洲成人教育局(CAE)主辦的OET(Occupational English Test)和英國的TEA(Test of English for Aviation,航空英語考試)等等。
需要特別提到的是,除了部分EAP和BE/EIC考試之外,絕大多數的ESP測試都有自己獨立的一級量表。
b) 二級量表未必會用到一級量表的全部量程
不同類型的考試針對不同能力段的語言學習者,比如少兒英語考試就用不到CEFR量表A2以上的內容。下面這張圖很直觀的反映了培生的PTE系列考試與它們對應的一級量表GSE之間的關係。
同理,我們會發現學術英語考試通常從B1起步,因為語言能力在B1之上才被定義為語言的「獨立使用者」,才可能完成一些學術場景下的基本交流。比如雅思(IELTS)考試的4分對應的是CEFR的B1水平。因此,雖然雅思計分是從0到9,但4分以下的成績沒有意義。
https://www.ielts.org/ielts-for-organisations/common-european-framework
託福考試也是一樣,閱讀低於4分,聽力低於9分,或總分在42以下的成績都只具有統計學上的意義。
http://www.ets.org/toefl/institutions/scores/compare/
唯一不同的是培生的PTE學術英語考試(PTE-A)。它的分數從10到90全程都是有意義的。這不僅是因為GSE量表每一個刻度都有具體的學習目標描述,更是因為PTE-A考試獨特的設計。
PTE-A考試不僅考聽說讀寫四項交流技能(Communicative Skills,簡稱CS),還同時考察語言知識(Enabling Skills,簡稱ES),包括語法(Grammar)、口語流利度(Oral Fluency)、語音(Pronunciation)、拼寫(Spelling)、詞彙(Vocabulary)和書面語篇(Written Discourse)6分方面。考試的每一道題的得分都會被解釋為對應的CS和ES分數。因此,雖然PTE考試的CS能力是從GSE42分(對應CEFR的B1水平)開始考察,但即便要完成90分級別的CS任務也有可能用到10分的詞彙,比如「the」和「a」。而PTE-A考試的總分由CS和ES的分數構成,因此PTE-A考試的每一分都是能被解釋的。
最後來說一說這些二級量表上分數的意義。這還得從量表的分類說起。量表有好有壞有的粗糙有的精準。按照量表的質量高低我們將量表分為四類:
稱名量表(Nominal Scale,簡稱NS)。NS是最低水平的量表,量表上的數據只有類別意義,只能用來給被測量個體歸類,但無法體現個體間差異。比如說一個0到4的英語量表,0表示英語零基礎的學習者,1表示初級學習者,2表示中級學習者、3表示高級學習者,4表示英語母語者。我們可以用這個量表把學習者歸到這5個類別中,但在同一個類別中的個體之間的差異無法再此量表中體現。
定序量表(Ordinal Scale,簡稱OS)。定序量表上的讀數可以用來給被測量個體排序。比如上面提到的那個0-4的英語量表,如果只有5個被測量個體,且5人分別能被歸到不同的等級,那麼在這個特殊情況下,這個稱名量表就變成了定序量表。各類比賽裡的排名也是典型的定序量表。我們只知道第一名比第二名強,第二名比第三名強,但各自的差距在這個量表中並不體現。
等距量表(Equal Interval Scale,簡稱EIS)。顧名思義,等距量表具有距離相等的單位/刻度,並且等距量數間的差異具有相等的價值。簡單的說,就是100分-80分=75分-55分。
等比量表(Ratio Scale,簡稱RS)。相比等距量表,RS量表的量數不僅可以做加減運算,還可以做乘除倍數運算。這種量表其實在生活中隨處可見,比如量身高的尺子和稱體重的秤。但在語言測試中,制定等比量表是不可能完成的任務,因為對語言能力的描述不可能做到完全客觀和完全量化。
需要特別注意的是,在語言測試領域,幾乎所有的一級和二級量表都是看似等距的定序量表。比如CEFR量表中A1和A2之間的差距不等於C1與C2之間的差距。同樣,託福考試120分的考生和110分的考生之間的差距不等於80分的考生和70分的考生之間的差距。因此,從A1水平提升到A2水平所需要學習的內容和投入的時間,和從B1提升到B2也自然是完全不同的。
因此我們在制定學習目標或者教學計劃的時候,不要只看離目標分數還差多少分,而是要根據自己當下的語言能力水平,按照量表的建議作出合理規劃。英語學習的確有方法,卻沒有捷徑。這一點大家務必牢記!
至此,我們的量表系列就暫時告一段落了。下一季我們要開始從英語能力量表聚焦到語言測試與測評。歡迎大家持續關注並順手轉發!