新高考綜合改革是新時代育人方式改革的突破口,圍繞培養什麼人、怎樣培養人、為誰培養人這一根本問題,服務於全面而有個性發展的社會主義建設者和接班人的培養與選拔。新高考綜合改革中的普通高中學業水平考試(以下簡稱「學考」)是中國特色現代教育考試招生制度的重要組成部分,是形成分類考試、綜合評價、多元錄取的考試招生模式的關鍵環節。正在試行的普通高中學業水平選擇性考試(簡稱「學考選擇性考試」)對基礎教育和高等教育人才培養與選拔都產生了一系列積極效應,但也遇到一些新問題、新挑戰。
學考選擇性考試的實施,關係到學生全面而有個性發展的教育教學改革的深入推進,對構建科學的教育評價體系有重要影響。學考選擇性考試改革的成敗,與新高考制度整體改革的成敗息息相關。與全國統一高考的功能定位不同,學考選擇性考試具有多功能取向。我國在選拔性考試方面已有成熟經驗,而在基於標準的學業水平考試方面還沒有適合我國國情的理論與技術,亟需準確把握學考選擇性考試的功能定位,明晰改革路徑,加強理論研究與實踐探索,適時調整完善學考選擇性考試設計。
一、鑑定、監測與選拔:高中學考選擇性考試的功能定位
學考選擇性考試的功能定位來源於國家教育綜合改革的整體部署與規劃,學考選擇性考試不是一項獨立的考試制度,而是綜合評價多元錄取機制的一部分,是考試招生制度改革的重要內容。此次高考綜合改革中,學考選擇性考試具有一考多用的功能。
《教育部關於普通高中學業水平考試的實施意見》(以下簡稱《學考實施意見》)提出:「學業水平考試是根據國家普通高中課程標準和教育考試規定,由省級教育行政部門組織實施的考試,主要衡量學生達到國家規定學習要求的程度,是保障教育教學質量的一項重要制度。考試成績是學生畢業和升學的重要依據。」在此次高考綜合改革方案中,學考選擇性考試成績是高校綜合評價錄取新生的重要依據之一,具有選拔功能。《普通高中課程方案(2017年版2020年修訂)》規定:「選擇性必修課程」是學考選擇性考試的主要考查內容,也是獲得高中畢業總學分的重要教學內容。因此,學考選擇性考試也承擔對學生畢業總學分獲得的鑑定功能和相關教學質量的監測功能。
以往的高考改革更多地關注如何完善高考的選拔性功能,因此很容易延續這一思維慣性,錯誤地認為計入高考總成績的學考選擇性考試仍只承擔選拔功能,依據常模參照的思路,針對考生群體的水平分布情況來設計考試。這樣的考試設計,難以實現學考選擇性考試的鑑定功能和監測功能,無法落實學考選擇性考試的多功能定位,也難以實現綜合評價多元錄取方式改革的初衷。
設置學考選擇性考試,期望測量出考生的優點和長處,評價考生的潛質、興趣、能力,給予考生以科學的評價和定位。通過學考選擇性考試,區分考生學業的發展性向與水平,為高校錄取新生提供重要依據;通過學考選擇性考試,鑑定考生學業水平,判斷是否達到國家課程標準所規定的畢業要求;通過學考選擇性考試,監測教學質量,為評價高中教育質量提供可靠信息。
《國務院辦公廳關於新時代推進普通高中育人方式改革的指導意見》(國辦發〔2019〕29號)(以下簡稱《指導意見》)明確提出:「學業水平選擇性考試與高等學校招生全國統一考試命題要以普通高中課程標準和高校人才選拔要求為依據,符合相應學業質量標準,體現不同考試功能。」學考選擇性考試通過對考生學業質量水平的評價,承擔著鑑定、監測和選拔三項功能,兼有標準參照和常模參照的雙重測量屬性。
二、標準參照和常模參照相結合:高中學考選擇性考試功能發揮的應然轉向
(一)糾正以往「錄分不錄人」的招生弊端
目前改革試點區仍然是依據常模參照的思路,學考選擇性考試只報告考生的得分和排序,這是人與人在比較,不是人與學業標準進行比較,只有體現考生在群體中位置的相對評分,沒有反映考生能力水平的絕對評價。這樣的成績報告只能部分滿足學考選擇性考試選拔功能的要求,尚難滿足鑑定功能和監測功能的要求,在招生錄取過程中也只能做到「按分」錄取。
近年來,教育工作者們不斷強調考試對教學與選拔的反饋作用,越來越多傳統的終結性考試都開始在設計中結合標準參照和常模參照兩種方法。例如,國際學生評估項目(Program for International Student Assessment,PISA)就既依據標準進行能力等級劃分,又對參與的國家和地區進行排名;美國大學入學考試(American College Testing,ACT)雖然成績主要用於為大學招生錄取提供信息,但在命題中主要依據高中課程標準和大學準備標準。學考選擇性考試要實現鑑定、監測和選拔三項功能,其設計必須將標準和常模相結合:既要將考生所具有的知識能力水平與標準相比較,對考生的水平作出一個絕對評價,體現考生是否達到某一能力等級;又要將考生與全體考生相比較,對考生的水平作出一個相對評價,體現考生在群體中的排名位置。一個孤立的考試分數在與特定的參照系作比較前,不代表任何意義,只有與考試前制定的標準對照,才能解釋考試分數作出評價。標準參照與常模參照相結合,才能夠為高校提供更多可供錄取時參考的有用信息,不僅知道考生的分數,還知道這個分數所代表的知識結構、能力結構和考生的潛質,有助於改變以往錄取中「錄分不錄人」的情況。
(二)構建科學的教育評價體系
高中教育是國家基礎教育的重要組成部分,關係到國家和民族的整體人口素質水平,是促進社會安定和經濟發展的重要因素。《指導意見》明確要求:「堅決扭轉片面應試教育傾向,切實提高育人水平,為學生適應社會生活、接受高等教育和未來職業發展打好基礎,努力培養德智體美勞全面發展的社會主義建設者和接班人。」《普通高中課程方案(2017年版2020年修訂)》也明確了我國普通高中教育的任務是「促進學生全面而有個性的發展,為學生適應社會生活、高等教育和職業發展做準備,為學生的終身發展奠定基礎」。高考如果只有選拔,以選拔代替基礎教育與高等教育的銜接,會造成社會成本太高、束縛人才的成長、加劇高中與大學之間的矛盾等一系列問題。提高高中整體教學質量,更需要發揮學考的鑑定和監測功能。
高考綜合改革方案中語文、數學、外語是統一高考科目,偏重於基礎性和綜合性考查;學考選擇性考試科目是選考科目,關注學科導向,注重考查大學專業學習所需要的必備知識和關鍵能力。統考科目和選考科目相結合,在完成對共同基礎的考查同時,可以實現對考生個性能力、發展潛質的評價,促進學習方式和育人模式的轉變。充分發揮高考統考科目與學考選考科目的不同功能,才能實現綜合評價、多元錄取的改革初衷。標準參照和常模參照相結合的學考選擇性考試設計,有利於扭轉僅以分數排隊的不科學的教育評價模式,使高中教育不只注重教育的篩選功能,更注重教育的培養功能。
(三)加強高中與大學教育的銜接
當高等教育發展實現大眾化以及普及化,高等教育的招生規模達到與高中大體相當的規模時,高中與大學之間可以實現共生銜接,高校招生考試制度也會發生根本性的改變。《學考實施意見》明確指出學考要「促進高中、高校人才培養的有效銜接」。將學考選擇性考試納入招生錄取機制,擴大了高中教育成果在高校招生錄取中的作用和分量,拓寬了大學與高中之間的銜接機制,學考選擇性考試成為實現高中與大學之間共生銜接的重要載體。
高考綜合改革方案貫徹選擇性教育的理念,賦予高校和考生選擇考試科目的權利。標準參照和常模參照相結合的學考選擇性考試可以按課程標準中的學業質量水平區分考生,並對接大學相關專業學習的基本素養和能力要求,從而實現高校招生從「選拔」向「選擇」功能的轉變。這將有助於高校明確招生標準,通過調整高校招生錄取的取向,促進高校與高中之間人才培養的有機銜接,既有利於促進學生全面而有個性的發展,使學生從僅憑分數被動地被高校選拔轉向主動地依據自身特點及生涯規劃選擇專業及做好高校學習的準備,又可讓高校選擇專業認同的、適合培養的學生。
(四)糾正考生的不正常博弈行為
目前學考選擇性考試以考生的百分位排名為基本依據的等級賦分方式,不是將考生表現與學業質量水平標準進行比較,而是以考生在參加該科目當次考試的考生群體中的排名來衡量。這種賦分方式只有「量」的概念,沒有「質」的考慮,考生成績受「和誰一起考」的影響,而非只取決於自身的學業水平,導致在一些科目中出現了高水平學生得不到高分的情況,也難以比較不同科目、不同考次的試題難度和考生水平,加劇了考生在選擇考試科目時的不正常博弈行為。標準參照和常模參照相結合的考試設計,依據學科學業質量水平標準,設定等級賦分,能充分展現考生的能力水平。無論某科目、某批次、某年份的考生數量是多少,考生的等級成績都與相對穩定的國家課程標準所要求的學業質量水平作比較,高水平者得高分,低水平者得低分。等級賦分重在考生的學業能力水平,有助於引導學生合理選擇適合自己的選考科目,糾正考生的不正常博弈行為,保障考試的公平性。
三、完備頂層設計:高中學考選擇性考試的改進路徑
高考綜合改革對育人和社會發展有重要的價值導向,是教育治理體系現代化的重要環節,為了維護社會的公平和正義,科學實施學考選擇性考試,還需加強頂層設計。國家教育諮詢委員會委員鍾秉林根據試點地區新高考實施情況指出:要加強對高考改革具體環節的科學論證,要客觀分析存在的問題,從制度設計層面進行政策調整,通過提高高考制度的科學性來實現公平性。作為高考綜合改革的構成要素,學考選擇性考試改革不僅涉及考試技術,還涉及政策體制、評價機制、人才理念、教育教學等各個方面。從試點地區情況來看,標準參照和常模參照相結合的學考選擇性考試迫切需要國家制定一系列相應的政策來指引。
(一)強調整體性,制定學考選擇性考試國家標準
根據國際考試行業的成功經驗,所有高質量的考試都需要有一套得到學科專家、測量專家和政府相關部門三方認可的具有很強操作性的考試標準。目前,我國尚無高中學業水平考試國家標準作為學考考試設計與實施的依據,亟須在總結試點地區經驗基礎上,依據國家課程標準和高校人才選拔要求,研製學考選擇性考試國家標準,以落實《學考實施意見》明確的國家標準、省級考試的高中學業水平考試管理機制。
國家考試標準應從學考科目、考試內容、考試方式及招生錄取整體設計,對人才素養內涵和能力需求進行科學定義,權威界定學考選擇性考試實施規範。這可以避免不同地區對國家課程標準和高校人才選拔要求的不同解讀,提升學考選擇性考試的質量,推進國家課程標準理念與要求的落地,助力高中育人方式改革。學考選擇性考試國家標準,有利於縮小跨省招生的高校同一專業不同生源地之間新生專業學習能力的差異,有利於高校把握教學起點的質量,增加高校及社會對高中學業水平選擇性考試的認可程度。從教育監測的角度來看,國家標準也有利於通過學業水平考試監測全國範圍內不同地區之間、不同年份之間的教育質量差異,為教育政策決策提供依據。從教育治理現代化的視角來看,有利於遵循管辦評分離的原則,依據國家標準對高校招生考試質量和高中教學質量進行公平科學的評價。
在國家標準的指導下,各省市可以根據實際情況,在命題中體現地方特點。2020年1月教育部考試中心牽頭組織專家研製的高考評價體系公布。高考評價體系是高考命題、評價與改革的理論基礎和實踐指南。實行高考綜合改革的省份可依據高中課程標準,參考高考評價體系,結合本省實際情況探索設計學業水平選擇性考試命題藍圖,以確保新高考、新課程理念的順利落地。
(二)加強協同性,緊密對接高中課改要求與高校人才選拔要求
學考選擇性考試國家標準要促進教學、考評、招生有機銜接,形成育人合力,關鍵是處理好高中課程改革與大學人才選拔改革的關係,研究課程標準中學科學業質量標準的考生實際表現和高校學習的必備知識與關鍵能力,實現高校選拔與高中育人的有機銜接。學考選擇性考試國家標準要從一考多用功能定位出發,對「考什麼」「怎麼考」「成績怎麼報告」等關鍵環節提出指導意見。
回答「考什麼」的問題,需要制定學考選擇性考試各科目的能力標準。教育標準有內容標準和能力標準之分,內容標準是學校教學的依據,能力標準首先服務於考試,描述參加某特定考試的考生所需具備的能力。2017年版的國家課程標準明確學業質量標準是對學生學業成就水平的總體刻畫,規定了學生學習結果的應然水平,是一種規範性的內容標準,而非能力表現標準。
對試點地區學考選擇性考試的試題內容和學生作答數據分析表明,試卷與課程標準的一致性程度不高,與課程標準中學業質量水平的描述難以對應。其主要原因在於學業質量水平為規範性標準,描述較為宏觀,無法直接對命題、評分及等級分數劃定和使用作出操作性指導。
學考選擇性考試能力標準是考試整體設計的基礎與核心。能力標準的制定,既要依據課程標準和高校人才選拔要求,也要藉助常模建立參照系。要基於課程標準中的學業質量標準對選考科目能力等級進行層次清晰的內容描述,並充分體現高校學科(專業)對生源培養的層級要求,結合學生實際表現水平設定常模,制定各個等級所代表的能力結構和表現標準。
學考選擇性考試能力標準的制定可以參照教育部、國家語委頒布的《中國英語能力等級量表》。為使這個國家語言能力測評標準貼合國情、教情,在研製過程中既參照各學習階段的課程標準(教學指南),又在28個省的1500多所大中小學開展實證研究,收集了16萬多名師生數據建立常模。量表以語言運用為導向,構建了多層級的指標體系,對各等級的能力特徵進行了全面、清晰、翔實的表現性描述。
要回答「怎麼考」的問題,就需要制定測試框架。測試框架是指對測評工具研究的整體規劃和界定。國際上的一些基於標準的考試,如PISA、美國國家教育進展評價項目(National Assessment of Educational Progress,NAEP)、國際閱讀素養進展研究項目(Progress in International Reading Literacy Study,PIRLS)都有相應的測試框架或測試說明。
測試框架應基於能力標準確定考試構念,再圍繞構念確定適合目標群體能力的考試內容、考試範圍、考試形式、考試時長、評分標準等,並提出實現試題命制、考試實施、閱卷評分及分數轉化和解釋報告的標準化的建議,確保考試構念得到有效測量,即確保考試的效度。標準參照和常模參照相結合的學考選擇性考試的測試框架,其考試內容、考查維度和能力要求要與課程標準保持一致。
「成績報告」是標準和常模相結合設計學考選擇性考試的關鍵環節。學考選擇性考試在分數獲得(包括等級劃分)上應為標準參照,在考試成績報告上既可以提供標準參照的分數解釋,又可以提供常模參照的分數解釋。學考選擇性考試成績的等級劃分應以課程標準、能力標準為依據,可採用Angoff法、對照組法、書籤法等。等級分數的內涵既要能反映考生學業水平的差異,還應體現報考限定專業的學習基礎。各地可根據當年招生計劃,依據學科(專業)錄取人數與考生實際水平的設定常模,在不改變考生排序基礎上,細化等級分數,計入總成績,用於高校招生錄取。
成績報告可由考生能力等級認定、能力等級描述以及計入總分的細化等級分數三部分組成,量化和質性評價方式互為補充。等級認定關注考生「能做什麼」,關注考生所具有的知識、能力水平,關注考生所能完成的任務,用於鑑定考生和監測教學,用於高校錄取時判斷考生是否達到進入相關專業學習的基本素養和水平。量化的轉換分數關注考生「在哪兒」,關注考生在群體中的位置,對考生排隊,計入考生錄取總成績,用於高校錄取時按分數高低順序排位選拔。同時,依據能力標準和測試框架,對考生學業能力作出質性描述。
(三)提升專業性,制定符合高校專業培養需要的招生標準
新高考制度推行「兩依據一參考」旨在以綜合評價破解「唯分數論」,發現和培育學生的良好個性,促進學生全面發展健康成長。高校要從過去「被動選人」轉向「主動選人」,主動鑑別和選拔符合培養標準的新生。
然而在招生過程中,高校對招生標準的設定還存在很大不足,比如將弱勢學科、冷門專業包裝到大類招生中,甚至不限定任何選考科目以擴大生源基礎。先行試點的浙江省2017年選考科目不設限的專業就佔53.9%,共12786個。對此,《指導意見》明確要求:加強高等學校招生工作能力建設,不斷提高招生錄取工作科學化、專業化水平;高等學校要根據人才培養目標和專業學習基本需要,結合實施高考綜合改革省份學生的選考情況,不斷完善招生專業選考科目要求;高校應以多種方式向高中學校介紹專業設置、選拔要求、培養目標及就業方向等,為學生提供諮詢和幫助。
高校要主動發揮其在招生錄取中的主體作用,認識到高校是新一輪考試招生制度改革的總樞紐,努力加強招生能力建設。目前,高校分層分類發展趨勢明顯,不同層次類型的高校,其學生培養要求是不一樣的。高校不同專業對新生的知識、能力結構的要求不同,招生標準也應該不同。要引導高校理性限制選科,優化高校招生分類依據,研究不同專業新生入學所需選考科目的必備知識、關鍵能力與學科素養。在此基礎上,明晰人才培養規格和選拔標準,及時追蹤與評價學科、專業錄取要求與考生知識結構匹配的效果,從而以學科需求為基礎,探索大類招生模式,提升高校生源質量。不同高校應該從自身人才培養的特點出發,確立自身的使命,並根據其使命來尋找、發現和選擇與之相匹配的學生,制定符合自身需要的招生標準。
(四)注重契合性,研究探索適合國情的學業水平考試理論與技術路徑
學考選擇性考試是此次高考綜合改革的重點,仍有不同考試內容的可比性、不同科目分數的可加性、高考和學考兩種不同性質考試的融合性等一系列亟待研究的問題。這方面直接照搬國際模式與方法行不通,需要在試點的基礎上加以總結和創新,形成適合我國國情的能指導實踐的理論和方法。
首先,依據我國課程標準和招錄模式,借鑑國際經驗,積極探索實施兼具標準參照性和常模參照性的等級認定,並轉換為可計入總分的等級分。其次,課程標準中的核心素養超越了一般的學科知識和能力的範疇,處於更高一層的抽象層級。傳統的命題和考試形式難以全面考查核心素養,需要加強考試內容和形式改革的研究,通過考試評價促進教學改革,提升招生質量。
再次,同一專業的情況下,一流大學的一流學科和普通大學的普通學科對新生的能力要求是存在較大差距的,用同一標準來衡量時,如何精準區分是一個亟待研究的問題。例如,根據課程標準規定,學業質量水平4是進入高校相關專業學習應達到的水平要求,但是這一要求能否同時滿足不同層次高校不同專業水平的需求,仍需深入研究。
複次,隨著課程改革和教學改革的推進,課程學習情況可能會發生變化,甚至在相對較短的時間內就發生變化,學考選擇性考試國家標準制定之後,還需要根據課改推進情況與大學招生標準及時修訂。
最後,為科學使用學考選擇性考試數據,還應增加項目反應理論的運用。以往的高考數據分析多基於經典測量理論。從改革試點地區的現狀看,經典測量理論和技術尚不能有效解決學考選擇性考試實踐中遇到的突出問題,未能完全實現其一考多用的功能定位。需要根據學考選擇性考試的測量屬性和功能,研究如何將經典測量理論與項目反映理論相結合,從而提升學考選擇性考試的科學化水平。
(五)促進協調性,充分發揮學考選擇性考試的多維評價功能
高考改革牽涉多元利益主體,多元參與是調和各利益相關者多元利益訴求的途徑之一。充分發揮學考選擇性考試的多維評價功能,能促進不同利益主體之間的協調。
標準參照和常模參照相結合設計的學考選擇性考試,讓學考成績真實客觀反映學生學業發展水平。不僅可以鑑定學生學業水平、評價學校教學質量是否達到國家課程標準,還可診斷學生在選考科目中各個能力維度上的優勢與不足,關注到學生不同特點和個性差異,便於因材施教,發展每一位學生的優勢潛能。
兼具標準參照和常模參照性質的學考選擇性考試有利於培養學生專業興趣和紮實基礎,促進學生個性特長的發展,也有利於實現較大範圍內的學業質量監測和跨省市招生的高校選拔適合的新生。
從大評價觀出發,對學考選擇性考試結果的大數據深度挖掘,還可進一步為中學、教育管理部門等提供教學評價客觀信息,為教育政策決策提供依據。實現以測評促進學生學習成效的提高,以測評促進教師教學的改進,以測評促進整體教育質量的提升。
學考選擇性考試評價可聚焦於三點:一是評價考試本身質量,特別是通過追蹤學考選擇性考試與高校教育教學的關係,以評價促進考試效度的提高,完善學考選擇性考試;二是對考生進行診斷性評價,為考生學業發展提供指導;三是監測學業質量,關注教學和考試改革進程中的問題,為教育政策決策提供依據。
評價內容可圍繞三個問題進行設計:學生該學什麼(目標問題)?學到什麼(測量評估問題)?該做什麼以促進學生學習(改進問題)?可以借鑑國際知名考試的經驗,深度挖掘數據,拓寬評價與監測的深度和廣度,在不同年份之間進行縱向比較,對學校教學質量進行增值性評價,而不只局限於同一年份之內的橫向排名。如此,也將有利於客觀評價同一地區不同資源配置水平的學校的績效。
此外,在實施學考選擇性考試多次考試的地區,還可以搜集歷時性的考試數據,為考生個人提供能力發展評價報告,為考試機構改進命題提供基於證據的建議,為中學提供教學改進評價報告。需要注意的是,評價不僅僅是為了「達標驗收」或「以評促建」,更重要的在於建立起評價雙方或多方之間平等協商、多方互動的對話平臺,在「大評價觀」的指導下,構建「招—考—教—學」的協調發展機制,促進科學的教育評價體系的構建。
來源:中國教育學刊,作者韓家勳,系教育部考試中心研究員;肖立宏,系北京教育考試院副研究員,首都師範大學博士研究生;黃曉婷,系北京大學中國教育財政科學研究所副研究員,美國加州大學伯克利分校教育學博士。