李金鶴:《基於「百分等級」的分段成績轉換方案》的瑕疵及完善建議

2021-02-19 鶴銜金榜

《基於「百分等級」的分段成績轉換方案》的瑕疵及完善建議

李金鶴

2018年1月24

 

2018年1月18日,北京市教育學會官方微信公眾號《新高考中學業水平考試成績轉換的研究》一文(下稱該文),提出了學業水平考試成績轉換的新方案——基於「百分等級」的分段成績轉換方案(下稱《轉換方案》)

該文對「百分等級」是這樣定義的:「某原始分的百分位等級是指在考生群體中得分低於該原始分的考生人數百分比。例如某原始分對應的百分位等級為85,表示在群體中有85%的考生成績低於該原始分。」

這個定義與我若干年前提出的「位次優勢」思路是一致的(參見李金鶴編著的《高考志願決勝指南》第86頁),只是目的和用途不一樣而已。我提出「位次優勢」的概念,是給考生提供一種較為科學的錄取數據分析方法,而該文提出「百分等級」的定義,是為了有效解決新高考中學業水平成績轉換問題。

如該文所言,《轉換方案》不僅明顯優於滬、浙現行方案,也優於學者們目前提出的其他方案,完全可以在部分省份的新高考中試用。

不過,我認為,《轉換方案》在分段處理方式上還有瑕疵,有必要進一步完善。我說的瑕疵,主要是指對於原始分高於拐點分的考生,直接以百分位等級成績計入高考總分欠妥。

該文《表1.運用新的處理方案對2016年歷史科目考生成績的處理結果》顯示,原始分87分到93分的考生,都將以100分計入高考總分,這顯然不合適。

由於轉換結果是高考投檔、錄取的主要依據,所以評價一個轉換方案是否可行,主要應看其是否公平。從公平的角度考慮,轉換結果至少要達到兩條標準:一是不錯位,即原始分高的考生轉換後位次仍然在前。二是有區別,即原始分不一樣的考生轉化後分數也得有區別,不能相同,尤其是對於高分段考生更應如此(《轉換方案》對於原始分40分以下的考生的處理另當別論,理由該文作者已經說明)。

按照《轉換方案》的處理方式,選考各科前1%的高分考生都將以100分計入高考總分。也就是說,這1%的高分考生,在3科選考科目上將沒有任何區別,毫無區分度,全靠語數外3科來爭高低上下。

假設兩考生3門選考科目的原始分都分別是87分與93分,語數外3科成績完全一樣,那麼他們轉換後的分值也就完全一樣,這對於93分的考生來說,是不是顯失公平(原始分高18分)?如果考生質問我們這樣做的合理性,也很難作出令人信服的解釋。

別看這1%的高分生比例不大,但其競爭卻是非常激烈的——差1分可能就會差出一個院校檔次,更何況差6分!

以北京為例:

2017年文史類考生的前1%約為154人,第154名的高考成績是655分,第1名的成績是690分,有35分的跨度。錄取分與655及其以上分數匹配的院校有4所(清華大學錄取分668、上海交通大學錄取分662、北京大學錄取分660、復旦大學錄取分650)。假設甲、乙兩個考生除歷史成績分別是87分、93分以外,其他各科分數完全一樣,合計都是568分。那麼,若按原始分投檔錄取,甲生655分只能錄取到復旦大學,而乙生661分可以錄取到北京大學。若按《轉換方案》轉換,甲、乙兩生成績相同,錄取院校就不會有這麼大的差別了。

理工類情況與其類似,不再贅述。這種情形會不會因為不分文理發生改變?不會。因為若投檔錄取不分文理,計劃也將合併,就同一個省份而言,1%高分人數與高層次院校計劃之比並沒有變化(前提是計劃調整不大)。

北京尚且如此,其他省份的問題就會更突出。因為北京考生總量相對較少,1%高分群體的絕對量較少,加上高層次院校在北京投放的計劃相對較多,1%高分群體對應的高層次院校的招生計劃也相對較多。所以,對北京1%高分群體來說,分數相差幾分,其錄取院校的層次相差不會太大。而其他省份就大不一樣了,如果相差幾分,錄取結果可能會有天壤之別!

 

我們用山東和北京做個簡單比較,就會發現這個問題非常嚴重。

山東2017年文史類180分以上的考生就有142576人,忽略180分以下考生人數,前1%就有1426人。第1426名的高考成績是603分,第1名的成績是670分,有67分的跨度。錄取分與603及其以上分數匹配的院校有32所。

雖然實際錄取情況比較複雜,但我們還是可以簡單的理解為:北京用4所頂尖院校就可以消化錄取前1%的高分考生,山東則需要32所院校才能消化錄取前1%的高分考生!顯然,這32所院校的層次是有很大差別的,中國農業大學就名列其中。與此形成鮮明對照的是,2017年北京文史類考生617分就可以被中國農業大學錄取。同樣可以簡單理解為:北京用包括中國農業大學在內的27所院校就消化錄取了前6.3%的高分群體,山東用32所院校才能消化錄取前1%的高分考生!有點望塵莫及啊。所以,對前1%高分生來說,尤其是對非京、滬的其他省份前1%高分生來說,每一分都相當重要,每一分都非常有價值,而《轉換方案》卻人為的抹掉了他們3門選考科目本來具有的分數差距和區分度!

 

還需要強調兩個問題:

一是我在分析中提到的前1%考生群體的分數跨度。從數值上來看,前1%考生群體原始分跨度都較大,這實際上就是原始分對前1%高分考生的區分度。如果按照《轉換方案》轉換後,這個群體的分數跨度肯定要減小,也就是區分度要大大降低。

二是前1%高分考生群體的區分度非常有意義,必須引起高度重視,不能人為抹掉。越靠前、越優秀的考生,分數的差距對我們判斷考生的基礎知識紮實度、創新能力、思維能力等都有更大參考價值,這個分數之差可能就客觀的反映了這些考生們的實際能力和綜合素質之別。因此,對高分群體更應該保留差距,作為投檔及院校錄取的參考。

 

綜上所述,該文提出的《轉換方案》是個可行的方案,但還需要充分考慮前1%高分考生群體區分度存在的重要意義,並在轉化結果中有效的體現出來。因此,有必要進行完善。

 

方案完善建議如下:原始分在拐點以上的考生,應以原始分成績為基礎,並約定只有最高分才能賦值100分,其他分值均按比例轉換。

按照該文提供的數據,根據我提出的完善建議,現對拐點以上的轉換情況列於表1。大家看,這個結果是不是比原來更合理一些?至少不會出現一大堆100分,人為抹掉區分度的情況。

轉換公式:

 

新轉化分=拐點分+(原始分-拐點分)×(100-拐點分)/(最高分-拐點分)

 

如此一來,可能有人會問:各段的轉換都不是 「百分等級」分,那這個基於「百分等級」還有何意義?實際上是有意義的。它的意義就在於找到拐點,確定需要進行比例換算的原始分區間。

表1:轉換結果對比

 

原始分

累計比例

百分位等級

原文轉化分

新轉化分

72

68.68

69

72

72

73

71.56

72

73

73

74

74.43

75

75

75

75

77.32

78

78

76

76

80.29

81

81

77

77

82.94

83

83

79

78

85.50

86

86

80

79

87.84

88

88

81

80

90.11

91

91

83

81

92.02

93

93

84

82

93.91

94

94

85

83

95.46

96

96

87

84

96.73

97

97

88

85

97.78

98

98

89

86

98.58

99

99

91

87

99.10

100

100

92

88

99.55

100

100

93

89

99.73

100

100

95

90

99.88

100

100

96

91

99.97

100

100

97

92

99.99

100

100

99

93

100.00

100

100

100

附原文:《新高考中學業水平考試成績轉換的研究》

作者:臧鐵軍 楊君

【晨霧老師轉此文的按語】本文作者之一臧鐵軍是北京教育考試院副院長。本文在這個時候發布,意味著本文提出的基於「百分等級」的分段成績轉換方案很可能成為未來北京市新高考改革將要採用的賦分方案。但是本文沒有通過北京教育考試院官方渠道發布,而是通過北京市教育學會官方微信公眾號以學術探討名義發布,說明此方案雖然已經基本成型,但是還處於探索階段,希望看看社會的反應。

摘要:新一輪高考招生制度改革2018年已在上海、浙江的成功落地實施。上海、浙江的學業水平考試的分數呈現和轉換方式有所不同,而後續改革省市依據各自的特點對分數的呈現和轉換也有不同的設計要求。本文綜合考慮中學教學、考試命題、高校招生以及社會公眾關切等多方面的因素,對新高考中學業水平考試成績的轉換原則進行了論證。文章對浙、滬試點方案以及其他受關注方案的特點及利弊進行了分析,在此基礎上提出了基於「百分等級」的分段成績轉換方案。運用該方案對2016年高考實測數據的分析表明,該方案能夠滿足學生的選科需要,較好處理學科間的難度平衡問題,符合「大平行志願」投檔錄取的招生模式的要求,同時也緩解了學業水平考試分數呈現和轉換的一些潛在矛盾。

一、引言

2014年9月4日,國務院發布《關於深化考試招生制度改革的實施意見》(下文簡稱國務院《實施意見》),提出探索基於統一高考和高中學業水平考試成績、參考綜合素質評價的多元錄取機制,即「兩依據、一參考」的考試錄取機制。《實施意見》指出普通高中學業水平考試(下文簡稱學考)主要檢驗學生學習程度,是學生畢業和升學的重要依據,並確定在上海、浙江先行高考綜合改革試點。兩省市於2014年9月公布了深化高考綜合改革的實施方。2014年12月,教育部發布《關於普通高中學業水平考試的實施意見》(下文簡稱教育部《實施意見》),提出學考成績的呈現和使用原則,計入高校招生錄取總成績的學考3個科目成績以等級呈現,其他科目一般以「合格、不合格」呈現。

學考成績的呈現方式以及在高考錄取中的使用方式是此次高考改革的一個關鍵問題,直接涉及到對於考生的公平性,對於高校招生的選拔性,對於基礎教育的導向性以及對於高考自身的科學性,是本次改革中不可迴避的問題。本文就目前正在實驗的浙、滬方案以及其他可供參考的方案進行了對比研究,並從側重操作性的角度提出了新的學考成績呈現及分數轉化方案,希望能拋磚引玉,引起學界對這一問題的深入研究。

二、問題的提出及解決問題的原則

依據國務院《實施意見》的精神,2016年全國絕大部分省市都公布了高考綜合改革方案。縱觀各省方案,改革的總體框架均已明確,但一些省市公布的方案對學考成績的具體呈現方式和在招生錄取中的使用方式尚未有具體的操作性的表述。2017年有北京、天津等四個省市進入改革試點,2017年9月份入學的新一屆高中生將使用新的課程計劃和新的高考改革方案。因此,深入討論和研究學考成績的呈現和使用方式,對於學考的順利實施和高考改革的推進有著重要的現實意義,是當前改革中教師、學生、家長和社會各方矚目、亟需解決的一個重點問題。

根據國務院及教育部相關文件精神的要求,學考成績呈現及使用方案需考慮以下三個因素及其帶來的相關問題。

1、考生和學校間的雙向選擇及相關問題。即考生根據未來的職業期望和自身特長自主選擇選考科目,高校根據自身辦學定位和專業培養目標提出對考生的學考科目報考要求,此即「雙向選擇」。按照浙、滬方案,考生選考科目只需一門在高校選考科目範圍之內,就可報考該校該專業。因此,招生錄取中報考同一專業的考生的選考科目並不完全相同。

現行高考的「語數外+文(理)綜」的考試招生模式,在錄取中採用原始分相加並按總分錄取的方式,由於同類考生(文科或理科)的考試科目相同,即使有的學科試題偏難或者有的學科偏易,從公平的角度也能得到考生和社會的普遍認可。

採用新方案後,錄取同一專業的考生的考試科目有所不同。由於命題和學科屬性的差異,導致各學科間不僅平均分可能會有所不同,且不同學科的成績分布形態也不相同,因此學科間的成績具有不可比性,不同組合的3個選考科目成績簡單相加,同樣也具有不可比性。如在理科科目(如物理、化學)的考試中,優秀學生可以取得滿分,但從數十年高考的成績來看,優秀的考生在文科科目(如政治、歷史)考試中取得滿分的可能性幾乎為零,而社會公眾又普遍感覺物理、化學要難於政治和歷史學科,這就是所謂的學科屬性差異。因此,簡單的將考試的原始分累加並用於錄取的做法過於粗糙,即使不同科目的平均分相接近,但由於不同學科在高分數段和低分數段分布的明顯差異,也極可能導致公眾對公平性的質疑。

新「雙向選擇」方式帶來了不同科目的成績如何比較,如何相加,如何解釋的問題,這是自恢復高考40年來從未遇到的新問題。

2、等級呈現及相關問題。應當說,學考選考科目成績以百分比例確定等級的呈現方式,是解決上述「雙向選擇」新問題的較為簡潔有效的途徑。

將選考科目的考試成績用於高校招生錄取,主要功能為選拔和區分,即挑選出優秀的考生進入高校學習。挑選的依據通常使用原始分直接比較,除此之外還可以依據考生在群體中的相對位置進行比較。從教育測量統計的角度看,以相對位置賦分進行多學科相加更加合理。

體現相對位置最直接的方法就是按考生成績由高到低設置不同的等級,並事先按照一定規則對各等級賦予相應的考生比例。由此得到的等級可直觀反映出考生在群體中的位置,用於招生錄取,既迴避了原始分直接相加的矛盾,也體現出選考科目的選拔功能,符合教育部《實施意見》中「計入高校招生錄取總成績的學考3個科目成績以等級呈現」的規定。

等級是對考生原始分轉化後的一種表達。等級的劃分有兩種形式,基於標準參照的等級和基於比例設置的等級。學考中非選考科目的考試成績以「合格、不合格」呈現,即屬於基於標準參照的等級,這也是由學業水平考試的標準參照屬性決定的。教育部《實施意見》對選考科目的等級比例進行了大致的規定,即選考科目的成績以等級呈現,一般分為A、B、C、D、E五個等級,各等級比例依次為A等級15%,B等級30%,C等級30%,D、E等級共25%,這屬於基於比例設置的等級。同時,教育部《實施意見》也強調「具體比例由各省(區、市)根據基本教學質量要求和命題情況等確定」,為各省、市的等級方案制定設定出了進一步探索和實踐的空間。

顯然,等級的數量越多,各等級所對應的考生比例越小,對考生的區分也更加細緻。等級數量的增加也對考生的成績分布形態提出了更高的要求,需要在命題中有計劃地調控試題的難度及難度梯度分布。此外,等級方案的制定還應考慮到所在省、市高考招生錄取的實際情況,如報考人數,各錄取批次的錄取考生比例等因素。

需要注意的一點是,選考科目都採用同一等級方案進行成績轉換,其實質是對考生成績分布進行了正態化處理(按照教育部規定的等級比例,處理後的分布形態接近正態),這一操作的前提條件是各選考科目的考生能力水平大體均衡。但在實際選考中,情況會有所不同。另一方面,各科的現行課程標準是按照學生未來發展的需要來設計的學習內容和學業水平,即各學科在課程設計時並未側重於學科難度的一致性。因此,各學科的難度水平本身是不平衡的,這也是考生普遍認為物理學科要難於其他選考科目的原因。由於等級考成績經轉化後計入高考錄取總成績,其高利害性和考生的趨利心理導致考生在選考科目時,並不完全基於學習興趣和個人特長,而是綜合考慮到學科的學習難度。因此,一般情況下,成績較差的考生不想選考物理,也不敢選考物理,而選考物理的考生一般為成績中等偏上且對物理學科有學習興趣的考生,即選考物理的考生群體的學習能力、學業水平分布會趨向於中等到中等偏上的學生。按照百分比例確定等級和轉化分的成績使用方式,會使得中等水平的考生選考物理所獲得的等級較低,導致其轉化分低於原始分,這將直接影響下一屆考生繼續選考物理的意願,由此進入惡性循環,不利於學科教育的發展。

3、新高考招生中「大平行志願」投檔錄取的相關問題。學考等級成績如何滿足大平行志願投檔錄取的要求,這是改革中的又一個關鍵性問題。「大平行志願」投檔錄取按「分數優先,遵循志願」的原則投檔,即把考生的總成績從高到低順序排列,以一分為單位,高分優先投檔,前一分數完成投檔後,下一分數才可開始投檔。大平行志願突出了分數的價值,考生高考成績的每一分都決定考生能否投檔。

按照教育部《實施意見》的等級劃分方案,B、C等級各佔30%的考生,導致一個等級所對應的原始分跨度將超過10分,亦即該等級的高分考生和低分考生的原始分差大於10分。這與「大平行志願」錄取以1分為單位進行投檔在操作方向上多有不同,將會導致考生對從原始分到等級分轉化過程中的分差模糊化的質疑。為緩解這一矛盾,各省在制定等級轉換方案過程中,更多傾向於「多等級、小間隔」的等級轉化計分方案。需要指出的是,即使採用「多等級、小間隔」的等級方案,如浙江的「21級」方案,也不可避免的出現某些等級的原始分跨度超過5分,也未能解決「大平行志願」錄取中以1分為單位進行投檔所帶來的矛盾。

從歷年高考統計數據分析,若兩科目的難度係數相近,因學科不同導致的成績分布差異的影響主要體現在高分段考生上。由於這部分考生受等級方案的影響大,對分數區分效度更加敏感。此外,考慮選考科目的學業水平考試的屬性,考試難度上將會比改革前的高考更容易,導致高分段考生數量增加,減弱對高分段的區分效度。高分段成績的轉換處理是等級方案設定中需要著重考慮的因素。對於低分段考生,錄取院校一般為高職院校,由於目前高職院校和本科院校採取分類錄取,因此等級方案對低分段考生無實質影響。

按照國務院《實施意見》的要求,對學考成績的呈現和使用的研究還必須要考慮到高中教育教學,只有符合教育教學實際的政策方案,才具備實施的基礎。同時方案操作的簡單易行也非常重要。有些方案以科學性為重,雖具備較好的理論依據,但操作繁瑣複雜,尤其是涉及過多的技術性操作,導致社會大眾由不理解到不認可和不接受。如上世紀90年代的標準分轉換實驗,正是由於大眾的不理解、不認可而難以實施。

三、浙、滬方案芻議

按照國務院《實施意見》的要求,浙、滬兩省先行試點各自的實施方案。兩個方案中語、數、外三科必考科目的計分方式相同,均採用原始分計入高考總分,選考科目的考試成績呈現方式也大體相似,都是循著「原始分數—百分比例—等級—轉化分數」的路徑。不同之處在於等級數量及對應的考生比例有所區別,計入高考成績的轉化分值區間也有所不同。上海方案的轉化分區間為30分,浙江方案的轉化分區間為60分。

對比浙、滬等級方案可看出,滬版的「11級方案」更加簡潔,也便於操作,浙版的「21級方案」,因其等級較多,對考生的區分較滬版更加細緻。不論「11級方案」還是「21級方案」,都會出現「中間等級對應原始分區間較小、兩端等級對應原始分區間較大」的現象,這是由原始分的分布形態所決定的。所以,原始分的計分單位在轉換過程中,有的區間被放大,有的區間被壓縮。由於滬版方案的中間9個等級考生比例相同,相比浙版方案,等級轉化更容易造成轉化分與原始分的分布形態差異,並增加三科選考科目的轉化分總成績與原始分總成績的排序錯位率。當然可以認為等級轉換帶有公平意義的設計或教育測量學意義的矯正,但這需要進一步的論證和更加充分的理論支撐。

總的來看,浙、滬方案符合國務院及教育部《實施意見》的文件精神,同時也有結合地方實際的大膽創新和嘗試。首先,通過百分比例設定等級的做法在一定程度上迴避了不同科目試卷間無法等值的問題,其次將等級轉換為分數計入高考錄取總分的做法,巧妙解決了高考科目的原始分與選考科目的等級兩類成績混合使用的問題,迴避了招生錄取操作中大平行志願投檔的難點,有利於招生錄取工作的平穩過渡和順利實施。

四、對於其他方案的分析和討論

浙、滬方案公布後,也相繼有其他一些學考成績呈現和使用的方案提出,在這裡分別分析論述如下:

1、標準分轉換方案。標準分數是將考生原始分數與其所在考生群體的平均分數之差除以該群體分數的標準差所得的商數。它以標準差為單位表示原始分數在群體中所處的位置,即反應考生的原始分數在平均分數之上多少個標準差,或是在平均分數之下多少個標準差。相比於原始分,標準分有諸多優點,如能客觀地反映考生在群體中的相對位置,修正了原始分數在人們頭腦中「高」「低」的絕對性,還原考試成績信息應有的參考性;提高了不同科目的成績的可比性和可加和性等。依據本次高考改革的框架設計要求,僅將單科成績轉化為標準分並無實際意義,必須將學業水平考試的選考3科目和統一考試的語文、數學、英語3科都轉換為標準分,然後將6科標準分相加後取總分。但由於轉換前後兩種分數的評價體系不同,會造成標準分排序與原始分排序的部分錯位。

標準分轉換方案是各省在這次高考改革的論證過程中幾乎都討論過的方案之一,教育行政部門對這一方案也有較高的認可度。理論上,使用標準分更具科學性,但由於高考的高利害性及標準分轉化的複雜性,從上世紀90年代推行標準分實驗來看,標準分轉化易帶來社會公眾的不理解,導致分數使用及相關政策難於實施。

2、權重係數方案。該方案對學考中的選考科目成績進行加權處理後加和計算總分。例如將三個選考科目的成績由高到低排序後分別按照120%、100%、80%的係數折算,以此為實際分數進行總分加和。即三科折算後實際滿分分別為120分、100分和80分。這一方案中,選考科目與權重係數並不一一對應,而是由成績的高低排序決定。選擇同樣科目的兩個考生,由於科目成績排序不同,同一科目對應的權重係數也並不相同。這是一個有利於發揮考生的特長,「揚長避短」的方案,引導考生在感興趣的優勢學科的學習中打下堅實的基礎,給考生提供個性發展的空間,符合教育部《實施意見》中「考生依據自身特長自主選擇選考科目」的文件精神。其次,這一方案中儘管各權重係數對應科目不同,但加權的原則是相同的,因此可以向考生公布原始分。再次,由於打亂了科目排序,這一方案在一定程度上淡化了不同選考科目難度的均衡問題。

該方案不足之處在於,首先,高校雖然可以依據專業培養需要確定選考科目,但被錄取考生的選考科目的成績排序與高校的理想排序多半會有不同,弱化了高校的選擇性。其次,再度降低了考試成績對考生性向的解釋力,也降低了分數的區分效能。再次,如何科學確定權重係數,以及折算對考生成績分布形態及排序的改變和作用方向需要深入研究和科學論證。

也有考慮高校依據專業培養目標提出固定學考科目加權的方案,但這一方案的組合操作更為複雜,更難於把控。儘管如此,由高校提出科目加權不啻為一個符合高考規律的改革方向,在今後的高考改革中值得重視和加強。

3、「高考總分+選考等級」方案。該方案以學考中的選考科目的等級作為學校和專業的錄取門檻,以高考科目語文、數學、外語總成績排序進行錄取。選考科目可由高校依據辦學定位和專業培養目標確定,並對選考科目的成績提出等級要求;考生根據自身的優勢和學習願望選擇選考科目。這一方案的優點是體現了高考和學考這兩種不同性質考試的區別,在成績使用上各司其職,在錄取中發揮不同的功能。但在錄取操作過程中,還存在以下兩個問題:①由於用學考科目的等級作為錄取門檻,必將出現選考科目的「一票否決」現象(尤其是二本高校的錄取),即可能出現考生高考統考3科總分高於錄取分數線,但由於某一門選考科目成績未達到等級要求而未能錄取。統考3科總分相加尚且有所互補,而學業水平考試中,因一個等級之差(有可能僅一分之差)導致「一票否決」,此種情況容易造成考生及家長對政策的不理解,在理論上也難以解釋。②學考科目等級要求難以把握。若高校選考科目等級要求過高,則導致錄取的門檻過高,高考統考高分未錄取的可能性加大,一些專業有可能生源不足;若選考科目等級要求過低,則導致滿足等級要求的考生比例過高,語文、數學、外語3科成績將在錄取中起決定作用,不利於高校依據專業特點進行個性化優選錄取,同時對引導中學教學培養學生全面發展具有非常不利的影響。

五、基於「百分位等級」的分段成績轉換方案

根據國務院《實施意見》對本次高考改革頂層設計的要求,綜合對前述各方案優勢和缺陷的分析,筆者研究設計了基於「百分位等級」的分段成績轉換方案。本方案在很大程度上吸收了浙滬方案、標準分轉化等方案的優點,同時也在很大程度上規避了這些方案的不足。採用前幾年的高考數據對方案進行模擬檢驗,表明本方案在數據轉換中無奇異點,在分布形態上基本可以平滑對接。需要特別說明的是,如果從等級轉換的角度看,顯然本方案採用的百分位等級數量多、等級密度大。但許多地方都在論證中將標準分方案作為重點討論的方案之一,只是由於複雜的轉換計算不易被社會認可而猶豫。如果標準分的等級密度可以為教育行政部門所接受,那麼基於「百分位等級」的分段成績轉換方案的等級密度只能小於或等於標準分,因此完全可以作為一種成績轉換方案在新高考中使用。

1、百分位等級

某原始分的百分位等級是指在考生群體中得分低於該原始分的考生人數百分比。例如某原始分對應的百分位等級為85,表示在群體中有85%的考生成績低於該原始分。換句話說,百分位等級指的是考生在群體中所處的位置,百分位等級越低,個體所處的位置越靠後。

實質上,百分位等級是將全體考生成績排序後等比例的分成100個等級,並對各等級按照1-100賦分。同標準分一樣,百分位等級賦分也具有能淡化原始分數的絕對性,可以客觀地反映考生在群體中的相對位置,還原考試成績參考性以及可使不同科目考試成績具有可比性和可加和性等優點。此外,百分位等級賦分操作簡單易懂,易於計算,也容易解釋。因此,相比標準分方案,百分位等級方案更易於被社會接受和認可,更重要的是,採用百分位等級,對於高分段考生可以同時向社會公布考試的原始分而不帶來大的負面矛盾。

2、百分位等級成績與原始分成績的分布分析

為了說明百分位等級成績的分布特點,下面以2016年某地高考歷史科成績(由文綜試卷分解出)為例,對考生成績進行百分位等級轉換,結果如圖1所示。

圖1. 2016某地高考歷史學科原始分與百分位等級對比圖

(此圖也由晨霧老師在網上尋得)

結合圖1可以看出,與原始分成績相比,在考生的成績分布上,百分位等級具有以下兩個方面的特點。

(1)原始成績經百分位等級轉換後,所有科目的考生成績分布均覆蓋1-100分的完整區間。一方面,通過填滿分數區間,可以增加高分成績的區分效度,尤其是文科如歷史、政治等多年高考都無滿分答卷的學科;另一方面,更為重要的是,通過對百分位等級轉化,調整了學科間難度的平衡,很大程度上弱化了不同選考科目的成績等值性問題。以上兩個方面的優點是無法通過命題及難度調控來解決的。

(2)如圖1所示,對考生成績進行百分位等級轉化後,一定存在一個原始分曲線與百分位等級曲線相交的點,可稱其為拐點,這一點的分數稱為拐點分(由於百分位等級的不連續性,實際轉換中,拐點分可能位於兩相鄰原始分之間,如表1所示)。原始分低於拐點分,轉化後百分位等級低於相應的原始分;原始分高於拐點分,則轉化後的百分位等級高於相應的原始分,圖1直觀地表述了這一特性。對此舉例說明如下:若拐點分為72分,則表明73分及以上的考生佔總考生人數的28%,因此原始成績為72分的考生,其原始分和百分位等級均為72。原始成績高於72的考生,其百分位等級高於原始成績;原始成績低於72的考生,其原始成績高於百分位等級。需要注意的是,在一般的考試中,除有意空答,一般規範答題的考生均能獲得十幾分至幾十分的成績,對於這部分考生的成績採用百分位等級轉換後,其百分位等級可能僅為個位數。因此,對於成績遠低於拐點分的考生,採用百分位等級會帶來很大的分數落差。

3、基於「百分位等級」的分段處理方案

通過上述分析可知,原始分位於拐點分以下,其百分位等級低於原始分;若原始分位於拐點分以上,其百分位等級高於原始分。若直接採用百分位等級計入高考錄取總分,對原始分遠低於拐點分的考生,其計入高考總分的成績低於其原始分且落差值過大,可能30多分的原始分成績經轉化後的百分位等級為個位數。因此必然帶來考生心理上的不平衡。為此,有必要對百分位等級進行分段處理,具體操作如下:

(1)通過「百分位等級」轉換確定原始分對應的百分位等級,並確定拐點分值。

(2)對於原始分高於拐點分的考生,以百分位等級成績計入高考總分。

(3)對於原始分成績低於拐點分的考生,採取如下分段處理:①借鑑浙滬方案,對學考合格的考生以40分為計分起點,即原始分成績低於40分的考生,只要學考中的合格性考試取得「合格」等級,計入高考成績的分值為40分;②原始成績位於40和拐點分之間的考生以原始分成績計入高考總分。

4、分段處理方案的特點

仍以2016年某地高考歷史科成績為例,採用上述分段處理方案,處理結果如表1。

表1.運用新的處理方案對2016年歷史科目考生成績的處理結果

結合表1和圖1,可以看出,基於「百分位等級」的分段處理方案有如下優點:

(1)該方案有利於高考統考成績與學考成績轉化後進行加和,並適用於大平行志願的投檔錄取方式。雖然對於不同分數段採取分段處理,但各段結合點附近的考生成績是平滑對接的。

(2)對於成績高於拐點分的考生,由於百分位等級高於原始分,一方面有利於凸顯考生的優勢科目,鼓勵並引導考生依據自身特長選擇選考科目,符合本輪考試改革的制度設計初衷;另一方面也避免了因學科差異導致的高分段考生的成績分布差異,在一定意義上平衡了考生所感覺到的學科難度差異和學科間的試卷難度差異,同時擴大了高分段考生的分數使用區間,對高分段的考生區分更加細緻和科學。更重要的一點是,該方案更符合「大平行志願」投檔錄取的招生模式的要求,使高分段考生的每一分都能在投檔錄取中發揮作用,符合社會公眾對錄取中分數使用的期望。

(3)對於原始成績位於40分和拐點分之間的考生,由於百分位等級低於原始分,故採用原始分而不是百分位等級計入高考總分。可以避免採用百分位等級造成考生成績縮水,導致考生心理上的不平衡。此外通過對歷年高考實測數據分析可知,若難度相近,則各科成績分布形態的差異主要體現在高分段,且各科成績分布圖的峰值與拐點分基本重合,在40分與拐點分之間的考生成績分布形態也非常相近,因此,在此分數段上各科採用原始分相加具備理論上的可行性。對於原始成績低於40分的考生,以40分計入高考總分,在此取用了浙滬方案對學考合格性考試的計分方式。考慮選考科目的學業水平考試屬性,考試難度會低於現行高考,因此,選考科目成績低於40分的考生所佔比例很小,同時考慮到當前高考競爭主要在高分段,而對低分段考生的區分要求不高的特點,可以滿足高職院校分類錄取的要求,符合現階段高校招生錄取的實際情況,符合學業水平考試的制度設計。

(4)本方案中分段處理和轉換學考成績,採用了放大或保持考生特長的價值取向,因此,轉換成績和學考原始成績可並行公布,能夠解決和滿足考生查卷面分和查每道試題得分的要求,緩解考生要求查詢自己的分數信息與分數解釋的矛盾。

(5)運用本方案處理和轉換學考成績後,可以較合理地調整和改善各學科的成績分布形態,使各學科的成績分布形態趨於相同。尤其是當各學科平均分比較接近時,經本方案處理和轉換後,其成績的分布形態更加接近,由此構成了不同學科的成績相加的科學性基礎。

(6)運用本方案還可適當解決選考物理考生的結構失衡問題。假如出現中、低能力水平的考生不選,而能力水平較高的考生集中選考物理的情況,相應的拐點分數將會隨高分段成績集中的分布形態而向上提升。由於拐點以下的考生是按原始分計入錄取總成績,對於能力處於中上水平的考生,只要其物理卷面分高,其計入總成績的分數相應也高,不會出現轉化分低於卷面成績的現象,在成績轉化中並不吃虧。因此,即使是中低能力水平的學生,只要物理有個體的相對優勢,也不會在成績轉換中吃虧,此方案使得選考物理以及選考各學科的成績轉換很少受到考生群體差異的影響,考生就敢於選考物理,選考物理的考生的群體分布也就趨於平衡了。

五、結論

新高考改革中學考成績的呈現和使用關乎考生的切身利益,也與高校招生工作息息相關,備受關注。方案的制定應綜合考慮並權衡考生、中學教學、高校等各方利益,兼顧錄取中成績使用的公平以及各層次高校招生的效率。新一輪高考改革提出了新的問題,而在學業水平考試成績轉換並與高考統考成績合併使用上,目前似乎很難找到令各方廣泛認可的萬全方案。綜合考慮,本文提出的基於「百分位等級」的分段處理方案是一個相對較優的方案,既參考了教育測量理論上的科學性要求,也具備實施操作上的簡單可行性,更重要的是,由於轉換後的分數使用方式是就高不就低,方案原理簡單易懂,更容易為社會大眾所接受和理解,也能降低向社會公眾公布原始分的潛在風險。

考試招生制度改革是一個艱巨複雜的過程,不可能一蹴而就,更不可能一勞永逸。改革的推進需要勇於探索,逐步完善。相信隨著改革的深入,將在不斷發現問題、解決問題的過程中建立起新的考試招生制度。

參考文獻:

[1]國務院. 國務院關於深化考試招生制度改革的實施意見[EB/OL]. [2014- 09- 04].http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_1778/201409/174543.html.

[1]上海市人民政府. 上海市深化高等學校考試招生綜合改革實施方案[EB/OL].[2014-09-19].http://gaokao.eol.cn/zui_xin_dong_tai_2939/20140919/t20140919_1177783.shtml.

[1]浙江省人民政府. 浙江省深化高校考試招生制度綜合改革試點方案[EB/OL].[2014-09-19].http://gaokao.eol.cn/zj_5663/20140919/t20140919_1177705_1.shtml.

[1]教育部.教育部關於普通高中學考的實施意見[EB/OL]. [2014-12-10]. http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s4559/201412/181664.html

信息來源:2018-01-18 北京市教育學會 微信公眾號

ID:gh_e8d7969de470

尊重科學       重視數據

適應需求       圓夢金榜

相關焦點

  • 第70期:基於成長百分等級模型開展增值評價的實證研究
    建議在增值評價中關注能夠反映學生進步程度的成長百分等級模型,結合其他指標對學校效能進行綜合評價,以更好地促進區域教育公平、優質、均衡發展。關鍵詞:學業評價;增值評價;教育評價;成長百分等級模型學生成長百分等級模型通過整合學生多次測驗數據,計算每個學生在學業夥伴中相對位置的變化,以此來衡量學生的進步程度。與基於單次測驗計算的百分位數不同,學生成長百分等級是在前期學業水平條件下計算的百分位數。
  • 新高考中學業水平考試成績轉換的研究
    本文在這個時候發布,意味著本文提出的基於「百分等級」的分段成績轉換方案很可能成為未來北京市新高考改革將要採用的賦分方案。但是本文沒有通過北京教育考試院官方渠道發布,而是通過北京市教育學會官方微信公眾號以學術探討名義發布,說明此方案雖然已經基本成型,但是還處於探索階段,希望看看社會的反應。
  • 用於成長評估的學生成長百分等級模型:來自美國的經驗
    Betebenner開發了基於R語言的SGP數據處理軟體——Quantile,藉助Quantile軟體,研究者可以很方便地計算出用於成長評估的SGP值。目前,NCIEA向採用SGP模型的美國各州提供便於根據自身需要進行完善的開源(open-source)SGP計算軟體包。[5]SGP模型最初被應用於科羅拉多州,因此也常常被稱為「科羅拉多模型」。
  • 海南省教育廳關於印發《海南省普通高考標準分轉換實施辦法》的通知
    、公平公正,根據《海南省人民政府關於印發海南省深化高等學校考試招生綜合改革試點方案的通知》(瓊府〔2018〕25號)精神,我廳組織專家對我省原標準分轉換辦法進行了研究、優化和修訂,現將修訂後的《海南省普通高考標準分轉換實施辦法》印發給你們,請遵照執行,並積極做好宣傳解讀工作。
  • 第891期:用於成長評估的學生成長百分等級模型
    學生成長百分等級模型可以不依賴縱向量表進行成長評估,不包含線性假設和方差齊性假設,具有較大的靈活性,已經成為美國使用最為廣泛的一種成長評估種模型。藉助現代信息技術,依託大型的學生資料庫,多維的、動態的成長評估可以向家長、教師、學校和教育行政管理機構提供更加豐富的反饋信息,對學生的學習和教師教學的改進提出更具體、更有針對性的建議。
  • 海南優化高考標準分轉換辦法 附新版對照表
    新標準分綜合分的分數轉換區間與原標準分一樣,仍為[100,900]。二是百分等級的計算方面,通過優化,確保了每個學科無論選科人數多少,單科最高分的標準分都能達到滿分300分,綜合分最高分的標準分都能達到滿分900分。省教育廳負責人表示,我省自1988年以來,一直使用標準分呈現高考成績,依據標準分錄取得到社會的廣泛認同。
  • 李金鶴:全新志願填報工具,助力北京新高考模擬志願填報
    三、求學寶的解決方案1.關於往年文理錄取數據的處理我們首先要知道,考生在各分段的實際分布是不均勻的,文理考生在各分段的分布是有差異的,取消文理後與以往分文理考生在各分段的分布是有變化的。所以,任何按照某個或某幾個固定係數對往年文理數據進行簡單合併轉換的方法,都是不符合考生在各分段的實際分布規律的,因而都是不科學的。全國資深升學指導專家李金鶴老師總結的「分段比例映射法」,完美解決了往年文理數據合併處理難題。
  • 【李金鶴說志願】家長的過度焦慮,害莫大焉!
    【李金鶴服務項目:1.生涯規劃「1對1」服務2.選科指導「1對1」服務3.志願填報「1對1」服務【「高考志願體驗卡」免費送,關注本號並轉發本文後私信索贈】「高考志願體驗卡」按照李金鶴總結的「分段比例映射法」(山東、浙江等新高考省份)、「位次優勢法」(老高考省份)對往年錄取數據進行了可比性綜合處理,只需輸入分數、選科組合(新高考),即可按「衝、穩、保」三個層次智能匹配院校及專業(數量同官方志願草案),並可隨意調整更換。
  • 【李金鶴說志願】做到這「四點」,志願填報準備工作何愁不到位!
    對於完全沒有時間的家長,建議遵循「專業的事交給專業的人做」的原則,趁早選擇一個「1對1」服務老師。須知,志願填報在某種程度上可能會影響孩子一生的發展軌跡,輕率不得,馬虎不得。但有一點請千萬注意,目前的志願填報市場比較雜亂,選擇老師一定要慎重,應好好考察一下這個老師的行業背景,從業時間,在這個領域有過什麼著述或創見等。
  • 新能源汽車領域,開始關注細微瑕疵檢測_易車網
    通過比較周圍4個分割(而不僅是相鄰2個分割)的濃度,可以檢測出微小的濃度變化(瑕疵)。1.3瑕疵模式的原理總結瑕疵模式,是藉助「段」這種由幾個像素組成的小單位,與周圍進行分段比較,將濃度變化點檢測為瑕疵或汙點的模式。
  • 高考升學指導專家——李金鶴簡介
    2006高考錄取分數線研究報告》之高考升學指導專家——李金鶴簡介  李金鶴,土家族,湖北省長陽縣人,現居遼寧省錦州市。  2005年4月23日(世界圖書日)下午,李金鶴應騰訊教育頻道及北京天利考試信息網之邀,在北京王府井圖書大廈舉辦圖文直播式「2005高考志願填報公益大講座」,受到了現場考生、家長以及廣大網友的高度評價,成為王府井圖書大廈當日6場講座中人氣最旺、效果最佳、媒體評價最高的講座(參見「中國圖書商報社網」《 現場目擊「促銷大戰」8小時》一文),《錦州晚報》以《我市高考升學指導專家李金鶴享譽京城
  • 北京新高考選考成績或採用「百分位等級」賦分?
    北京高考專家晨霧分析,文章通過北京市教育學會官方微信公眾號以學術探討名義發布,說明此方案已基本成型,文中提出的基於「百分位等級」的分段成績轉換方案很可能成為未來北京新高考改革選考科目將要採用的賦分方案。全文轉載此文,以供參考。
  • 【李金鶴說志願】對考生家長來說,「居家隔離」焉知非福!
    幾個月轉眼即逝,強烈建議家長們要利用一切可利用的時間,提前將志願填報的準備工作做到位。志願填報準備工作究竟包含哪些內容?做到什麼程度才算到位?怎麼做才更科學高效?本學堂將陸續為大家梳理。【「高考志願體驗卡」免費送,關注本號並轉發本文後私信索贈】「高考志願體驗卡」按照李金鶴總結的「分段比例映射法」(山東、浙江等新高考省份)、「位次優勢法」(老高考省份)對往年錄取數據進行了可比性綜合處理,只需輸入分數、選科組合(新高考),即可按「衝、穩、保」三個層次智能匹配院校及專業(數量同官方志願草案),並可隨意調整更換。
  • APMS成績分析指標詳解
    13、最高分差距最高分差距 = 學生成績 - 最高分表示該學生所得的分數與團體最高分的差值,差距值的絕對值數值代表與最高分偏離的程度。此指標能直觀地反映出某學生的成績跟整體學生中最高分成績的差距。 14、成績段分布科目成績段分布:對單科成績進行分段統計(具體分段由用戶設定)。
  • 山東2020年「新高考」方案公布 實行等級分數轉換
    山東省教育廳16日舉行2020年「新高考」實施方案新聞通氣會,通報山東省明年普通高考和錄取工作實施方案。與改革前相比,山東「新高考」在考試科目和時間、成績構成和分數轉換、劃線和錄取辦法、志願設置和填報等4個方面有改革變化。
  • 【李金鶴說選科】新高考「6選3」,其實只有5類組合!
    一般性的建議是,應從生涯規劃的角度認真思考將來準備從事的職業以及大學擬學的專業方向,再以此為基礎進行綜合考量。【李金鶴「1對1」服務】面向全國提供服務,有需求者可私信聯繫(服務費用稍高於市場價,非誠勿擾),服務項目:1.生涯規劃「1對1」服務2.選科指導「1對1」服務3.志願填報「1對1」服務
  • 管理心理學筆記之統計(3)百分位數,百分等級與內插法
    例如你在某次考試中的成績為X=65,65這個數字本身並不能提供更多的信息讓你知道這個分數是好是壞。你需要更多的信息,比如平均分數或者分數高於你的人數來評價你的成績。這就涉及到頻數分布的另一個用途,它可以用來描述整組數據中的個體位置。
  • 也談海南新高考的標準分轉換及計算方式
    中,筆者指出了賦分制帶來的缺陷和困境,其中提及海南省採取的標準分轉換方法。 4月8日,海南省考試局發布文件,進一步優化了今年第一次實施的新高考標準分轉換辦法。 保留海南標準分轉換試驗 自1988年以來,海南省一直使用標準分呈現高考成績。
  • 四川省2021年美術聯考成績分段表可視化數據分析
    本文數據來源於四川省教育考試院,為了更淺顯地表達數據背後的信息,筆者將其轉換為圖表的形式供廣大藝考生和家長參考。(各數據圖製作工具:Microsoft Office)(圖2)1.2021年聯考成績250-280以上分段考生數高於2020與2019年。