作者:翁馨 發布時間: 2017-09-19 08:01
作者:翁馨 發布時間: 2017-09-19 08:01
提到教育測評,你會想到什麼?是密密麻麻的答題卡?是挑燈夜戰的苦苦準備?還是捲紙上的一個個紅勾叉?其實,隨著科技的進步,測評早就遠遠超出了簡單的「考試」概念。它不僅開始與大數據結合,更開始逐漸從大一統、一刀切的標準化向更尊重個體的個性化轉型。而且,測評也越來越成為對教育進行修正的重要參考,甚至在科技的幫助下,測評可以為教育者提供實時的教學效果反饋,提供跨越不同國家的橫向比較,為個人提供更有時間縱深的綜合動態測評。
從七十年代開始,由一小群來自華盛頓和俄勒岡州的教育研究者組成的NWEA(Northwest Evaluation Association)專注於推動對考核與測驗環節的改革。在他們的努力下,美國的測試系統已經進入了嶄新的信息化、全球化的時代。中美對話與NWEA進行了深入的訪談,以尋求新時代下更創新有效的科學測評之路。
1977年,NWEA剛剛成立的時候,公眾所熟知的教育測評系統還屬於「一刀切」的統一紙質考試。當年,NWEA所希冀的是建立一個鼓勵因材施教的測評系統。在他們設計的考試中,老師會依據學生的學術水平為他們選擇不同難度的試題,每道題的難度都是在和其他題目的對比下設定的——這是美國第一個個人化的測試平臺。據此,NWEA建立了一個可以比較衡量學生成果的「成績等級」。這項測試的強大之處在於,它既可以評估學生相對於同齡人的水平,也可以體現學生自身對於知識的熟練程度。這使得我們對於測評的理解,遠遠超過了「考試」的概念。
NWEA設計的「適應性」個性化試題(圖片來源於網絡)今天,NWEA把考試搬到了網絡平臺上。從二年級到十二年級的學生都會在打開瀏覽器窗口時被分配到一個和他們年級相符的題目,如果他們答題的過程進行得順利,系統就會給他們提供更複雜的試題,如果錯題率較高,考試難度就會相對降低。NWEA的董事會主席、布朗大學教育政策學教授Kenneth Wong博士在接受中美對話採訪時告訴我們,這份測試的目標是讓每個學生達到50%左右的準確度,從而來監測學生在自己學習階段所能自主取得的水平。
MAP:關注到每個學生的個性化考試MAP考試界面(圖片來源於網絡)這份測試的官方名稱叫做MAP(Measures of Academic Progress)。它不僅高效,也非常簡明易懂、利於分析。NWEA研究中心的負責人John Cronin博士對中美對話說,MAP後臺的系統中對每個分數段都有詳盡的解釋,說明在這個水平的學生都理解和消化了哪些知識點,下一步的學習應該如何進行,以及哪些方面還需要提高。MAP的另一個革命性特點是,它可以給教師提供實時性的反饋。藉助網際網路的媒介,教師們在考試後就可以及時收到對學生水平的評估。一年中,這項測試會進行三到四次,所以在每個季度,老師們都有根據測驗結果改進自己教學方法的機會。來自密西西比州的學區副主管Jody Woodrum博士說,MAP告訴教師們應該特別關注哪些落後的孩子,又應該給哪些尖子生創造更多進步的空間。
現在,NWEA已經從創建時的14個學區擴張成了一個全國性的組織,並在全球都有合作夥伴,MAP覆蓋的學生人數也達到了700多萬人。NWEA的獨特性也恰恰在這點體現:它創造了一個國家級的基準組,並提供了將全國任意兩個學生相比較的可能。
使用MAP進行學生進步追蹤及基準比較(圖片來源於網絡)MAP所使用的基準組由一個經過加權的公式計算而出。這個組中的學生的種族及社會和經濟條件的比例都代表了全國人口的分布——這些數據對建立比較教育的研究來說非常重要。Kenneth Wong博士也告訴中美對話,NWEA 正在創建一個大型教育資料庫——這個資料庫將不僅僅包括分數,也會體現學生和學校的社會性組成。
在研究人員的努力工作下,NWEA現在可以把單個學生的表現和基準組相對的百分比呈現出來。比方說,一個考到200分的學生所取得的百分比可能是45%,說明他在基準組中領先了45%的學生,他可以據此來了解自己在同齡人當中的水平。除了常規比較之外,NWEA還可以通過幾個調整來評估學生水平的增長。在增長評估中,NWEA將不再考慮學生的種族背景和經濟水平,而用來比較的兩個因素則是起始分數和教學量。比如再回到那個以45%的成績獲得200分的學生身上,在28個星期的教學後,他和全國的基準組形成了怎樣的比較?如果基準組在這個教學時間內進步了8分,而我們的學生進步了10分,那麼我們可以說他走在了基準組的前面。
NWEA的學生報告樣本(圖片來源於網絡)制定全國性基準組並真正比較學生需要大量的實時數據。NWEA不僅做到了這點,還將會為學生提供一份跟蹤他們至少三到四年的持續進步縱向報告。個體學生比較的方式是根據每所學校用來預估學生成長軌跡的8-9項數據而產生的。但是,NWEA還沒有開始製作預計未來軌跡的建模。在這方面,Cronin博士認為,為低成績的學生預測低增長軌跡可能是無益的。他補充說,NWEA的理念並不是簡單地預測未來的增長——他們希望制定一個可以改變低增長軌跡的課程,而不是固化這種模式。
OECD: 與全球同齡人的同場競技學生們用NWEA設計的系統測試(圖片來源於網絡)在國家一級上,NWEA最近開始與PISA合作,為美國國內的學校提供OECD測試,從而對國際上的學校和學區之間進行比較。OECD的測試方式是從每所學校抽取85名15歲的學生,並提供數學,閱讀和科學的比較考試。在此之前,PISA提供了國家間宏觀教育系統的比較,而NWEA可以把這種對比推進到學校一級。Kenneth Wong博士在採訪中告訴中美對話,每個學校將接受相同的測試,考試將與PISA考試中項目水平的難度相符。接下來,NWEA可以據此為學校生成報告和個體化支持。 「例如,美國Fairfax的一所學校可以參加OECD考試,並可以根據之後生成的報告來判斷學校具體到八年級數學的教學水平是否和在中國上海或芬蘭的學校持平。」在教育數據變得更加全球化的今天,這一測試有助於推動透明化的國際數據共享,並為學校提供了相互學習的機會。
在發表於《教育周刊》的一篇文章中,維吉尼亞州Fairfax縣的前學區主管John Dale和讀者分享了他在學校推行OECD測評的經驗。Dale先生認為,在排名之外,向來自全球各地教育界的同行學習更為重要,而OECD就為他的學區提供了一個這樣的學習機會。作為全美第11大的教育系統,Fairfax縣的學校發現,OECD測評提供的對比可以更好地讓他們認知自己在全球化標準中所處的位置。很多校長表示,他們想了解他們的學生和世界範圍內領先的同齡人們相比之下的水平,從而為學校制定國際化的基準。
NWEA出具的學校報告樣本(圖片來源於網絡)在參加OECD考試之後,所有學校都會收到一份非常詳盡的報告,其中將會包括對測試結果的詳細解釋和每份試卷結尾的學生調查。每份報告將會把單所學校的表現與全球高中的表現進行比較,並強調與該學校相關的分析結果。 例如,在Fairfax縣,這份報告顯示,該地區學校的表現優於芬蘭和韓國,並在科學方面和高排名的國家極為接近,但通過將更多的跨學科學習納入課堂,學校的表現還可以進一步提高。
憂慮:用於教師或適得其反儘管有這些優勢,這兩個測試還是不可避免地招致了一些批評和質疑。除了學生評估之外,MAP評估已被印第安納州的一些學校用作教師評估工具。Cronin博士向我們指出,NWEA不希望看到這種趨勢,因為它可能會損害學生和老師之間的信任——通過使用MAP評估作為問責措施,教師可能會越來越擔心評估結果本身,而不是將其視為提高其教學技能的一種方式。這一發展不僅破壞了評估的原始意圖,而且對學生和教師的成長都有害無益。
無論如何,MAP和OECD測試等評估的出現在當今教育行業的發展中依然有著至關重要的作用。在學習過程的數位化進程中,個性化學習平臺的發展需要與其兼容的評估系統來跟蹤。MAP評估的靈活性可以幫助教師和政策制定者們來高效地收集和查明學生的成績,加強了他們對學生學習過程的了解,並給予了他們可能的幹預和支持方式。與此同時,OECD測試則為學校提供了具有突破性的、將學生的表現與世界各地的其他學校進行比較的機會。
因此,當人們詢問:個性化教育怎麼測評?全球化是否帶來了教育評估方面的進步?我們說,因為NWEA的努力,美國教育行業向著透明化、現代化及國際化的未來跨出了一大步,問題的答案,或許在這裡。
本文轉自微信公眾號「中美對話」,作者翁馨,編輯蒲艾、丁夢琪,芥末堆經授權轉載。
1、本文是
芥末堆網轉載文章,原文:
中美對話;2、芥末堆不接受通過公關費、車馬費等任何形式發布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,並希望被芥末堆報導,請您
填寫信息告訴我們。
推廣: 芥末堆商務合作:010-5726 9867