近日,由北京師範大學等機構聯合主辦的「2020全球人工智慧與教育大數據大會」在京舉行。本屆大會經教育部批准,以「教育未來,因A.I.而能」為主題,邀請全球頂尖人工智慧科學家、大數據挖掘專家、教育監測專家及教育科技產業界優秀人才共同參與。多鄰國-測評研究負責人、計算心理測量學(computational psychometrics)專家Alina Von Davier博士受邀參加大會,並在「智能化教學設計:聚焦教學設計 A.I.助力技術提升」線上分論壇發表了題為《在計算心理測量框架下,由數據優先評估的測試分數的可比性》演講,從題目設計、評估模式和技術優勢多個維度對多鄰國英語測試進行了詳細闡述,驗證了多鄰國英語測試的科學有效性。
突破傳統測試開發瓶頸,一小時內完成權威英語水平鑑定
傳統語言測試的題目開發往往始於專業書面測試題目的開發,通過數千名學生參與測試獲取有關題目難度和考生答題表現的數據,並針對這些數據進行心理測量分析,最終依據分析結果建立題庫,整個流程非常耗時且昂貴。而多鄰國英語測試則突破了傳統英語評估模式的束縛,為全球考生帶來了便捷、高效、經濟的全新考試體驗。Alina指出,與傳統語言測試不同,多鄰國英語測試的考題開發不依賴於測試對象的答題表現進行試題評估,而是藉助先進的機器學習和自然語言處理技術構建測試開發模型,不僅解決了傳統人工試題開發耗時耗力的問題,還能夠幫助專家們重新思考和制定測試標準和考題內容,打造出反映考生真實英語水平的專業測試。
由於採用先進的人工智慧技術,多鄰國英語測試系統的算法在可在考生考試過程中根據其答題情況實時判斷其對應的語言水平能力,並為之匹配難度適中的測試問題,從而使測試更加高效。因此,相較於線下花費3-4小時完成難度遞增的傳統留學英語考試,考生可隨時隨地通過裝有攝像設備的電腦和穩定的網絡連接參與線上測評,並在一小時內對聽、說、讀、寫等能力進行全面考察,48小時內得到認證成績,大幅度提升考生海外院校申請效率。
人工智慧技術結合心理測量,海量語料構建自適應考試題庫
依託於先進的計算心理測量框架,多鄰國英語測試打破了人工開發題目的模式,讓專家們能夠藉助機器學習和自然語言處理技術的幫助,繞過傳統考試中繁冗的前測步驟,從而進一步優化測試。以歐洲共同語言參考標準 (CEFR) 及詞彙表為標準,多鄰國英語測試根據不同單詞出現的語境、難度分級等對大規模語料庫進行標註,並採用統計方法預估未來將要生成的題目難度。在人工智慧技術和自然語言處理技術的共同作用下,一個擁有海量考題、對接權威標準的計算機自適應考試題庫便得以成形。實驗發現,考生平均需參加約1000次考試才可能遇到重複題目,測試結果真實可靠。
除了在設計機制上不同於傳統考試,多鄰國英語測試也實現了多樣化的內容設置。專業英語學習網站、高級英語備考資料和大型英語資料庫都為多鄰國英語測試提供了可靠的語料來源,不僅囊括學術用語,也包含日常生活中的真實對話。考試內容主題涉獵廣泛,從音樂到科技,很大程度上抵消了考生參加考試的焦慮和緊張,讓他們能夠更加從容應對。
開發框架實效性對標傳統測試,獲全球逾2500所高校認可
研究發現,多鄰國英語測試與語言學家開發的傳統語言測試成果具有顯著的一致性。根據人工智慧和自然語言處理領域的頂級期刊——美國麻省理工學院計算語言學協會學報(Transactions of the Association for Computational Linguistics)中的論文顯示,多鄰國英語測試與託福和雅思等英語評估測試呈現強烈相關性,這意味著三者在分數上能夠相互換算,進一步確保了多鄰國英語測試結果的可靠性。另外,多鄰國英語測試的結果也具有高度的可靠性和穩定性,不會因為考試次數增加或考試題目的不同,而產生不合理的分數浮動。
基於領先的人工智慧技術和完備的課程設計,多鄰國英語測試目前已經獲得全球範圍內2500多所高校認可,包括哥倫比亞大學、耶魯大學、南加州大學、帝國理工學院、倫敦大學學院、澳洲國立大學、新南威爾斯大學和麥吉爾大學等世界頂尖學府。
Alina表示:「未來我們將不斷優化測試體驗,全面考量影響考生測試表現的各種因素,同時繼續打磨核心技術,以更加嚴謹的態度評估試題開發框架和機器學習模型,為全球考生提供更加高效和便捷的測試體驗。」
未經允許不得轉載:DOIT » 人工智慧驅動線上語言測試開發,多鄰國英語測試引領行業新趨勢