導語:近日,一位美國家長Simmons發現在自己上七年級的孩子,因一道歷史題得了50分,這意味著他必須把剩下的題目都答對,才能通過。歷史題目是:「君士坦丁堡的地理位置對拜佔庭帝國的力量有何優勢?」孩子的回答基本沒有問題,所以Simmons一開始以為老師批卷子過於嚴苛。可是當發現孩子提交答案不到1秒鐘分數就出來,Simmons這才意識到,孩子作業正在被AI平臺評估,而不是人!
Simmons意識到,AI教育平臺很有可能採取的是根據關鍵詞來評分。於是,Simmons在孩子的作業回答中加入毫無邏輯的「財富、商隊、中國、印度」四個單詞,結果意外發現,這道題得了滿分。
換句話說,只要把所有可能的關鍵詞組合起來,總能蒙對答案!
提供AI評分技術服務的是Edgenuity公司,其公司的官方幫助中心中也明確說明,評分就是按照關鍵詞的百分比進行評分,全部命中就是100分,沒有關鍵詞就是0分。疫情導致很多學校採用Edgenuity提供的遠程教學和考試評估解決方案。
事實上,關於Edgenuity的AI評分機制存在的問題早就有,只是最近才被媒體發現。甚至,在google中搜索Edgenuity,「Can you cheat on Edgenuity?(你能欺騙Edgenuity嗎?) 」一直處於熱搜位置。
足可見,國外的學生對於如何在AI系統中作弊也是情有獨鍾,奇葩的學生到處都有!
如今在線教學平臺的問題越來越明顯,一邊考試,一邊通過手機查答案的情況很普遍。未來,在線教育是必然趨勢,但如何做到更加合理科學的考勤、教學、考核都需要我們進一步研究解決方案。
如今,隨著Edgenuity的問題報導,堪稱「學渣福音」的騙過AI的手段在未來都將被戳破。
畢竟,Edgenuity目前已經擁有超過2萬所學校客戶,還包括全美排名前25的學校中的20個。換句話說,Edgenuity覆蓋了全美最頂尖教育資源的80%,可見其影響範圍之大。而且,Edgenuity在2020年還被評為卓越教學獎、EdTech獎項等。
在國內,AI評估的案例也不少。2017年,阿里巴巴推出了AI批閱中文試卷的系統。2017年,湖北襄陽就在中考評卷中加入了機器評分輔助手段。科大訊飛也一直在致力於AI輔助人工閱卷解決方案。
但是,AI閱卷系統真的靠譜嗎?
從目前來看,似乎找到一些標準關鍵詞,就可以得滿分。也就是說,以後作弊就比之前更容易。而且,機械的評分標準對於一些固定答案來說還行,可是對於一些開放性題目來說,目前還真的很難反映出學生的人文水平。
畢竟,AI還很難理解人類的語言。
未來,AI能否代替人民教師?你怎麼看?
關注靜心科技,一個靜心看待世界的人!