雷鋒網 AI 科技評論按:由CCF 主辦的CNCC 2019 於10月17日—10月19 日在蘇州金雞湖會議中心舉辦。本屆大會以「智能+引領社會發展」為主題,有1000多家機構代表,8000餘人參會。在17日下午舉辦的「人工智慧賦能未來教育」論壇上,哈工大人工智慧研究院副院長、哈工大社會計算與信息檢索研究中心(HIT-SCIR)主任劉挺教授做了題為《智能教育的理念變革與技術落地》的報告,展望智能時代下的未來教育。AI科技評論在徵得劉挺教授的同意下,回顧和整理了本次報告的精彩內容。
劉挺教授作為教育部人工智慧科技創新專家組成員、教育部電子信息類、計算機類兩個教指委的人工智慧專家,對傳統教育所面臨的困境及智能教育所帶來的革命做了深入的探究。在報告中,劉挺教授根據自己的研究經歷介紹了大量NLP技術在智能教育中的落地應用案例,並對智能教育的未來做了具有指導性的展望。
劉挺,哈爾濱工業大學長聘教授,哈工大人工智慧研究院副院長,人工智慧專業負責人,計算機學院社會計算與信息檢索研究中心主任。國家「萬人計劃」科技創新領軍人才,教育部新世紀優秀人才,教育部人工智慧科技創新專家組成員,教育部高校電子信息類專業教指委人工智慧專業建設諮詢委員會成員、計算機類專業教指委人工智慧專家。黑龍江省中文信息處理重點實驗室主任,黑龍江省「人工智慧」頭雁團隊帶頭人。多次擔任國家863重點項目總體組專家、國家自然科學基金委會評專家。中國計算機學會理事,中國中文信息學會常務理事、社會媒體處理專委會(SMP)主任,曾任國際頂級會議ACL、EMNLP領域主席。主要研究方向為人工智慧、自然語言處理、智能教育和社會計算,是國家973課題、國家自然科學基金重點項目負責人。2012-2018年在自然語言處理領域頂級會議發表的論文數量列世界第6位。主持研製「語言技術平臺LTP」、「大詞林」等科研成果被業界廣泛使用。曾獲國家科技進步二等獎、省科技進步一等獎、錢偉長中文信息處理科學技術一等獎等。
以下為雷鋒網AI科技評論根據報告內容整理而成——
(演講正文)
今天的報告主要是向大家匯報一下我最近對教育的觀察和思考,因為一年前教育部成立一個人工智慧專家組,我也是其中的一個成員,所以覺得我自己有義務和責任去觀察和思考人工智慧與教育的關係。
我報告的題目是《智能教育:理念變革與技術落地》,主要分為四個方面:傳統教育的困局;智能教育的革命;人工智慧技術在教育領域的應用案例;以及智能教育的未來。
一、傳統教育的困局
在考慮人工智慧與教育時,我們不能脫離教育的本質,因此我們需要去思考「到底什麼是教育?」這個問題。德國著名哲學家雅思貝爾斯在他的著作《什麼是教育》中曾提出:
「所謂教育,不過是人對人的主體間靈肉交流活動,包括知識內容的傳授、聲明內涵的領悟、意志行為的規範、並通過文化傳遞功能,將文化遺產教給年輕一代,使他們自由地生成,並啟迪其自由天性。」
我們把這段話拆解來看,其實教育主要有三個方面:
價值塑造:讓人成為人。受教育的人和沒有受教育的人本質的區別是教育能陶冶人的情操,使人更加富有理性,獲得更加全面的發展,人能更容易在以後的發展道路上獲得幸福。能力培養:獲得學習能力,以及生存技能,包括技術能力、社交能力。在所有的能力中,學習能力又是第一位的。知識傳授:已有知識的傳承。從這個角度,我們來看當前中國教育,其實面臨著很多的問題。
從教育的過程來看。首先,由於學生數量很多,教師很少,因此不可避免地會忽視學生的個性,做不到因材施教。其次,教師個人的經驗難以充分的展示。我們使用的教材都是經過教育部嚴格審定的,教師想要充分的展開自己對課程的獨特見解並不容易,或者根本不可能。無論是從經濟角度還是時間角度來看學習成本都非常高,而另一方面學習效率卻非常低,學生們非常辛苦,經常熬夜,但學習的效果卻並不一定好。
從教育的結果來看,應試教育是一種對創新能力的扼殺,標準答案容易固化人的思維。這個我有很深刻的體驗,許多博士學生從小學到博士,一路考來,很適應應試教育,但結果在做研究時卻做不了創新,只能去讀國外的論文,拿回來修修補補。另一方面,學校裡學到的知識和社會的需求之間存在著巨大的鴻溝,學生往往是學習知識有餘,學習「能力」很難。
當然中國的教育也同樣造成了教育的不公平問題,主要體現在優質資源分布極為不均,城鄉之間存在巨大的差異,在城市裡出現各種學區房的現象。
傳統的教學模式,往往教師是學校制定的,而非學生選擇的;而學生也非常多,教師沒法關注到每個學生的個性化差異並予以照顧。而學生所學習的教材也是教育部指定的紙質課本,主要以文字為主,配以少量插圖。教學的方式則主要以課堂教學為主。
但是伴隨著資訊時代到來,傳統教學模式受到了巨大的衝擊。學生獲取知識的途徑不再僅限於教師,學生可以通過網際網路上各種公開課或百科來學習比教師所教授地更多的信息,而且學生之間還能夠建立社交網絡相互之間進行答疑解惑。而教材選擇上也不再局限於某一本課本,而是可以自由地選擇,而且可以從網上下載許多電子課件。學生許多的學習時間都是在課堂之外。
當教師可選,教材可選的時候,「教」與「學」之間面臨著巨大的矛盾。那麼這個矛盾中,誰才是矛盾的主要方面呢?有人認為「名師出高徒」、「嚴師出高徒」等,教師在教學過程中發揮著主導作用。但也有人認為「師傅領進門,修行在個人」,應當依據學生的個性化來定製學習路線。例如有人建議將知識點碎片化,然後學生根據個人的特點開發自己的學習路線。但我認為,學生本身是有惰性的,而且知識(特別是理工科的知識)是有次序的。因此也應當注意「教」的重要性。
不過我們要認識到,現在的教學逐漸在朝向以學生心智為主導的方向發展。隨著學習的展開,學生的心智應當發生變化,從而能夠更好地適應環境,這不但是一個知識量的增加,更重要的是心智結構變得更為複雜。在這個過程中教師和機器都是學生成長的助力。
二、智能教育的變革
隨著人工智慧的再次爆發,現在大家都在提「人工智慧+教育」。據我的觀察這其實包括了三個方面,由於大家名詞不加區分,所以這三方面經常交疊在一起。第一個是人工智慧教育(ArtificialIntelligent Education, AI Education),講課的內容是教人工智慧,旨在培養掌握人工智慧技術的人才,形象的表示如下圖:
第二個是智能教育( Intelligent Education ),是用AI來輔助教學,人工智慧知識教育的手段,用來促進教學流程的自動化、智能化,來提高效率,提升效果:
第三個是計算教育學(Computational Education),這個是通過人工智慧的技術來進行教育學的研究,通過統計分析來研究教育學的原理:
在這裡,我想要討論的是第二個,智能教育,即如何利用人工智慧的技術來促進教育。我們用一張圖來看下教育、人工智慧與智能教育三者之間的關係:
教育是由人教人,由有知識的人教知識匱乏的人;人工智慧是人來教機器;而智能教育是機器來教人或者機器輔助來教人。這是它們三者之間的關係。其實有時候計算機的學習方法對我們人類學習也是有幫助的。我們能教會計算機,同時也可以用這種方式來教人。
我也將傳統教育與智能教育做了一個對比,如下表格:
傳統教育主要是發生在教室,智能教育發生在空間裡面,資源空間、物理空間、社交空間都可以;傳統教育主要是知識的傳遞,而智能教育則代表能力的提升,是知識獲取的引導者;傳統教育是知識灌輸,智能教育是互動探究式的學習;傳統教育一般是以文字為主配少量的插圖,我們知道只是用文字這種單一的形式會丟掉很多原汁原味的東西,文字的教學可能會限制我們的思維,智能教育則具有多元化、多模態的數字教育資源;傳統教育只需要簡單的技術支持,而智能教育則需要高級的數位化技術以及智能技術的支持。
從學習評價來看,傳統教育受結果導向,主要表現是應試教育,智能教育是數據驅動的過程化評價,由於學生的整個學習過程可以被數位化的記錄下來,所以我們可以在過程中像切片一樣來看他們的學習過程。傳統教育以分數為評價機制,智能教育是多元化綜合評價,逐漸形成一個定量的精準化評價。
從學習路徑的規劃來看,傳統教育是模塊化的,智能教育比模塊化還要更加細緻和碎片化。由於有碎片化所以內容點之間可以形成一個複雜的網絡。在智能教育過程當中,學生可以動態的調整學習路徑,每個學生可以有自己的學習路徑。
如果將規模化和個性化作為橫縱坐標。在農業時代的教育(例如私塾),是個性化教學的,孔子對子路、顏回會有不同的教育方法,同時,不同老師的獨特經驗也可以傳授給學生。隨著進入工業時代,為了培養大規模的人才,就制定了標準化的培養方案,教師嚴格遵循教育部審定的教材、制定的教育大綱,大規模的教學主要以文字為主體,只有少量配圖,只有極少的多模態,這也導致從學校出來的人的能力和企業實際的需求有很大的差距,因為並沒有得到基於實際的能力鍛鍊。到智能化時代,我們說智能革命,是在兩個維度同時突破。它的規模比工業時代更大,同時又實現了個性化。這種學生的個性化培養能使老師的個人經驗得以傳承同時又是多模態化的,使我們能在時間和空間的兩個維度上都突破限度。在時間上隨時學不需要非得上課學,碎片化學習提高效率,還有終身的學習,在空間上隨時隨地可以學習。
這裡可以借鑑下機器學習的三種學習模式,從規則系統的角度來看,規則學習很像是填鴨式教學,人制定標準的規則,讓機器照著去做(直接告訴學生知識,技巧)。然後是神經網絡,大量的訓練數據(大量做題)。其次是強化學習,在與環境的互動中得到反饋,進而得到提升(在探索中學習)。
在教育系統中的主要角色(學校、教師和學生),他們的主要工作以及在智能教育中所產生的產品形態,如下:
智能教育的目標如下:
致力於培養智慧型、創新型的人才把老師從重複性的勞動中解救出來;促進教育公平、區域教育發展平衡;促進教育效果、教育體系運行效率和教育投入的效益。
在政策方面,人工智慧+教育演進的速度非常快,最大的一個標誌就是2017年7月國務院出臺了《新一代人工智慧發展規劃》;隨後在2019年2月國務院又出臺了《中國教育現代化2035》,將「加快信息化時代教育變革」列入戰略任務。
在這些主要的政策中,其主要思路有六條:
推動教學改革,探索基於人工智慧的新教學模式,推動教學方法改革,重構教學流程;智能校園。變革組織結構和管理體制,優化運行機制和服務模式,實現校園精細化管理;智能評價。教學過程監測、學情分析和學業水平診斷,精準評估教與學的績效;在線學習。開發立體綜合教學場、基於大數據智能的在線學習教育平臺;個性化。以學習者為中心,提供精準推送的教育服務,實現教育定製化;終身教育。服務全民終身學習。今年 5 月份國際人工智慧與教育大會上,習總書記在講話中提到人工智慧與教育,一方面是要培養人工智慧人才;另一方面就是智能教育。關於智能教育,他提到了終身教育,平等教育,個性化教育和開放靈活的教育。
國家各個部委響應國家的政策組建了F06,然後把人工智慧和計算機和自動化並列組建了一個學科,叫F0701,專注於研究教育智能化、教育信息化。
三、人工智慧技術在教育領域的應用案例
我們講下 AI 在教育領域的應用案例。下面是我從理工科的角度畫的一張布局圖,主要分成五個層次:
人工智慧的核心技術包括自然語言處理、視覺、聽覺等等都會在教育領域找到用武之地。我們從技術出發來找應用場景:
我最近在和學校的幾位老師推動「智能監考」這件事情,其技術實質就是把異常行為檢測應用到監考當中。我們學院唐降龍教授將機器視覺技術應用到體育運動當中,
例如分析滑雪的動作是否規範、什麼時候應該有什麼速度等。用在教學中,我們同樣可以通過視覺行為分析對學生在化學實驗中的實踐操作過程與精度進行缺陷檢測,並給出其優化學習指導,提升學校實踐教學質量。
哈工大做知識圖譜已經有很多年了,我們的成果是2014年推出的《大詞林》,2019年推出了2.0,擁有1000萬個實體,上位詞十八萬,目前很多企業(包括騰訊、阿里、科大訊飛、360、搜狗等多家企業)都在付費使用。大詞林的優勢在於當給你一個課本時,無需手工參與,能夠自動構建而成知識圖譜。因此可以先把一門課構建成知識圖譜,然後學生在學的過程中不斷對學生進行評價,構建一個個性化的知識圖譜,例如紅色表示不會,綠色表示會的,黃色表示半懂不懂。這樣能夠引導孩子更好的學習。我的孩子在上高中時會有一個錯題本,事實上錯題本正是這樣一個知識圖譜。
我們做的情感分析技術可以用在教育資源的評價上。例如網上有很多老師講「C語言」,但到底哪個老師講的好?我應該跟著哪個老師來學?網上會有一些討論,根據對這些討論中的情感分析,我們可以給這些課程資源進行好壞的打分。
另外我們與科大訊飛合作的工作曾經在國際權威閱讀理解評測中多次奪冠。現在的閱讀理解技術雖然在評測中能夠取得很高的分數,但還不能做到可解釋。我們希望能夠做到,當一個學生在選擇答案時,機器不僅能夠告訴孩子他的選擇是否正確,還能夠告訴他為什么正確或為什麼錯誤,即解釋閱讀理解中的推理過程。
另外是自動校對。我的碩士研究就是自動校對,但自動校對很難,特別是中文更加複雜。不過隨著深度學習以及大數據的出現,這方面確實有很大的進展。我們希望能夠把這項技術用來幫助孩子在寫作文等方面起到輔助作用,例如能夠自動校對語法錯誤等。
我們曾在國家863計劃的支持下研製了首個中文作文自動寫作系統,就是你給我一個主題,機器能夠自動生成一篇文章,例如篇章結構、事實論據、點名主題等,一般自動生成的文章在滿分50分的情況能夠獲得33~35分的成績。
此外也可以用來輔助寫作,例如為寫作提供素材,生成同義詞、反義詞、近義詞等,對句子進行潤色或翻譯,或者直接寫篇詩歌后作文作為參考。哈工大不僅做知識圖譜,還做事理圖譜,不同之處在於前者的節點是名詞,而後者是動詞。我們根據實例圖譜中記錄的不同事情發展的脈絡可以寫出不同的故事。例如我們曾參加國際故事結尾預測(storycloze test)評測比賽,獲得了第一名(相關工作發表在IJCAI 2019以及Coling2018),如下:
此外,我們也和科大訊飛合作了中文作文評閱系統:
中文作文評閱系統現在已經能夠達到和人類相近的水平。我們的思路並不是機器取代人類閱卷評分,而是輔助。例如在高考中,閱卷老師會給作文打分,之後機器會快速地對已經打分的作文進行掃描並打分,如果人和機器之間的分數差別太大,再用專家進行二次審核。
我們也做了人機對話技術,這項技術在教育中的一個應用就是智能答疑系統。一個老師可以給幾十萬人進行授課,但卻無法做到對每個人進行答疑。智能答疑系統能夠自動地對用戶的問題進行回答。
另外就是能夠自動地生成問卷,根據用戶知識點的確實自動構建覆蓋其知識點的題庫。以上這些是我從我自己的老本行NLP出發,給大家匯報一些潛在的應用。這些應用做出來,會幫助提高自動化,推動智能教育的革命。
四、智能教育的未來
對於智能教育的未來,我這裡主要談下最關鍵的個性化問題。
現在的教育最大的問題是陷入了盲目低效的學習困境,導致培養出的人才千人一面。有統計顯示有約60%的題目訓練是無效訓練,要麼是重複訓練,要麼是超出了孩子理解難度的範圍。另外孩子在日常測試中有約50%的錯題在期中或期末考試中還會出錯,原因在於孩子認不清到底是哪個知識點出錯。
我覺得要想走出困境,最為重要的是智能評價。在醫療和金融領域,常常會根據評價來改進個性化服務。同樣的,智能教育領域也應當以評價為核心推動個性化發展。只有檢測才能實現個性化。學習者在學習某個知識點時出現學習障礙,可能是因為學習者對於與當前知識點相關的其它知識點沒有掌握,於是我們可以通過構建領域知識點間的邏輯結構關係來幫組進行診斷。然後根據診斷結果,定製個性化教材和課程,自動推薦個性化學習內容和練習題。
舉個例子。這是真實的一個案例,一名同學4月份在金屬部分的測試中僅得了54分,這裡紅色代表他還沒有掌握的知識點,綠色代表他已經掌握的知識點,黃色介於二者之間。經過個性化學習後,5月平均分達到74分,6月份便達到了96分。
現在的教學主要是對知識進行考察,但是其本質則是在考察能力。例如歷史,如果問你「商鞅變法」與「王安石變法」之間的異同,這在課本裡是找不到的,這裡考察的包括表達能力、推理能力、創新能力等。其他也是同樣。因此我們應當從以知識圖譜為中心的教學方式過渡到以能力圖譜為中心的教學方式中。
目前智能教育落地存在的問題包括數據壁壘,市場認識不足,學科的壁壘。應用模式上也存在一些問題,例如本來AI+教育是為了降低教師和學生負擔的,但現在卻反而加重了他們的負擔,好比因為原來學生們都只有步槍,現在大家都配上了機槍,甚至是坦克,應用模式沒有改變,反而加重了他們的負擔,成為教育領域的軍備競賽。所以要回歸初心,看看本報告開頭關於教育本質的闡述,教育第一位使命的還是提高價值觀讓人能夠更加幸福,切不可讓人工智慧技術成為應試教育的幫兇。
最後我總結一下,智能教育引導重大變革,最關鍵在於因材施教;國家的政策支持使智能教育的社會地位和經濟價值不可估量;人工智慧教育的各項技術在教育領域都有用武之地;自然語言處理技術在自然語言學習和知識學習方面將發揮重大的作用。