不到現場,照樣看最乾貨的學術報告!嗨,大家好。這裡是學術報告專欄,讀芯術小編不定期挑選並親自跑會,為大家奉獻科技領域最優秀的學術報告,為同學們記錄報告乾貨,並想方設法搞到一手的PPT和現場視頻——足夠乾貨,足夠新鮮!話不多說,快快看過來,希望這些優秀的青年學者、專家傑青的學術報告 ,能讓您在業餘時間的知識閱讀更有價值。
人工智慧論壇如今浩如煙海,有硬貨、有乾貨的講座卻百裡挑一。「AI未來說·青年學術論壇」系列講座由中國科學院大學主辦,百度全力支持,讀芯術、paperweekly作為合作自媒體。承辦單位為中國科學院大學學生會,協辦單位為中國科學院計算所研究生會、網絡中心研究生會、人工智慧學院學生會、化學工程學院學生會、公共政策與管理學院學生會、微電子學院學生會。2020年8月29日,第18期「AI未來說·青年學術論壇」(「AI+X」領域專場)以「線上平臺直播+微信社群圖文直播」形式舉行。中科大劉淇帶來報告《從自適應學習的角度理解AI+教育》。
劉淇,中國科學技術大學計算機學院、大數據學院特任教授,博士生導師,中科院青促會優秀會員,中國人工智慧學會機器學習專委會委員,中國計算機學會大數據專家委員會委員。主要研究數據挖掘與知識發現、機器學習方法及其應用,相關成果獲得過IEEE ICDM 2011最佳研究論文獎、ACM KDD 2018 (Research Track)最佳學生論文獎。還曾獲中科院院長特別獎和優博、教育部自然科學一等獎(排名第2)、阿里巴巴達摩院青橙獎,入選了國家基金委優秀青年科學基金項目、中國科協「青年人才託舉工程」、微軟亞洲研究院青年學者「鑄星計劃」、CCF-Intel青年學者提升計劃。
從自適應學習的角度理解AI+教育
「自適應(Adaptive)」對於機器學習和人類學習都是非常重要的一個概念,它通過挖掘大量數據來對當前情境進行感知,並進一步融合多種知識和技術實現學習進程的動態自適應調整。劉淇老師在本報告中從自適應學習的角度,向同學們展示了AI和教育的可能的結合途徑,以及需要解決的若干技術問題。
首先,劉淇老師指出相較於傳統的考試方式,自適應測試的方式可以花費更少的時間來測試學生的水平。自適應測試需要設計一個能夠診斷學生認知水平的認知模型,然後加上一些自適應的選題策略。劉淇老師對於接下來的步驟提出了一個問題:在得到學生的認知水平之後,怎樣結合學生的認知背景去給學生做個性化學習的推薦?對於這個問題,劉淇老師指出這和傳統的機器自適應學習、推薦系統有所區別。傳統的機器學習更關注的是學習的結果,即做出決策,而對於我們人的自適應學習更關注的是建模和學生學習的過程。傳統的推薦系統是用戶需求感知或者興趣感知,然而,自適應學習則要基於學生的能力,進行學生認知情境感知的自適應推薦。
劉淇老師針對以上出現的三個問題提出了解決方案:①如何測試學生水平?——認知診斷。②如何根據診斷結果選題?——自適應測試。③如何給學生做個性化的學習路徑推薦?——認知情境感知的推薦。
一、認知診斷
認知診斷是診斷用戶在某項技能或某個知識點上的水平,其被廣泛應用於遊戲、體育運動、招聘和教育等領域。例如,江蘇衛視的「最強大腦」每個選手出場時都會展示該選手各個維度認知能力的雷達圖,該雷達圖是基於選手做題結果形成的。那麼,根據學生的做題結果診斷出該生對每個技能點和知識點的掌握水平,是認知診斷要解決的任務。
認知診斷是心理測量學中的經典任務,該方向的研究者提出了許多傳統模型,例如IRT項目反應理論,該模型是基於若學生水平越高、題目越簡單,學生就更應該做對這道題目。之後,劉淇老師指出了這類傳統模型存在的問題:①項目反應函數是人工設計的,需要一些專家支持。②項目反應函數大部分也是線性的函數,表達能力比較有限。③項目反應函數只能處理數值數據,不能處理現在我們能夠收集到的試題文本和圖片和一些視頻多元異構的大數據。
基於這些問題,劉淇老師團隊設計了一個能夠建模高階認知關係和異構大數據的認知函數模型——NeuralCD。劉淇老師介紹該模型輸入的是學生的表示和試題的表現、試題和知識點的相關度、學生知識點的掌握程度、知識的難度和試題的區分度,輸入之後我們會過一些全連結層,再來預測這個學生在某個題上的做題結果。該模型的詳細細節在論文中有介紹。
二、自適應測試
自適應測驗包含兩部分:一部分是認知診斷模型,即剛才提到的IRT和NeuralCD。還有一部分是選題策略,基於診斷模型對學生的學習情況做出診斷結果,然後給學生選些題目,學生做了以後再給學生一個診斷,根據診斷結果再給學生選題,然後再診斷再選題,這樣周而復始,這就是自適應測試的過程。
劉淇老師提到最近的工作是在設計一種選題策略能夠獨立於每個認知模型。選題和認知診斷模型是相互獨立的,這樣做的優勢在於自適應測驗系統想要更換認知診斷模型或者想要更換選題策略的時候不需要把二者同時更換,只需要更換一部分就可以了,所以自適應測驗的測驗效率和靈活性會大大提高。
怎麼來做選題策略呢?劉淇老師團隊受機器學習思想中主動學習的概念的啟發,主動地幫助這些模型挑選信息量更高的題目。那麼什麼樣的信息量更高呢?劉淇老師以GRE考試(美國研究生入學考試)為例,做了介紹。GRE當中的題目有的時候會越做越難,有的時候會越做越簡單,為什麼會這樣呢?越做越難是因為機器剛開始低估了考生水平,所以在自適應測驗當中不斷選擇一些難題測試真實水平,越做越簡單則是因為機器認為高估了考生水平,所以不停降低試題的難度。
三、認知情境感知的推薦
在得到了認知診斷的結果和自適應測驗的選題策略後,怎樣快速地給學生做一些情境感知的自適應推薦?情境感知的自適應推薦和傳統推薦的區別在於,推薦的過程要考慮到學生的認知情境。比如有一個同學現在學了知識點D,因為考得很差,我們需要給他們推薦一個學習路徑,能夠讓他們快速掌握知識點D,我們就要考慮兩方面的因素:一方面是考慮這個學生每個學習時刻的認知水平的變化、另一方面就是給學生做推薦的時候也要考慮到知識的學習結構,比如學生知識點D掌握得不好並不一定是知識點D出了問題,可能是前面的知識點C出了問題,所以自適應推薦的過程當中要同時考慮學生的認知結構和知識點的學習順序結構,所以這是我們要解決的兩方面的約束。
根據這樣的約束,劉淇老師設計了一些方法,用於動態地追蹤學生的認知水平的變化,在知識點的結構當中找到一些學習的前後順序關係,評估學生的整個學習路徑的回報。結合學生當前的認知情境和當前的知識點結構,得出最優化的學習路徑。
在講座的結尾,劉淇老師總結了人的自適應學習中要解決的三個問題:認知診斷、自適應測試、認知情境感知的推薦。在討論部分劉淇老師還提出了該方向存在的其他問題,比如如何對學生的學習過程和學習心理數據有一個更清晰的認識,如何診斷傳統的機器學習的能力等問題。
劉淇老師團隊主頁:http://base.ustc.edu.cn/
部分公開的代碼和數據:https://github.com/bigdata-ustc
(整理人:翟振宇)
AI未來說*青年學術論壇
第一期 數據挖掘專場
1. 李國傑院士:理性認識人工智慧的「頭雁」作用
2. 百度熊輝教授:大數據智能化人才管理
3. 清華唐傑教授:網絡表示學習理論及應用
4. 瑞萊智慧劉強博士:深度學習時代的個性化推薦
5. 清華柴成亮博士:基於人機協作的數據管理
第二期 自然語言處理專場
1. 中科院張家俊:面向自然語言生成的同步雙向推斷模型
2. 北郵李蕾:關於自動文本摘要的分析與討論
3. 百度孫珂:對話技術的產業化應用與問題探討
4. 阿里譚繼偉:基於序列到序列模型的文本摘要及淘寶的實踐
5. 哈工大劉一佳:通過句法分析看上下文相關詞向量
第三期 計算機視覺專場
1. 北大彭宇新:跨媒體智能分析與應用
2. 清華魯繼文:深度強化學習與視覺內容理解
3. 百度李穎超:百度增強現實技術及應
4. 中科院張士峰:基於深度學習的通用物體檢測算法對比探索
5. 港中文李弘揚 :物體檢測最新進展
第四期 語音技術專場
1. 中科院陶建華:語音技術現狀與未來
2. 清華大學吳及:音頻信號的深度學習處理方法
3. 小米王育軍:小愛背後的小米語音技術
4. 百度康永國:AI 時代的百度語音技術
5. 中科院劉斌:基於聯合對抗增強訓練的魯棒性端到端語音識別
第五期 量子計算專場
1. 清華大學翟薈:Discovering Quantum Mechanics with Machine Learning
2. 南方科技大學魯大為:量子計算與人工智慧的碰撞
3. 荷蘭國家數學和計算機科學中心(CWI)李繹楠:大數據時代下的量子計算
4. 蘇黎世聯邦理工學院(ETH)楊宇翔:量子精密測量
5. 百度段潤堯:量子架構——機遇與挑戰
第六期 機器學習專場
1. 中科院張文生:健康醫療大數據時代的認知計算
2. 中科院莊福振:基於知識共享的機器學習算法研究及應用
3. 百度胡曉光:飛槳(PaddlePaddle)核心技術與應用實踐
4. 清華大學王奕森:Adversarial Machine Learning: Attack and Defence
5. 南京大學趙申宜:SCOPE - Scalable Composite Optimization for Learning
第七期 自動駕駛專場
1. 北京大學查紅彬:基於數據流處理的SLAM技術
2. 清華大學鄧志東:自動駕駛的「感」與「知」 - 挑戰與機遇
3. 百度朱帆:開放時代的自動駕駛 - 百度Apollo計劃
4. 北理宋文杰:時空域下智能車輛未知區域自主導航技術
第八期 深度學習專場
1. 中科院文新:深度學習入門基礎與學習資源
2. 中科院陳智能:計算機視覺經典——深度學習與目標檢測
3. 中科院付鵬:深度學習與機器閱讀
第九期 個性化內容推薦專場
1. 人民大學趙鑫:基於知識與推理的序列化推薦技術研究
2. 中科院趙軍:知識圖譜關鍵技術及其在推薦系統中的應用
第十期 視頻理解與推薦專場
1. 北京大學袁曉如:智能數據可視分析
第十一期 信息檢索與知識圖譜專場
1. 北京郵電大學邵鎣俠:知識圖譜高效嵌入方法
2. 人民大學徐君:智能搜索中的排序-突破概率排序準則
3. 百度周景博:POI知識圖譜的構建及應用
4. 百度宋勳超:百度大規模知識圖譜構建及智能應用
5. 百度馮知凡:基於知識圖譜的多模認知技術及智能應用
第十二期 年度特別專場
1. 復旦大學桂韜:當NLP邂逅Social Media--構建計算機與網絡語言的橋梁
2. 清華大學董胤蓬:Adversarial Robustness of Deep Learning
3. UIUC羅宇男:AI-assisted Scientific Discovery
4. 斯坦福應智韜:Graph Neural Network Applications
第十三期 AI助力疫情攻關線上專場
1. 清華大學吳及:信息技術助力新冠防控
2. 北京大學王亞沙:新冠肺炎傳播預測模型
3. 百度黃際洲:時空大數據與AI助力抗擊疫情——百度地圖的實踐與思考
4. 百度張傳明:疫情下的「活」導航是如何煉成的
第十四期 深度學習線上專場
1. 中國科學院徐俊剛:自動深度學習解讀
2. 北航孫鈺:昆蟲目標檢測技術
3. 百度尤曉赫:EasyDL,加速企業AI轉型
4. 百度鄧凱鵬:飛槳視覺技術解析與應用
第十五期 大數據線上專場
1. 復旦趙衛東:大數據的系統觀
2. 中科大徐童:AI×Talent數據驅動的智能人才計算
3. 百度李偉彬:基於PGL的圖神經網絡基線系統
4. 中科大張樂:基於人才流動表徵的企業競爭力分析
第十六期 NLP前沿技術及產業化線上專場
1. 復旦大學黃萱菁:自然語言處理中的表示學習
2. 中科院劉康:低資源環境下的事件知識抽取
3. 百度何中軍:機器翻譯 —— 從設想到大規模應用
4. 百度孫宇:百度語義理解技術ERNIE及其應用
5. 哈佛鄧雲天:Cascaded Text Generation with Markov Transformers
6. 復旦大學桂韜:Uncertainty—Aware Sequence Labeling
第十七期 百度獎學金特別專場
1. 麻省理工學院趙明民:能穿牆透視的計算機視覺
2. 卡內基梅隆大學梁俊衛:視頻中行人的多種未來軌跡預測
3. 清華大學丁霄漢:深度網絡重參數化——讓你的模型更快更強
4. 南京大學趙鵬:動態環境在線學習的算法與理論研究
5. 上海交通大學方浩樹:人類行為理解與機器人物體操作
留言點讚關注
我們一起分享AI學習與發展的乾貨
如轉載,請後臺留言,遵守轉載規範