「NLP前沿講座」,是智東西公開課針對自然語言處理領域推出的一檔講座,聚焦於自然語言處理前沿領域研究成果與進展。我們將持續邀請研究者、專家與資深開發者,為大家帶來直播講解。
語言模型編碼在神經模型中的評估越來越受到科研人員的關注。語言探針(linguistic probe)是最近比較流行的一種可以探測深度神經模型裡面編碼了哪些特徵的「診斷性分類器」算法,分類器效果的好壞直接體現深度模型包含信息的好壞,也就是模型性能的好壞。「探針」的選擇是對模型性能的解釋,因此如何選擇「探針」成為了一個難點。
2019年Hewitt & Liang提出,語言探針分類器的效果好可能因為信息好,或者探針本身學會了探測任務。而在2020年,Pimentel et al.反對這種二分法。那麼這種二分法到底是否正確呢?多倫多大學的朱子寧博士通過信息理論對此進行了驗證,表示這兩種可能性確實存在。同時他們還發現探針的構建與選擇,與兩篇論文中提到的控制任務(Hewitt和Liang,2019)和控制功能(Pimentel等人,2020)是等價的,也就是說,這兩種選擇標準造成的誤差原因是相同的。
11月20日上午10點,智東西公開課邀請到多倫多大學在讀博士朱子寧參與到「NLP前沿講座」第8講,帶來主題為《如何利用語言探針檢測深度神經模型性能》的直播講解。在本次講解中,朱子寧博士首先會講解深度神經模型的性能檢測算法,然後對語言探針的定義及分類器的選擇進行詳解,最後就如何減少探針誤差的方法進行重點解析。
朱子寧博士目前就讀於多倫多大學,師從Frank Rudzicz。他的研究方向包括自然語言處理和深度模型的可解釋性,試圖設計實驗來理解深度語言模型編碼的信息,以及這些模型在應用時的表現。
課程內容
課程主題
《如何利用語言探針檢測深度神經模型性能》
課程提綱
1、深度神經模型的性能檢測算法2、語言探針:一種探測模型編碼特徵的「診斷性分類器」3、基於資訊理論的語言探針分類器選擇4、減少語言探針誤差的方法解析
講師介紹
朱子寧,多倫多大學在讀博士,師從Frank Rudzicz;研究方向包括自然語言處理和深度模型的可解釋性;試圖設計實驗來理解深度語言模型編碼的信息,以及這些模型在應用時的表現。
直播信息
直播時間:11月20日10:00直播地點:智東西公開課小程序
加入討論群
加入討論群,除了可以免費收看直播之外,還能認識講師,與更多同行和同學一起學習,並進行深度討論。添加小助手小語(ID:hilele20)即可申請,備註「姓名-公司/學校/單位-職位/專業」的朋友將會優先審核通過哦~