多倫多大學在讀博士朱子寧:如何利用語言探針檢測深度神經模型性能...

2020-12-05 智東西

「NLP前沿講座」,是智東西公開課針對自然語言處理領域推出的一檔講座,聚焦於自然語言處理前沿領域研究成果與進展。我們將持續邀請研究者、專家與資深開發者,為大家帶來直播講解。

語言模型編碼在神經模型中的評估越來越受到科研人員的關注。語言探針(linguistic probe)是最近比較流行的一種可以探測深度神經模型裡面編碼了哪些特徵的「診斷性分類器」算法,分類器效果的好壞直接體現深度模型包含信息的好壞,也就是模型性能的好壞。「探針」的選擇是對模型性能的解釋,因此如何選擇「探針」成為了一個難點。

2019年Hewitt & Liang提出,語言探針分類器的效果好可能因為信息好,或者探針本身學會了探測任務。而在2020年,Pimentel et al.反對這種二分法。那麼這種二分法到底是否正確呢?多倫多大學的朱子寧博士通過信息理論對此進行了驗證,表示這兩種可能性確實存在。同時他們還發現探針的構建與選擇,與兩篇論文中提到的控制任務(Hewitt和Liang,2019)和控制功能(Pimentel等人,2020)是等價的,也就是說,這兩種選擇標準造成的誤差原因是相同的。

11月20日上午10點,智東西公開課邀請到多倫多大學在讀博士朱子寧參與到「NLP前沿講座」第8講,帶來主題為《如何利用語言探針檢測深度神經模型性能》的直播講解。在本次講解中,朱子寧博士首先會講解深度神經模型的性能檢測算法,然後對語言探針的定義及分類器的選擇進行詳解,最後就如何減少探針誤差的方法進行重點解析。

朱子寧博士目前就讀於多倫多大學,師從Frank Rudzicz。他的研究方向包括自然語言處理和深度模型的可解釋性,試圖設計實驗來理解深度語言模型編碼的信息,以及這些模型在應用時的表現。

課程內容

課程主題

《如何利用語言探針檢測深度神經模型性能》

課程提綱

1、深度神經模型的性能檢測算法2、語言探針:一種探測模型編碼特徵的「診斷性分類器」3、基於資訊理論的語言探針分類器選擇4、減少語言探針誤差的方法解析

講師介紹

朱子寧,多倫多大學在讀博士,師從Frank Rudzicz;研究方向包括自然語言處理和深度模型的可解釋性;試圖設計實驗來理解深度語言模型編碼的信息,以及這些模型在應用時的表現。

直播信息

直播時間:11月20日10:00直播地點:智東西公開課小程序

加入討論群

加入討論群,除了可以免費收看直播之外,還能認識講師,與更多同行和同學一起學習,並進行深度討論。添加小助手小語(ID:hilele20)即可申請,備註「姓名-公司/學校/單位-職位/專業」的朋友將會優先審核通過哦~

相關焦點

  • 如何「錨定」NLP模型中的語言智慧?丨長文評析語言探針
    探針對語言任務的性能預測,或用於關聯或比較神經網絡和語言現象的支持模式,提供了對編碼語言知識的內容和方式的獨特見解。對於性能預測的指標,可以是分類準確性,相關係數或預測金標的平均倒數排名(MRR, Mean Reciprocal Rank)。
  • 法國國立路橋學校在讀博士肖洋:非特定場景下的目標檢測和3D姿態...
    作為場景理解的關鍵子任務,圖像中目標檢測和姿態估計也是近幾年的研究熱點。針對圖像中目標檢測問題,大部分方法已經在多樣本情況下取得了很好的結果。然而,對於樣本較少的新對象類別,其性能仍然滯後;在姿態估計領域,近幾年的方法都需要針對特定的對象實例或類別進行訓練。但是對於未預定義類別的事物,目前方法性能略顯不足。那麼,到底如何解決當前出現的場景理解問題並進行優化呢?
  • 「神經常微分方程」提出者之一:如何利用深度微分方程模型處理連續...
    David Duvenaud 是多倫多大學向量學院的創始人之一,能源預測和貿易公司 Invenia 的聯合創始人,目前在多倫多大學擔任計算機科學助理教授。他在劍橋大學獲得博士學位,後在哈佛大學 Intelligent Probabilistic Systems 實驗室完成博後工作。
  • 我國開發新型探針 神經遞質被完美「監視」
    日前,北京大學生命科學學院李毓龍研究組聯合多個研究組開發的兩種新型神經遞質探針,可以精確地實時檢測多種生物的特定神經遞質——乙醯膽鹼或多巴胺的「一舉一動」。相關論文分別於7月9日、7月12日在國際學術期刊《自然·生物技術》和《細胞》在線發表後,在國內外同行中引發關注。兩種探針有何「過人之處」?它們如何準確追蹤原本看不見、摸不著的神經遞質?
  • 深度神經決策樹:深度神經網絡和樹模型結合的新模型
    深度神經決策樹:深度神經網絡和樹模型結合的新模型 工程師郭婷 發表於 2018-08-19 09:14:44 近日,來自愛丁堡大學的研究人員提出了一種結合深度神經網絡和樹模型的新型模型
  • 如何加速神經語言模型訓練?東北大學小牛翻譯團隊有妙招
    那要如何知道每個詞出現時的概率呢?在神經語言模型中,其整體結構如上圖所示(圖為循環神經語言模型[1]),輸入層將離散表示的詞彙轉化成連續空間上的詞向量,不同詞彙之間的向量距離能夠反映詞語之間的相似性。二、更快地訓練神經語言模型隨著在語音識別、機器翻譯等領域對語言模型性能需求的日益增長,我們迫切地希望能夠進一步改善神經語言模型的性能。一般來說使用更大量的訓練數據來訓練更複雜的模型結構將會獲得更優的模型性能,但與此同時帶來的問題在於其訓練所花費的時間消耗也相應地變長了。面對這種情況,如何有效地減少訓練神經語言模型佔用的時間成為了亟待解決的問題。
  • 復旦大學黃萱菁:自然語言處理中的表示學習
    復旦大學黃萱菁帶來報告《自然語言處理中的表示學習》。黃萱菁,復旦大學計算機科學技術學院教授、博士生導師。1998年於復旦大學獲計算機理學博士學位,研究領域為人工智慧、自然語言處理、信息檢索和社會媒體分析。兼任中國中文信息學會常務理事,社會媒體專委會副主任,中國計算機學會中文信息技術專委會副主任。
  • Talk預告 | 南大NLP實驗室x字節李磊團隊合作研究:基於隱變量模型的神經機器翻譯
    他與大家分享的主題是: 「基於隱變量模型的神經機器翻譯」。屆時將會介紹鄭在翔及字節跳動李磊團隊提出的一個新的基於隱變量的神經機器翻譯模型:鏡像生成式神經機器翻譯模型。Talk·信息▼主題:基於隱變量模型的神經機器翻譯嘉賓:南京大學在讀博士生 鄭在翔時間:北京時間 10月10日 (周六) 20:00地點:將門TechBeat技術社區http://www.techbeat.net
  • 科學家設計新型雙光子螢光探針 —新聞—科學網
    據論文第一作者、南京工業大學先進材料研究院博士研究生方海嘯介紹,人體內的神經遞質代謝需要維持一個穩定的代謝平衡,如果單胺氧化酶的功能發生異常,會過多或者過少地代謝神經遞質,從而破壞生物體內神經遞質的代謝平衡。所以單胺氧化酶與中樞神經系統疾病有著密切的聯繫,是中樞神經系統疾病研究中的重要生化標誌物。
  • 探針檢測破壞性線粒體
    裡肯的研究人員開發了一種多功能探針,可以精確地檢測出有缺陷的線粒體(細胞的動力室)的程序性破壞。他們用它來證明,在患有類似帕金森氏症的老鼠身上,多巴胺產生神經元受損的線粒體無法被破壞。 出國看病機構和生元了解到線粒體是一種細胞器,它產生我們細胞所需的大部分化學能量。
  • 從經典結構到改進方法,神經網絡語言模型綜述
    神經網絡語言模型(NNLM)克服了維數的限制,提升了傳統語言模型的性能。本文對 NNLM 進行了綜述,首先描述了經典的 NNLM 的結構,然後介紹並分析了一些主要的改進方法。研究者總結並對比了 NNLM 的一些語料庫和工具包。此外,本文還討論了 NNLM 的一些研究方向。
  • 音頻鑑黃是如何做到的?深度解析音頻檢測背後的技術
    針對說話內容有語音識別、關鍵詞檢索等;針對語種的判別有語種識別的技術;針對說話人的識別有聲紋識別技術;針對說話內容無關的通常採用音頻比對的技術來進行檢測。 語音識別的關鍵技術——聲學模型 語音識別的聲學模型主要有以下兩種:混合聲學模型和端到端的聲學模型。 混合聲學模型通常是隱馬爾科夫模型結合混合高斯、深度神經網絡、深度循環神經網絡以及深度卷積神經網絡的一個模型。
  • 運用深度學習教機器人理解自然語言
    他主要研究機器學習和人工智慧如何使用在文本和知識中讓計算機變得更智能。他在德克薩斯農工大學獲得心理學學士學位和工商管理碩士,在德克薩斯大學獲得計算機博士學位。譯者/趙屹華 審校/劉帝偉、朱正貴 責編/周建丁。在深度學習出現之前,文字所包含的意思是通過人為設計的符號和結構傳達給計算機的。
  • 深度學習與圖像識別 圖像檢測
    CNN等為什麼對圖像領域更加有效,因為其不但關注了全局特徵,更是利用了圖像識別領域非常重要的局部特徵,應該是將局部特徵抽取的算法融入到了神經網絡中。圖像本身的局部數據存在關聯性,而這種局部關聯性的特徵是其他算法無法提取的。深度學習很重要的是對全局和局部特徵的綜合把握(2)深度學習不是一個黑箱系統。
  • 正則表達式與神經網絡的深度融合
    ,提出了將正則表達式規則與神經網絡深度融合的新思路。在有足夠多標註數據的情況下,神經網絡往往效果驚人。但是,當標註數據匱乏時,神經網絡的性能就會大打折扣。此外,神經網絡缺少可解釋性以及難以融入外部知識的問題也一直為人所詬病。
  • 用飛槳做自然語言處理:神經網絡語言模型應用實例
    發展帶來巨大推動,是多個領域的關鍵部分,但另一方面,成也蕭何敗也蕭何,語言模型其實也限制了 NLP 發展,比如說在創新性生成式任務上,還有如何用語言模型獲得雙向信息。 為更好計算,利用條件概率公式和鏈式法則,按照從左到右的句序,可以將公式轉換成: 題變成了如何求解: 怎麼根據前面所有的詞預測下一個詞,當然這個問題對於現在還有點複雜,之後可以用 RNN 模型來計算,但現在讓我們先假設對於一個詞離它近的詞重要性更大,於是基於馬爾可夫性假設,一個詞只依賴它前面
  • 德克薩斯A&M大學在讀博士遊宇寧:自監督學習在圖卷積網絡中的研究...
    為了有效利用大量的無標籤數據,自監督學習通過設置合理的學習目標和定義前置任務,從數據本身中得到了監督信號。當前自監督學習已經被廣泛用於訓練卷積神經網絡(CNNs),有效地提高了圖像表示學習可傳遞性、泛化能力和魯棒性,並且已在語義分割、目標檢測、圖像分類、人體動作識別等實戰場景中展現出卓越效果。現在更多無需人工標註的前置任務訓練也被提出,如前景對象分割、圖像修補、圖像著色等。
  • 打破局限,研發抑制性神經遞質螢光探針iGABASnFR
    興奮性神經遞質探針也得到了開發,但是關於抑制性遞質探針一直沒有特別大的突破(1)。以往有研究報導GABAB受體上附著有機螢光團的半合成有機螢光探針,但其對GABA(400μM)的低親和力限制了應用(2)。因此尋求新的GABA螢光探針將有助於促進神經科學領域的研究。近日,美國霍華德休斯醫學研究所Loren L.
  • 深度牛頓!24歲博士小哥用圖神經網絡重新發現宇宙
    傳統的符號模型可以很好地解釋和泛化,但高維數據又不好處理,那二者能否優勢互補呢?近日,普林斯頓大學的博士Miles Cranmer發表了一篇論文,將符號模型和深度學習模型結合了起來,給天體物理學帶來了新的驚喜! 19歲時,Miles Cranmer讀了一篇物理學家李 · 斯莫林的採訪。
  • 實踐入門NLP:基於深度學習的自然語言處理
    特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。