自然語言處理終極方向:深度學習用於自然語言處理的5大優勢

2021-02-13 新智元

來源:machinelearningmastery.com

作者:Jason Brownlee

編譯:朱煥


【新智元導讀】在自然語言處理領域,深度學習的承諾是:給新模型帶來更好的性能,這些新模型可能需要更多數據,但不再需要那麼多的語言學專業知識。

在自然語言處理領域,深度學習的承諾是:給新模型帶來更好的性能,這些新模型可能需要更多數據,但不再需要那麼多的語言學專業知識。

 

關於深度學習方法有很多炒作和大話,但除了炒作之外,深度學習方法正在為挑戰性問題取得最先進的結果,特別是在自然語言處理領域。

 

在這篇文章中,您將看到深度學習方法應對自然語言處理問題的具體前景。看完這篇文章後,你會知道:

 

1. 自然語言處理深度學習的承諾。

2. 深度學習從業人員和研究科學家對自然語言處理深度學習的承諾有什麼說法。

3. 自然語言處理的重要深度學習方法和應用。

 

讓我們開始吧。

 

深度學習的方法很受歡迎,主要是因為它們兌現了當初的承諾。

 

這並不是說在技術上沒有任何炒作,而是說,這種炒作是基於非常真實的成果。這些成果正在從計算機視覺和自然語言處理的一系列極具挑戰性的人工智慧問題中得到證實。

 

深度學習力量的第一次大型展現,就是在自然語言處理領域,特別是在語音識別方面。 最近的進展則是在機器翻譯方面。

 

在這篇文章中,我們將看到,自然語言處理領域的深度學習方法的五個具體承諾。這些承諾是這個領域的研究人員和從業人者最近所強調的,而這些人面對這些承諾的態度比一般的新聞報導要克製得多。

 

總而言之,這些承諾是:

 

深度學習插入替換現有模型 。深度學習方法可以插入現有的自然語言系統,由此產生的新模型可以實現同等或更好的性能。

新NLP模型 。深度學習方法提供了新的建模方法以挑戰自然語言問題(如序列-序列預測)。

特徵學習 。深度學習方法可以從模型所需的自然語言中學習特徵,而不需要專家指定、提取特徵。、

持續改進。自然語言處理中的深度學習的表現是基於真實世界的結果,並且所帶來的改進正在持續,還可能加速。

端對端模型 。大型端對端深度學習模型可以適應自然語言問題,提供更一般和更好的方法。

 

我們現在將仔細看看這些承諾中的每一個。其實自然語言處理深度學習還有一些其他承諾;,這些只是我從中選擇的最突出的五個。

 

 

自然語言處理中的深度學習的第一個承諾是,能夠用具有更好性能的模型替代現有的線性模型,能夠學習和利用非線性關係。

 

Yoav Goldberg在他的《NLP研究人員神經網絡入門》中強調,深度學習方法取得了令人印象深刻的成果,他說在此文中說:「最近,神經網絡模型也開始應用於文本自然語言信號,並再次帶來了非常有希望的結果。」

 

他還繼續強調,這些方法易於使用,有時可用於批量地替代現有的線性方法。他說:「最近,該領域在從稀疏輸入的線性模型切換到稠密數據的非線性神經網絡模型方面取得了一些成功。大多數神經網絡技術都很容易應用,有時候幾乎可以替代舊的線性分類器;不過,在許多情況下仍存在著使用神經網絡的障礙。」

 

 

另一個承諾是,深度學習方法有助於開發全新的模型。

 

一個很好的例子是,使用能夠學習和判斷超長序列輸出的循環神經網絡。 這種方法與從前的完全不同,因為它們允許NLP從業者擺脫傳統的建模假設,並實現最先進的結果。

 

Yoav Goldberg在其NLP深度學習的專著《自然語言處理的神經網絡方法》第xvii頁指出,像循環神經網絡這樣複雜神經網絡模型可以帶來全新的NLP建模機會。他說,「在2014年左右,該領域已經開始看到,在從稀疏輸入的線性模型到稠密輸入的非線性神經網絡模型的轉換方面,已取得了一些成功。 .……其他的變化更高級,需要研究者改變思維,並能帶來新的建模機會。特別是,基於循環神經網絡(RNNs)的一系列方法減輕了對序列模型中普遍存在的馬爾可夫假設的依賴,允許以任意長序列為條件,並產生了有效的特徵提取器。 這些進步導致了語言建模、自動機器翻譯和其他應用的突破。」

 

 

深度學習方法具有學習特徵表示的能力,不必要求專家從自然語言中人工指定和提取特徵。

 

NLP研究員Chris Manning在自然語言處理深度學習課程的第一次講座中突出了這方面的觀點。

 

他描述了人工定義輸入特徵的局限性:按照這種方法,在之前的應用中,機器學習只是在統計NLP中證明人類事先定義的特徵,並且計算機幾乎沒有學習。

 

Chris 認為,深度學習方法帶來的承諾是自動特徵學習。 他強調,特徵學習是自動的,而不是人工;它易於適應,不脆弱,並可以不斷自動地改善。

 

Chris Mining 在2017年的《自然語言處理與深度學習》講座第一講幻燈片中說,「一般來說,我們人工設計的特徵往往被過度地指定,它們不完整,需要很長時間才能設計和驗證,會讓你忙活一天後只能達到有限的性能水平。而深度學習到的特徵易於適應,能快速訓練,它們可以持續學習,以便達到以前未能實現的、更好的性能水平。

 

 

NLP的深度學習的另一個承諾是,在挑戰性問題上持續快速改進。

 

在《自然語言處理與深度學習》講座第一講中,Chris Manning表示,深度學習的方法很受歡迎,因為它們很管用。他說,「深度學習對大多數人來說如此令人興奮的真正原因是,它確實管用。「

 

他強調,深度學習的初步結果令人印象深刻。深度學習在語音領域的表現比過去30年中任何其他方法的表現都更好。

 

Chris 提到,深度學習帶來的不僅是最先進的成果,而且是不斷改進的進步速度。他說,」……在過去的六七年中,非常令人驚嘆的是,深度學習方法一直在不斷改進,並以驚人的速度變得更好。 我其實想說,這是前所未有的,我看到這個領域飛速地進展,每個月都會推出更好的方法。「

 

 

深度學習的最終承諾是,開發和訓練自然語言問題的端對端模型能力,而不是為專門模型開發流程。

 

端對端模型不僅能改進模型的性能,也能帶來更好的開發速度和簡潔性。

 

神經機器翻譯(簡稱NMT)是指,嘗試學習將一種語言翻譯成另一種語言的大型神經網絡。 傳統上,這是由一系列手工調整的模型組成的流程來處理的,而流程中的每個模型都需要專業語言知識。

 

Chris Manning 在史丹福大學NLP深度學習課程第十講《神經機器翻譯和注意模型》中描述了這一點。他說:」神經機器翻譯是指,我們想要做的是構建一個大型神經網絡,在這個網絡中我們可以對訓練整個端到端機器翻譯過程並進行優化。……這種遠離人工定製模型、朝向端到端、序列到序列預測模型的趨勢,一直是語音識別的趨勢。 這樣做的系統被稱為NMT (神經機器翻譯)系統。

 

設計端到端模型,而非為專門系統設計流程,這也是語音識別的一個趨勢。

 

在斯坦福NLP課程第十二講《語音處理的端到端模型》中,目前就職於Nvidia的 NLP研究員Navdeep Jaitly強調,語音識別的每個組成部分都可以用神經網絡來代替。自動語音識別流程中的幾大組塊是語音處理,聲學模型,發音模型和語言模型。問題是,每個組塊的屬性和錯誤類型是不同的。這激發了開發一個神經網絡來端到端地學習整個問題的需要。

 

他說,「隨著時間的推移,人們開始注意到,如果我們使用神經網絡,這些組件中的每一個都可以做得更好。 ……但是,仍然有一個問題。 每個組件都有各自的神經網絡,但是每個組件中的錯誤都是不同的,所以它們可能無法很好地協同工作。 所以這讓我們擁有動機,嘗試去把整個語音識別當作一個大模型來訓練。」

 

 

深度學習是一個很大的學習領域,並不是它的所有內容都與自然語言處理相關。

 

哪些類型的深度學習模型能提升性能?學習者在具體優化方法上很容易陷入泥沼。

 

從較高層次看,深度學習中有5種方法在自然語言處理中應用最為廣泛。

 

他們是:

嵌入圖層

多層感知器(MLP)

卷積神經網絡(CNN)

循環神經網絡(RNNs)

遞歸神經網絡(ReNNs)

 

 

深度學習不會徹底解決自然語言處理問題或人工智慧問題。

 

迄今為止,在自然語言處理的一系列廣泛問題中,已經對深度學習方法進行了評估,並在其中一些問題上取得了成功。這些成功表明,使用深度學習能獲得高於以往的表現或能力。

 

重要的是,深度學習方法取得最大成功的領域,恰恰是一些更加面對終端用戶、更具挑戰性也更有趣的問題。

 

深度學習取得成功的5個例子包括: 

 

 

如果您想深入學習,下面是更多的相關資源:

A Primer on Neural Network Models for Natural Language Processing, 2015.

Neural Network Methods in Natural Language Processing, 2017.

Stanford CS224n: Natural Language Processing with Deep Learning, 2017

 

原文:https://machinelearningmastery.com/promise-deep-learning-natural-language-processing/

【號外】新智元正在進行新一輪招聘,飛往智能宇宙的最美飛船,還有N個座位

點擊閱讀原文可查看職位詳情,期待你的加入~

相關焦點

  • 自然語言處理深度學習的7個應用
    自然語言處理領域正在從統計方法轉變為神經網絡方法。自然語言中仍有許多具有挑戰性的問題需要解決。然而,深度學習方法在一些特定的語言問題上取得了最新的成果。這不僅僅是深度學習模型在基準問題上的表現,基準問題也是最有趣的;事實上,一個單一的模型可以學習詞義和執行語言任務,從而消除了對專業手工製作方法渠道的需要。
  • CCCF專欄 | 自然語言處理中的深度學習:評析與展望
    為什麼深度學習能夠成為自然語言處理的強大工具?未來深度學習在自然語言處理中將如何發展?本文嘗試回答這兩個大家都關心的問題。人的語言處理人是如何進行語言處理,即語言理解和語言生成的?這個問題仍是當今科學最大的未解之迷。
  • 深度學習在自然語言處理上的七大應用
    本文由 「AI前線」原創,原文連結:http://t.cn/RQhUr9y 作者|Jason Brownlee,譯者|CarolGuo,編輯|Emily 自然語言中仍然存在許多具有挑戰性的問題。然而,深度學習方法在某些特定的語言問題上可以獲得最先進的結果。
  • 自然語言處理的發展簡史
    因為處理自然語言的關鍵是要讓計算機「理解」自然語言,所以通常把自然語言理解視為自然語言處理, 也稱為計算語言學。它的終極目標是用自然語言與計算機進行通信,使人們可以用自己最習慣的語言來使用計算機,而無需再花大量的時間和精力去學習不很自然和習慣的各種計算機語言。 自然語言處理是一門融語言學、計算機科學、數學於一體的科學。
  • 自然語言處理——人工智慧戰略的重要方向
    而自然語言處理(Natural Language Processing,簡稱NLP)已成為計算機科學領域與人工智慧領域中的一個重要方向,它推動著智能時代的持續發展和突破,並越來越多地應用於各個行業。自然語言處理:AI皇冠上的明珠自然語言處理是研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。 既是一門科學,也是一門應用技術,試圖讓機器去模擬人類的語言能力。
  • 【CCCF專題】深度學習在自然語言處理中的應用
    自然語言處理中的深度學習隨著語音和圖像處理領域的突破性進展,深度學習在自然語言處理領域也越來越受到重視,並逐漸應用於自然語言處理的各種任務中。然而自然語言處理任務有其自身的特點,與語音和圖像處理之間的不同主要體現在以下兩方面。語音和圖像在處理過程中的輸入信號可以在向量空間內表示,而自然語言處理通常在詞彙一級進行。
  • 實踐入門NLP:基於深度學習的自然語言處理
    特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。
  • 深度學習在自然語言處理研究上的進展
    在自然語言處理領域,雖然深度學習方法也收到越來越多的關注,在很多任務上也取得了一定效果,但是並沒有其它領域那麼顯著。傳統的主流自然語言處理方法是基於統計機器學習的方法,所使用的特徵大多數是基於onehot向量表示的各種組合特徵。這個特徵表示方式會導致特徵空間非常大,但也帶來一個優點。就是在非常高維的特徵空間中,很多任務上都是近似線性可分的。
  • 臺大這門深度學習自然語言處理課程,可能被低估了
    估計很多同學看到標題首先想到是李宏毅老師的「深度學習人類語言處理」課程,不過這次我們說的是臺灣大學陳蘊儂老師的「應用深度學習」課程,這門課程我們之前在公眾號上推薦過
  • 自然語言處理的應用前景
    其子類別包括自然語言生成(NLG)(計算機自行創建通信的能力)和自然語言理解(NLU)(理解俚語、錯誤發音、拼寫錯誤以及其他語言變體的能力)。 自然語言處理(NLP)的工作原理 自然語言處理通過機器學習(ML)進行。機器學習系統像其他任何形式的數據一樣存儲單詞及其組合方式。
  • 自然語言處理中的知識獲取問題
    當前,一方面NLP受到大數據和深度學習的雙輪驅動,在各項關鍵技術方面都有不同程度的進步,另一方面NLP滲透到各個行業,與教育、醫療、法律等知識服務型行業深度整合,同時以虛擬/實體機器人等新型應用模式與線下服務對接。本文聚焦前一話題,試圖以知識獲取方式的演進為主線,勾勒自然語言處理技術的發展脈絡,進而探討大數據怎樣與深度學習密切配合,推動NLP的發展。
  • 自然語言處理深度學習活躍研究領域概覽 | 網際網路數據資訊網-199IT...
    本文是紐約大學助理教授 Sam Bowman 關於自然語言處理中深度學習活躍領域的課程講義PPT。對深度學習NLP領域最近較為活躍的研究進行了綜述,其中包括Attention 模型、結構化記憶、詞水平以上的無監督學習等等。Sam Bowman 在史丹福大學完成博士學位,是Kris Manning 和 Chris Potts的學生。
  • 自然語言處理(NLP)的一般處理流程!
    什麼是NLP自然語言處理 (Natural Language Processing) 是人工智慧(AI)的一個子領域。自然語言處理是研究在人與人交互中以及在人與計算機交互中的語言問題的一門學科。為了建設和完善語言模型,自然語言處理建立計算框架,提出相應的方法來不斷的完善設計各種實用系統,並探討這些實用系統的評測方法。2.
  • ...復旦大學邱錫鵬老師】面向自然語言處理的深度學習基礎,199頁ppt
    《面向自然語言處理的深度學習基礎》講座,總共199頁ppt,講述自然語言處理的理論與實踐,是非常好的學習資料。
  • 自然語言處理的ImageNet時刻已經到來!
    2012 年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 提交的深度神經網絡 [7] 模型預測結果比第二名高出了 41%,這表明了深度學習是一種可行的機器學習策略,並且可能會引發機器學習研究中深度學習的爆炸式增長。ImageNet 的成功表明,在深度學習時代,數據與算法是同等重要的。
  • 復旦大學黃萱菁:自然語言處理中的表示學習
    復旦大學黃萱菁帶來報告《自然語言處理中的表示學習》。黃萱菁,復旦大學計算機科學技術學院教授、博士生導師。1998年於復旦大學獲計算機理學博士學位,研究領域為人工智慧、自然語言處理、信息檢索和社會媒體分析。兼任中國中文信息學會常務理事,社會媒體專委會副主任,中國計算機學會中文信息技術專委會副主任。
  • 資料|普林斯頓大學陳丹琦主講2020課程《深度學習自然語言處理...
    from=leiphonecolumn_res0420課程官網:https://www.cs.princeton.edu/courses/archive/spring20/cos598C/陳丹琦博士是自然語言處理研究員領域的新星大神,她從斯坦福畢業後,到普林斯頓大學任助理教授。
  • CNCC 2019 | 劉群:基於深度學習的自然語言處理,邊界在哪裡?
    >當前,深度學習之於自然語言處理,有其局限性。近日,在北京語言大學舉辦的第四屆語言與智能高峰論壇上,華為諾亞方舟實驗室語音語義首席科學家劉群教授高屋建瓴,細緻分析了深度學習時代NLP的已知與未知。他從自然語言處理基於規則、統計到深度學習的範式遷移出發,探討了深度學習方法解決了自然語言處理的哪些問題以及尚未解決哪些問題。
  • 十分鐘學習自然語言處理概述
    筆者學習以來寫了不少文章,文章深度層次不一,今天因為某種需要,將文章全部看了一遍做個整理,也可以稱之為概述。關於這些問題,博客裡面都有詳細的文章去介紹,本文只是對其各個部分高度概括梳理。(本文原創,轉載註明出處:十分鐘學習自然語言處理概述  )1 什麼是文本挖掘?
  • 自然語言處理(NLP)中的深度學習發展史和待解難題
    王小新 編譯自 sigmoidal量子位 出品 | 公眾號 QbitAI自然語言處理(NLP)是指機器理解並解釋人類寫作與說話方式的能力。近年來,深度學習技術在自然語言處理方面的研究和應用也取得了顯著的成果。技術博客Sigmoidal最近發布了一篇文章,作者是機器學習工程師Rafal。