閒談深度學習在自然語言處理領域的5大關鍵優勢

2020-11-25 電子發燒友

在自然語言處理領域,深度學習將給予最大的幫助,深度學習方法主要依靠一下這五個關鍵優勢,閱讀本文將進一步了解自然語言處理的重要深度學習方法和應用。

在自然語言處理領域,深度學習的承諾是:給新模型帶來更好的性能,這些新模型可能需要更多數據,但不再需要那麼多的語言學專業知識。

關於深度學習方法有很多炒作和大話,但除了炒作之外,深度學習方法正在為挑戰性問題取得最先進的結果,特別是在自然語言處理領域。

在這篇文章中,您將看到深度學習方法應對自然語言處理問題的具體前景。看完這篇文章後,你會知道:

1. 自然語言處理深度學習的承諾。

2. 深度學習從業人員和研究科學家對自然語言處理深度學習的承諾有什麼說法。

3. 自然語言處理的重要深度學習方法和應用。

深度學習的承諾

深度學習的方法很受歡迎,主要是因為它們兌現了當初的承諾。

這並不是說在技術上沒有任何炒作,而是說,這種炒作是基於非常真實的成果。這些成果正在從計算機視覺和自然語言處理的一系列極具挑戰性的人工智慧問題中得到證實。

深度學習力量的第一次大型展現,就是在自然語言處理領域,特別是在語音識別方面。 最近的進展則是在機器翻譯方面。

在這篇文章中,我們將看到,自然語言處理領域的深度學習方法的五個具體承諾。這些承諾是這個領域的研究人員和從業人者最近所強調的,而這些人面對這些承諾的態度比一般的新聞報導要克製得多。

總而言之,這些承諾是:

深度學習插入替換現有模型 。深度學習方法可以插入現有的自然語言系統,由此產生的新模型可以實現同等或更好的性能。

新NLP模型 。深度學習方法提供了新的建模方法以挑戰自然語言問題(如序列-序列預測)。

特徵學習 。深度學習方法可以從模型所需的自然語言中學習特徵,而不需要專家指定、提取特徵。、

持續改進。自然語言處理中的深度學習的表現是基於真實世界的結果,並且所帶來的改進正在持續,還可能加速。

端對端模型 。大型端對端深度學習模型可以適應自然語言問題,提供更一般和更好的方法。

我們現在將仔細看看這些承諾中的每一個。其實自然語言處理深度學習還有一些其他承諾;,這些只是我從中選擇的最突出的五個。

深度學習插入替換現有模型

自然語言處理中的深度學習的第一個承諾是,能夠用具有更好性能的模型替代現有的線性模型,能夠學習和利用非線性關係。

Yoav Goldberg在他的《NLP研究人員神經網絡入門》中強調,深度學習方法取得了令人印象深刻的成果,他說在此文中說:「最近,神經網絡模型也開始應用於文本自然語言信號,並再次帶來了非常有希望的結果。」

他還繼續強調,這些方法易於使用,有時可用於批量地替代現有的線性方法。他說:「最近,該領域在從稀疏輸入的線性模型切換到稠密數據的非線性神經網絡模型方面取得了一些成功。大多數神經網絡技術都很容易應用,有時候幾乎可以替代舊的線性分類器;不過,在許多情況下仍存在著使用神經網絡的障礙。」

新NLP模型

另一個承諾是,深度學習方法有助於開發全新的模型。

一個很好的例子是,使用能夠學習和判斷超長序列輸出的循環神經網絡。 這種方法與從前的完全不同,因為它們允許NLP從業者擺脫傳統的建模假設,並實現最先進的結果。

Yoav Goldberg在其NLP深度學習的專著《自然語言處理的神經網絡方法》第xvii頁指出,像循環神經網絡這樣複雜神經網絡模型可以帶來全新的NLP建模機會。他說,「在2014年左右,該領域已經開始看到,在從稀疏輸入的線性模型到稠密輸入的非線性神經網絡模型的轉換方面,已取得了一些成功。 。……其他的變化更高級,需要研究者改變思維,並能帶來新的建模機會。特別是,基於循環神經網絡(RNNs)的一系列方法減輕了對序列模型中普遍存在的馬爾可夫假設的依賴,允許以任意長序列為條件,並產生了有效的特徵提取器。 這些進步導致了語言建模、自動機器翻譯和其他應用的突破。」

特徵學習

深度學習方法具有學習特徵表示的能力,不必要求專家從自然語言中人工指定和提取特徵。

NLP研究員Chris Manning在自然語言處理深度學習課程的第一次講座中突出了這方面的觀點。

他描述了人工定義輸入特徵的局限性:按照這種方法,在之前的應用中,機器學習只是在統計NLP中證明人類事先定義的特徵,並且計算機幾乎沒有學習。

Chris 認為,深度學習方法帶來的承諾是自動特徵學習。 他強調,特徵學習是自動的,而不是人工;它易於適應,不脆弱,並可以不斷自動地改善。

Chris Mining 在2017年的《自然語言處理與深度學習》講座第一講幻燈片中說,「一般來說,我們人工設計的特徵往往被過度地指定,它們不完整,需要很長時間才能設計和驗證,會讓你忙活一天後只能達到有限的性能水平。而深度學習到的特徵易於適應,能快速訓練,它們可以持續學習,以便達到以前未能實現的、更好的性能水平。

持續改進

NLP的深度學習的另一個承諾是,在挑戰性問題上持續快速改進。

在《自然語言處理與深度學習》講座第一講中,Chris Manning表示,深度學習的方法很受歡迎,因為它們很管用。他說,「深度學習對大多數人來說如此令人興奮的真正原因是,它確實管用。「

他強調,深度學習的初步結果令人印象深刻。深度學習在語音領域的表現比過去30年中任何其他方法的表現都更好。

Chris 提到,深度學習帶來的不僅是最先進的成果,而且是不斷改進的進步速度。他說,」……在過去的六七年中,非常令人驚嘆的是,深度學習方法一直在不斷改進,並以驚人的速度變得更好。 我其實想說,這是前所未有的,我看到這個領域飛速地進展,每個月都會推出更好的方法。「

端對端模型的承諾

深度學習的最終承諾是,開發和訓練自然語言問題的端對端模型能力,而不是為專門模型開發流程。

端對端模型不僅能改進模型的性能,也能帶來更好的開發速度和簡潔性。

神經機器翻譯(簡稱NMT)是指,嘗試學習將一種語言翻譯成另一種語言的大型神經網絡。 傳統上,這是由一系列手工調整的模型組成的流程來處理的,而流程中的每個模型都需要專業語言知識。

Chris Manning 在史丹福大學NLP深度學習課程第十講《神經機器翻譯和注意模型》中描述了這一點。他說:」神經機器翻譯是指,我們想要做的是構建一個大型神經網絡,在這個網絡中我們可以對訓練整個端到端機器翻譯過程並進行優化。……這種遠離人工定製模型、朝向端到端、序列到序列預測模型的趨勢,一直是語音識別的趨勢。 這樣做的系統被稱為NMT (神經機器翻譯)系統。

設計端到端模型,而非為專門系統設計流程,這也是語音識別的一個趨勢。

在斯坦福NLP課程第十二講《語音處理的端到端模型》中,目前就職於Nvidia的 NLP研究員Navdeep Jaitly強調,語音識別的每個組成部分都可以用神經網絡來代替。自動語音識別流程中的幾大組塊是語音處理,聲學模型,發音模型和語言模型。問題是,每個組塊的屬性和錯誤類型是不同的。這激發了開發一個神經網絡來端到端地學習整個問題的需要。

他說,「隨著時間的推移,人們開始注意到,如果我們使用神經網絡,這些組件中的每一個都可以做得更好。 ……但是,仍然有一個問題。 每個組件都有各自的神經網絡,但是每個組件中的錯誤都是不同的,所以它們可能無法很好地協同工作。 所以這讓我們擁有動機,嘗試去把整個語音識別當作一個大模型來訓練。」

自然語言處理深度學習網絡的類型

深度學習是一個很大的學習領域,並不是它的所有內容都與自然語言處理相關。

哪些類型的深度學習模型能提升性能?學習者在具體優化方法上很容易陷入泥沼。

從較高層次看,深度學習中有5種方法在自然語言處理中應用最為廣泛。

他們是:

嵌入圖層

多層感知器(MLP)

卷積神經網絡(CNN)

循環神經網絡(RNNs)

遞歸神經網絡(ReNNs)

NLP中的問題類型

深度學習不會徹底解決自然語言處理問題或人工智慧問題。

迄今為止,在自然語言處理的一系列廣泛問題中,已經對深度學習方法進行了評估,並在其中一些問題上取得了成功。這些成功表明,使用深度學習能獲得高於以往的表現或能力。

重要的是,深度學習方法取得最大成功的領域,恰恰是一些更加面對終端用戶、更具挑戰性也更有趣的問題。

深度學習取得成功的5個例子包括:

詞表示和詞含義

文本分類

語言建模

機器翻譯

語音識別

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 自然語言處理深度學習的7個應用
    原文:7 Applications of Deep Learning for Natural Language Processing作者:Jason Brownlee翻譯:無阻我飛揚摘要:在這篇文章中,作者詳細介紹了自然語言處理深度學習的7種應用,以下是譯文。自然語言處理領域正在從統計方法轉變為神經網絡方法。
  • 人工智慧與自然語言處理概述:AI三大階段、NLP關鍵應用領域
    並著重介紹了大數據和自然語言處理的發展,對自然語言處理在大數據中扮演的角色作了探討。「人工智慧」包含兩個關鍵點:自動化智能人工智慧的目標推理自動學習&調度機器學習自然語言處理計算機視覺機器人通用智能人工智慧三大階段階段 1——機器學習:智能系統使用一系列算法從經驗中進行學習。階段 2——機器智能:機器使用的一系列從經驗中進行學習的高級算法,例如深度神經網絡。
  • 實踐入門NLP:基於深度學習的自然語言處理
    可以說,自然語言的研究歷史雖然還不是很長,但近些年在谷歌、IBM、斯坦福、阿里巴巴、Facebook等NLP領域的核心企業和研究所的推動下,其取得的成績,足以顯示它在人工智慧領域乃至整個計算機科學研究的重要性和廣闊應用前景。
  • 中國的自然語言處理領域的人工智慧公司
    自然語言處理是工業界與學術界都關注的人工智慧領域,這一領域的突破性發展與深度學習算法的成熟有直接的關係。加拿大多倫多大學的辛頓是深度學習的先驅,他和學生於2006年發表在《科學》上的文章提出了降維與逐層預訓練的方法,這使得深度學習成為可能。
  • 從語言學到深度學習NLP,一文概述自然語言處理
    本文從兩篇論文出發先簡要介紹了自然語言處理的基本分類和基本概念,再向讀者展示了深度學習中的 NLP。這兩篇論文都是很好的綜述性入門論文,希望詳細了解自然語言處理的讀者可以進一步閱讀這兩篇論文。本文第一部分介紹了自然語言處理的基本概念,作者將 NLP 分為自然語言理解和自然語言生成,並解釋了 NLP 過程的各個層級和應用,這一篇論文很適合讀者系統的了解 NLP 的基本概念。
  • 自然語言處理(NLP)中的深度學習發展史和待解難題
    王小新 編譯自 sigmoidal量子位 出品 | 公眾號 QbitAI自然語言處理(NLP)是指機器理解並解釋人類寫作與說話方式的能力。近年來,深度學習技術在自然語言處理方面的研究和應用也取得了顯著的成果。技術博客Sigmoidal最近發布了一篇文章,作者是機器學習工程師Rafal。
  • CNCC 2019 | 劉群:基於深度學習的自然語言處理,邊界在哪裡?
    >當前,深度學習之於自然語言處理,有其局限性。近日,在北京語言大學舉辦的第四屆語言與智能高峰論壇上,華為諾亞方舟實驗室語音語義首席科學家劉群教授高屋建瓴,細緻分析了深度學習時代NLP的已知與未知。他從自然語言處理基於規則、統計到深度學習的範式遷移出發,探討了深度學習方法解決了自然語言處理的哪些問題以及尚未解決哪些問題。
  • 深度學習與自然語言處理的工作概述及未來發展
    深度學習是機器學習的一個領域,研究複雜的人工神經網絡的算法、理論、及應用。自從2006年被Hinton等提出以來[1],深度學習得到了巨大發展,已被成功地應用到圖像處理、語音處理、自然語言處理等多個領域,取得了巨大成功,受到了廣泛的關注,成為當今具有代表性的IT先進技術。
  • 深度| 深度學習概覽之自然語言處理:從基本概念到前沿研究
    選自Adit Deshpande blog作者:Adit Deshpande機器之心編譯參與:趙華龍、王宇欣、吳攀本文是 Adit Deshpande 的 Deep Learning Research Review 系列文章的第三篇,總結和解讀了深度學習在自然語言處理領域的應用。
  • 復旦大學黃萱菁:自然語言處理中的表示學習
    復旦大學黃萱菁帶來報告《自然語言處理中的表示學習》。黃萱菁,復旦大學計算機科學技術學院教授、博士生導師。1998年於復旦大學獲計算機理學博士學位,研究領域為人工智慧、自然語言處理、信息檢索和社會媒體分析。兼任中國中文信息學會常務理事,社會媒體專委會副主任,中國計算機學會中文信息技術專委會副主任。
  • 想攻克自然語言處理?你需要這個武器
    但是,僅僅是到這一步,自然語言處理也已經走過了數不清的年頭,耗費了無數科學家的心血,未來更是大大的可期。>Google 今年發布了智慧語音助理Google Assistant,演示環節中機器人顧客對答如流,與理髮店店員的交互優雅又自然沒錯,我們與計算機之間的聯繫與交互正朝著前所未有的高度發展,而在這歷程之中——舞動著智能「魔法棒」的,則一定少不了——自然語言處理。
  • 人工智慧難點之——自然語言處理(NLP)
    (NLP)是人工智慧和語言學領域的分支學科。(人工智慧主要包含以下幾個方面: 自動推理-計算語言學-計算機視覺-進化計算-專家系統-自然語言處理-機器人學)自然語言處理(NLP)是資訊時代最重要的技術之一。理解複雜的語言也是人工智慧的重要組成部分。
  • AI自然語言處理(NLP)領域常用的16個術語
    自然語言處理(NLP)是人工智慧領域一個十分重要的研究方向。NLP研究的是實現人與計算機之間用自然語言進行有效溝通的各種理論與方法。本文整理了NLP領域常用的16個術語,希望可以幫助大家更好地理解這門學科。
  • 自然語言處理必讀:5本平衡理論與實踐的書籍
    為了幫助你解決問題,我幫你選擇5本關於自然語言處理的書,不像其他的書單,除了第一本之外,這些書都不是免費的,但事實證明它們是值得投資的,希望能對大家有所幫助。它也稱為NLTK書籍,應用Python進行自然語言處理在整個過程中都很大程度上依賴於NLTK庫。以下摘自這本書的序言:「本書對NLP領域介紹通俗易懂。它可以用於個人學習,也可以作為自然語言處理或計算語言學課程的教科書,或者作為人工智慧、文本挖掘或語料庫語言學課程的補充。本書非常實用,包含數百個例子和分級練習。
  • 科普自然語言處理
    >自然語言處理是計算機科學領域與人工智慧領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯繫,但又有重要的區別。自然語言處理並不是一般地研究自然語言,而在於研製能有效地實現自然語言通信的計算機系統,特別是其中的軟體系統。因而它是計算機科學的一部分。
  • 如何用深度學習做自然語言處理?這裡有份最佳實踐清單
    對於如何使用深度學習進行自然語言處理,本文作者 Sebastian Ruder 給出了一份詳細的最佳實踐清單,不僅包括與大多數 NLP 任務相關的最佳實踐,還有最常見任務的最佳實踐,尤其是分類、序列標註、自然語言生成和神經機器翻譯。作者對最佳實踐的選擇很嚴格,只有被證明在至少兩個獨立的群體中有益的實踐才會入選,並且每個最佳實踐作者至少給出兩個參引。
  • 包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等
    現在人工智慧已經包括的領域有計算機視覺,語音識別,自然語言處理,圖像識別等。人工智慧的步驟人工智慧基本步驟包括,信息提取->信息分析->假設建模->學習->泛化,具體步驟。如果說計算機視覺是讓計算機看到一張黑白的二維圖像,那麼它可以識別字符串,可以通過圖像獲取某個標註的信息,它具有特定的識別圖像,可以從圖像分析出某個基本的結構。
  • 對話UT Austin大學教授:未來5年自然語言處理最大的挑戰在哪裡?
    香儂科技: 近年來,深度學習模型的可解釋性受到了很多關注,領域中有很多方法被提出以解釋深度神經網絡的行為(解釋性熱圖 explanatory heat-map,自然語言等)。
  • 一文讀懂Smartbi的自然語言處理(NLP)技術
    二十世紀八十年代以來的趨勢就是,基於語言規則的理性主義方法不斷受到質疑,大規模語言數據處理成為目前和未來一段時期內NLP的主要研究目標。統計學習方法越來越受到重視,自然語言處理中越來越多地使用機器自動學習的方法來獲取語言知識。
  • 復旦大學陳俊坤:自然語言處理中的多任務學習 | AI 研習社職播間第...
    分享主題:自然語言處理中的多任務學習 & 復旦大學 NLP 實驗室介紹分享提綱:1、復旦大學 NLP 實驗室介紹2、基於深度學習的自然語言處理3、深度學習在自然語言處理中的困境4、自然語言中的多任務學習5、多任務基準平臺