自然語言處理必讀:5本平衡理論與實踐的書籍

2020-12-06 讀芯術

全文共2444字,預計學習時長7分鐘

圖源:unsplash

當談到學習方法時,我們常常會提到教程、博客文章、在線課程等等,書本總是會被忽略掉。即使是在找一本關於某個主題的書,也會很快發現這樣的書太多了,無法快速判斷哪一本最適合自己。

為了幫助你解決問題,我幫你選擇5本關於自然語言處理的書,不像其他的書單,除了第一本之外,這些書都不是免費的,但事實證明它們是值得投資的,希望能對大家有所幫助。

1.應用Python進行自然語言處理(Natural Language Processing with Python)

本書由Steven Bird, Ewan Klein 和 Edward Loper編寫,你可以從Python系統的角度學習自然語言處理的實用基礎知識,更適合初學者。它也稱為NLTK書籍,應用Python進行自然語言處理在整個過程中都很大程度上依賴於NLTK庫。以下摘自這本書的序言:

「本書對NLP領域介紹通俗易懂。它可以用於個人學習,也可以作為自然語言處理或計算語言學課程的教科書,或者作為人工智慧、文本挖掘或語料庫語言學課程的補充。本書非常實用,包含數百個例子和分級練習。本書適合所有人,無論以前的編程經驗如何,只要你想學如何編程並分析書面語言,就可以讀它。」

如上所述,這本書絕對實用。雖然你肯定會在進行過程中得到概念解釋,但毫無疑問,這本書的確是為那些希望用Python實現NLP解決方案的人而設計的。

2.使用PyTorch進行自然語言處理(NaturalLanguage Processing with PyTorch)

圖源:unsplash

本書的作者是Delip Rao和Brian McMahan,其中並沒有介紹NLP領域的傳統技術,而是介紹了如今使用的神經網絡。這門學科的另一種實用方法是使用PyTorch進行自然語言處理,將神經網絡應用於NLP中。

從這本書的網站你可以直接看到一些主題,包括:

· 探索計算圖表和監督學習範式

· 掌握PyTorch優化張量操作庫的基礎知識

· 對傳統的NLP概念和方法進行概述

· 學習建立神經網絡的基本概念

· 使用嵌入來表示單詞、句子、文檔和其他特性

· 探索序列預測並生成Seq2seq模型

· 學習構建生產NLP系統的設計模式

從更傳統的(基於非神經網絡)NLP技術到當代NLP,NLP越來越依賴於深度學習。

3.用神經網絡的方法進行自然語言處理(Neural Network Methods for Natural Language Processing)

這是Yoav Goldberg寫的關於NLP的神經網絡方法的書。本書針對NLP相關的概念進行了深入解釋,你可以學習如何輕鬆地用代碼實現它們。以下摘自本書網站:

「這本書著重於神經網絡模型在自然語言數據中的應用。本書第一部分和第二部分涵蓋了監督機器學習和前饋神經網絡的基礎知識,在語言數據上使用機器學習的基礎知識,以及使用基於向量而不是符號表徵的單詞。」

「本書第三部分和第四部分介紹了更專業的神經網絡架構,包括一維卷積神經網絡、遞歸神經網絡、條件生成模型和基於注意力的模型。這些架構和技術是機器翻譯、句法分析和許多其他應用程式的最新算法背後的驅動力。」

在理論或解釋性領域,自然語言處理的神經網絡方法將大大加強你對基於現代神經網絡的NLP方法是如何工作的理解。

4.自然語言處理的語言學基礎(LinguisticFundamentals for Natural Language Processing)

在使用NLP時,盲目學習語言基礎並不好一個好主意,而且在缺乏任何語言正式學習經歷的情況下,如果要從純計算的角度研究NLP或計算語言學時,你要注意的地方就有很多了。本書旨在幫助你彌合這一差距。

網站上這樣描述此書:

「本書旨在提供一種簡潔易懂的信息,它關於形態和句法結構的人類語言,可以用於創造更複雜、更獨立的語言,因此是更成功的NLP系統。」

「本書第一章的以下內容支撐這一點:關於語言結構的知識可以為NLP的機器學習方法提供特徵設計的信息。更具體地說:語言結構的知識將導致機器學習呈現更好的特徵。」

「本書由100個為更好地理解形態和語法的要點組成,與要點組成相關主題的章節也包含在內。如果你沒有語言學背景,讀起來可能有些辛苦,但它將讓你更好地理解語言,並在NLP職業生涯中熟練使用。」

5.自然語言處理實踐(NaturalLanguage Processing in Action)

Hobson Lane, Hannes Hapke 和Cole Howard合著的這本書將帶我們回到現實。本書涵蓋了傳統的和基於神經網絡的NLP方法,可以看作是書單中前兩本書的組合,其中涵蓋了使用現代工具,如TensorFlow和Keras的實際編碼解決方案。

摘自本書網站:

「《自然語言處理實際應用》是一本指南,幫助你建立可以閱讀和解釋人類語言的機器。你將使用現成的Python包來捕獲文本中的含義並做出反應。本書擴展了傳統的NLP方法,包括神經網絡、現代深度學習算法和生成技術,幫助你解決現實問題,如提取日期和名字,編寫文本,和回答自由形式的問題。」

圖源:unsplash

本書是目前市場上最新的、最全面和最實用的書。但你也可以根據想要進入的系統以及想要獲得的細節水平,並考慮其他一些因素,來選擇更適合自己的書籍。

這5本都是絕對值得一讀的好書,你要做的是弄清楚自己到底想學什麼,再做出相應的選擇,接著讀下去,絕對會大有收穫。

留言點讚關注

我們一起分享AI學習與發展的乾貨

如轉載,請後臺留言,遵守轉載規範

相關焦點

  • 10本機器學習和數據科學的必讀書籍推薦
    近日,他在 KDnuggets 上推薦了一份機器學習和數據科學相關的免費必讀書單,雷鋒網特來與大家分享。需要提前說明的是,這份書單大致以由淺入深的順序排列:首先是關於數據統計,接著是機器學習,最後是一些綜合性的更宏觀的書籍。所有書籍均為英文原著,有中文譯本的我們也都給出了相關連結。
  • 實踐入門NLP:基於深度學習的自然語言處理
    特別是最近兩年,基於深度學習的自然語言處理逐漸取得了一定進展,在人機對話、問答系統、語言翻譯等方向的應用也一直是自然語言處理中的熱門話題,而這些應用的實現,基本依賴於底層技術和模型的進步,再加上自然語言處理領域也算是一個多學科交叉的行業,自然語言處理的未來發展對於很多相關學科和方向都具有深遠的影響力。
  • 自然語言處理的最佳實踐
    雷鋒網 AI 開發者按,近年來,自然語言處理(NLP)在質量和可用性方面快速增長,這有助於推動人工智慧解決方案的實際落地。在過去的幾年裡,研究人員一直在將新的深度學習方法應用於 NLP。數據科學家開始從傳統的方法轉向最先進的(SOTA)深度神經網絡(DNN)算法,這種算法使用的語言模型經過了大文本語料庫的預訓練。
  • 乾貨滿滿:5本必看深度學習書籍!
    如果你喜歡書中出現一頁又一頁的詳細理論,那麼請直接把這篇文章當作反面教材。但如果你是喜歡理論聯繫實踐,那這就是你想要的書單。1.其中的數學不好怎麼學AI系列文章是重頭戲,尤其是第五章「用卷積神經網絡(CNNs)進行圖像識別」,和第七章「處理自然語言」。作者Aurélien Géron能通俗易懂地解釋很多複雜的問題,這也是我一直在追求的風格。在我看來,這本書完美結合了詳盡的實例和日常可用的代碼。
  • 17本必讀的數學、幾何書籍——淺顯易懂,受益終生
    雪花人:威爾遜·本特利傳這本美麗的書是由威爾遜本特利拍攝的真實照片的集合,他在他的一生中拍攝了5000多張雪晶的照片。這些照片至今仍令人驚嘆,它們幾乎有一個世紀的歷史了。你會發現威爾遜·本特利的生活非常有趣。大自然的分形幾何這本書對分形和混沌是至關重要的。我就是喜歡這本書,因為它與眾不同。這的確是一部經典之作。
  • 關於決策的書籍推薦,這本書科學決策必讀
    關於決策的書籍,我只推薦《決策必讀12篇》。《決策必讀12篇》絕對是我看過的最好的決策書籍,沒有之一。為什麼這麼說呢?首先,這本書是一本真正聚焦決策的書,裡面全是關於如何做好決策和科學決策的乾貨,沒有摻雜任何其他內容,是一本非常純粹的決策書籍。
  • 10本理科生必讀的宇宙和量子力學科普書籍
    這本書用很詼諧的方式講述了經典物理和量子力學的碰撞,喜歡量子世界的粉絲必讀作品。《上帝擲骰子嗎》是2006年01月01日遼寧教育出版社出版的圖書,作者是曹天元。 該書講述的是關於量子論的故事。量子論是一個極為奇妙的理論。
  • 【資源】藥劑學經典書籍13本,藥學人必讀!
    本次分享的藥劑學經典書籍共13本,如下圖:1、《藥物新劑型與新技術
  • 自然語言處理深度學習的7個應用
    原文:7 Applications of Deep Learning for Natural Language Processing作者:Jason Brownlee翻譯:無阻我飛揚摘要:在這篇文章中,作者詳細介紹了自然語言處理深度學習的7種應用,以下是譯文。自然語言處理領域正在從統計方法轉變為神經網絡方法。
  • 成為「中國精英」必讀的181本書籍(附推薦理由)足夠看十年!
    我是從《中國讀者理想藏書》《影響中國歷史進程的一百本名書最新排行榜》《國人必讀的1000本中外名著》《100部世界文學名著》《塑造現代文明的100本書》《人生必讀的100本書》《影響歷史進程的100本書》《影響人類的100本書》等書籍中精選出來的書目,既要具備經典性,也要具有影響力和知名度,既要結合中國人的閱讀習慣,又要在西方經典中精選出適合國人的閱讀之作,需要做到大眾性和經典性的統一
  • 科普自然語言處理
    它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯繫,但又有重要的區別。自然語言處理並不是一般地研究自然語言,而在於研製能有效地實現自然語言通信的計算機系統,特別是其中的軟體系統。因而它是計算機科學的一部分。
  • NLP入門+實戰必讀:一文教會你最常見的10種自然語言處理技術
    大數據文摘作品編譯:糖竹子、吳雙、錢天培自然語言處理(NLP)是一種藝術與科學的結合,旨在從文本數據中提取信息。從自動翻譯、文本分類到情緒分析,自然語言處理成為所有數據科學家的必備技能之一。在這篇文章中,你將學習到最常見的10個NLP任務,以及相關資源和代碼。為什麼要寫這篇文章?
  • 十二本大學生必讀的政治學經典書籍,老師的私藏版
    言言今天給大家推薦的是政治學的經典書籍,這個書單是我們的政治學老師分享給我們的,都是非常經典的書本,希望對大家有所幫助。十二本大學生必讀的政治學經典書籍,分享給大家:亞里斯多德:《政治學》柏拉圖:《理想國》盧梭:《社會契約論》洛克:《政府論》
  • 軟體測試必讀的經典書籍
    工具,環境語言都在變化,但是根本的測試思想沒有變。怪不得有人稱該書為測試領域的"開山鼻祖"。該書信息密度不低,第一章以一個小測試作為引子,第二章闡述全書的核心思想,後面各章就討論了詳細的方式方法。所謂詳細也是相對而言,能打下進一步學習的基礎就足夠了。實例很少,偏向於原則、理論、概念。如果想應聘測試工程師,也可以作為惡補書籍,也是就該書小而全。
  • 國際語言復興研究的理論和實踐
    這些章節涵蓋了以下話題:健康與福祉、語言政策與規劃、教育、讀寫素養、語言檔案編制以及技術(Hinton,Huss & Roche2018)。本文將以討論全球範圍內的語言瀕危危機及其學術研究為開篇,介紹語言復興的相關理論研究和經驗實踐。
  • 10本經典的管理學書籍推薦,關於管理學的書都在這裡了
    商業還是需要不斷實踐和反覆琢磨。最後,讀書不會令人變得厲害,知行合一才有可能。我認為好書的標準:1、好書是經得起口碑和時間考驗的,它們可能在思想、觀點、表達、體驗等任何一方或多方取勝,因此那些被推爛了的書是你需要優先考慮的。
  • 80本翻譯書籍推薦,CATTI、MTI和實戰翻譯指導
    翻譯學習書單市面上的翻譯書籍五花八門,種類繁多,我們應該如何選擇適合自己的好的書籍呢?今天,就為大家匯總一下自己覺得還不錯的書籍,並進行了分類,每一類別下分別為大家推薦幾本相關書籍。我是喜歡屯書之人,雖然有不少未能讀完,但是讀完的部分我是儘量努力吸收其精華,書可以多,但是讀書切記貪多嚼不爛,大家還是按需求購買哈。(一)翻譯理論篇1.
  • 自然語言處理的經驗主義和理性主義
    傑裡內克的這些話,把基於規則的自然語言處理研究貶低到了一無是處的程度,把從事基於規則的自然語言處理研究的人,貶低到了一文不值的程度,對於基於規則的自然語言處理,採取嗤之以鼻的態度。、Viterbi算法、A*搜索算法、雙向搜索算法、加權自動機、支持向量機等有限狀態轉移網絡、有限狀態轉錄機、遞歸轉移網絡、擴充轉移網絡、短語語法結構、自底向上剖析、自頂向下剖析、左角分析法、Earley算法、CYK算法、富田算法、複雜特徵分析法、合一算法、依存算法、一階謂詞演算、語義網絡、框架網絡等基於統計的自然語言處理的理論基礎是哲學中的經驗主義,基於規則的自然語言處理的理論基礎是哲學中的理性主義
  • 如何用深度學習做自然語言處理?這裡有份最佳實踐清單
    對於如何使用深度學習進行自然語言處理,本文作者 Sebastian Ruder 給出了一份詳細的最佳實踐清單,不僅包括與大多數 NLP 任務相關的最佳實踐,還有最常見任務的最佳實踐,尤其是分類、序列標註、自然語言生成和神經機器翻譯。作者對最佳實踐的選擇很嚴格,只有被證明在至少兩個獨立的群體中有益的實踐才會入選,並且每個最佳實踐作者至少給出兩個參引。
  • 書單| 精神分析動力學Ⅰ:基礎入門的理論及實踐
    本書不但對精神病學、心理學和社工專業的學生來說是必讀之作,還能為已經在從事臨床工作的人士提供思考個案概念化過程的全新視角。作為數十個美國臨床心理學和精神科醫學培訓項目的指定用書,這本精神分析取向心理治療的教材以其在「實用主義」和「循證實踐」方面的優勢和特點贏得了無數的好評和矚目的銷量,為精神分析思想的傳承和發展打開了一扇新的大門。