一本開源的NLP入門書籍

2021-02-13 漢語堂

作者 | duoergun0729 

Github:https://github.com/duoergun0729/nlp

NLP基礎知識

NLP應用案例

對美食評語進行情感分析

https://github.com/duoergun0729/nlp/blob/master/%E9%A2%84%E6%B5%8BYelp%E7%BE%8E%E9%A3%9F%E8%AF%84%E5%88%86.md

讓機器理解文字

圖像、文字和聲音是人類接觸、理解外部世界最常見的三種形式,其中文字又是最容易保存和進行交換的形式。大量的人類文明,最終都是以文字的形式保留下來的;大量的信息交換,都是是文字的形式進行。如何能讓機器可以與人交流,理解人類的思想,最終能像人類一樣理解文字以及文字背後的各種想法、意圖呢?自然語言處理,即所謂的NLP是重要的支撐技術。

NLP與安全

在傳統的web攻防中,大家與http協議結下了不解之緣。但是在安全領域,web攻防只是很小一個分支。許多明顯的與工作和生活無關的垃圾郵件,人一樣就可以看出來,但是基於規則的垃圾郵件網關處理起來卻總是差強人意。越來越多的電商、論壇甚至是視頻網站的彈幕,總是可以看到明顯的人身攻擊或者違法違規信息,但是基於規則的過濾機制總是被繞過。人類可以很輕鬆的理解二十四口交換機,知道蘋果是水果還是手機,但是機器如何做到呢?答案就是NLP。

一本開源的NLP入門書籍

作者:

這可能是第一本用開源的思想寫的NLP入門書籍,整個寫作過程都在我的Github上。

https://github.com/duoergun0729/nlp

之所以想用開源的思路去寫,主要是因為NLP技術,尤其是基於機器學習的NLP技術發展非常快,比如目前已經廣泛使用的fasttext技術,2016年發布論文,2017年已經進入大量生產領域,但是許多自然語言處理書籍還停留在大學課程的範圍,甚至連詞向量都很少涉及。相對周期繁瑣的紙質書籍編寫,在Github上我可以很方便的進行編寫和更新,有勘誤也可以很快修改。目前我已經完成了其中的三篇,後面我將不斷更新內容。

-END-

相關焦點

  • PaddleNLP:工業級中文NLP開源工具集
    為了適應全面豐富的NLP任務,方便更多開發者靈活插拔嘗試多種網絡結構,並且讓應用最快速達到工業級效果,今年4月23日,百度正式開放了工業級中文NLP工具與預訓練模型集——PaddleNLP(nlp.baidu.com/homepage/nlptools)。
  • 乾貨 | NLP、知識圖譜教程、書籍、網站、工具...(附資源連結)
    書籍註:Steven Bird,愛丁堡大學博士,墨爾本大學副教授。 包括52nlp、rickjin、liwei等國內外華人大牛.http://www.52nlp.cn/實戰課程:自己動手做聊天機器人http://www.shareditor.com/bloglistbytag/?
  • PaddleNLP:工業級中文 NLP 開源工具集
    今年4月23日,百度正式開放了工業級中文 NLP 工具與預訓練模型集——PaddleNLP(nlp.baidu.com/homepage/nlptools)PaddleNLP 將自然語言處理領域的多種模型用一套共享骨架代碼實現,可大大減少開發者在開發過程中的重複工作。
  • NLP神器 spacy 入門教程
    spaCy入門如果你對spaCy還不熟悉,你應該注意以下幾點:讓我們詳細討論一下每一個問題。spaCy的統計模型這些模型是spaCy的核心。讓我演示如何創建nlp對象:import spacynlp = spacy.load('en_core_web_sm')# 創建nlp對象doc = nlp("He went to play basketball")
  • 贈書:8本NLP書籍任你選
    很久沒有關注中文NLP書籍,思維還停留在老早之前的印象。
  • 資料收集整理書籍(一)
    ://github.com/lancopku/PKUSeg-python py3,北大中文分詞·https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes 吳恩達機器學習 python 筆記·https://paperswithcode.com/sota 機器學習具體項目、演示、代碼·https://github.com/duoergun0729/nlp
  • 對入門Java幫助會很大的3本書籍!
    下面分享在學習Java過程中看過的一些幫助比較大的Java入門書籍。
  • 四本黑客入門書籍推薦
    黑客入門必讀書籍推薦二——Python灰帽子:黑客與逆向工程師的Python編程之道
  • Python 從入門到進階經典書籍,你看過幾本?
    那麼今天就來給大夥說道說道,我會劃分為以下幾個分類,讓不同階段的朋友可以根據自身的情況,選擇適合自己當下學習的 Python 書籍:Python 初學入門階段可以看的書籍Python 進階階段可以看的書籍Python 數據分析可以看的書籍Python web 開發可以看的書籍Python GUI 開發可以看的書籍Python
  • Android 入門書籍推薦
    在這 13 年中,隨著移動開發的不斷發展,越來越多的開發者出版書籍分享自己的經驗。相信很多想入門 Android 的新手們都有個困惑,市面上那麼多入門書籍,究竟看哪一本入門比較好呢?我從事 Android 開發已經有 7 年了,當年我入門學習 Android 時,也有這個困惑。不過那時 Android 才剛剛開始發展,有關 Android 的書籍還很少,而且能找到的資料也不多。
  • 12本深度學習書籍推薦:有入門,有深度
    推薦 12 本能幫助你從零開始學習深度學習的書籍。本文推薦的這些書每一本都有自己的優點,以下這些圖書我按照個人推薦進行了排序。大家可以根據介紹,選擇適合自己的書來讀。第二本書是《深度學習》,這也可能是這份書單中最全面最完整的一本書。
  • Go語言相關書籍推薦(從入門到放棄)
    前言最近總有讀者問我可不可以推薦一下go語言入門必讀書籍。所以今天就推薦幾本。
  • AI大牛推薦的八本必讀NLP書籍(建議收藏)
    自然語言處理是一門融語言學、計算機科學、數學於一體的科學。今天小編精心挑選了AI大牛推薦的八本NLP書籍,八本書帶你快速入門自然語言處理,助你早日成為頂級NLP工程師!本書致力於總體介紹自然語言處理領域中的一些概念、術語、應用任務、算法和技術、系統搭建方法等,非常適合作為對自然語言處理任務感興趣的初學者進入該領域的入門書籍。
  • 每周贈書 | 五本NLP書籍,從入門到進階都齊了
    本書將探索如何使用諸如全文本搜索、專有名稱識別、聚類、標記、信息提取、匯總等方法自主組織文本。書中涵蓋了NLP的概念,即使沒有統計或自然語言處理背景的人也可以理解它。評 論 贈 書平常除了技術書,你還會看什麼書?哪一本是你極力推薦的?
  • 經典合集| NLP領域4本必讀書籍pdf免費分享
    今天圖靈君就給大家整理了幾本NLP領域的經典書籍,覆蓋NLP諸多核心技術與應用場景。PS,文末有驚喜,快來看一下吧~自然語言處理領域經典綜述教材《Speech and Language Processing 》,中文名《自然語言處理綜述》。該書由NLP領域的大牛,史丹福大學 Daniel Jurafsky教授和科羅拉多大學的 James H.
  • 推薦8本python經典書籍-部分可下載
    《Python編程:從入門到實踐》從編程小白的角度看,入門極佳。手把手教的感覺,卻絕不囉嗦。什麼叫入門書?一本書讀下來,行文上不卡殼,邏輯上不跳躍,讀者如爬樓梯,一步一步即可登樓。  《Head First Python》Head First 系列的書籍一直飽受讚譽,這本也不例外。Head First Python主要講述了Python 3的基礎語法知識以及如何使用Python快速地進行Web、手機上的開發。本書將提供一個完整的學習體驗,幫助你迅速成為一名Python程式設計師。
  • 入門理財書籍推薦
    最近有童鞋問起,玲玲老師有啥入門的理財書籍推薦,在這整理一篇供大家參考。 現在市面上關於理財的書籍林林總總,打開電商的圖書頻道,輸入「投資」和「理財」這兩個關鍵詞,都能呈現鋪天蓋地的內容,排序靠前的推薦書目一定有《聰明的投資者》、《證券分析》、《窮查理寶典》、《巴菲特致股東的信》等等。
  • 【NLP】競賽必備的NLP庫
    import spacynlp = spacy.load("en_core_web_sm")text = ("When Sebastian Thrun started working on self-driving cars at " "Google in 2007, few people outside of the
  • 通過開源書籍學習 Ruby 編程
    這篇文章有 9 本很優秀的推薦書籍,有針對包括初學者、中級程式設計師和高級程式設計師的書籍。當然,所有的書籍都是在開源許可下發布的。這篇文章是 OSSBlog 的系列文章開源編程書籍[1]的一部分。◈ 理解代碼如何出錯以及為什麼會出錯,闡述如何處理日誌記錄本書為開源書籍,在 CC NC-SA 許可證下發布。在此下載《Ruby Best Practices》[3]。《I Love Ruby[4]》
  • 谷歌開源NLP模型可視化工具LIT,模型訓練不再「黑箱」
    假如有一款可視化的工具,能夠幫助研究人員更好地理解模型行為,這應該是件非常棒的事。近日,Google 研究人員發布了一款語言可解釋性工具 (Language Interpretability Tool, LIT),這是一個開源平臺,用於可視化和理解自然語言處理模型。LIT 重點關注模型行為的核心問題,包括:為什麼模型做出這樣的預測?什麼時候性能不佳?在輸入變化可控的情況下會發生什麼?