想快速入門NLP?我們測評了15門最火課程,幫你找到最適合的

2021-01-13 大數據文摘

大數據文摘出品

來源:airev

編譯:DD、Andy

數年前,當小編剛踏足NLP領域時,還沒有太多相關課程,找學習資料就頗費功夫;如今,當網上充斥著各種良莠不齊公開課時,從中挑選一門適合自己的又成了另一種頗費功夫,特別對於選擇困難綜合症患者。

該篇作者根據自己多年的實踐經驗,對網上諸多NLP公開課進行了評分與評論,很有參考價值。此外,作為涉足NLP也有數年的小編,也推薦不妨先挑一門Code-first課,強推Fast.AI,之後再用大學公開課繼續深入,比如伯克利的Info256 以及斯坦福有名的cs224n,之後想再深入理論可以試試CMU的cs11-747.

接下來,我們就來看看作者對15節NLP課程的測評~

如果你的標準很高,那麼選擇一門符合你需求的網課就會變成了一件很困難的事。因為大部分網課都不全面,並不值得花太多時間在上面。

那麼如果有人給你提供了一個關鍵的學習路徑,並告訴你每個模塊講了什麼,你該按照什麼樣的順序去學習、進階,你會怎麼想?那一定是——完美!

這就是為什麼我會寫這篇NLP選課指南,利用了我8年的機器學習實踐經驗作為參考。我個人一共完成或瀏覽了15個最有名的課。在下面這份嚴格的評論中,我將重點放在它們提供的實踐以及商業知識上。

無論你是剛開始接觸NLP還是想在業務中實現一個最新算法,這篇文章都將為你提供巨大價值。下面就來看一下這條學習路徑,並挑你最感興趣的課程吧!

我理想中的NLP課程是這樣的:

圍繞著實踐問題展開的;只涵蓋對實踐有用的信息,夾雜一些更深入的理論知識作為補充資料;內容是與時俱進的,至少每次業界有重大新聞,它都能及時更新相應內容;由一群業界經驗豐富的專家編寫的;包含能解決業務實際問題的真實代碼。

但理想很豐滿,現實……很骨感。

代碼至上的網課們

A Code-First Introduction to NLP course

課程連結:

https://github.com/fastai/course-nlp

授課人:Fast AI

專業評分:8/10

工具和庫:IPython notebooks, PyTorch, Fast.AI, spacy, sklearn, nltk

我的建議:

我個人很享受這種由上而下的學習方式。這門課內容非常紮實(毫無疑問,這是Jeremy Howard本人創建的課程),它很實用且內容在新算法的更新上很及時(最近更新到2019年夏天)。

缺點:

它缺少一些業界的實操案例,只關心算法的實際用法。

強推這門課!

SpaCy Tutorial

課程連結:

https://github.com/yuibi/spacy_tutorial

授課人:Yuibi Fujimoto

專業評分:7/10

工具和庫:spacy,prodigy,sklearn

我的建議:

很完整、實用的指南。它只涉及到了spacy,而這也是很多人的真實需求。這門課對內容細節的把握非常到位。

Natural Language Processing

課程連結:

https://github.com/yandexdataschool/nlp_course/tree/master

授課人:Yandex

專業評分:7/10

工具和庫:keras,nltk,gensim,sklearn,bokeh,matplotlib

我的建議:

這是一門很新的實戰課程,它涉及到了最重要的一些領域。但同樣地,它也沒有涉及到現實任務的實戰,只是專注於算法原理和它們直接的應用。

Natural Language Processing

課程連結:

https://www.coursera.org/learn/language-processing

授課人:俄羅斯國立高等經濟大學計算機系(HSE Faculty of Computer Science) / Yandex

專業評分:3/10

工具和庫: nltk, sklearn, tensorflow, genism,starspace

我的建議:

這是一門很簡潔、基礎的課程,它只涉及到一些很基礎的理論。

缺點:

這門課不是很全面,也缺乏關於最新算法和實際業務案例內容。而且,它只使用tensorflow,沒有涉及到keras,對於學習深度學習來說,這並不是一個很好的方式。

Advanced NLP with spaCy

課程連結:

https://course.spacy.io/en/

授課人:Explosion AI

專業評分:8/10

工具和庫:spacy

我的建議:

這門課也只涉及到spacy,但是範圍更廣。它簡單友好的操作界面深得我心。簡短,但強推的一門課!在評分項目中,也有涉及到業界實操的內容!

Coursera-Natural Language Processing Certification in TensorFlow

課程連結:

https://www.coursera.org/learn/natural-language-processing-tensorflow

授課人:Laurence Moroney

專業評分:2/10

工具和庫:Tensorflow

我的建議:

這門簡短的課程介紹了一些基礎知識,比如:分詞、一些基礎的詞嵌入方法和序列模型。授課方式是理論+小測驗。對新手來說,我並不推薦這門課程,因為它缺少太多內容。

Edx-Natural Language Processing Course

課程連結:

http://www.edx.org/course/natural-language-processing-nlp-2

授課方:微軟

專業評分:7/10

我的建議:

這門課程介紹了機器學習和NLP領域中可使用的各種方法,你不光能學到經典算法、深度學習算法,還能了解到深度情感相似模型以及在現實工作中如何使用它們。每個模塊都有自己的測驗和代碼作業,可以很好地幫助你理解學到的內容。

Codecademy-Natural Language Processing

課程連結:

https://www.codecademy.com/learn/natural-language-processing

專業評分:5/10

工具和庫:nltk, re

我的建議:

這門課時長約10小時,算是NLP入門級別的課程,內容包含:正則表達式、文本處理、詞向量、tf-idf。是一門更適合完全沒有NLP基礎的人的課程。

DataCamp-Natural Language Processing Fundamentals in Python

課程連結:

https://www.datacamp.com/courses/natural-language-processing-fundamentals-in-python

授課人:Katharine Jarmul

專業評分:7/10

工具和庫:nltk, re, genism, polyglot, spacy, sklearn

我的建議:

這門課主要講的是如何解決一些小問題。它介紹了一些生成詞向量和預處理的技巧,像tf-idf和spacy。我認為這也是一門比較適合剛入門、需要一些實戰經驗的新手課程。因此我們決定在最後的對比中不把它加入比較。

大學公開課

伯克利 - Applied Natural Language Processing

課程連結:

http://people.ischool.berkeley.edu/~dbamman/info256.html

授課人:David Bamman

專業評分:8/10

我的建議:

這門課比較適合有python編程經驗,但不了解nlp的人。在這門課中,你會用到目前流行的python庫,如:sklearn、keras、spacy,去解決分類、回歸問題。我認為,這種強制性的學期制課程比較適合學生黨學習。

華盛頓大學(UW) - Natural Language Processing

課程連結:

https://courses.cs.washington.edu/courses/cse517/17wi/

授課人:Yejin Choi

專業評分:6/10

我的建議:

這門課面向的是想學習nlp基礎方法理論的新手。這門網課是在2017年錄製的,所以你無法從裡面找到任何現在最新的內容。它涉及到的當時(2017)最新的內容有:序列、語義和深度學習相關內容。但我認為,學這門課的人需要在課後有自己的探索和研究,去鞏固學到的知識。

牛津 - Deep Learning for Natural Language Processing

課程連結:

https://www.cs.ox.ac.uk/teaching/courses/2016-2017/dl/

授課人:Phil Blunsom

專業評分:8/10

我的建議:

這門課需要你有機器學習方面的經驗,以及很強的數學背景(包括:概率、線性代數和連續數學)。你將會學到從RNN、BPTT到針對神經網絡優化GPU的很多知識和技能。我建議學完這門課的學生再去學習一下最新的模型和理論,因為它並沒有實時更新相關內容。

以色列特拉維夫大學 - Advanced Methods in Natural Language Processing

課程連結:

https://www.cs.tau.ac.il/~joberant/teaching/nlp_spring_2019/index.html

授課人:Jonathan Berant

專業評分:7/10

我的建議:

這門課教授的是NLP領域中最新的一些方法。它只需要你有一定的機器學習背景,nlp背景並不是必須的。而且,授課方準備了很多值得閱讀的報告,這也非常有助於學習。

斯坦福 - From Languages to Information

課程連結:

https://web.stanford.edu/class/cs124/

授課人:Dan Jurafsky

專業評分:6/10

我的建議:

雖然這是門NLP課程,但它也涉及到很多機器學習方面的內容。其中,關於社交網絡的內容在其他網課中並沒有很好地展開,可以算是這門課的一個亮點。通過這門課,你可以收穫很廣的知識面,但對於只鑽研nlp的人來說,我並不是很推薦這門課。

斯坦福cs224n - Natural Language Processing with Deep Learning

課程連結:

http://web.stanford.edu/class/cs224n/

授課人:Chris Manning, Matthew Lamm

專業評分:8/10

我的建議:

這是面向項目的最新課程,包括這個領域的最新進展。要上這門課,你需要有數學和編程的基礎(Python或強大的C++能力)。我只會推薦有一定經驗的人去上這門課,你會從中學到更深入的知識。

總結

在分析完所有課程後,我得出的結論是:在最新的算法和企業項目實例方面,沒有任何一門課是足夠全面的。它們大部分都缺少實戰練習,而這大大地阻礙了知識的吸收。

現在,讓我們來總結一下工程師在學習一門NLP課程時遇到的主要挑戰:

課程內容很快就會過時,我希望它始終包含最新(不一定是複雜的)知識;沒有或過少的實踐練習來增強在課程中學到的理論知識;如果卡住,沒有人能幫助你進行練習;課程以算法原理為重點,而不是如何解決實際問題。

許多不合標準的課程甚至都已不再更新。人們掉入了坑中並為此付出代價,卻沒有從中收穫太多實際價值。

相關報導:

https://airev.us/ultimate-guide-to-natural-language-processing-courses/

相關焦點

  • 大學裡最難學的4門課程,你也掛科了嗎?
    最近,一則山東大學數學系大三學生期末考試,抽象代數這門課程竟然有一半以上學生成績不及格的新聞迅速火遍了網絡。抽象代數作為數學專業最難的課程之一,已經成為了很多數學系學生的噩夢。對於這件事,很多人都發表了自己的看法。
  • 傳說中大學最難的幾門課程
    但是你知道我們選的專業到底是幹什麼的嗎?這門專業需要學一些什麼東西呢?學起來枯不枯燥?我們會不會後悔呢?今天小編就來帶領大家提前進入大學的課堂,認識認識這傳說中在大學裡最難的幾門課程。   藥理學   pharmacology   屬於藥學類的課程,各專業都有設置這門課程。
  • 這套1600贊的NLP課程已開放,面向實戰,視頻代碼都有丨資源
    這套課程內容包括主題建模、情緒分類,語言建模和翻譯等,是舊金山大學今年春天的最新碩士課程,此前已經有300多名學生上過此課並畢業。裡面融合了此前經典NLP課程的基礎內容,比如正則表達、SVD、樸素貝葉斯,還加入了最近興起的神經網絡中新方法,比如RNN、seq2seq、注意力機制和Transformer架構。
  • 盤點美國領先在線教育平臺2017最受喜愛的課程,2018年趨勢如何?
    史丹福大學的「數學思想概論」是Coursera 2017年榜單上的第四名,而密西根大學的「 Python入門」排名第六,普林斯頓大學的「算法,第一部分」排名第七。 Udacity和edX也觀察到類似的趨勢。EdX是一家非營利組織,提供來自包括哈佛和麻省理工學院在內的100多個機構的免費在線課程,其中有7門課程涉及計算機科學和編程、數據分析或人工智慧。
  • NLP入門+實戰必讀:一文教會你最常見的10種自然語言處理技術
    在它的幫助下,我們從文本中提煉出適用於計算機算法的信息。從自動翻譯、文本分類到情緒分析,自然語言處理成為所有數據科學家的必備技能之一。在這篇文章中,你將學習到最常見的10個NLP任務,以及相關資源和代碼。為什麼要寫這篇文章?
  • 大學裡最難的10門課程,學霸都差點掛科!
    二、音韻學這門課中最難的就是學古人說話,聽古語。如果你是真心喜歡這門學問的,喜歡古人古事,未來還可以讀研深入研究。三、固體物理這門課程從原創科學家的思想出發,介紹固體物理學中主要的概念、實驗和理論,其中包括了固體物理學史、化學鍵與晶體形成、固體結構、晶體振動和固體熱性質、固體電子理論、固體的電性質(輸運過程)、固體的磁性、固體的介電性質和光學性質等內容。材料類都得學,傳說中清華材料學院的神課,考試平均分都不超過他的體溫。
  • 最適合兒童的程式語言 - Python
    所以在需要找到Scratch圖形編程到高級語言圖形編程的過渡,Python就是最適合的程式語言。首先讓我們一起聊聊為什麼開始學習Python?對於開展STEAM教育,Scratch圖形編程是最適合的方式之一。低齡的小朋友在接受和掌握一門語言上難度過大,對數理邏輯也是處於認知階段。所以採用圖形動畫和聲音的互動方式的教授學習效果最為合適。Scratch圖形編程體現在簡單的編程邏輯體驗和入門,針對的一般是小學及以下階段的學生。
  • 作業幫鴨鴨英語怎麼樣,買課的老母親這樣說!
    作業幫鴨鴨英語怎麼樣,買課的老母親這樣說!和家長站在一起,幫你選機構反套路,分享乾貨深測評~ 不知道家長們有沒有發現,現在市面上出現了越來越多AI錄播課程。相比較直播課來說,AI錄播課確實是缺少了互動性,但是對於初學英語的孩子,或者英語基礎較為薄弱的孩子來說,AI錄播課還是存在著一定的優勢。 今天這篇文章,熊爸就給大家測評一下作業幫鴨鴨英語APP,來一起看看鴨鴨ai課靠譜嗎,課程是否值得家長夠買。
  • 最全!2019 年 NLP 領域都發生了哪些大事件?
    它讓許多自然語言處理從業人員和研究者們可以輕鬆地使用最先進的通用框架(例如,BERT、GPT-2 和 XLM 等)。Mathpix 工具可以讓你拍攝一個公式的照片,然後自動幫你升恆該公式的 Latex 代碼。
  • 哈佛大學心理學教授推薦書單:最適合自學的入門心理學
    哈佛大學心理學教授推薦書單:大學入門級心理學沒你想的那麼難說起心理學,相信日常生活中的我們大多數人都略知一二,但是具體心理學是什麼,可是誰都說不上來,總覺得是高大上非常高深的東西,而今天小編帶給大家的是,哈佛大學心理學教授推薦書單:入門級心理學沒你想的那麼難,讓我們一起來看看入門級心理學都是在講一些什麼事情。
  • 英語啟蒙APP測評?
    我憑著多年攢下的經驗,開始了課程調研之路。機構課程測評、雞娃心得交流、學習規劃建議,歡迎加涵爸唯一微信諮詢:【hanba2014】( 為方便我及時通過好友申請,請備註「涵爸微信」。一些家長給涵爸看了他們手機裡的英語app,多到能去做英語測評。但是,app多的同時,家長在給孩子選擇的時候,就產生了更大的焦慮。這麼多機構,到底該選哪個呢?今天涵爸就來測評一下在網上褒貶不一的寶寶玩英語(成長兔英語)啟蒙app,從5個維度看看它到底適不適合你家孩子。
  • 想入門人工智慧? 這些優質的 AI 資源絕對不要錯過
    隨著市場對AI人才的需求不斷增長,許多機構都開始提供相應的培訓課程,而且價格和質量各不相同。與其他所有學習一樣,在投入大量精力和金錢後,你當然不希望發現浪費了時間卻沒學到應獲得的技能。那麼對於想入門人工智慧的人群來說,應該從哪兒開始呢?本文列出了一些優質AI學習資源。希望在閱讀本文後,能幫助你順利開啟AI學習之旅。
  • 年薪30W+,易學懂的人卻很少,最近這個職業火了……
    關鍵的是還比較容易入門,傳統視覺從業者就算沒有理論基礎,也很快就能夠掌握。 深度學習作為機器學習的一個分支,是機器學習的關鍵技術之一。兩者都同屬於人工智慧的範疇,但深度學習是基於仿生學,是目前最像人類的人工智慧技術。因此,深度學習行業崗位能夠在短時間內迅速火起來,小編一點都不覺得意外。
  • 選機器學習課程怕踩雷?有人幫你選出了top 5優質課
    選自Medium作者:LearnDataSci機器之心編譯本文作者在多年研究在線學習圖景、在不同平臺註冊大量機器學習課程後,收集了目前最好的 5 門機器學習課程。機器學習根植於統計學,正在逐漸成為最有趣、發展最快的計算機科學領域之一。機器學習可應用到無數行業和應用中,使其更加高效和智能。
  • 0基礎新手電工如何快速入門?電工快速入門方法
    前提是,你必須對電氣有濃厚的興趣愛好,這樣進步就很快了。現在電氣自動化發展很快,設備淘汰更新也很快,你今天掌握的技術,很可能明天就用不上了,所以,要不斷的學習。英語基礎要好,否則將來你接觸進口設備維護,編程,包括各種軟體的使用都很不方便的。
  • 【超全資源】自然語言處理(NLP)入門學習資源清單(部分資料下載)
    &model=en&cpu=1&cph=0 記得我曾經讀到過這樣一段話,如果你覺得有必要回答兩次同樣的問題,那就把答案發到博客上,這可能是一個好主意。根據這一原則,也為了節省回答問題的時間,我在這裡給出該問題的標準問法:「我的背景是研究**科學,我對學習NLP很有興趣。應該從哪說起呢?」
  • 那些火遍b站的神曲測評:適不適合跳廣場舞(上)
    而它的孿生姐妹《桃源戀歌》,則更是被人跟《最炫民族風》唱串了曲。難道二十年後我們真的要伴隨著這些音樂跳廣場舞嗎?為了探究一下二十年後的我會不會在別人的籃球場上跳蝴蝶步這個嚴肅的問題。我特地做了一次【業餘的】測評,來看看像《極樂淨土》等火遍b站的歌曲,會不會出現在二十年後的拉杆箱低音炮裡。
  • 這是23門全世界最好的計算機科學課程
    如果你或者你的朋友想要學習相關課程,這一列表是一個不錯的參考,歡迎收藏轉發~1、Python交互程序設計入門(第 1 部分)來自萊斯大學,Coursera在這門課程中,介紹了編程的基本元素(如表達式、條件和函數) ,然後使用這些元素來創建簡單的交互式應用程式,如數字秒表。
  • 亞馬遜最全資料庫,你想知道的都在這裡
    洪應明的《菜根譚》中有句話很適合描寫佛系亞馬遜賣家們的心情:「寵辱不驚,看庭前花開花落;去留無意,望天上雲捲雲舒」。人到世上走一遭,為的就是開心。不驕不躁,不把流量、銷量看得太重也沒什麼不好。但即便再佛系,我們做亞馬遜最終的目的也是為了賺錢,敲敲木魚又變不出人民幣,是吧?不出單, 佛系的我們不埋怨,花些時間來學習還是可以有的。
  • 阿卡索的彩虹互動英語課程怎麼樣?這篇超詳細測評奉上
    阿卡索的課程受眾也非常廣,基本上從英語啟蒙到少兒英語再到成人英語都有涉及,由於內容比較多,無法一篇文章中說完,之前我測評過阿卡索少兒英語的《魔法英語》課程,這次接著來測評《彩虹互動英語》課程,家長可以對比選擇。