這套1600贊的NLP課程已開放,面向實戰,視頻代碼都有丨資源

2021-01-13 量子位

銅靈 發自 凹非寺量子位 出品 | 公眾號 QbitAI

紙上得來終覺淺,決勝NLP要躬行。

一套面向實戰、號稱「代碼優先」的NLP課程來了,名字為A Code-First Introduction to Natural Language Processing,fast.ai出品,全程免費學習。

不到半天點讚超過1600,轉發近500。

這套課程內容包括主題建模、情緒分類,語言建模和翻譯等,是舊金山大學今年春天的最新碩士課程,此前已經有300多名學生上過此課並畢業。

裡面融合了此前經典NLP課程的基礎內容,比如正則表達、SVD、樸素貝葉斯,還加入了最近興起的神經網絡中新方法,比如RNN、seq2seq、注意力機制和Transformer架構。

還加上了對道德問題、偏見問題和虛假信息可能帶來的影響。

既然偏向實戰,那代碼必須全。這套課程用的是PyTorch和fast.a庫所有的Python代碼都在Jupyter Notebook中,還有全套視頻與你為伴。

服用指南

直接看課程裡面有什麼乾貨。

1、概覽

什麼是NLP

2、傳統NLP方法

佔整個課程三分之一的篇幅,介紹了使用SVD進行主題建模,通過樸素貝葉斯和邏輯回歸、以及正則表達式進行情感分類。

3、深度學習:NLP中的遷移學習

NLP中的遷移學習涉及到在大型語料庫上訓練語言模型,並且對不同的小語料庫進行微調等。

這項工作已經被BERT、GPT-2和XLNet等模型採用,在這一節中,主要分享了構建英語以外其他語言模型的技巧,包括用ULMFit建立越南語和土耳其語語言模型的技巧。

4、深度學習:Seq2Seq翻譯和Transformer架構

這一節研究了簡單RNN如何工作的細節,還介紹了用於翻譯的Seq2Seq模型。

從建立翻譯模型,到teacher forcing方法、注意力機制以及GRU等方法提高準確率。

最後介紹了Transformer架構的實現。

5、NLP的倫理問題

倫理問題及潛在的風險是作者重點推薦的一節。

在OpenAI的GPT-2語言模型問世後,翻譯、閱讀理解、回答問題等任務都能做到以假亂真,讓不少群眾開始慌張。

這一節給出了解決方法和建議步驟,如驗證系統和數字籤名等。

每節課都有視頻,每個視頻長度在20-90分鐘之間。

側重實踐

這門課背後的fast.ai,在深度學習界算是獨樹一幟。

fast.ai由Kaggle大神Jeremy Howard、後悔讀了博的數學博士Rachel Thomas、原本在巴黎教了7年書的Sylvain Gugger聯合創辦。

他們是真正的實踐派,課程以「教實用的東西、高效解決問題」為核心追求,非常重視工程實現細節。

在去年發布更基礎的「程式設計師的機器學習入門」課時,他們讚揚了吳恩達老師的入門課worderful之後就接了個「但是」:但是,它現在有顯得太老氣了,特別是作業還得拿Matlab寫。

fast.ai的課程就非常緊跟程式設計師的實踐潮流,用Python編程,用交互式的Jupyter Notebooks學習。

同時,他們也非常鼓勵學生去參加Kaggle競賽,檢驗自己的能力。

這套NLP新課,也是同樣的思路了。

傳送門

課程首頁:

https://www.fast.ai/2019/07/08/fastai-nlp/

GitHub上有課程所需的所有代碼:

https://github.com/fastai/course-nlp

Fast.ai庫:

https://docs.fast.ai/

相關焦點

  • 【重磅AI課程】京東NLP企業項目實戰訓練營
    AI項目資源,從實戰中提升自己。京東NLP企業項目實戰訓練營首期班正式定檔啦,6月1日不見不散!一門專注於培養行業TOP10%NLP工程師的高級課程,已收錄:Seq2Seq、Distillation、Transformer、XLNet、ALBERT等前沿框架實戰;教學內容出自於京東智聯雲3大AI項目數據;科研團隊由AI科學家、博導級人士組成;優秀學員畢業後可享受京東AI內推綠色通道!
  • 「重磅AI課程」京東NLP企業項目實戰訓練營
    基於先進的AI技術和強大項目實戰能力,為培養更多專業人工智慧人才,京東經過長時間打磨麵向大眾學員推出「真企業級項目實戰訓練營」,讓每一位學員切切實實接觸到企業級的AI項目資源,從實戰中提升自己。京東NLP企業項目實戰訓練營首期班正式定檔啦,6月1日不見不散!
  • 想快速入門NLP?我們測評了15門最火課程,幫你找到最適合的
    我理想中的NLP課程是這樣的:圍繞著實踐問題展開的;只涵蓋對實踐有用的信息,夾雜一些更深入的理論知識作為補充資料;內容是與時俱進的,至少每次業界有重大新聞,它都能及時更新相應內容;由一群業界經驗豐富的專家編寫的;包含能解決業務實際問題的真實代碼。但理想很豐滿,現實……很骨感。
  • 戰疫情丨西工大77個在線開放課程和虛擬仿真實驗教學資源面向社會...
    西北工業大學堅決響應國家號召,積極承擔社會責任,決定將學校國家級/陝西省精品在線開放課程、校級建設的在線開放課程以及虛擬仿真實驗教學資源面向各大高校和全社會全部免費開放使用,為在抗擊疫情的同時做到「延期不延教、停課不停學」提供支持。現有共77個線上共享課程資源和虛擬仿真實驗教學資源,面向各大高校和全社會開放使用。
  • ...工大77個在線開放課程和虛擬仿真實驗教學資源面向社會全部免費...
    西北工業大學堅決響應國家號召,積極承擔社會責任,決定將學校國家級/陝西省精品在線開放課程、校級建設的在線開放課程以及虛擬仿真實驗教學資源面向各大高校和全社會全部免費開放使用,為在抗擊疫情的同時做到「延期不延教、停課不停學」提供支持。現有共77個線上共享課程資源和虛擬仿真實驗教學資源,面向各大高校和全社會開放使用。
  • 資源| 史丹福大學NLP組開放神經機器翻譯代碼庫(附論文)
    )Minh-Thang Luong(斯坦福博士,Google Brain 研究科學家)Abigail See(史丹福大學計算機科學在讀博士)Hieu Pham代碼庫對於混合 NMT(hybrid NMT),請使用這個代碼庫並且引用:代碼庫:https://github.com/lmthang/nmt.hybrid論文:使用混合詞-字符模型實現開放詞彙神經機器翻譯
  • 免費開放1600多門慕課課程!清華大學直播課程吸引五萬人觀看
    免費開放1600多門慕課課程!多門慕課課程免費向社會開放。課程主要內容有兩部分:清華大學黨委書記陳旭介紹清華防控疫情工作開展情況;清華大學校長邱勇介紹疫情防控期間教學安排調整及相關工作。在直播中,清華大學校長表示,清華大學負責的1600多門慕課課程將會免費向全社會開放,另外還有2000多門課程會用雨課堂的形式推介,還將建立雨課堂「克隆班」,為其他學校的師生提供相應技術支持。
  • 單細胞數據挖掘與課題設計實戰課程
    下一個機會正在開放給有準備的人 但必須要考慮的兩個問題: 1. 有經費基礎如何最大化利用資源取得項目產出; 2.
  • 北京大學化身「充電寶」 公開課程資源大放送
    線上教學的開展,為日常學習開闢了一片新天地,原本內部的課堂面向社會開放,優質的線上資源、開放的學習平臺、共享的名師課堂……原來北大有這麼多之前都不知道的公開課資源!除了本校以外,還有來自全國各地的456所學校在疫情期間引用了北大慕課作為本校SPOC,開課班次多達1600餘次,選課人數逾24萬人次。以下我們精選每個學科門類的代表課程略作展示,更多課程資源等待大家親自挖掘,一起打開這塊「超大容量充電寶」!
  • 【超全資源】自然語言處理(NLP)入門學習資源清單(部分資料下載)
    &model=en&cpu=1&cph=0 記得我曾經讀到過這樣一段話,如果你覺得有必要回答兩次同樣的問題,那就把答案發到博客上,這可能是一個好主意。根據這一原則,也為了節省回答問題的時間,我在這裡給出該問題的標準問法:「我的背景是研究**科學,我對學習NLP很有興趣。應該從哪說起呢?」
  • 重磅發布 | 牛津大學Deep NLP深度自然語言處理課程17年最新(漢化視頻)
    去年,大數據文摘獲得授權並完成了李飛飛教授史丹福大學CS231N課程視頻的漢化斯坦福《CS231n深度學習與計算機視覺課》(戳標題查看),該課程目前在網易雲課堂有超過4萬人學習,並且好評不斷。大數據文摘視頻團隊在今年又獲得重磅資源,牛津大學深度學習與自然語言處理課程(Deep NLP)!大數據文摘已聯繫課程主講人取得翻譯授權,並聯合北京郵電大學模式識別實驗室組織了視頻漢化,免費發布。 所以大家可以看到中文字幕了!開不開心!
  • 66所高校線上授課,清華大學課程向社會免費開放!
    1600多門慕課課程。在抗「疫」過程中,北大以高度的社會責任感,動員學術資源、利用技術優勢,向社會開放大量學術教育資源。 思政課通過「思政雲課堂」全面開展線上教學,提供思政課精講、重難點解析、專題講解等視頻課程,以及教學課件、測試題庫等豐富的教學資源、學習資源,並且提供全流程的教學互動工具,能為在線數位化教學提供完整的解決方案。
  • NLP 新手必看!這是一份覆蓋全面的基於 PyTorch 和 keras 的 NLP...
    想必同學們也會經常在網上找一些好的學習資源。最近,小編在 github 上發現了一份基於 PyTorch 和 keras 的 NLP 學習教程。這份教程內容相當豐富,內容涵蓋神經網絡機器翻譯、問答匹配、電影評價分類、新聞分類等多個領域。項目的 GitHub 地址為:https://github.com/lyeoni/nlp-tutorial。
  • 百度文庫開放教育資源:全國中小學生都能免費用
    百度文庫開放教育資源:全國中小學生都能免費用 2020年02月07日 16:46作者:NJNR205編輯:NJ-蔡必成文章出處:泡泡網原創
  • 清華大學校長邱勇:將向社會免費開放1600多門慕課課程
    期間,清華大學校長邱勇表示,學校將把清華負責的學堂在線1600多門慕課課程免費向社會開放。南都記者從清華大學官網了解到,學校於2月1日發布《關於全校師生同上一堂課的通知》,要求全校師生在2月3日通過雨課堂平臺同上一堂課。課程主要內容有兩部分:清華大學黨委書記陳旭介紹清華防控疫情工作開展情況;清華大學校長邱勇介紹疫情防控期間教學安排調整及相關工作。
  • 清華大學發布大規模開放在線課程平臺「學堂在線」
    中新社北京10月10日電 (記者 馬海燕)清華大學10日在京發布大規模開放在線課程平臺「學堂在線」。  隨著「學堂在線」的正式發布,清華大學的「電路原理」、「中國建築史」等五門課程,麻省理工學院的「電路原理」、北京大學的「計算機輔助翻譯原理與實踐」課程作為第一批上線課程在該平臺開放選課。  今年5月,清華大學加入了由哈佛大學、麻省理工學院聯合發起的大規模開放在線課程平臺edX。
  • 成都七中線上課程面向全國免費開放,涵蓋高一到高三各學科
    成都七中線上課程面向全國免費開放,涵蓋高一到高三各學科 2020-02-07 19:39 來源:澎湃新聞·澎湃號·政務
  • 國家開放大學門戶網上線 提供3600多個5分鐘課程
    旨在推廣終身教育、推進信息技術與教育教學的融合,實現優質教育資源共建共享的國家開放大學門戶網站3日正式上線,將有3600多個「5分鐘課程」面向廣大學習者。    據介紹,5分鐘課程是指時長為5至10分鐘的微型課程,以視頻為主,具備自主學習及碎片化學習特點。
  • CMU 2020年「神經網絡NLP」課程開課啦
    神經網絡為建模語言提供了強大的新工具近日,CMU 2020年「神經網絡 NLP」課程開課啦!對正在學習自然語言處理的同學們來說,這是一份不可多得的好資源。每一節將介紹自然語言中的一個特殊問題或現象,描述建模的難點,並演示幾種用來解決這個問題的模型。該課程將涵蓋在創建神經網絡模型中各種有用的技術,包括處理大小不一的結構化句子、高效處理大數據、半監督和無監督學習、結構化預測和多語言建模。
  • 推薦算法系統/人臉識別/深度學習對話機器人高級實戰課
    二、課程簡介把目前網際網路最熱門、最前沿的項目實戰匯聚一堂,通過真實的項目實戰課程,讓你快速成為項目總監或負責人!!!,在技術領域,尤其在大數據和人工智慧方向有豐富的算法工程落地實戰經驗,其中在獵聘網任職期間主導的推薦算法系統項目獲得公司優秀項目獎,推薦效果得到5倍的提升。