近幾年,自然語言處理這個技術領域突飛猛進,一些在本科階段就接觸該領域的同學已經成功進入自然語言處理(nlp)專業,進行更深入的研究。自然語言處理(nlp)學習資源一般有:中文nlp,包括如果你想向中文nlp領域發展,最好多讀一讀《中文語言處理》《中文機器翻譯教程》,裡面有些來自於國外的優秀實驗室和經典論文。
國外nlp的經典論文可以通過讀《exploringnaturallanguageprocessing》進行了解;英文nlp比較成熟和高頻的綜述有《practicallanguageprocessing》《languageunderstanding》,裡面有很多經典的論文;以及經典的michaeln.reid的《thefoundationsofnaturallanguageprocessing》和《thefoundationsoflanguageunderstanding》,國內有些機構翻譯為《自然語言處理》。
一般從研究生第一年開始上專業課,從自然語言理解開始,一個學期、半個學期和一個學期的課程會介紹不同的核心概念。最重要的是閱讀帶有一定的難度的書籍,這也意味著讀者要學習本領域最頂尖的期刊和會議論文。
在領域頂尖期刊上看到的論文,往往有更好的基礎和嚴謹的寫作風格。學生對這些書的喜愛通常會給學生自己找到學習的動力,事實上,就我本人來說,看完《artificialintelligence》這本書後,我的語言水平、數學水平、專業素養以及行業知識得到很大的提升。
不同於許多機器學習中特有的方法。nlp在推薦系統,搜索,語音識別等方面已經開始得到很多應用。然而現有的nlp方法沒有走出這一極限。我所能想到的,是自動推薦系統,結合自然語言處理的學習資源有:基於機器學習的推薦系統,通過智能推薦機制,讓更多的用戶選擇他們最感興趣的產品。
基於機器學習的搜索系統,它可以用自然語言中的詞和語言;基於模型的網頁推薦系統;結合機器學習的推薦系統;機器學習在資源分配方面的應用。本人希望大家都能利用這些閱讀資源提升自己的知識與能力。
自然語言處理讀書問答系列:讀什麼:先看一本入門性質的書籍,推薦《機器學習實戰》這本書比較推薦人工智慧入門有困惑的人看一看,它適合閱讀,值得反覆閱讀。不過對於讀研的人來說,這本書可能過於深了,數學公式較多,剛剛接觸自然語言處理的本科生可能會看不懂。把這本書當作科普書來看。
從哪裡看:這裡推薦的方法都是讀《googlebook》。怎麼讀:確定感興趣的話題。主要從數據分析,nlp歷史,機器學習,自然語言處理,循環神經網絡入手;讀哪個方向的論文,讀懂。通常從nlp裡面分類:自然語言處理,機器學習,深度學習。