提到自然語言處理,非計算機專業的同學可能會覺得有些陌生,但自然語言處理的應用場景你一定陌生,比如聊天機器人(蘋果Siri, 亞馬遜Echo),機器翻譯(谷歌翻譯),語音識別(科大訊飛),電商平臺基於歷史搜索和瀏覽記錄推薦你可能感興趣的產品(淘寶,京東,考拉),知乎或其他問答平臺會分析回答的質量,決定是否將某些答案摺疊,甚至我們電腦或者手機打字用的輸入法。
雖然自然語言處理是如今大火的人工智慧的一個分支領域,但自然語言處理的應用-機器翻譯的研究卻早於人工智慧這個詞的出現。1956年的達特茅斯會議是公認的人工智慧的起源,但著名的展示機器翻譯的喬治敦實驗卻是在1954年進行的。作為人類歷史上第一次機器翻譯,喬治敦實驗的唯一內容就是把有機化學領域的60多個俄語句子翻譯成英文。自此之後的十年,自動翻譯成為熱門研究課題。
下圖這位,可能很多人不認識,但學過語言學的同學看到這張照片一定寒從心底起。
作為20世界語言學泰鬥,認知科學的開創人,喬姆斯基曾經是多少語言類學生的噩夢,他的語言學理論曾經讓無數英語專業學生啃得生不如死,哀嚎他的書簡直不是寫給人看的。但對語言學稍有涉獵的同學都了解,喬姆斯基對語言學和認知科學的貢獻無可辯駁。有學者認為,賈伯斯之於語言學和認知科學就像圖靈之於計算機和人工智慧,事實上賈伯斯及的語言學研究早年的人工智慧領域影響頗深,甚至已經有了實際應用。
從理論上來說,喬姆斯基定義的四型文法及每一型的語言表達能力數學表達,深刻影響了編譯領域中語法前端的設計;尤其是三型文法和二型文法,為如今的程序設計語言語法建立了理論基礎。
從應用上來說,上世界70年代美國德克薩斯大學與聯邦德國西門子公司合作的德英翻譯系統METAL就利用了喬姆斯基的轉換生成語法和短語結構理論。
在討論自然語言處理這一學科時,提到喬姆斯基,一方面是希望大家了解語言學理論對自然語言處理和人工智慧的影響,另一方面是希望英專學生了解,因為有語言學基礎,且英語能力優秀的話,如果要申請出國留學,除了TESOL, 教育和傳媒等人文類專業,自然語言處理也是個很不錯的選擇。
推薦院校
最近有一些同學專門諮詢自然語言方向的專業,這裡就給大家推薦幾個自然語言處理方向的碩士課程及入學要求,供大家參考。
愛丁堡大學
★Speechand Language Processing
愛大的語言學在2019年QS學科排名中位居世界第五,該課程涵蓋了從語音學,語音合成和語音識別到自然語言生成和機器翻譯等語音和語言處理的所有領域,授課老師多是世界範圍內語言學,信息學,心理學和其他相關學科的領軍人物。
課程結構:
必修課程:
加速自然語言處理
語音和語言處理的計算機編程
語音處理
使用R語言的單變量統計和方法
選修課程:
音韻學和語音學概論
自動語音識別
機器學習和模式識別
機器翻譯
自然語言理解
模擬語言
語音合成
入學要求:2:1學位,語言學,計算機科學,工程,心理學,哲學,數學或其他相關專業。雖然對計算機技能和數學沒有非常高的要求。但是最好還是要有所準備。
英語能力要求:雅思總分7分,單項不低於6.5。PTE 總分不低於67,單項不低於61。
學費:26,600英鎊
謝菲爾德大學
★ComputerScience with Speech and Language Processing
該課程為英國計算機協會認證課程。
核心課程:
文字處理
語音處理
語音技術
機器學習和自適應智能
自然語言處理
研究方法和專業問題
團隊軟體項目
學位論文項目
選修課程:
行動裝置軟體開發或面向對象編程和軟體設計。
入學要求:
要求2:1及以上學位,計算機科學,工程,語言學,數學或者心理學專業。
雅思總分不低於6.5,單項不低於6.0。
學費:22,600英鎊
行業前景
MarketsandMarkets數據顯示,全球自然語言處理市場規模預計獎從2016年的76.3億美元增長到2021年的160.7億美元,複合年增長率16.1%。根據《中國人工智慧發展報告2018》提供的數據,2017年中國人工智慧智能市場規模高達237億元,其中自然語言處理市場49.77億元,佔比21%。
自然語言處理目前也已經有許多成熟應用的產品,除了文章開頭提到機器翻譯,語音識別,還包括輿情監測,例如美國的Xalted的iAcuity, 中國朝聞天下的Wom-Monitor,視頻平臺的字幕生產,比如油管視頻自動匹配的字幕,除此之外,還有其他自動摘要,文本分類等多種應用。
自然語言處理領域仍然大有可為。有志投身NLP的同學們可以考慮申請上述院校的自然語言處理相關專業。