計算語言學前景廣闊

2020-12-17 中國社會科學網

計算語言學是用計算機研究和處理自然語言的一門新興交叉學科。在近年推進新文科建設的背景下,計算語言學及其相關應用日益引起關注。計算語言學領域相關學者在接受本報記者採訪時表示,計算語言學方興未艾,應用廣泛,前景廣闊。

橫跨文理工三大學科領域

計算語言學是橫跨語言學、數學和計算機科學的交叉學科。它同時涉及文科、理科和工科三大領域,具有跨學科的性質。學者在從事計算語言學研究時不僅要具備語言學知識,還要具備數學和計算機科學方面的知識。教育部語言文字應用研究所研究員馮志偉告訴記者,面對信息網絡時代的新要求,不少語言學家都在努力學習計算機自然語言處理技術,不斷更新知識再學習,成為兼通語言學、數學和計算機科學的新一代語言學家。

北京大學是計算語言學研究的重鎮。談到當前計算語言學前沿時,北京大學計算語言學研究所所長王厚峰向記者表示,近20多年來,統計與機器學習方法在自然語言處理中佔據主導地位。無論是統計方法,還是機器學習方法,其基礎都是數據。因此也可以說,20多年來,自然語言處理主要是由數據驅動的。近幾年深度學習的發展進一步強化了數據的作用,特別是對無標註語言數據的使用。在深度學習的大框架下,出現了一些有代表性的技術,如預訓練語言模型的出現。

計算語言學已經開始廣泛應用。馮志偉以機器翻譯為例介紹說,當前國際上計算語言學研究在機器翻譯方面取得了很大成就,機器翻譯經歷了基於規則的機器翻譯、統計機器翻譯、神經機器翻譯等階段,目前正在實用化和商品化,機器翻譯已經從學者的夢想變成了現實。

 發揮優勢促進學科融合

隨著近年來人工智慧、數字人文、大數據等領域的快速發展,以及新文科建設的需要,各地學術機構結合各自學科優勢,推進研究工作,紛紛構建了計算語言學和自然語言處理相關領域的學術新機構新平臺。如2019年6月成立的北京語言大學語言智能研究院,2019年7月清華大學人工智慧研究院創建的自然語言處理與社會人文計算研究中心。

王厚峰介紹了當前他們的新研究。其一是跟蹤與改進,如在預訓練模型方面,儘量融入多模態的信息,包括結構化知識。其二是模型效率的改進。在當前的深度學習框架下,訓練複雜度非常高,如何降低複雜度是需要研究的問題。其三是加強以中文為核心的語言知識挖掘研究。

在北京語言大學教授宋柔看來,目前語言學和語言工程還存在脫節的現象,要促進語言學和語言工程的深度融合,加強攜手協作建立語言知識體系。

清華大學中文系教授劉石和清華大學計算機科學與技術系教授孫茂松展開學術合作,提出了構建「中國古典知識庫」的設想。劉石目前正在承擔的國家社科基金重大項目「基於大數據技術的中國古代文學經典文本分析與研究」,在古典詩歌分詞及知識圖譜工作中,運用計算語言學和自然語言處理技術,自動實現針對古典詩歌文本的詞彙抽取、分詞和關聯分析,並上線「古典詩歌知識圖譜」。

 經驗主義方法與理性主義方法結合

如何進一步推進研究,王厚峰表示,我國學界在相關方面基本屬於跟蹤研究,還需要有創新型研究。其中尤其缺乏針對中文的計算研究,中文有很多自身的特點,今後需要結合中文特點開展相關研究。

馮志偉認為,目前,在計算語言學研究中,深度學習方法成為了主流方法,幾乎被應用於計算語言學研究的所有領域。這是一種基於語言大數據的經驗主義方法,語言規則受到忽視。深度學習應當與語言學研究結合起來,基於語言大數據的經驗主義方法應當與基於語言規則的理性主義方法結合起來,相互促進,相得益彰,這樣才能推動計算語言學的進一步發展。

來源:《中國社會科學報》2020年9月21日第2015期 作者:本報記者 曾江

精彩推薦:

決戰脫貧攻堅 決勝全面小康

詞學史研究的空間視角

數位化轉型中政府治理的機遇與挑戰

歡迎關注中國社會科學網微信公眾號 cssn_cn,獲取更多學術資訊。

相關焦點

  • 生物語言學研究前景廣闊
    本書從進化、變異以及計算三個角度對生物語言學進行了討論,並在書中明確指出生物語言學將成為語言學研究的一個重要的分支。本系列叢書在2013年又推出了由Cedric Boeckx, Kleanthes K.
  • 計算語言學研究所:支流的風景一樣好
    在北大理科一號樓四層的一個走廊裡,「計算語言學研究所」的牌子安靜地掛著。徑直往裡走,便能看到辦公室裡學者們忙碌的身影。雖然隸屬於號稱「北大第一大院」的信息科學技術學院,但計算語言學研究所卻鮮為人知,「計算語言學」這個學科也被冠以「冷門」的名號。
  • 李富強:生物語言學研究前景廣闊
    此後幾十年,語言學家們對此領域的研究不斷推進,而在現代語言學研究中,對生物語言學研究起到推動作用的,則是生成語法創始人N. Chomsky以及學派內其他學者於20世紀70年代以後開始的一系列研究。本書從進化、變異以及計算三個角度對生物語言學進行了討論,並在書中明確指出生物語言學將成為語言學研究的一個重要的分支。本系列叢書在2013年又推出了由Cedric Boeckx, Kleanthes K.
  • 【學科】大哉,計算語言學之為用
    喬姆斯基在計算機出現初期就把電腦程式設計語言與自然語言置於相同的平面上,用統一觀點進行研究。在《語法的形式特性》一文中,他用一節篇幅論述程序設計語言,討論有關程序設計語言的編譯程序問題。馬爾可夫、圖靈、香農和喬姆斯基對語言和計算關係的探討,為計算語言學的理論和技術奠定了堅實的基礎。
  • 馮志偉談計算語言學
    計算語言學是近年日益受到重視的前沿交叉學科。教育部語言文字應用研究所研究員馮志偉主要研究計算語言學、語言學流派、語料庫語言學、術語學,他是我國最早從事計算語言學的學者之一,從20世紀50年代末在北京大學求學期間踏上計算語言學的學術道路,為我國計算語言學的發展作出了突出貢獻。
  • 計算語言學漫遊指南 | 語言學午餐
    上個月,《你好,機器作詩了解一下》這篇文章發布之後,許多讀者留言說希望小編能更全面地介紹下計算語言學的研究內容、相關讀物和轉專業留學申請等信息。於是,午餐君今天就為大家帶來一份乾貨滿滿的計算語言學漫遊指南!
  • 計算語言學相關資料
    發展歷程通過這個定義,我們可以看出計算語言學是計算機科學、語言學等不同領域而又彼此交叉的學科。馮志偉於2011年在《外國語》第34卷第1期上發表了《計算語言學的歷史回顧與現狀分析》,簡要地介紹了計算語言學的發展歷程,從20世紀40年代到50年代末的萌芽,其中頗為有名的是1936年Turing給「可計算性」下的嚴格的數學定義,並提出了「圖靈機」[2](Turing Machine)的數學模型。
  • 計算語言學院校信息大匯總!丨語言學午餐
    之前也有不少讀者朋友們留言,說希望午餐君可以介紹下計算語言學方面的院校。正值保研準備期和留學申請季,那麼本期《語言學周刊》,我們就來介紹介紹計算語言學方面的院校信息!我們先來看看世界各地有那些著名的計算語言學研究組和實驗室。它們歷史悠久,對計算語言學領域發展貢獻巨大,擁有著最知名的學者們。了解這些實驗室,無論是對於未來升學的選擇,還是對熟悉學界分布,都大有裨益。
  • 當前計算語言學發展的幾個特點
    計算語言學對人工智慧意義重大計算語言學是研製智能化電子計算機的一項基礎性工作,而人工智慧的研究又離不開對自然語言的處理,因此計算語言學的研究在人工智慧的研究中起著舉足輕重的作用。人們早已為計算機軟體設計了許多人工語言。
  • 計算語言學與深度學習
    期《譯文》作者:克里斯多福·D.他還表示:「理智地看,我認為自然語言處理非常迷人,讓我們得以集中研究高度結構化的推理問題,研究那些通向『什麼是思想』的核心又還具有重要實際意義的課題,以及研究無疑會讓世界變成更美好地方的技術。」這應當是不錯的前景。那麼計算語言學者們還要害怕深度學習麼?我認為並不需要。
  • 計算語言學,iBrandUp人物
    點擊播放 GIF 0.0M- 這篇專訪將聚焦於計算語言學-△ 陳佳媛關鍵詞計算語言學、語言哲學、計算美學、AI設計研究領域是:計算語言學,計算美學、數字人文、語言哲學。△計算語言學的詞雲其中,計算語言學是一門跨學科的研究領域,試圖找出自然語言的規律,建立運算模型,最終讓電腦能夠像人類般分析,理解和處理自然語言。
  • 計算社會語言學:是啥?咋搞?
    我們將計算社會語言學構建為一個有獨立目標的研究領域,包括開發支持社會語言學的工具,建立包含語言內容以及社會背景信息的數據建模和分析的新統計方法,以及基於社會語言學見解開發或改進NLP工具。1.2 討論範圍鑑於這一領域的廣度,我們將按如下方式限制本次調查的範圍。首先,社會語言學主題的覆蓋將是選擇性的,主要由計算語言學中涉及社會語言學主題的工作決定。
  • 2019考研專業:語言學及應用語言學
    中國教育在線訊 2019考研,對考研專業了解越多,考研人越易選出適合自己的方向,中國教育在線考研頻道將陸續推出2019考研業解析系列,進行基本的專業介紹,探析就業前景與方向,推薦知名院校,介紹相近可調劑專業,並以一所高校為例對課程設置進行說明。
  • 來自一個計算語言學的不完全指南
    】一、什麼是計算語言學?你只需要掌握相關的知識和技能來解決實際的語言學或應用問題即可,不必要糾結這些概念。計算語言學下面還細分語音處理、文本分析、機器翻譯、知識圖譜等具體方向。因為這三個術語或學科緊密相連,大致的區分按字面就能區分;但深入之後,它們有很多重合的部分。很多學者在理解上也是很有爭議的。甚至有人認為,計算語言學和自然語言處理只是在語言學和計算機科學的不同稱呼,實質相同。
  • 語言學在職研究生報考條件及就業前景
    語言學是以人類語言為研究對象的學科,探索範圍包括語言的結構、語言的運用、語言的社會功能和歷史發展,以及其他與語言有關的問題。讀語言學     語言學是以人類語言為研究對象的學科,探索範圍包括語言的結構
  • ——《計算語言學方法研究》成果選介
    中國共產黨新聞 >> 全國哲學社會科學規劃辦公室 >> 成果選介 >> 學科成果 >> 語言學 計算語言學方法研究 ——《計算語言學方法研究》成果選介
  • 計算語言學研究70年(一)
    第十三章 計算語言學研究70年第一節 引言計算語言學是利用計算機技術,從計算的角度出發,尋找自然語言的規律,以使得計算機系統能夠像人類那樣理解和生成自然語言的研究。計算語言學是一門交叉學科,它涉及語言學、數學以及計算機科學等。在計算機領域,被稱為自然語言處理。當處理的對象為中文時,稱中文信息處理。1950年提出的圖靈測試一般被認為是自然語言處理思想的發端。
  • 考研專業介紹:語言學及應用語言學
    一、學科概況  語言學及應用語言學是一個相對新興的專業。 除了語言學本體理論研究之外,更關注語言的應用研究。研究的範圍非常廣泛,主要研究語言在各個領域中實際應用的語言學分支。它著重解決現實當中的實際問題,一般不接觸語言的歷史狀態,也不大介入一般理論上的爭辯。可以說,它是鑑定各種理論的實驗場。
  • 研究彈幕、訓練AI、助破案、做老師,原來你是這樣的語言學!
    雖然人類研究語言已有千年歷史,但語言學成為一門獨立學科,也僅僅只是近兩個世紀的事情。 語言學的現實應用通過一句話的線索抽絲剝繭幫助偵查案件。這是語言學運用到司法刑偵的功勞。該課程提供廣泛的語言學知識,學生在學習語言學核心知識外,還有靈活的跨學科課程選擇。
  • 吹響我國語言學發展號角 ——紀念《語言學是一門領先的科學》發表...
    而在《科學》中,伍鐵平教授提出「語言學是一門領先的科學」的意義並不在於使語言學成為一門凌駕於其他學科之上的科學,而在於讓人們認識到語言學這門長期被我們忽視的科學,是現代科學體系的一個重要組成部分,在現代科學的發展中扮演著極其重要的角色。語言學是一門通過客觀的觀察、大量的數據測量得出的經驗科學,它具有可證實、可證偽的科學規律,是一種解釋力較強、可以驗證假設的經驗科學理論。