哈工大訊飛聯合實驗室奪中文語法診斷大賽全球冠軍

2020-12-13 人民日報海外網

海外網7月26日電以前寫作文,老師改語病,如今,AI就能揪出問題。在語病糾錯的武林江湖裡,中文又比英文難得多。最近,一場通過AI檢測中文語病的「中文語法錯誤自動診斷大賽」上,哈工大訊飛聯合實驗室摘得桂冠。

第五屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,簡稱 CGED)剛在澳大利亞墨爾本舉辦。本屆CGED評測的參賽者可謂高手如雲,團隊包括中國社科院、阿里巴巴、北京大學、哈工大訊飛聯合實驗室(下文簡稱HFL)等,最終由HFL競得冠軍。而上一屆的冠軍是阿里巴巴團隊。

中文語法錯誤自動診斷大賽官方網頁

外國人寫的中文錯句做考題

新增「語病修正」項獲最高分

寫完一篇作文,語文老師批改時從裡面選出多餘的詞、缺少的詞、使用不當的表述、以及語序不通的表述,然後一一改正過來。這樣的場景,現在已經成為一場世界性的比賽——第五屆中文語法錯誤自動診斷大賽(簡稱CGED)(比賽官網:http://www.cged.science)。今年第五屆的評測大會於上周四(2018年7月19日)在澳大利亞墨爾本舉行,這場比賽最終由哈工大訊飛聯合實驗室摘得桂冠。

比賽方式是,主辦方挑選了一些外國人寫作的中文句子片段,讓參賽者通過人工智慧算法技術對其中的語法語義錯誤進行識別並進行系統性能評估。

今年共13個團隊參加CGED評測

所選「考題」有四種錯誤類型,具體包括多詞、缺詞、用詞不當和語序不當。

比賽從四個維度對參賽者的能力進行評估:語病識別(即:識別句子是否有錯誤)、語病分類(識別具體的錯誤類型)、語病定位(識別錯誤的位置和類型)、語病修正(對於缺詞和錯詞,提供修正的建議)。一共有13個團隊參加了這項比賽。

在這四項成績中,哈工大訊飛聯合實驗室獲得了後三項的第一名、以及第一項的第二名,總體排名第一,首次參賽便摘得冠軍。

值得一提的是,去年的比賽只有三項成績,第四項「語病修正」是今年才增加的比賽分項。和去年相比,除了「指出問題」,還提供「解決答案」,其難度更上一級。在「語病修正」的任務中,在「第一候選」或「前三候選」項,HFL分別獲得0.1723分和0.2527分,以絕對領先的成績排第一名。也就是說,在13個參賽團隊中,HFL做語法改錯題成績最棒。

在最難的「語病修正」比賽分項中HFL摘獲第一名。

為什麼可以在「語病修正」任務中斬獲佳績?

科大訊飛研究院北京分院副院長、哈工大訊飛聯合實驗室主任助理付瑞吉分析,因為參賽系統採取了端到端的神經網絡模型與詞彙點互信息相結合,將語病位置空出,根據上下文以及語病信息對於該位置正確的詞彙進行推測。擁有極強探索精神的你,可以直接英語論文深究其中原理(連結:http://www.aclweb.org/anthology/W18-3707)

糾錯語法AI冠軍如何誕生?

通過神經網絡序列標註模型生成

怎麼區分「靜靜的頓河」與「靜靜地等待」這兩個短句中,「的」和「地」有何區別?哈工大訊飛聯合實驗室出品的AI神器就能做得到!靠的是對神經網絡序列標註模型BiLSTM-CRF進行改進。

付瑞吉分析,這次HFL的AI可以獲得冠軍,有賴於對神經網絡序列標註模型BiLSTM-CRF進行改進,包括底層的整個模型、單模型內部的融合、模型外的融合三大板塊。具體而言——

第一,將詞向量、統計、先驗的語法知識相融合,如漢語語言習慣用法等統計特徵,比如「靜靜的頓河」和「靜靜地等待」中結構助詞「的」和「地」的使用會根據上下文的詞性而決定;

第二,採用模型內部融合的技術,將多個BiLSTM單模型的輸出加權融合,再經過CRF計算最終結果;

第三,採用了模型選取、模型排序等外部融合方法,發揮了不同模型的優勢。

總體來說,這三項「黑科技」讓哈工大訊飛聯合實驗室出品的AI可以獲得更好的語感,從而摘冠。

HFL語法檢錯技術框架圖

中文比英文語病糾錯難度大得多

語病糾錯應用前景廣泛

需要說明的是,在語病糾錯領域,中文比英文難度大得多。這主要由兩個原因決定的:第一,英語語法規範,有嚴格的主謂賓;第二,英文積累的語料豐富,劍橋大學已經積累了上千萬個句子。

相較之下,中文語法靈活,語病檢測的技術難度高得多,而且目前參加評測的語料庫只有3萬多個句子,語料量亟待擴充。

所以,目前英語語法糾錯已經有成熟的應用,而中文的語法糾錯還處於不斷積累和探索的階段。從現在的評測結果來看,目前的技術指標還比較低,離實際應用尚需時日。

值得期待的是,無論是學習外語,還是文稿的錯字校對,這次參賽獲獎的語病檢測和修正技術未來都將有廣泛的應用前景。

據悉,為了推動這項技術的發展,賽事主辦方已經將精心標註的歷屆比賽數據全部開源,付瑞吉說,「我們對主辦方的科學奉獻精神表示感謝!也希望更多的研究者能夠參與到該任務中來,共同推動技術進步」。

HFL「牛」在哪裡?

布局「訊飛超腦」讓機器能理解會思考

哈工大訊飛聯合實驗室(HFL)是科大訊飛針對「訊飛超腦」項目計劃,重點引進和布局的核心研發團隊之一,由科大訊飛AI研究院與哈爾濱工業大學社會計算與信息檢索研究中心(HIT-SCIR)在2014年共同創辦。

根據聯合實驗室建設規劃,雙方將在語言認知計算領域進行長期、深入合作,具體開展閱讀理解、自動閱卷、類人答題、人機對話、語音識別後處理、社會輿情計算等前瞻課題的研究。

研究重點將突破深層語義理解、邏輯推理決策、自主學習進化等認知智能關鍵技術,支撐科大訊飛實現從「能聽會說」到「能理解會思考」的技術跨越,並圍繞教育、司法、金融、人機互動等領域實現科研成果的規模化應用。目前,HFL有語文評閱、閱讀理解、智能司法、社會計算等研究方向。

2017年7月、10月以及2018年1月,哈工大訊飛聯合實驗室的閱讀理解研究組(HFL-RC)在業內公認的機器閱讀理解頂級賽事斯坦福SQuAD挑戰賽中先後奪得三次第一名。2018年2月,獲得國際語義評測(SemEval 2018)閱讀理解任務第一名。

這次獲得CGED大賽的是HFL語文評閱研究組,其研發的作文自動評閱技術通過自動學習人類專家的評分標準,對紙筆考試作文從字跡工整度、詞彙豐富性、句子通順度、文採、篇章結構、立意等多個維度綜合評價。目前,作文自動評閱技術以輔助人工進行評分質檢等應用方式,已在全國多地考試中應用,覆蓋考生數百萬人。

科大訊飛作文自動評閱技術框架

CGED大賽【考題類型】

看看你強還是AI強?

1, M(missing word)錯詞

錯誤:人戰勝了飢餓,才努力為了下一代做更好的、更健康的東西。

正確:人戰勝了飢餓,才能努力為了下一代做更好的、更健康的東西。

2, R(redundant word) 多詞

錯誤:我根本不能理解這婦女辭職回家的現象。在這個時代,為什麼放棄自己的工作,就回家當家庭主婦?

正確:我根本不能理解婦女辭職回家的現象。在這個時代,為什麼放棄自己的工作,就回家當家庭主婦?

3, S( word selection) 用詞不當

錯誤:我根本不能了解婦女辭職回家的現象。在這個時代,為什麼放棄自己的工作,就回家當家庭主婦?

正確:我根本不能理解婦女辭職回家的現象。在這個時代,為什麼放棄自己的工作,就回家當家庭主婦?

4, W(word order)語序不當

錯誤:飢餓的問題也是應該解決的。世界上每天由於飢餓很多人死亡。

正確:飢餓的問題也是應該解決的。世界上每天很多人由於飢餓死亡。

科大訊飛AI

連獲多項「世界第一」

2017年,國際語音合成大賽全新無監督Machine Learning任務第一名;

2017年-2018年,三次刷新機器閱讀理解領域權威評測SQuAD世界紀錄;

2017年10月,刷新自動駕駛領域權威國際評測Cityscapes世界紀錄;

2018年,聲音模仿領域 Voice Conversion Challenge獲得第一名;

2018年2月,機器閱讀理解領域第十二屆國際語義評測比賽(International Workshop on Semantic Evaluation, SemEval 2018)第一名;

2018年3月,在由國際醫學影像頂級會議ISBI舉辦的IDRiD眼底圖分析競賽中,科大訊飛在最體現機器輔助醫生診斷能力的病灶分割任務中最難的子項「MA分割任務」獲得第一;

2018年4月,在由國際學術頂會ICPR舉辦的圖文識別挑戰賽 MTWI Challenge中,科大訊飛與中科大語音及語言國家工程實驗室聯合團隊在全部三項比賽任務上獲得第一;

2018年7月,在Blizzard Challenge 2018國際語音合成大賽的比賽中,科大訊飛報送的參賽系統摘得10個測評打分項目中的9項第一,成為「最全能的冠軍」,科大訊飛已在該項比賽中連續十三年奪冠。

相關焦點

  • 第六屆中文語法錯誤診斷大賽,哈工大訊飛聯合實驗室再獲多項冠軍
    近日,第六屆中文語法錯誤診斷大賽(CGED)研討會於AACL 2020大會「面向教育技術的自然語言處理(NLPTEA)」workshop中順利舉行。今年共有國內外14支隊伍參賽,提交了44個系統。訊飛、阿里、上交、南大、有道、外研社、新華社等團隊均有精彩表現。
  • 在外國人寫的中文句子裡找錯 哈工大訊飛聯合實驗室奪冠
    第五屆中文語法錯誤自動診斷大賽日前在澳大利亞墨爾本閉幕,中國社科院、阿里巴巴、北京大學等全球13個團隊參賽,最終哈工大訊飛聯合實驗室憑藉在人工智慧領域的多項技術積累,首次參賽就奪得冠軍。
  • 中文最佳,哈工大訊飛聯合發布全詞覆蓋中文BERT模型
    近日,哈工大訊飛聯合實驗室發布了基於全詞覆蓋的中文 BERT 預訓練模型,該模型在多個中文數據集上,取得了當前中文預訓練模型的最佳水平,部分效果甚至超過了原版 BERT、ERNIE等中文預訓練模型。。哈工大訊飛聯合實驗室(HFL)是科大訊飛重點引進和布局的核心研發團隊之一,由科大訊飛AI研究院與哈爾濱工業大學社會計算與信息檢索研究中心(HIT-SCIR)在2014年共同創辦。
  • 哈工大訊飛聯合實驗室榮登多步推理閱讀理解評測HotpotQA榜首
    哈工大訊飛聯合實驗室不僅在國際比賽中拔得頭籌,也持續積極推動中文信息處理技術的研究與發展。2019年10月19日,由中國中文信息學會計算語言學專業委員會主辦,哈工大訊飛聯合實驗室承辦,科大訊飛股份有限公司冠名的第三屆「訊飛杯」中文機器閱讀理解評測研討會(CMRC 2019)在雲南昆明圓滿落幕。
  • 哈工大訊飛聯合實驗室發布的中文ELECTRA系列預訓練模型再迎新成員
    哈工大訊飛聯合實驗室發布的中文ELECTRA系列預訓練模型再迎新成員 哈工大訊飛聯合實 發表於 2020-12-26 09:49:26 哈工大訊飛聯合實驗室發布的中文
  • 網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    原標題:網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠   對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球
  • 訊飛與哈工大聯合實驗室刷新SQuAD成績,兩項指標均大幅提升
    文 | 奕欣來自雷鋒網(leiphone-sz)的報導雷鋒網AI科技評論按:科大訊飛與哈工大聯合實驗室
  • 訊飛行業認知智能升級讓文書質檢更簡單
    除了9項主任務之外,GLUE評測還設立了一項診斷任務(AX),用於檢測模型在不同語言學問題上的表現。本次提交的模型在診斷任務中也取得了52.6分的好成績。本次奪冠的模型MacALBERT + DKM,在業界領先的預訓練語言模型ALBERT基礎上加入了自主研發的語義糾錯型掩碼語言模型(MLM as correction),進一步提升了模型在相似文本上的區分能力。
  • 網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改CGED大賽的全稱是中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis
  • 網易有道 AI 團隊拿下中文語法錯誤診斷大賽
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改。12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 網易有道AI團隊拿下中文語法錯誤診斷大賽
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改。12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 通關英語,再戰中文,網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改。12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 網易有道AI團隊獲中文語法錯誤診斷大賽冠軍
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改。  12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 中文最佳,哈工大訊飛聯合發布全詞覆蓋中文BERT預訓練模型
    而在中文領域,哈工大訊飛聯合實驗室也於昨日發布了基於全詞覆蓋的中文 BERT 預訓練模型,在多個中文數據集上取得了當前中文預訓練模型的最佳水平,效果甚至超過了原版 BERT、ERINE 等中文預訓練模型。基於 Transformers 的雙向編碼表示(BERT)在多個自然語言處理任務中取得了廣泛的性能提升。
  • 網易有道AI團隊獲中文語法錯誤診斷大賽冠軍_個股資訊_市場_中金在線
    網易有道AI團隊獲中文語法錯誤診斷大賽冠軍 2020
  • 哈工大劉挺:哈工大 SCIR 實驗室的 NLP 研究 | CCF-GAIR
    其所帶領的哈工大社會計算與信息檢索研究中心(HIT-SCIR)已然成為國內頂尖 NLP 研究機構之一,在 NLP 領域具有極高的影響力,推出了語言技術平臺、大詞林等一大批核心技術。此外,該中心先後培養出 200 多名學生,廣泛分布於百度、騰訊、阿里、微軟、訊飛等企業,為國內 NLP 的研究和落地貢獻了有生力量。近期,哈工大 SCIR 也動作頻繁。
  • 瑞金醫院 MMC 人工智慧輔助構建知識圖譜大賽結果出爐,哈工大...
    雷鋒網 AI 科技評論消息,2019 年 2 月 27 日,瑞金醫院 MMC 人工智慧輔助構建知識圖譜大賽總決賽在上海圓滿落下帷幕。哈爾濱工業大學語言技術研究中心機器智能與翻譯研究室研究生劉龍航、宋治勳組成的「身體是革命的本錢」團隊(指導老師:趙鐵軍)以第一賽季第 2 名、第二賽季第 1 名的成績入圍本次大賽決賽,並最終獲得冠軍。
  • 其實還有科大訊飛!
    僅2018年,據不完全統計,科大訊飛在智能語音和人工智慧國際權威競賽或評測項目上奪得的冠軍就至少有12個:  2018年1月,機器閱讀理解SQuAD閱讀理解大賽科大訊飛再次刷新世界紀錄,EM得分超過人類平均水平(參賽者包括微軟、谷歌、Facebook、IBM、Salesforce、史丹福大學、卡耐基梅隆大學、清華、北大等國內外企業和科研機構);  2018
  • 中文自然語言處理雲平臺 訊飛語言云
    2014年11月28日,由科大訊飛和哈爾濱工業大學聯合推出的全球首個中文自然語言處理雲服務平臺「哈工大訊飛語言云」正式發布。作為科大訊飛現有智能語音交互技術服務平臺--「訊飛語音雲」的重要拓展,該「語言云」將與「語音雲」一起為廣大網際網路及移動網際網路的開發者提供從語音到語言的全面的、頂級的、一站式的核心技術服務支撐。
  • 再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍
    再發「最強音」,科大訊飛喜獲國際口語機器翻譯評測大賽冠軍 繼斬獲今年八項「世界第一」之後,科大訊飛再度發力,在剛剛結束的 2018 年國際口語機器翻譯評測比賽中,科大訊飛在英德方向語音翻譯任務端到端模型比賽中