網易有道AI團隊獲中文語法錯誤診斷大賽冠軍

2020-12-18 大眾網

  對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改。

  12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。

  CGED大賽已經走到第六年,比賽的方式是由計算機自動對外國人寫作的中文句子進行錯誤的檢測和糾錯,分為檢測是否有錯誤、錯誤位置、錯誤類型、糾錯等共計6個賽道。來自國內外14支團隊參與了今年的比賽。

  英文語法錯誤診斷:有道已實現全面產品落地

  AI作文批改技術在英語學習上的應用,網易有道早已實現落地。

  2020年年中,網易有道將AI作文批改功能正式落地於網易有道詞典App,隨後在有道精品課初中英語秋季系統班中成功應用,用戶反饋良好。

  近日,網易有道推出「有道寫作」,將原有內嵌在網易有道詞典App的AI作文批改功能,延伸至網頁瀏覽器、Word插件、PC詞典等埠,滿足用戶的多場景使用需求。

  AI作文批改受益於有道在神經網絡機器翻譯任務上的多年數據積累和快速更迭的深度學習技術,使用了基於Transformer架構的核心引擎,能夠對用戶的英語作文進行評分、評語和糾錯,有效解決了不同年齡段英語學習者的自助學習的需求。

  中文難於英文:語文作文批改面臨更高技術壁壘

  相比於英文,中文語法糾錯任務的研究還較為早期,無論是任務本身的特點,還是數據的積累都與英文有較大的差異。

  一方面,中文字符連寫,傳統的語義理解及分析的方法基本上都需要依賴於分詞等前置處理模塊,而存在錯誤的文本會放大語言的歧義性,帶來基礎模塊識別質量的下降;另一方面,中文的語法不像英文有較為嚴格的規則,相對更為隨意和複雜,不容易通過定義規則來處理。和英語語法糾錯任務相比,比賽方能夠提供的中文訓練數據是非常有限的,因此很難直接使用較為複雜的深度學習模型充分學習建模。

  儘管有道AI團隊在智能批改糾錯方面有較長時間的積累,該任務對技術團隊來說仍然是不小的挑戰。」

  「人工智慧只有通過積累足量的語料後,才可以理解複雜度高的語法錯誤,進而才能作為產品功能落地。」網易有道首席科學家段亦濤表示,網易有道在教育和學習場景之下深耕多年,在OCR(光學字符識別)、NMT(神經網絡翻譯)、語音識別技術等方面都已經有良好的技術落地成果,且用戶口碑和體驗一直好評不斷。

  機器批改作文:Precision(精確率)在工程實踐中更具意義

  值得注意的是,有道AI團隊在本次比賽中的語法糾錯項目中,在CorrectionTop3和CorrectionTop1綜合指標(F1)分別獲得第1和第3名的情況下,對應的Precision(精確率)要明顯高於其他參賽隊伍。這在教育實踐場景當中對用戶體驗更為重要。

  比賽綜合指標F1兼顧了Precision與Recall(召回率),作為模型精確率與召回率的一種調和平均。前者代表參賽系統給出的所有修改片段中,片段被正確修改的比例;後者代表在所有需要被正確修改的片段中,參賽系統修改的片段佔的比例。

  有道在Precision上的絕對領先,是源於有道AI寫作助手的設計理念:錯誤的修改建議將誤導用戶進行不正確的修改,從而大大影響用戶的體驗。而且,在用戶本身缺乏辨別能力的業務場景(如:低齡兒童的教育業務)中,該問題還會被進一步放大。

  因此,在英文語法糾錯任務(如:CoNLL-2014和BEA-2019英文語法糾錯任務)中,通常會採用F0.5作為評價指標。該指標的計算方法與F1指標類似,區別在於相比於Recall,該指標賦予了Precision更高的權重。

  在CGED獲獎之前,網易有道曾試水了第七屆NLPCC中的「中文語法錯誤修正」共享任務比賽,斬獲冠軍。在技術優勢積累、K12業務拓展的加持下,網易有道在語文作文修改領域的技術升級進展飛速。

  目前,網易有道的產品矩陣中已經布局了不少針對CSL(以中文為第二語言)學習者的課程和應用。段亦濤表示,除了設計面向中文學習者的學習工具,未來網易有道還可以與中小學校合作,實現輔助老師進行作文批改等功能,進一步擴大有道AI技術在K12業務上的應用場景。

相關焦點

  • 網易有道AI團隊獲中文語法錯誤診斷大賽冠軍_個股資訊_市場_中金在線
    網易有道AI團隊獲中文語法錯誤診斷大賽冠軍 2020
  • 網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    原標題:網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠   對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球
  • 網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    對於英語學習者來說,機器自動批改作文技術已經不再陌生,而全球人工智慧專家們正在攻克更具挑戰性的堡壘——中文作文批改CGED大賽的全稱是中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis
  • 網易有道 AI 團隊拿下中文語法錯誤診斷大賽
    12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 網易有道AI團隊拿下中文語法錯誤診斷大賽
    12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 通關英語,再戰中文,網易有道AI團隊首戰中文語法錯誤診斷大賽奪冠
    12月初,第六屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,以下簡稱CGED)公布最終成績,作為首次參賽的隊伍,有道AI自然語言處理(NLP)團隊在比賽中的語法糾錯Top3賽道斬獲冠軍,並且在另外兩個賽道(語法糾錯Top1、錯誤定位)位列前三,這也標誌著有道AI在中文作文批改上取得的又一重大進展。
  • 網易有道在NLPCC中文語法錯誤修正比賽中斬獲冠軍
    網易有道在NLPCC中文語法錯誤修正比賽中斬獲冠軍 最終網易有道AI團隊貢獻出最佳糾錯成果,於眾多參賽高手中脫穎而出,力壓包括阿里巴巴團隊、北京大學團隊在內的5組全球學術界和業界知名研究團隊,斬獲冠軍。
  • 網易有道斬獲首屆NLPCC中文語法錯誤修正比賽冠軍
    在今年首增的「中文語法錯誤修正」共享任務比賽中,網易有道AI團隊以召回率第一、綜合評價指標第一的絕對優勢拿下了冠軍。以上事件在雷鋒網旗下學術頻道 AI 科技評論資料庫產品「AI 影響因子」中有相應加分。本次比賽中,主辦方提供的測試集是北京外國語大學的外籍學生撰寫的中文作文;訓練集則採集自外國人學習中文的網站,包括非母語人士撰寫的中文文本和母語者的注釋和修正。
  • NLPCC中文語法錯誤修正比賽中網易有道斬獲冠軍
    在第七屆國際自然語言處理與中文計算會議(以下簡稱NLPCC)中,第一次新增了「中文語法錯誤修正」共享任務比賽。最終網易有道AI團隊貢獻出最佳糾錯成果,於眾多參賽高手中脫穎而出,力壓包括阿里巴巴團隊、北京大學團隊在內的5組全球學術界和業界知名研究團隊,斬獲冠軍。
  • 第六屆中文語法錯誤診斷大賽,哈工大訊飛聯合實驗室再獲多項冠軍
    近日,第六屆中文語法錯誤診斷大賽(CGED)研討會於AACL 2020大會「面向教育技術的自然語言處理(NLPTEA)」workshop中順利舉行。今年共有國內外14支隊伍參賽,提交了44個系統。訊飛、阿里、上交、南大、有道、外研社、新華社等團隊均有精彩表現。
  • 哈工大訊飛聯合實驗室奪中文語法診斷大賽全球冠軍
    在語病糾錯的武林江湖裡,中文又比英文難得多。最近,一場通過AI檢測中文語病的「中文語法錯誤自動診斷大賽」上,哈工大訊飛聯合實驗室摘得桂冠。第五屆中文語法錯誤自動診斷大賽(Chinese Grammatical Error Diagnosis,簡稱 CGED)剛在澳大利亞墨爾本舉辦。
  • 厲害了網易有道!力壓阿里、北大,奪得【中文語法錯誤修正】冠軍!9.17他們大BOSS來無錫,你來嗎?
    近日,在第七屆國際自然語言處理與中文計算會議(NLPCC)中,主辦方第一次新增了「中文語法錯誤修正」共享任務比賽。主辦發拿來了一大批北京外國語大學的外籍學生攥寫的中文作文,最終,網易有道AI團隊貢獻出最佳糾錯成果,力壓包括阿里巴巴團隊、北京大學團隊等在內的5組全球學術界和業界知名研究團隊,斬獲冠軍。
  • 酷6視頻翻譯將和網易有道達成合作
    網易有道斬獲首屆NLPCC中文語法錯誤修正比賽冠軍 CCF 自然語言處理與中文計算國際會議 (NLPCC) 是由中國計算機學會主辦的中文信息技術專業委員會年度學術會議,是專注於自然語言處理及中文計算領域的國際會議。在今年首增的「中文語法錯誤修正」共享任務比賽中,網易有道AI團隊以召回率第一、綜合評價指標第一的絕對優勢拿下了冠軍。
  • 網易有道推出有道寫作 AI作文批改功能多埠落地
    近日,網易有道推出「有道寫作」,將原有內嵌在網易有道詞典App的AI作文批改功能,延伸至網頁瀏覽器、Word加載項、PC詞典等埠,滿足用戶的多場景使用需求。  有道寫作是AI作文批改功能的應用升級,能夠幫助用戶解析文章的拼寫、語法、樣式、詞級潤色等不足,並進行智能修改實現完美英文寫作。
  • 網易有道推出有道寫作 AI作文批改功能多埠落地_發現頻道_中國...
    >   近日,網易有道推出「有道寫作」,將原有內嵌在網易有道詞典App的AI作文批改功能,延伸至網頁瀏覽器、Word加載項、PC詞典等埠
  • 升級AI作文批改功能 有道寫作可識別百種英語寫作錯誤類型
    【環球網科技綜合報導】12月9日消息,近日,網易有道推出「有道寫作」,將原有內嵌在網易有道詞典App的AI作文批改功能,延伸至網頁瀏覽器、Word加載項、PC詞典等埠,滿足用戶的多場景使用需求。有道寫作是AI作文批改功能的應用升級,能夠幫助用戶解析文章的拼寫、語法、樣式、詞級潤色等不足,並進行智能修改實現英文寫作。在2020年年中時,AI作文批改功能正式落地網易有道詞典App,該功能是繼有道神經網絡翻譯後,網易有道推出的又一重要的人工智慧技術應用。
  • 網易有道AI作文批改入選2020機器之心
    原標題:網易有道AI作文批改入選2020機器之心【金煉獎】   6月19日,機器之心2020
  • 網易有道AI作文批改入選2020機器之心「金煉獎」
    其中,網易有道與華為雲、百度、騰訊、阿里巴巴、字節跳動等32家企業一同入選了「助力產業復甦的最佳賦能AI解決方案」。眾所周知,網易有道是中國領先的智能學習公司。此次入選機器之心2020 人工智慧金煉獎的AI作文批改功能,是網易有道在軟體附加內容布局上繼神經網絡翻譯後,推出的又一重要的人工智慧技術應用。
  • 網易有道詞典推出AI作文批改功能 專業度堪比高考閱卷老師
    此外,在「作文詳情「中,疑似有誤的字詞被標紅,輕點可查看,無論大小寫規範,還是名詞/動詞/冠詞/介詞/代詞等拼寫錯誤,或者時態誤用、詞彙缺失/冗雜等語法問題,均可逐一指出並予以修正建議。網易有道詞典AI作文批改高中英語作文的結果據了解,目前,網易有道詞典AI作文批改能夠識別的語法錯誤類別共計14種,涵蓋齊全,包括拼寫錯誤、時態錯誤、動詞原形與動名詞誤用、介詞錯誤等,並能夠根據上下文語境,識別不符合原文語境的單詞誤用。
  • 驍龍技術峰會成功舉行 Qualcomm AI合作夥伴網易有道提供大會翻譯...
    而有道視頻翻譯更加快捷和精準。利用有道自主研發的語音識別、NMT翻譯、智能斷句並切分時間軸等人工智慧技術,讓用戶上傳視頻到「有道視頻翻譯」網站後,就可自動生成雙語字幕。在這一過程中,一段60分鐘的視頻翻譯僅需15-20分鐘就可以完成。同時,利用網易自營的有道人工翻譯團隊的專業翻譯與校對,實現翻譯文本的優化,保證翻譯質量。目前,有道視頻翻譯支持中譯英、英譯中內容翻譯與轉換。