科大訊飛摘得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍!

2020-12-22 驅動中國

提起科大訊飛,人們總津津樂道於「讓機器能聽會說」的先進智能語音技術。其實除此之外,科大訊飛的「攻城獅們」也一直致力於讓機器「能看會認」。

近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室,以顯著優勢獲得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍。這是科大訊飛繼ICPR 2018 MTWI圖文識別挑戰賽上獲得三項冠軍、ICDAR 2019 CROHME數學公式識別挑戰賽上獲得兩項冠軍後,在複雜版面文檔圖像識別理解方向上所取得的又一佳績,再次展現科大訊飛在相關領域的技術先進性。

離線手寫數學公式識別(官方數據)榜單

離線手寫數學公式識別(外源數據)榜單

備註:「Correct」表示公式識別的句正確率,「」和分別表示整條公式中允許出現1處和2處錯誤的識別的句正確率

技術頂天,掌握圖文識別「金字塔」級別難題「解法」

此次OffRaSHME(Offline Recognition and Spotting of Handwritten Mathematical Expressions)數學公式識別挑戰賽由ICFHR 2020(International Conference on Frontiers of Handwriting Recognition)舉辦,參賽隊伍包括韓國三星、東京農工大學、華南理工大學、中山大學等多家常年深耕文檔分析理解領域的研究機構。

相比於常規的圖文識別,對數學公式的識別難度和技術挑戰往往更高。本次OffRaSHME官方比賽任務為「離線手寫數學公式識別」,該任務相比ICDAR 2019 CROHME的離線手寫公式識別任務,難度再度升級,有以下三大難點:

公式結構複雜,尤其是各種結構的嵌套

難以辨別的形近字符XxZ2r

本次比賽添加了很多非常規符號的組合容易和公式混淆

難度雖高,但這樣的任務對於科大訊飛來說並不算陌生。

基於在手寫數學公式識別領域深耕多年的技術積累,科大訊飛從基於上下文無關文法的傳統數學公式方法到創新性地提出基於LaTeX建模的Encoder-Decoder識別算法,其中,LaTeX作為最常用的數學公式表達之一,研究人員將數學公式識別問題看作圖像到LaTeX序列的翻譯問題,藉助注意力機制實現更精準的端到端識別能力,該方案在2019 CROHME中一舉打敗了常年佔據CROHME冠軍地位的MyScript。

而針對數學公式識別中最難的複雜結構嵌套問題,科大訊飛提出了基於樹形結構信息建模的Encoder-Decoder識別算法,這種算法在複雜公式結構嵌套上更具泛化能力。針對形近符號區分難度大的問題,科大訊飛提出使用基於LaTeX語言模型的數據增強策略,利用數學公式的樹形結構表達,合理地拆分分解數學公式,並利用這些公式訓練LaTeX語言模型,最後使用語言模型增強出合理的、符合上下文語義關聯的數據,該策略可以很大程度上緩解形近符號識別困難的問題。

通過以上多項技術能力的綜合運用,此次科大訊飛以顯著優勢拿下了此次任務難度極高的數學公式識別挑戰賽冠軍,證明了其在數學公式識別領域的技術先進性;在實際應用中,學生作業試卷文檔存在版面結構複雜、書寫風格差異顯著等難點問題,這一系統將為其提供更為豐富有效的解決方案。

通過多項技術能力的綜合運用,在「能看會認」上,科大訊飛做得更好了!不僅能識別更複雜的數學公式,還能做到「中文+數學公式」混合搭配的內容識別,此後將在更多A.I.產品中應用。

https://v.qq.com/x/page/s3080uld0xk.html

應用立地打造「能看會認」的A.I.產品

在數學公式識別比賽之外,近期科大訊飛還在另一項自然場景的文字檢測分割識別的相關技術成果在ICDAR ReCTS(Reading Challenge on Reading Chinese Text on Signboard)評測任務取得顯著突破,刷新單字識別、文本行識別、文本行檢測和端到端識別全部四項榜單世界記錄,使得系統在解決複雜場景下文字檢測和識別的難題中更為遊刃有餘。

這些成績並非一簇而就。

事實上,科大訊飛在圖文識別領域已有多年核心技術積累,擁有自主智慧財產權,並伴隨著每次技術迭代,產品都迎來大規模更新升級,更好滿足用戶在多個場景下使用需求。

2015年,輕量級的卷積神經網絡首次在手機設備上使用,使得在線手寫字符識別任務上取得突破性進展。依託此項技術,訊飛輸入法用戶手寫輸入體驗感顯著提升。

2016年,CNN-HMM框架在文本行識別任務中得到成功應用,該套系統無需進行文本行切分等規則化的複雜版面分析,有效避免切分帶來的錯誤,使得篇章級的中、英文手寫文檔識別效果達到人工相當水平。依託此項技術,科大訊飛智能輔助評卷系統能夠對語文作文、英語作文、英語翻譯、數學填空、英語填空等題型進行輔助評卷,應用全國多省市的中高考,累計處理題卡數量過億張。

2018年,基於注意力機制的Encoder-Decoder模型在自然場景文字識別任務上大放異彩,融合語言模型進行端到端訓練,使得拍照模糊的文字也能通過語言模型「聯想」而被正確識別。依託此項技術,在訊飛翻譯機中,對複雜場景下的多種字體也能一拍即譯,讓拍照翻譯更清晰更準確,能夠滿足更多消費者在國外旅遊、購物的場景應用需求。

今年,在數學公式識別任務的諸多關鍵技術上繼續突破,相關核心技術也將應用在訊飛智能學習機等產品中,幫助用戶精確地進行大數據學情分析,找到知識點的薄弱項,實現「個性化精準學」,幫助廣大同學提升學習效率、鞏固學習效果。

在技術應用的過程中,手寫圖文識別也與智能語音等關鍵技術深度融合,讓大家切實感受到技術進步帶來的高效、便利性。如「出口成章,躍然紙上」的訊飛智能辦公本,可以實現語音直接搜索手寫筆記內容,「一句話找到手寫筆記」,滿足用戶在更多筆記場景下的記錄、寫作、搜索、多端同步需求,有效提高辦公效率。

在即將到來的618年中大促中,還有更多產品將和大家見面,大家可以進一步、零距離體驗這些新技術。

堅守人工智慧道路21年,科大訊飛不斷攀越技術高峰,在智能語音、計算機視覺、自然語言理解等技術領域摘得一項又一項桂冠,但這並不是終點。科大訊飛將始終秉承「頂天立地」的技術信仰,打造一件件「能聽會說」、「能看會認」、「能理解會思考」的人工智慧產品,用人工智慧點亮人間煙火。

相關焦點

  • 搜狗奪食科大訊飛語音識別
    在語音識別領域,代表語音技術圈領先水平的INTERSPEECH為促進語音識別技術的進步,舉辦了2020屆語音識別挑戰賽。在今年舉辦的INTERSPEECH 2020 DNS挑戰賽中,搜狗以4.01的MOS評分奪得冠軍。AI降噪技術取得的喜人成績,讓搜狗在語音識別技術的商業化推進中有了更足的底氣。
  • AI就是生產力 科大訊飛讓你新年裡效率起飛
    2020年接近尾聲,辭舊迎新之際,別忘給身邊親朋好友準備一份禮物表達美好祝願。如何從傳統禮物裡脫穎而出,讓禮物既有範兒又實用?科大訊飛(002230,股吧)消費者產品相信可以為你提供不同人群不同場景下的多種好物選擇。
  • 科大訊飛劉慶峰:未來不屬於人工智慧,屬於掌握了人工智慧的人類
    12月11日,經教育部批准,由中央電化教育館、北京師範大學、科大訊飛股份有限公司聯合舉辦的「教育未來,因A.I.而能——2020全球人工智慧與教育大數據大會(A.I.D.E)」在北京·國家會議中心舉行。科大訊飛股份有限公司董事長劉慶峰出席主論壇並發表演講。
  • 科大訊飛打造訊飛看見——X光安檢安檢圖像識別系統 做A.I.+安檢的...
    傳統X光圖像的判圖一直依賴於人工,質效低、耗時久、工作量大,且無法高效識別X光圖像中的違禁品,漏檢問題時有發生。對此,科大訊飛研發了一款「安檢神器」——訊飛看見X光安檢圖像智能識別系統,它能實時精準識別各類可疑物體,為安檢裝上「永不停機」的智慧大腦。
  • 科大訊飛助力第五屆全國青少年無人機大賽(安徽省賽)成功舉辦
    2020年12月5日,由中國航空學會、安徽省航空學會、安徽省青少年科技教育協會主辦,科大訊飛協辦的第五屆全國青少年無人機大賽(安徽省賽)在合肥高新創新實驗中學如期舉辦,來自全省50餘所學校百餘支隊伍的近500名選手參賽。
  • 科大訊飛怎麼樣?科大訊飛翻譯機口碑甚好
    很多人喜歡旅行,但是由於語言不通不能更好的去旅行,針對更多年輕消費者的需要,科大訊飛全面的推出全新翻譯機,解決語言溝通障礙問題。  科大訊飛一直以來都專注於人工智慧的設計與開發,在人工智慧、大數據領域完成更多的需要,而科大訊飛翻譯機3.0的上線,正是為了解決日常用戶在語言溝通上所遇到的各種不暢。
  • 科大訊飛的擦邊球
    「所謂的智能翻譯,就是按照文本讀,而且是不管語義群分割的,文字顯示也並不是語義群同時顯示或鎖定的,那就很顯然是在識別語音,而不是從根據原文在翻譯。」王同學在網文中稱,這是「赤裸裸的欺騙」。21日下午7時許,科大訊飛作出回應:考慮到專業技術背景及口音等原因,這次2018創新與新興產業發展國際會議,科大訊飛只提供會議轉寫上屏服務,並未提供翻譯服務。
  • 新年必備好禮 訊飛AI生產力好物助力效率提升
    查詞只需0.5秒 訊飛掃描詞典筆一掃抬手見釋義作為2020年11月首發AI學習類新品,科大訊飛掃描詞典筆針對英語單科學習中生詞學習過程中的聽、說、讀、記全流程需求,設計了對應的創新功能,能幫助孩子在英語生詞的查閱和學習方面都更加高效。在查詞方面,詞典筆的筆尖對準單詞,查一個單詞僅需0.5秒,輕輕一掃抬手即見釋義。
  • 冬日AI在京城 訊飛AI產品粉絲見面會北京站開啟
    11月29日,北京科大訊飛總部將舉辦一場訊飛AI產品粉絲見面會。對科大訊飛AI產品感興趣,想去現場體驗一下的朋友們,可通過【訊飛AI生活】官方微信報名參與。
  • 科大訊飛有哪些子公司_網友中的科大訊飛怎麼樣
    科大訊飛作為中國最大的智能語音技術提供商,在智能語音技術領域有著長期的研究積累,並在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。有哪些子公司呢? 安徽淘雲科技有限公司 安徽淘雲科技有限公司是一家專注於為少年兒童打造智能的軟硬體一體化產品與服務的高新技術企業。
  • 科大訊飛副總裁章繼東:訊飛輸入法的十年技術變革史
    10月20日,在訊飛輸入法10周年沙龍活動上,科大訊飛副總裁章繼東介紹了訊飛輸入法過去十年發生的技術變革。與此同時,章繼東發布了訊飛輸入法10.0版本。據了解,該版本搭載了「動態自適應編解碼語音識別引擎」,新增的唇形輔助輸入,能夠提高嘈雜環境及近距離多人說話的識別效果。另一方面優化了領域詞識別,可更精準的匹配遊戲、醫療、旅遊、購物等不同的場景詞彙。
  • 看看可以實時轉寫識別的科大訊飛錄音筆SR701
    隨著社會的不斷發展,80、90後注重生活品質,看重工作效率,為了更好的滿足消費需求,整個電子產品領域的消費都走向了「高端+AI」,出現了智能家電、智能家居,科大訊飛還針對不同的需要推出智能錄音筆SR701。
  • 科大訊飛翻譯機千萬學生的選擇
    對於想要出國旅遊或者是參加大型國際會議的人來說,語言是一大硬傷,為此科大訊飛推出了一款可以搞定所有語言的翻譯工作的產品訊飛——訊飛翻譯機。科大訊飛翻譯機因為功能強大,所以很受人們的歡迎,尤其是新上線的3.0版本,銷量一直都是處於領先地位。
  • 科大訊飛智能錄音筆A1獲得2020黑金科技獎(全文)_科大訊飛 智能...
    2020年8月3日,中關村在線(ZOL)通過線上方式揭曉2020年黑金獎(BlackGold)獲獎結果。黑金獎是由中關村在線與ChinaJoy主辦方——漢威信恆展覽有限公司打造的科技行業頂級獎項,迄今已連續舉辦五屆。
  • 科大訊飛阿爾法超能蛋雲南特價849元
    【中關村在線雲南行情】科大訊飛阿爾法超能蛋智慧機器人,近日在商家「科大訊飛雲南運營中心」特價促銷,優惠價為849元,好物好價,值得您入手!感興趣的朋友可直接前往昆明市盤龍區環城北路205號集豐寫字樓4棟101室詳詢,關於科大訊飛阿爾法超能蛋智慧機器人的促銷信息也可諮詢(聯繫電話:13577126956 )該商家。商品型號市場價(元)商品報價(元)升跌(元)科大訊飛阿爾法超能蛋8498490價格採集日期:2020年09月04日(價格如有波動,以商家報價為準)查看商品
  • 要想知道科大訊飛怎麼樣!科大訊飛翻譯機3.0了解一下!!
    對於一些朋友來說出國擔心語言不通,在國內旅遊,很多方言也不懂,這個時候科大訊飛翻譯機3.0就非常值得選擇, 能夠助你一路暢通無阻。 科大訊飛一直以來都專注於人工智慧的設計與開發,是亞太地區知名的智能語音和人工智慧上市企業,在人工智慧、大數據領域都實現了一系列成果。全新科大訊飛翻譯機3.0就是全面上線助力很多人出國旅遊、工作甚至是生活居住的必備設備。
  • 訊飛掃描詞典筆牽手海澱名校 AI教育公益計劃築夢校園行啟動
    本次大會,經教育部批准,由中央電化教育館與北京師範大學、科大訊飛共同舉辦,大會吸引了國內外百餘位專家大咖、教育管理者、教育一線工作者齊聚北京,圍繞AI+教育領域的眾多議題進行分享和交流。大會期間,科大訊飛正式發布了A.I.教育公益計劃——築夢校園行,首次向北京海澱區11所名校捐贈了訊飛掃描詞典筆,以科技賦能教育,助力學生高效自主學習。
  • 科大訊飛智學網校正儲備師資,以本地化加速布局在線大班課
    多知網4月18日消息,多知網觀察發現,科大訊飛近日在招聘在線授課教師,科目涉及高中物理、初中語文、小學數學等,正為智學網校做師資儲備。 不過,在教育領域,B端是過去幾年科大訊飛布局的主戰場。 公開信息顯示,科大訊飛目前已經與35000家學校達成合作,服務學生數量達1億。
  • 出國遊必備——科大訊飛翻譯機!
    針對眾多消費者的問題,科大訊飛推出科大訊飛翻譯機,用過科大訊飛翻譯機的用戶紛紛表示,出發前帶上它就能輕鬆解決語言溝通障礙了。科大訊飛是亞太地區知名的智能語音和人工智慧上市企業,長期從事語音及語言、自然語言理解、機器學習推理及自主學習等核心技術研究並保持國際前沿技術水平,不斷助力人工智慧產品研發和行業應用落地。而科大訊飛翻譯機3.0的上線,完全可以解決用戶的問題。
  • 科大訊飛發布TWS耳機
    近日,科大訊飛召開了新品發布會,帶來了旗下首款TWS即真無線藍牙耳機「iFLYBUDS」。這款耳機採用了半入耳設計,單次使用通話時長可達2.5小時,播放音樂可達4小時,「通話+錄音+轉寫」可達2小時,搭配充電倉,最高單次播放音樂續航可達20小時。