科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍

2021-01-08 雲掌財經

提起科大訊飛,人們總津津樂道於「讓機器能聽會說」的先進智能語音技術。其實除此之外,科大訊飛的「攻城獅們」也一直致力於讓機器「能看會認」。

近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室,以顯著優勢獲得ICFHR 2020
OffRaSHME數學公式識別挑戰賽冠軍。這是科大訊飛繼ICPR 2018 MTWI圖文識別挑戰賽上獲得三項冠軍、ICDAR 2019
CROHME數學公式識別挑戰賽上獲得兩項冠軍後,在複雜版面文檔圖像識別理解方向上所取得的又一佳績,再次展現科大訊飛在相關領域的技術先進性。

離線手寫數學公式識別(官方數據)榜單

離線手寫數學公式識別(外源數據)榜單

備註:「Correct」表示公式識別的句正確率,「」和分別表示整條公式中允許出現1處和2處錯誤的識別的句正確率

技術頂天,掌握圖文識別「金字塔」級別難題「解法」

此次OffRaSHME(Offline Recognition and Spotting of Handwritten Mathematical
Expressions)數學公式識別挑戰賽由ICFHR 2020(International Conference on Frontiers of
Handwriting
Recognition)舉辦,參賽隊伍包括韓國三星、東京農工大學、華南理工大學、中山大學等多家常年深耕文檔分析理解領域的研究機構。

相比於常規的圖文識別,對數學公式的識別難度和技術挑戰往往更高。本次OffRaSHME官方比賽任務為「離線手寫數學公式識別」,該任務相比ICDAR 2019
CROHME的離線手寫公式識別任務,難度再度升級,有以下三大難點:

公式結構 複雜, 尤其是各種結構的嵌套

難以辨別的形近字符 X x Z 2 r

本次比賽添加了很多非常規符號的組合 容易和公式混淆

難度雖高,但這樣的任務對於科大訊飛來說並不算陌生。

基於在手寫數學公式識別領域深耕多年的技術積累,科大訊飛從基於上下文無關文法的傳統數學公式方法到創新性地提出基於 LaTeX 建模的 Encoder-Decoder 識別算法 ,其中,LaTeX作為最常用的數學公式表達之一,研究人員將數學公式識別問題看作圖像到LaTeX序列的翻譯問題,藉助注意力機制實現更精準的端到端識別能力,該方案在2019
CROHME中一舉打敗了常年佔據CROHME冠軍地位的MyScript。

而針對數學公式識別中最難的複雜結構嵌套問題,科大訊飛提出了基於樹形結構信息建模的 Encoder-Decoder 識別算法 ,這種算法在複雜公式結構嵌套上更具泛化能力。針對形近符號區分難度大的問題,科大訊飛提出使用基於 LaTeX 語言模型的數據增強策略 ,利用數學公式的樹形結構表達,合理地拆分分解數學公式,並利用這些公式訓練LaTeX語言模型,最後使用語言模型增強出合理的、符合上下文語義關聯的數據,該策略可以很大程度上緩解形近符號識別困難的問題。

通過以上多項技術能力的綜合運用,此次科大訊飛以顯著優勢拿下了此次任務難度極高的數學公式識別挑戰賽冠軍,證明了其在數學公式識別領域的技術先進性;在實際應用中,學生作業試卷文檔存在版面結構複雜、書寫風格差異顯著等難點問題,這一系統將為其提供更為豐富有效的解決方案。

通過多項技術能力的綜合運用,在「能看會認」上,科大訊飛做得更好了!不僅能識別更複雜的數學公式,還能做到「中文+數學公式」混合搭配的內容識別,此後將在更多A.I.產品中應用。

https://v.qq.com/x/page/s3080uld0xk.html

應用立地 打造 「能看會認」的 A.I. 產品

在數學公式識別比賽之外,近期科大訊飛還在另一項自然場景的文字檢測分割識別的相關技術成果在ICDAR ReCTS(Reading Challenge on
Reading Chinese Text on
Signboard)評測任務取得顯著突破,刷新單字識別、文本行識別、文本行檢測和端到端識別全部四項榜單世界記錄,使得系統在解決複雜場景下文字檢測和識別的難題中更為遊刃有餘。

這些成績並非一簇而就。

事實上,科大訊飛在圖文識別領域已有多年核心技術積累,擁有自主智慧財產權,並伴隨著每次技術迭代,產品都迎來大規模更新升級,更好滿足用戶在多個場景下使用需求。

2015年,輕量級的 卷積神經網絡 首次在手機設備上使用,使得在線手寫字符識別任務上取得突破性進展。依託此項技術,訊飛輸入法 用戶手寫輸入體驗感顯著提升。

2016年,CNN-HMM 框架 在文本行識別任務中得到成功應用,該套系統無需進行文本行切分等規則化的複雜版面分析,有效避免切分帶來的錯誤,使得篇章級的中、英文手寫文檔識別效果達到人工相當水平。依託此項技術,科大訊飛智能輔助評卷系統能夠對語文作文、英語作文、英語翻譯、數學填空、英語填空等題型進行輔助評卷,應用全國多省市的中高考,累計處理題卡數量過億張。

2018年,基於注意力機制的 Encoder - Decoder 模型 在自然場景文字識別任務上大放異彩,融合語言模型進行端到端訓練,使得拍照模糊的文字也能通過語言模型「聯想」而被正確識別。依託此項技術,在訊飛翻譯機 中,對複雜場景下的多種字體也能一拍即譯,讓拍照翻譯更清晰更準確,能夠滿足更多消費者在國外旅遊、購物的場景應用需求。

今年,在數學公式識別任務的諸多關鍵技術上繼續突破,相關核心技術也將應用在訊飛 智能 學習機 等產品中,幫助用戶精確地進行大數據學情分析,找到知識點的薄弱項,實現「個性化精準學」,幫助廣大同學提升學習效率、鞏固學習效果。

在技術應用的過程中,手寫圖文識別也與智能語音等關鍵技術深度融合,讓大家切實感受到技術進步帶來的高效、便利性。如「出口成章,躍然紙上」的訊飛智能辦公本 ,可以實現語音直接搜索手寫筆記內容,「一句話找到手寫筆記」,滿足用戶在更多筆記場景下的記錄、寫作、搜索、多端同步需求,有效提高辦公效率。

在即將到來的618年中大促中,還有更多產品將和大家見面,大家可以進一步、零距離體驗這些新技術。

堅守人工智慧道路21年,科大訊飛不斷攀越技術高峰,在智能語音、計算機視覺、自然語言理解等技術領域摘得一項又一項桂冠,但這並不是終點。科大訊飛將始終秉承「頂天立地」的技術信仰,打造一件件「能聽會說」、「能看會認」、「能理解會思考」的人工智慧產品,用人工智慧點亮人間煙火。

相關焦點

  • 從CVPR到ICDAR 科大訊飛橫掃2019年度計算機視覺頂級會議多項冠軍
    從計算機視覺頂級會議CVPR的物體檢測挑戰賽DIW 2019到文檔分析與識別頂級會議ICDAR的手寫數學公式識別挑戰賽CROHME、場景文本視覺問答挑戰賽ST-VQA,這個6月不乏有一些計算機語言與人工智慧專業比賽陸續落幕。在這些行業賽事中,自然少不了科大訊飛的身影。
  • 科大訊飛DCASE挑戰賽奪冠,「A.I.+工業」前景廣闊
    南方網訊 (記者/陳偉峰)近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在聲音事件定位與檢測(Sound Event Localization and Detection,Task 3)任務中摘得桂冠。
  • 618終極福利時間 快入手科大訊飛A.I.黑科技
    在618開門紅當日,訊飛智能筆記本系列連續兩年摘得京東電紙書品類&天貓智能語音轉譯設備品類雙平臺銷售額桂冠,新品智能筆記本青春版喜獲天貓電紙書品類國內品牌單品銷售額冠軍。訊飛智能辦公本訊飛智能錄音筆SR系列定義了AI旗艦錄音筆行業四大標準——識別準、錄得遠、錄得清、語種全。
  • AI教育築夢校園|科大訊飛劉慶峰:未來屬於掌握了人工智慧的新人類
    12月11日-12日,「教育未來,因A.I.而能——2020全球人工智慧與教育大數據大會(A.I.D.E)」在北京·國家會議中心舉行。本次大會由中央電化教育館與北京師範大學、科大訊飛共同舉辦。
  • 追星就追科學家:科大訊飛為青少年教育「點燃一把火」
    為了讓這顆小小的種子一點點生根發芽,科大訊飛將青少年們帶到了未來科學大獎的殿堂,讓他們親身感受真正的科學家們的智慧與魅力。12月30日,科大訊飛以「追星就追科學家」為主題,成功舉辦了2020青少年對話未來科學大獎獲獎者專場活動。
  • 科大訊飛給你答案
    其背後的技術加持,來自於科大訊飛消費者事業群推出的訊飛智聲「多語種虛擬主播」解決方案。科大訊飛的虛擬主播採用的是合法合規授權下真人的拍攝製作形式,需要採集主播本人視頻和音頻數據,通過專業技術人員進行操作處理和數據訓練。
  • 訊飛諦聽,不止於聽
    深耕於人工智慧與智能領域多年的科大訊飛拾音品牌——諦聽,近期逐漸嶄露頭角,在一條科技評測視頻中,可以精準識別低至30分貝的微小聲音,也能在90分貝得噪音環境下有效提取音頻。30分貝是什麼概念呢?普通人正常說話的音量是50分貝左右,一隻蚊子飛過的聲音大約40分貝,也就是說訊飛諦聽甚至可以捕捉蚊子飛過的聲音。
  • 新年必備好禮 訊飛AI生產力好物助力效率提升
    查詞只需0.5秒 訊飛掃描詞典筆一掃抬手見釋義作為2020年11月首發AI學習類新品,科大訊飛掃描詞典筆針對英語單科學習中生詞學習過程中的聽、說、讀、記全流程需求,設計了對應的創新功能,能幫助孩子在英語生詞的查閱和學習方面都更加高效。在查詞方面,詞典筆的筆尖對準單詞,查一個單詞僅需0.5秒,輕輕一掃抬手即見釋義。
  • 科大訊飛拾音領域實現新突破,「諦聽」可識別30分貝超小音量
    深耕智能語音與人工智慧領域多年的科大訊飛,近期推出了全新拾音品牌——諦聽,在超小音量拾取和降噪方面再下一城。其實,訊飛在早前推出的訊飛錄音筆、智能滑鼠、阿爾法蛋等產品均涉及語音交互。基於產品應用的技術積累,這次在拾音領域發力深耕,令人欣喜。
  • 鵬城實驗室與科大訊飛攜手合作 推進大灣區智慧醫療「新基建」
    鵬城實驗室與科大訊飛籤約合作見圳客戶端•深圳新聞網2020年5月13日訊(見圳客戶端、深圳新聞網記者 吳英敏 通訊員 商笑野)日前,鵬城實驗室與科大訊飛股份有限公司戰略合作籤約儀式在鵬城實驗室舉行,在鵬城實驗室主任高文院士、科大訊飛董事長劉慶峰等見證下,實驗室常務副主任鄒鵬、科大訊飛高級副總裁杜蘭代表雙方籤約。
  • 科大訊飛有哪些子公司_網友中的科大訊飛怎麼樣
    科大訊飛作為中國最大的智能語音技術提供商,在智能語音技術領域有著長期的研究積累,並在中文語音合成、語音識別、口語評測等多項技術上擁有國際領先的成果。有哪些子公司呢? 安徽淘雲科技有限公司 安徽淘雲科技有限公司是一家專注於為少年兒童打造智能的軟硬體一體化產品與服務的高新技術企業。
  • 科大訊飛承建國內首個認知智能國家重點實驗室
    中證網訊(記者 任明傑)日前,科技部正式設立第一個人工智慧國家重點實驗室——認知智能國家重點實驗室,這一實驗室交由科大訊飛股份有限公司來承建。  「科大訊飛承擔建設認知智能國家重點實驗室,將藉助更高的平臺和勢能,進一步在全球範圍內整合認知智能領域的源頭核心技術、科技人才和行業數據資源,助力我國在認知智能的技術和產業走在世界前列,為我國成為世界主要的人工智慧創新中心貢獻自己的力量。」 科大訊飛副總裁、研究院院長胡國平告訴記者。
  • 訊飛智能鍵鼠,辦公效率快人一步|鍵盤|語音識別|滑鼠|科大訊飛...
    訊飛智能鍵鼠是科大訊飛面向A.I.+辦公領域推出的提升PC使用效率的智能外設組合,即通過軟硬體結合的方式,對傳統PC外設進行改造,進而讓其擁有智能化的能力,主要包括語音識別、語音翻譯、語音控制、OCR識別等功能。截至目前,訊飛智能鍵鼠包括訊飛智能滑鼠Lite、訊飛智能滑鼠Pro、訊飛智能滑鼠標準版以及訊飛智能鍵盤K710多款產品。
  • 中英文識別率更高,用科大訊飛翻譯機獲得滿滿體驗感
    為了滿足這些人的實際需求,科大訊飛打造出的訊飛翻譯機就非常的實用,翻譯速度快又準,獲得了用戶的高度評價。科大訊飛翻譯機自從上線以來,特別是3.0版本,因為功能豐富而且強大,所以備受用戶的青睞,銷量一直都保持領先。通過人工智慧技術的植入,科大訊飛翻譯機展現出了更加多出色的性能,滿足了用戶的個性化翻譯需求。
  • 北師大攜手科大訊飛發布「訊飛教育腦計劃」!
    二十多家聯盟成員單位齊聚北京,科大訊飛攜手其他聯盟單位重磅發布「訊飛教育腦計劃」,聚焦腦智科學前沿,分享年度研究成果,研討未來重點工作,以更好地服務國家基礎教育重大需求。1科大訊飛聯合中國兒童青少年腦智研究全國聯盟其他單位重磅發布「訊飛教育腦計劃」科大訊飛聯合北京師範大學等聯盟其他成員單位,發起了「訊飛教育腦計劃」,該計劃聚焦研究兒童青少年腦與心智發育和提升的新機制與新機理,探索個體學習與課堂教學的新方法與新形式。
  • 科大訊飛發布5大單品和iFLYOS 2.0
    「A.I.翻譯機要圍繞聽得清、聽得懂、譯得準、發音美四大標準為產品的核心要求,在實戰中通過對說話人、對環境、對內容三大適應性的考驗,才能稱之為一臺好用的翻譯機。」科大訊飛翻譯機產品經理翟吉博說。訊飛翻譯機3.0面對說話人的帶口音普通話、方言、各式英語的翻譯效果同樣出色。
  • 科大訊飛1024開發者節啟幕,A.I科技樹化身能力星雲服務百萬開發者
    10月23日,2020科大訊飛全球1024開發者節盛大開幕。今年這場盛會的主題為「AI煥新·更美好」,旨在通過「開放·合作·生態·共享」的理念,共建人工智慧新生態。其中,科大訊飛AI研究院常務副院長劉聰為大家帶來了一場A.I.技術的盛宴。
  • 科大訊飛副總裁李世鵬:語音領域訊飛沒有對手
    2019蘇州智博會期間,科大訊飛副總裁李世鵬接受了TechWeb的採訪,對科大訊飛產品的研發與應用方向,以及市場競爭情況進行了簡短討論。科大是否有足夠的技術壁壘來應對?李世鵬:如果你去CES展看過,80%以上的中文對話產品都是用科大訊飛的技術。包括海爾一類大廠,前不久我們還和海爾做了一家合資企業。你也可以看到,我們能夠和大型汽車廠商合作,做車內語音控制。說心裡話,語音這一塊,科大訊飛和新入局的小公司不在一個水平上,他們稱不上是訊飛真正意義的競爭對手。
  • 搜狗訊飛分獲IWSLT2018評測第一,到底哪個冠軍更有份量
    10月31日上午,科大訊飛和搜狗兩家公司幾乎在同一時間,都表示自己獲得了IWSLT2018國際口語機器翻譯評測比賽的第一名。看到這個奪冠「撞車」的消息,讓網友們不禁產生了強烈的疑惑:又不是並列第一名(搜狗明確說明了擊敗訊飛),這一個比賽裡為什麼會有兩個世界冠軍呢?
  • 科大訊飛狂攬25冠 翻譯機再次雙平臺奪冠
    此次購物節大戰中,科大訊飛表現搶眼。雙十一期間(11月1日至11月11日)科大訊飛智能硬體產品體系斬獲三大平臺25項冠軍,累計銷售額同比增長56%。科大訊飛消費者業務已連續三年保持超過30%的高增速,受到了業內以及消費者的高度認可。此次雙十一,科大訊飛辦公系列產品表現不俗。