從計算機視覺頂級會議CVPR的物體檢測挑戰賽DIW 2019到文檔分析與識別頂級會議ICDAR的手寫數學公式識別挑戰賽CROHME、場景文本視覺問答挑戰賽ST-VQA,這個6月不乏有一些計算機語言與人工智慧專業比賽陸續落幕。在這些行業賽事中,自然少不了科大訊飛的身影。
據悉,6月期間,由科大訊飛A.I.研究院與中科大語音及語言信息處理國家工程實驗室(NELSLIP)(以下統稱為訊飛-中科大聯合團隊)組成的聯合團隊,先是在物體檢測挑戰賽DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三雙重佳績。隨後又在手寫數學公式識別挑戰賽CROHME全部兩項任務以及場景文本視覺問答挑戰賽ST-VQA挑戰賽上全部三項任務摘取冠軍之席,此外還取得了街景招牌中文文本識別挑戰賽ReCTS單字識別任務冠軍。上述成績可謂展現了科大訊飛在計算機視覺領域的技術水平與優勢。
對於計算機視覺領域不是很熟悉的人,可能對DIW 2019挑戰賽略感陌生。實際上該項活動作為一項行業內的專業級賽事,不僅吸引了騰訊、百度、字節跳動等300多支團隊參賽,在賽題內容上來看,其所採用的Objects365數據集包含63萬張圖像,高達1000萬人工標註框,覆蓋365個日常物體類別,堪稱最大通用物體檢測數據集,科大訊飛能夠在300多支強隊中拔得頭籌,足可見其在圖像識別領域的不俗實力。
而在由美國羅切斯特理工學院(Rochester Institute of Technology)承辦的手寫數學公式識別挑戰賽CROHME中,科大訊飛與MyScript、三星、 WIRIS(MathType)、中科院自動化所、中山大學等多家在手寫數學公式識別領域著名的國內外研究機構同臺比拼,憑藉著自身在數學公式的字符和位置關係的端到端識別,以及多尺度空間注意力機制解決字符尺寸差異較大帶來的識別字符丟失等問題上的技術突破,連奪在線手寫數學公式識別和離線手寫數學公式識別兩項主要任務冠軍。
最後,在CVC(Computer Vision Center)舉辦的視覺問答挑戰賽ST-VQA上,面對算法圖像檢測、分割等前端技術,以及算法具備多模態數據融合、理解和推理能力的考驗,科大訊飛出色地完成了對圖像定候選詞表、對數據集定候選詞表,沒有額外詞表直接預測答案三項任務,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三項冠軍。
三場計算機視覺領域的巔峰大賽,N項領域內的前沿任務,科大訊飛A.I.研究院能夠同時將多個冠軍榮譽收入囊中,充分說明了科大訊飛在文字識別技術上的領先性。其實,作為亞太地區知名的智能語音與人工智慧上市公司,堅持技術頂天、產品落地的戰略理念,科大訊飛一直在核心技術上推陳出新,特別是在智能語音與自然語言處理領域,不僅積累了豐厚的成功經驗,近年來還積極嘗試將技術賦能行業,為教育、醫療、政法等領域提供可進一步釋放效能的人工智慧解決方案。相信憑藉著在核心技術上的優勢地位,科大訊飛能夠為更多領域更多行業帶來人工智慧的新體驗。