2020年8月14日,由科大訊飛提出的A.I.數據質量國際標準項目《人工智慧-分析和機器學習的數據質量-第4部分:數據質量過程框架》順利通過ISO/IEC國際標準化組織立項。該標準是首個由中國牽頭制定的人工智慧國際標準,將由科大訊飛專家作為項目負責人與全球各國專家共同制定。
彎道超車進行時
就在科大訊飛牽頭制定的人工智慧國際標準獲批立項前兩天,科大訊飛董事長劉慶峰就被列入「黑名單」公開回應,在最近結束的最權威的英文語音識別比賽中,科大訊飛再次蟬聯全球第一。
劉慶峰特別提及,由於美國對華為的極限施壓,谷歌的GMS不再給華為提供語音助手和全套服務,而科大訊飛能夠解決這一問題,重要的是,為華為提供的語音產品在英語、法語、西班牙語上已全面超越谷歌,彰顯國內語音產品的技術突破及市場認可度。
實際上,1999年之前,中文語音產業基本控制在國外IT巨頭手中,微軟、IBM、Intel等紛紛在中國設立語音研究基地,中文語音產業被國外企業佔據主導。在此背景下,劉慶峰博士1999年6月帶領來自中科大的17名同學,在安徽合肥的一間民房中成立一家語音技術公司,命名為「星星工作室」,後在2000年更名為「科大訊飛」,歷經近20年發展,科大訊飛2019年收入規模突破100億元,2008年上市至今收入複合增速高達38%。
在公司營收飛速突破的2019年,科大訊飛也正式進入人工智慧戰略2.0階段,除了繼續保持原有的技術領先、收入毛利增長、用戶數增長三大目標外,新增了人均效益提升的目標。
科大訊飛試圖通過全面推進增量績效管理、實現業務聚焦,來提升經營效益,最終達到「在人員沒有大幅增長的情況下,保持收入和毛利快速增長」的目標,從而促使淨利潤的增速與收入和毛利匹配,利潤端的效益逐漸釋放。
語音識別技術全球領先
科大訊飛之所以有信心增加並實現人均效益提升的目標,或許和公司最近幾年連續實現技術突破密不可分,畢竟手握核心競爭力,是一家科技公司的底氣所在。
2018年9月,訊飛在第五屆國際多通道語音分離和識別大賽(CHiME-5)比賽中,包攬單麥克風陣列任務、分布式麥克風陣列任務(Rank A)和兩種麥克風陣列對應的兩個端到端的語音識別任務(Rank B),共計四項任務所有項目冠軍,並再次刷新各項目的最好成績,實現兩連冠。
始辦於2011年的CHiME屬於國際語音識別評測中的高難度比賽,由法國計算機科學與自動化研究所、英國謝菲爾德大學、美國三菱電子研究實驗室等知名研究機構所發起。賽事的難點主要包括多麥克風陣列的同步錄音,大量的語音交疊(Speech Overlap)以及遠場混響和噪聲幹擾對錄音的影響等。
在這種高難度的世界級比賽中,科大訊飛系統較官方基線詞錯誤率降低35個基點,獲得四項冠軍,再次印證了科大訊飛在語音識別和多麥克風陣列語音信號處理領域內紮實的基本功和雄厚的技術實力。
而在語音合成領域,Blizzard Challenge是最具權威性和影響力的國際賽事,Blizzard Challenge在2019年首次以中文作為比賽任務,用某脫口秀主持人的風格作為聲音合成樣本,設定故事、百科、詩詞等文本為合成形式,再加上英文混讀、兒化音等偏門難點任務,號稱Blizzard Challenge「有史以來最難」。
此次比賽中有自然度、相似度、錯誤率三個評測項目。訊飛團隊提交的參賽系統摘下自然度、相似度兩項關鍵指標的第一。其中,訊飛把合成領域最關鍵的指標自然度從2018年的4.0MOS提高到4.5MOS,創歷史新高。
此次比賽中,科大訊飛向世界充分證明國內企業語音識別的「硬核實力」。憑藉其過硬的技術實力,以及優質客戶群,科大訊飛實現人均效益提升的目標也就不難理解了。