智東西(公眾號:zhidxcom)文 | 韋世瑋
智東西10月23日,今天科大訊飛在一年一度的全球1024開發者節上,發布了訊飛AI雲、認知中臺等一系列技術成果,同時《1024計劃》也升級到了4.0版本。
自2017年起,1024開發者節作為科大訊飛首個面向AI開發者的AI盛會,一直為全球各地的開發者們提供了交流、探索前沿科技成果的科技平臺。
而今年的1024開發者節除了發布一系列新技術和產品外,還打造了一個線上AI生態展廳,以及面積達2000平米的線下互動展廳,包括華為、京東、順豐速運和愛奇藝等各領域公司的主題展區,分享自身前沿科技及最新產品。
與此同時,科大訊飛董事長劉慶峰,科大訊飛高級副總裁、消費者事業群總裁胡國平,科大訊飛集團副總裁於繼棟,科大訊飛AI研究院常務副院長劉聰等高管也來到現場,為大家分享了訊飛在提升自身AI服務能力上的探索,以及為全球開發者所提供的價值。
劉慶峰談到,在AI從技術到應用落地過程中,有越來越多的領域紅利都在實實在在地兌現,而判斷AI紅利是否到來的三大標準,一是那些看得見摸得著的應用場景;二是能夠規模化推廣的產品;三是能證明產品和服務創造社會價值的統計數據。
隨著AI技術逐漸飛入尋常百姓家,科大訊飛作為國內AI語音領域的重要玩家,在不斷加速AI與語音技術跨領域融合的同時,也將自身的AI能力落地到各行各業,為傳統行業的AI轉型和創新提供解決方案。
會後,在智東西與少數媒體對胡國平的採訪中,他也向智東西分享了訊飛過去《1024計劃》3.0的階段性成果,和今年4.0計劃轉變的思路。
今年,科大訊飛又將會給我們帶來怎樣新的科技驚喜?在AI行業落地潮愈演愈烈的當下,訊飛又將如何為這個行業的創新發展提供新的思路和方向?智東西現場乾貨報導告訴大家答案。
一、劉慶峰:全球技術競爭倒逼產業關注源頭創新,AI產業發展的四大機遇
訊飛開放平臺自2010年誕生以來,一直經歷著翻天覆地的變化。
科大訊飛董事長劉慶峰談到,十年前,它只有通用的語音合成和識別兩種能力,應用終端數也不到10萬個,開發團隊僅十幾支。
但如今,訊飛開放平臺已經具備334種複雜的AI能力,應用終端數已超20億個,開發者團隊也已增長至150萬支以上。
▲科大訊飛董事長劉慶峰
在劉慶峰看來,隨著AI產業逐步走到拼落地的階段,AI之於各行各業未來的發展具有重要的戰略意義。
尤其在疫情之後,人們愈發真切地感受到AI在解決社會剛需問題上所存在的價值,以及巨大的社會需求。
劉慶峰認為,未來AI產業的發展面臨著場景驅動、數據支撐、技術驅動和資本助推四大機遇。
一方面,我國政府在AI場景應用上的獨特優勢,以及人們在教育、醫療等需要補短板的民生場景,對AI應用都有了越來越多的需求。同時,今年新型冠狀病毒肺炎疫情的蔓延,也讓人們更快速地進入到數字生存時代。
另一方面,當下以美國為首的部分政客仍在煽動中美科技戰,這進一步倒逼了我國AI行業更加關注源頭核心技術的創新能力,以及科研和產品核心能力發展的基本規律。「這對中國未來人工智慧三步走的戰略至關重要。」劉慶峰說。
而在資本方面,從去年科創板開板以來,註冊制的落實、證監會交易所審核的合規性、大量資金湧入等資本的鬆綁,都極大地助推著高新技術產業的發展,並使那些關注源頭技術的創企,能夠做出更長遠的布局。
如今,在AI產業發展的紅利之下,訊飛也已逐步構造了一個屬於自己的AI產業生態。
尤其在過去一年裡,科大訊飛平臺上的開發者團隊增長了近50萬家,目前實名認證的團隊已有157萬家,並開發出多達93萬項應用。
劉慶峰提到,AI生態已逐漸開啟了萬物互聯和工程師的紅利,同時創業者們對AI能力的應用也從為產品賦能轉向為企業轉型升級賦能。
同時,全球技術競爭的格局也在進一步倒逼產業必須在源頭上進行創新,並做更好的布局。
基於此,科大訊飛下一步的重點方向將從四個方向持續推進:
1、持續優化現有深度神經網絡算法;
2、實現機器學習的半監督和無監督學習;
3、推進個性化,讓AI能夠滿足每一個人的個人使用;
4、技術要進一步賦能數字生存時代。
除此之外,AI的情感計算和隱私保護也將是訊飛未來發展的兩個重要方向。
「我們的AI技術還需要從深度神經網絡進行推動,只有AI算法不斷進步,持續關注數字生存時代人的需求,才能持續驅動技術進步。」劉慶峰說。
二、胡國平:1024計劃全面升級,聚焦行業、城市及公益
今天,科大訊飛全面升級《1024計劃》,在往年教育、生態和公益計劃的基礎之上進行迭代,發布面向行業的先導計劃、賦能線下的城市計劃,以及公益計劃。
1、先導計劃:從培養人才到支持創業、生態創新
科大訊飛高級副總裁、消費者事業群總裁胡國平談到,訊飛在服務開發者和企業的過程中發現,人們對AI的需求越來越場景化和行業化,以往通用型的單點技術和賦能方式,已經無法滿足行業客戶的綜合訴求。
基於此,《1024計劃》的先導計劃將圍繞行業+AI,從產品賦能走向行業賦能,為生態和應用的發展提供更契合的AI動力。
具體來說,先導計劃包括面向行業的AI人才成長體系、AI開發者競賽平臺、支持大學生創業的「扶搖計劃」、集成訊飛供應鏈優勢並面向開發者與合作夥伴的「鯤池計劃」、生態矩陣上新14大行業專題、升級行業專屬服務體系等多項計劃,進一步聚焦AI行業的生態發展。
2、城市計劃:因地制宜,建立高校AI社團及實訓營
科大訊飛將從城市賦能、本地化服務、高校賦能三個方面,推動城市計劃的落實。
城市賦能方面,訊飛將組織開放平臺和訊飛研究院核心團隊前往各個城市及當地企業,根據當地的產業狀況和AI需求,形成針對城市的專屬AI賦能方案。
目前,訊飛已在蘇州、長春、天津和青島等10個城市建立了雙創基地。
本地化服務方面,訊飛將為特定城市中有重大需求保障的客戶提供本地服務保障,並充分融入本地相關產業聯盟,在建立廣泛常態化連結的同時,讓當地企業更便利地獲得AI服務和品牌扶持等。
高校賦能方面,訊飛將在線下建立實體組織來推動產學研的融合發展,與高校共同建立AI社團,提供AI課程、開展AI競賽。同時還開展AI實訓營,為學生提供AI實習的課題和相關機會。
目前,全國已有5所高校與科大訊飛共同建立了AI社團,其餘16所高校仍在溝通階段。
3、公益計劃4.0:支持脫貧攻堅,服務更多視聽障人群
為了支持國家脫貧攻堅,科大訊飛聯合新華社策劃了「聽,中國反貧困鬥爭的聲音」專項活動,改造了一輛搭載訊飛智醫助理、教育學習機、普通話學習平臺等豐富AI產品的大篷車,在安徽、雲南、重慶三個城市的深度貧困地區開展巡展。
如今,我國的視聽障人士共計已達7700萬人,胡國平在現場再次承諾,訊飛聽見APP和網站,將持續為所有聽障用戶提供終身免費轉寫服務。
與此同時,訊飛開放平臺已上線了22459個無障礙應用,每天為視聽障人群提供AI服務超5000萬次,累計服務視聽障人群超1087萬人。
在會後的媒體採訪環節中,胡國平告訴智東西,去年訊飛發布的《1024計劃》所提出的教育、生態和公益三方面計劃,在過去一年已取得階段性成果。
一方面,訊飛開放平臺的開發者數量已從108萬增長至157萬,開發應用數也從70萬增長到了93萬,且增速亦不斷增長;另一方面,通過教育計劃,訊飛也明顯感受到許多新手開發者能夠在短時間內進行相關AI創新和實踐。
而在生態方面,以往訊飛開放平臺更多為中小開發者,但從去年開始有越來越多的企業開發者,以及傳統行業開發者使用訊飛開放平臺,通過平臺的核心技術來解決自身痛點。
「人才正逐漸往行業和大企業進行一定程度的遷移,而我們與行業龍頭一起賦能行業,挖掘和探索AI在相關行業中的應用,這是一種更加有效的落地方式。」胡國平談到。
▲科大訊飛消費者事業群總裁
會上,胡國平還公布了訊飛開放平臺聯合艾瑞諮詢共同發布的《2020中國人工智慧API經濟白皮書》。該白皮書針對中國人工智慧API經濟發展和趨勢,提出了四個觀點:
1、疫情加速了企業數位化、智能化的轉型,對AI開放平臺形成利好;
2、AI開放平臺作為連接市場參與者共創價值的橋梁,將成為各大技術廠商的必爭之地;
3、AI開放平臺目前處於快速發展階段,未來仍將保持高速增長;
4、AI技術浪潮中,需要不斷跨界融合創新,與各行業場景融合,共同賦能傳統產業是必由之路。
白皮書相關數據顯示,2019年我國AI開放平臺市場規模已達104億,預計2020年市場規模將達到222億。同時,目前AI開放平臺仍處於初級階段,未來也將繼續保持高速增長,預計未來5年CAGR為41%左右。
三、於繼棟:訊飛開放平臺發布訊飛AI雲,兩大平臺組成
作為全球開放的智能交互技術服務平臺,訊飛開放平臺從2010年正式上線時,就已集成語音合成、語音搜索、自然語言處理和語音聽寫等多項能力。
經過10年發展,如今訊飛開放平臺已對外開放了334項AI能力及方案,覆蓋230萬的開發者和生態合作夥伴,累計支持的終端也已超28億。
▲科大訊飛集團副總裁於繼棟
科大訊飛集團副總裁於繼棟談到,得益於新基建發展對AI的需求,在今年疫情情況穩定後,訊飛開放平臺上的開發者數量進入了一個新的快速增長階段,連續三個季度的複合增長率已超53%。
其中,有越來越多的開發者通過開發AI應用,在工業生產、質檢和安全性等方面進行落地。從側面看,這也預示著人們逐漸進入了數位化生存的時代。
在於繼棟看來,智能升級、數字轉型、創新融合、企業數位化升級的最終歸宿是智能化。
因此,如何以數據為引擎,通過AI推動企業的可持續發展,也是訊飛開放平臺一直努力探索的方向。
基於此,於繼棟在會上發布了訊飛AI雲,通過開放基於自身10年積累的雲計算平臺,針對訊飛在AI領域的積累和優化,提供雲計算服務,為企業提供專屬及私有化部署。
於繼棟介紹,訊飛AI雲由磐石平臺和擎天平臺組成。
其中,磐石平臺主要針對AI服務,能夠對雲主機集群進行103項專業優化,降低成本、提升效率。同時,它還擁有多重認證與加密,能夠保障專屬雲用戶的接入安全。
擎天平臺則主要為企業客戶提供數據標註、模型訓練、引擎託管、服務編排等服務,以在全方位滿足不同行業客戶面對不同業務場景的AI需求。
經過兩年半發展,訊飛開放平臺已經引入了超過500家優質服務商,主要幫助上遊企業客戶解決他們在發展過程中遇到的場景定製化問題。
「但企業的數位化升級是一個非常巨大深遠的過程,只有訊飛一家公司的努力是遠遠不夠的。」於繼棟談到,訊飛也將與行業龍頭一起打磨更符合場景化的方案、聯合賦能行業,逐步幫助客戶實施和雲運營,幫助企業提升效能。
四、劉聰:訊飛科技樹構建的五大方向
在科大訊飛AI研究院常務副院長劉聰看來,AI核心技術需要遵循源頭化、體系化、可持續的發展,以在源頭技術上保持先進。
因此,以基礎算法為主幹、以技術體系為生長方向、以場景理解為發展動力這三個要素,也是科大訊飛AI科技樹的構築過程,亦是訊飛核心技術發展的內在邏輯。
會上,劉聰分別通過語音識別、語音合成、圖文識別OCR、行業認知智能等方面,為大家系統性地展示了科大訊飛的科技樹全景。
▲科大訊飛AI研究院常務副院長劉聰
1、語音識別:全場景音頻解析和個性化能力
在劉聰看來,語音識別需要持續地挑戰更加複雜的場景,實現從語音到聲音、從單純文字內容識別到音頻全場景的解析。
在現場,劉聰展示了訊飛全場景音頻解析的整體方案。該方案能夠通過多解析度特徵,提取聲音檢測事件的方案,再結合序列訓練對相似聲音進行精細建模,以實現對笑聲、音效等非語音和語音內容的分離。
其中,針對包含語音的有效內容,訊飛使用了基於富信息的語音降噪和分離方案,通過綜合利用聲音、文本、說話人等信息,使用多模態唇形、視線以及麥克風陣列的空間位置等信息進行聯合建模。
目前,訊飛與合作夥伴在直播場景下的複雜任務識別效果,從60%提升到了85%。劉聰提到,未來這些相關技術將會在訊飛開放平臺、訊飛聽見等平臺上線。
此外,劉聰還分享了訊飛在語音識別領域實現的個性化能力。
2、語音合成:全場景音頻合成,讓合成語音「有感情」
劉聰認為,語音合成技術的發展方向不能只以單純追求自然度為目標,而是要追求用戶可感知的技術,同時技術的呈現也需擁有更高的表現力。
也就是說,語音合成也需要實現從語音到聲音的全場景音頻合成。
在這一方面,訊飛基於自然語言理解技術,從文本中分析適合的情感焦點和角色相關信息,並通過語音的方式呈現出來,同時針對不同場景打造不同的背景音樂及音效,以呈現出一個全場景的合成音頻。
而這一技術不僅能應用在交互場景,也將在小說合成、配音合成等方面實現更多的價值。
除此之外,情感語音合成、多模態合成技術也是訊飛科技樹生長的重要方向。
3、圖文識別OCR:辦公場景識別準確率超90%
在OCR識別領域,劉聰認為當下面向各種場景的文檔類材料,如何用一套通用方法實現高精度的文檔恢復是行業的剛需。
在這個過程中,OCR技術不僅要進行文字識別,還要結合文檔中具有知識屬性的內容形成一些綁定要素。
例如在識別發票時,除了要識別標題之外,還需要識別印章相關的數字內容、公司名稱、納稅號等,這樣才能實現進一步的業務優化。
但現階段,在面對身份證、名片等典型識別需求時,這項技術的通用性和推廣性仍不足。
為此,訊飛基於第4代OCR技術框架,結合圖神經卷及網絡等結構化分析技術,以及基於對抗生成網絡的圖文數據生成技術,較好地解決了這些通用問題。
目前,針對辦公等一般場景的識別需求,訊飛OCR技術識別準確率可達到90%以上。
4、多語種:解決多語種語音知識積累不足和數據不足問題
劉聰向大家分享了訊飛在多語種領域實現的兩個突破。
一是針對多語種相關語言知識積累不足的問題,訊飛設計了基於相似性的統一端到端模型建模共性方案。
一方面,訊飛通過多語種統一的表徵和混合建模,實現了跨語種信息共享,發揮語種之間的共性和互補性。另一方面,訊飛通過統一的端到端建模,降低了方案對專家知識和數據的依賴。
二是針對數據不足的問題,訊飛採用了數據增強訓練技術。例如在合成訓練中,除了專門的音庫外,訊飛還應用了海量的無監督語音識別的結果來提升魯棒性。
劉聰提到,在效果要求基本相同的情況下,訊飛這項技術對數據的要求下降了80%以上。
與此同時,訊飛也將開放60個語種的語音合成系統、69個語種的語音識別系統、56個語種的圖文識別系統等多語種能力。其中,語音識別系統平均識別率超80%。
5、行業認知智能:發布認知中臺
為了進一步推進認知智能落地,劉聰在現場發布了認知中臺。
該中臺包括訊飛多年的技術積累和各行業經驗,能夠降低問題定義的難度,大幅度提升場景定製的效率。
劉聰談到,基於訊飛認知中臺和相關工具,用戶在解決常用認知過程中無需AI研究院,就能基本實現一個資深研究員成果80%以上的效果。同時,它的場景定義效率也提升50%以上。
在數據安全方面,訊飛認知中臺支持全部流程的獨立化部署及國產化。
認知中臺也將在近期上線,未來訊飛也將持續開放更多產品和功能。
結語:AI落地浪潮背後,訊飛硬核AI技術發展加速
回顧今年的科大訊飛1024開發者節,不管是《1024計劃》升級到4.0版本,還是訊飛AI雲、認知中臺等新技術的發布,我們不僅看到了訊飛在構建AI開發者生態、技術生態上的全方位探索和布局,同時在這之上,訊飛為整個行業發展所種下的AI科技樹,也早已綠樹成蔭。
我們將視野拉至AI全行業,如今AI落地的搶位愈演愈烈,AI發展的紅利也正逐漸湧入,而科大訊飛針對AI落地所推出的各類解決方案,也為行業健康有序的發展提供了新的思考方向。
但AI行業也並非一個「帝國」所能駕馭。未來,科大訊飛也將攜手更多各行各業的開發者與合作夥伴,一同將AI片密林澆灌的更加茂盛。