新冠肺炎疫情發生以來,遠程辦公,在線教育、雲服務,IoT,5G等為代表的新應用展示了數字經濟時代數據技術的優勢及巨大潛力,一個智能化社會的形...
新冠肺炎疫情發生以來,遠程辦公,在線教育、雲服務,IoT,5G等為代表的新應用展示了數字經濟時代數據技術的優勢及巨大潛力,一個智能化社會的形態初步呈現在世人面前。大量企業在數位化、智能化方面不斷加碼,提速轉型,也讓「企業數字基建」成為焦點。近日,全球領先的AI技術和解決方案提供者探智立方,發布了DarwinML TRNET的功能升級,以AutoML技術加持智能票據與文檔識別,幫助企業實現帳務自動化處理,為企業降低大量的運營成本。
現代企業的運作與票據和文檔處理是分不開的,合同管理、報銷管理、各類發票、機票、火車票、銀行票據與證明材料等的人工錄入,佔據了財務審核人員大部分的精力;於此同時,大多數企業針對票據的電子化僅僅做到了掃描或圖片記錄,而對於票據中內容的不能加以識別和處理,這就造成了數據利用不充分,人工成本高昂的運營現狀。
DarwinML TRNET智能票據與文檔識別平臺將徹底改變票據與文檔識別依賴於人工的現狀,通過人工智慧計算機視覺技術與NLP技術相結合,並充分發揮AutoML技術快速自動建模的優勢,為企業用戶打造適應自身需求的智能票據與文檔識別平臺。
同時,DarwinML TRNET採用自主研發的綜合信息評分算法模型,可以適應在票據格式不同的情況下,正確提取識別欄位的內容,根據某些欄位的特點,對識別結果進行校正和糾錯,從而提高識別的準確度,目前,增值稅專用發票、增值稅普通發票、增值稅電子普通發票、火車票、定額發票、航空運輸電子客票行程單、計程車票、客運票、機打發票等票據,DarwinML TRNET都能進行自動分類,結構化識別,並按用戶需求格式輸出識別結果。幫助企業實現高精度的票據及文檔自動化處理,免去人工錄入的勞動並降低錯差率,從而為企業降低大量的運營成本。
探索企業票據智能化管理新場景
DarwinML TRNET上市以來,已經得到了國內大型商業銀行、股份制保險公司、大型企業、專業財務公司等多家企業的青睞與使用,並與中國創新科技企業票易通達成戰略合作,通過結合人工智慧深度學習技術,打造全方位共贏的智能稅務行業發展的數位化新時代。票易通首席構架師陳凱這樣評價:「AutoML技術的發展已經可以為財務行業的多個應用點提供很好的效率提升,探智立方的DarwinML TRNET系統具有諸多優勢,是企業智能財務票據管理的好幫手。」
探智立方是全球領先的AI技術和解決方案提供者,基於自主研發的DarwinML平臺為AI在各行業的應⽤賦能,為企業客戶提供一站式、全自動的模型⽣成和部署能力。作為企業AI賦能平臺,DarwinML以先進的演化算法及強大技術作為支撐,從根本上協助企業將人工智慧⾼效構建到業務應用和決策中,並不斷探索基於公司核心技術DarwinML自動建模平臺在行業應用領域的不同場景,DarwinML TRNET即是在票據與文本識別領域的成功應用之一。未來,探智立方還將繼續探索把DarwinML核心技術應用到證券行業的量化投資分析,製造業的產品質量檢測等多個應用領域。
基於進化算法的 AutoML 路線
在 AI 自動建模上,AutoML 的實現路徑其實包括四大方向:強化學習、進化算法, 遷移學習方法及元學習(Meta Learning 是未來有潛力的方向之一),各家公司的實現路徑不同,不過大多數採用的是遷移學習。與眾不同的是,探智立方一直堅持探索進化算法方向。
「強化學習模型收斂較難,對失敗次數要求比較高,需要的計算量也不小,」宋煜表示。「目前業界應用最多的 AutoML 方法基於遷移學習(transfer learning),百度、華為、谷歌等公司推出的 AutoML 產品大多基於這種方法。」
不過後者也有缺點:需要背靠足夠大的數據科學家團隊,以及特定領域中豐富的模型種類。我們可以看到今天 AutoML 產品在圖像領域裡效果最優,這是因為圖像領域中可以獲取的資源是最多的(不僅是模型,甚至模型權重都有開源)。
但在大量其他領域,如果希望對時序、結構化數據進行處理和分析,沒有一定之規,也沒有現成權重,遷移的方法或許就無法適用了。
另一方面,基於序列模型的方法和元學習方法則會面臨搜索空間過大後導致運算量需求指數級上升等不同挑戰。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。