你是不是也曾在人聲鼎沸的超市裡,剛精挑細選好幾樣新鮮蔬菜水果,扭頭卻看到待稱重的隊伍已排到「天際」。生活真是時不時就要來點無奈,打散你我心裡的「小確幸」。那是否存在一種「聰明」的機器,它可自行辨認物品並結合重量「一步到位,自食其力」地計算出總價,免去排長隊等稱重的步驟呢?事實上,它存在——飛槳企業版EasyDL零門檻AI開發平臺的全新升級帶著更快速易用的解決方案來了!
5月20日「WAVESUMMIT2020」深度學習開發者峰會上,百度AI開發平臺部總監忻舟宣布EasyDL全新升級,重磅發布了業內首個專注於AI開發領域的智能數據服務平臺EasyData,進一步加強數據管理與加工能力,並在完整地支持Master模式的訓練與開發、端雲一體服務部署方面帶來了4項重要升級。
(圖:EasyDL平臺的全新發布與重要升級)
據介紹,EasyDL已成為目前市場上重點面向中小企業功能最全的一站式AI開發平臺。以「簡單、專業」為最核心理念的EasyDL希望通過平臺建立一條連接需求和複雜技術之間鴻溝的橋梁,幫助開發者實現零門檻AI開發,從繁雜的數據準備、環境配置、代碼開發和服務部署中脫身,專注於業務與創新。
由於大量開發者在結合業務進行模型訓練前,常常深受「數據」一環的困擾,因此EasyDL此次全新推出EasyData,面向AI開發領域,提供了一站式數據採集、清洗、標註、擴充、數據閉環等能力,與EasyDL模型訓練和部署環節配合,幫助開發者更高效更低成本的解決AI開發及應用過程中遇到的數據問題。
首先,在採集環節EasyData提供了業內首發的軟硬一體、端雲協同的自動數據採集方案,極大降低了開發者在「設備選型、調測和集成開發工作上的成本」,將數據採集效率從「周級」提升到「小時級」。緊接著,針對採回的數據,平臺還提供自動數據清洗方案,將人工處理成本降低80%。而針對AI開發中另一耗費時間的「數據標註」環節,EasyData可提供豐富的智能標註方案,支持物體檢測、圖像分割和文本分類三種任務場景,只需標註少量數據,即可通過啟動「智能標註」自動挖掘難例,並通過標註難例加速提升系統效果。與以往相同任務相比,基於EasyData智能標註解決方案,達到同等模型效果的數據標註量平均減少70%。在之後的模型訓練與發布環節,自動數據閉環使得整體模型迭代周期從月到周甚至到天,極大提升了AI開發全流程效率。
舉例來看,果蔬智能識別系統開發企業中科立業基於EasyDL快速開發的「智能雲秤」已落地20家店鋪,通過秤上的攝像頭來智能判斷商品,實現稱重結算一步到位。而在此前的實際開發中,中科立業遇到遮擋、光線影響、樣本多樣性等數據問題,在接入EasyDL後,基於EasyData的自動去模糊、過濾無效圖像、智能標註和數據增強,每天可以自動收集7000張有效樣本,整體減少了80%的數據處理量和70%的人工成本,通過EasyDLMaster模式,快速實現模型開發,對50種水果實現智能識別,準確率超過95%。
此次峰會中,EasyDL平臺除了針對數據管理方面全新發布了EasyData,還針對AI開發中的其他環節進行了4項全新升級。首先,EasyDL平臺對預訓練模型、預置算法進行了升級,使Master模式應用更簡單高效。如在NLP領域預置了效果領先的ERNIE2.0模型,將持續針對醫療、法律等專業領域擴展「領域模型」;在CV領域則預置了「超大規模視覺」預訓練模型,大幅提升通用分類和檢測的模型效果,並在零售、安防等領域發展場景化預置模型。EasyDL平臺目前共預置了36套經典NLP網絡與模型組合、26套經典CV網絡與模型組合,支持開發者更加高效快捷地進行模型開發。
其次,自動數據增強和超參搜索能力也針對實際的工業應用做了優化。其中,自動數據增強方面,平臺開放超過40種數據增強算子,可靈活配置,基於工業級搜索算法實現更高的搜索效率。同時,對於自動超參搜索,創新基於隨機微分方程的無梯度優化的調參算法,收斂速度快,不依賴平滑性假設,可支持大規模並行搜索調參。這使得EasyDL線上多場景模型精度平均提升10%以上。另外,分布式訓練加速也是EasyDL平臺的一大特點,基於PaddlePaddleDGC的優化,在常見的沒有專門經過通信優化的公有雲環境中,能夠使訓練時長平均減少70%。
總體來看,由於AI核心算法發展迅速,效果和複雜度不斷提升,並且涉及到數據處理、環境配置、結果分析、模型部署、運行監控等等,龐雜繁複的各環節,讓專注於各自領域的企業,對於所需的「定製AI開發」往往存在門檻過高的現象。而EasyDL為了讓各領域企業在進行「智能化」升級時可解放更多人力與資源聚焦在業務與創新上,在降低技術門檻、加快開發的同時,也確保了核心AI開發體驗的順暢和效果。例如,瀚才獵頭作為一家只有5個人力資源專家組成的創業公司,藉助EasyDL智能標註和預訓練模型ERNIE,公司的人力資源專家輕鬆快速,且具有行業創新性地將房地產行業「簡歷數據」建立了分類模型,針對100多個細分職業和11個通用職級進行分類,讓員工在面對「背景經驗差距巨大」卻是同一職位名稱的候選人時可進行更高效的篩選匹配。而該模型只使用了1萬條標註數據,就達到了95%以上的準確率,讓人才檢索效率迅速提升200倍。
(圖:EasyDL「盤活」瀚才獵頭海量沉沒數據價值)
最後,EasyDL還提供了市場上最全面的服務部署形態,不僅同時支持公有雲與私有化部署,更在端上適配廣泛,支持15+硬體和晶片類型和4大作業系統。會上,「EasyEdge軟硬一體方案」全新升級,包括6款方案,針對市面上流行的硬體進行專門適配,高中低全矩陣覆蓋,模型識別速度最高提升10倍,幫助開發者輕鬆打造嵌入式AI應用。其中,本次全新發布的「EasyDL-EdgeBoard(VMX)加速卡軟硬一體方案」基於IntelMovidius Myriad X晶片打造,具有小體積,低成本、高性能的特點,在百度AI市場售價679元起。另外,全新發布的「EasyDL+ NVIDIA Jetson軟硬一體方案」,覆蓋Nano、TX2、Xavier三款硬體產品,EasyDLSDK全系列加速適配。目前,Nano+ EasyDL SDK在百度AI市場限量直降,售價僅需800元。
自EasyDL平臺發布以來,已有越來越多的企業用戶和開發者將EasyDL作為他們實現業務創新和智能化升級的首選AI開發平臺。事實上,目前EasyDL已經成為了應用和落地最廣泛的AI開發平臺,已為工業、農業、交通運輸、政務等各行各業的開發者帶來了重要價值。未來,EasyDL也將繼續提供更好的開發壞境,讓開發者更加聚焦於業務與創新,加速AI開發落地的整個技術部署進程。
(7444658)