人工智慧三要素:算法、算力、數據,持續更進一步,讓AI的邊界不斷拓展。AI工業大生產時代到來,深度學習越來越肩負著人工智慧技術突破與行業落地的重任。5月20日,「WAVE SUMMIT 2020」深度學習開發者峰會在線召開,作為中國深度學習技術極客的年度盛宴,該峰會由深度學習技術及應用國家工程實驗室與百度聯合主辦,而百度飛槳作為中國首個開源開放、功能完備的產業級深度學習平臺又一次迎來全平臺重磅升級。
百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰在峰會上分享到:「時代契機為飛槳的發展提供了最好的機遇,飛槳將與產業緊密融合,與開發者並肩前行。」
(圖:百度首席技術官王海峰)
百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜正式對外發布飛槳最新的全景圖,包含飛槳開源深度學習平臺和飛槳企業版兩部分。飛槳開源深度學習平臺部分,包含核心框架、基礎模型庫、端到端開發套件與工具組件,持續開源核心能力,為產業、學術、科研創新提供基礎底座。同時,隨著企業應用需求越來越強烈,飛槳升級產品架構,推出飛槳企業版,包含零門檻AI開發平臺EasyDL和全功能AI開發平臺BML,助力各個企業進行AI創新。
(圖:飛槳核心框架架構全景)
為了滿足時代與政策雙重作用下猛增的「智能化」快速轉型需求,飛槳此次全平臺全新發布和升級35項技術能力。飛槳開源深度學習平臺的升級與發布依舊側重「工業級應用的極致體驗」和「持續布局深度學習前沿技術」兩大方向,繼續保持開源,讓深度學習從開發、訓練到部署的全流程功能更加強大,更引領著前沿技術的持續創新。此外,飛槳還更完善地支持著產業實踐的落地與價值創造,作為契合時代的「技術底座」,為新型基礎設施建設提供重要支撐。
特別值得一提的是,峰會現場飛槳率先宣布支持複數神經網絡,支持跨學科的機器學習研究。事實上,去年11月百度大腦就曾發布基於複數CNN網絡語音增強及聲學建模的「一體化」端到端建模技術,前瞻性遙遙領先。此次峰會,百度再次基於複數神經網絡,首發量子機器學習開發工具量槳。飛槳賦能量子計算,成為國內首個、目前也是唯一一個支持量子機器學習開發工具的深度學習平臺。
(圖:飛槳發布量子機器學習開發工具Paddle Quantum量槳)
通過量槳,開發者不僅可以輕鬆搭建簡潔的量子神經網絡,還可以根據豐富的量子機器學習案例一步步組建所需模型。此外,由於飛槳已系統地擴展了包括複數變量、複數矩陣乘法在內的多項底層功能,因此量槳可完美地支持量子電路模型,也支持通用量子計算相關的研究,具有極好的通用性以及拓展性。簡單來講,量槳的量子機器學習開發工具包括:量子開發工具集,量子化學庫,以及一系列優化工具。與此同時,量槳還提供了量子機器學習、量子化學模擬以及量子組合優化這三大核心量子應用。除此之外,聯邦學習、強化學習、圖神經網絡等前沿技術也再次升級,為開發者提供強大的前沿開發工具組件,有力支持更多開發需求。
從開發、訓練到部署,飛槳開源深度學習平臺為開發者帶來開發全流程體驗的提升。在開發方面,除了提升動態圖和高層API的能力外,飛槳還在圖像和語音領域新增3個端到端開發套件。其中,在圖像領域發布了工業級圖像分類開發套件PaddleClas,其深度優化的ResNet50_vd識別準確率可達82.4%;以及可實現「千萬級類別規模」分類,並提供模型並行、自動混合精度訓練的PLSC套件。目標檢測開發套件PaddleDetection也在模型數量、精度、速度和產業應用能力方面進行了全面升級。同時,還在語音領域全新推出具有「快、輕、簡」優勢的語音合成Parakeet開發套件。由於「端到端的開發套件」具有極易部署的重大優勢,不僅可用於服務端的集成或服務化部署,並且其推理計算還能在移動端與邊緣設備上進行部署,所以一直以來被各行各業的企業開發者在「智能化」升級時所喜愛。
(圖:飛槳開源深度學習平臺全面升級)
持續升級的還有自然語言理解(NLP)端到端開發套件ERNIE。ERNIE通過在通用基礎模型上藉助領域數據進一步構建弱監督任務,並進行持續學習,從而生成了多個「領域模型」,如法律領域、醫療領域等,可對專業內容進行理解。而將這些領域模型用於有監督的任務場景,即可得到各個領域的應用模型。截止目前,ERNIE面向產業應用,已形成包含有通用模型、任務模型、輕量級模型,以及領域模型的NLP預訓練模型集。
訓練方面,新增自動混合精度訓練能力,一行代碼就可以實現訓練速度提升兩倍;通過重計算機制降低顯存佔用,訓練極深模型又好又省;擴展了模型並行、彈性訓練等大規模分布式訓練能力,更好滿足超大規模數據場景的開發者需求。此外,還全新發布PaddleCloud雲上任務提交工具,可快速匹配雲上資源,提供雲端訓練資源。
而部署層面來講,飛槳提供多平臺、多場景、高性能的整體部署方案。此次除了持續夯實模型壓縮PaddleSlim、原生推理引擎Paddle Inference、在線部署框架Paddle Serving、輕量化預測引擎Paddle Lite等端到端部署核心能力,還全新發布國內首個開源JavaScript深度學習前端推理引擎Paddle.js,用於小程序、網頁端部署。會上,飛槳聯合全球領先硬體廠商英特爾、英偉達、arm中國、華為、MediaTek、寒武紀、浪潮、中科曙光等啟動共建硬體生態合作圈,強強聯手,合力推動AI更快速的發展與落地。
在工具組件上,為了進一步提升開發者全流程開發體驗,飛槳全新發布PaddleX全流程開發工具,實現對「開發、訓練、部署」全流程的打通,極大地方便了快速集成,大幅提升模型開發效率。目前,PaddleX已在各類AI應用的快速開發中提供支持,如廣東電科院使用PaddleX開發智能巡檢,將原來6小時的巡檢流程縮短至15分鐘;以及虛擬實境內容公司「指揮家」,在使用PaddleX實現VR應用時,其開發效率提升了30%以上。
去年秋季深度學習開發者峰會上,飛槳發布的Master模式,此次也迎來全面升級,預訓練模型更多、遷移學習能力更強。其中,在預訓練模型方面,重點聚焦視覺預訓練模型和NLP語義理解模型ERNIE。例如推出了視覺方面的超大規模的分類預訓練模型、目標檢測預訓練模型、超大規模視頻分類預訓練模型等等。遷移學習工具方面,則新增DELTA、Deep Transfer Never Hurt、自動化超參搜索等多個最新技術,提升應用效果。企業開發者可以通過開源的PaddleHub和EasyDL應用飛槳Master模式,僅用少量數據、簡單操作、更低成本,實現多場景下的優異模型效果。
最後,飛槳的服務平臺升級為「飛槳企業版」。其中,EasyDL此次重磅發布業內首個專注於AI開發領域的智能數據服務平臺EasyData,並在預訓練模型、自動數據增強與超參搜索,分布式訓練加速、端計算模型部署等4個方面進行升級。
不難感受到,飛槳一邊為「智能化」升級的產業實踐提供著全面且強有力的技術支持,一方面也在產業實踐過程中,實現技術能力的持續迭代、快速發展。在整個迭代進程中,飛槳針對不同開發能力及開發需求的個人開發者與企業,進行全方位的賦能,不斷降低深度學習的應用門檻。本屆峰會,飛槳再次通過一系列的新動作,將深度學習在實際業務中落地部署的速度加快,而同一時間,中國「產業智能化」轉型進程、中國智造的創新方式也再次獲得巨大助力。