智東西(公眾號:zhidxcom)
作者 |李水青
編輯 |漠影
「技術道路如此崎嶇漫長……你熱愛的代碼……這世界因程式設計師激蕩。」
在一曲程式設計師版的《曾經年少輕狂》搖滾歌聲中,WAVE SUMMIT+2020深度學習開發者峰會今天在北京啟動。
智東西12月20日報導,在這場人工智慧領域的年終盛宴上,百度為開發者帶來了八大全新發布與升級包括:
生物計算平臺「螺旋槳」、飛槳開源框架V2.0RC版、端雲協同的AI集成開發環境BML CodeLab三大新發布,更強大規模分布式訓練、開源算法庫增至200+、智能數據服務平臺EasyData升級三大升級,最新飛槳硬體生態路線圖,「大航海」計劃。
百度深度學習框架飛槳(PaddlePaddle)於2016年正式開源,成為中國首個開源開放、功能完備的產業級深度學習平臺,使得國產深度學習框架在谷歌、Facebook等國際巨頭的包圍中佔據一席之地。
幾年後的今天,飛槳已經越來越強調產業生態和真實落地價值。
大會開場,百度CTO王海峰公布了一組關於飛槳的統計數據:飛槳累計開發者數量已超過265萬,基於飛槳訓練的模型超34萬,服務企業累計超10萬家。而在2020年5月份上半年的WAVE SUMMIT 2020深度學習開發者峰會上,這些數字還是190萬、23萬、8.4萬,可見擴張迅猛。
本次會上,包括寧德時代新智能製造部部長張偉、崑崙數智人工智慧與物聯網技術總監衛乾都帶著智能落地的豐碩成果進行了報告,並同多家網際網路、工業、金融、交通等多行業的企業一同獲得「飛槳產業應用創新獎」。
除此之外,百度集團副總裁吳甜等人也帶來了飛槳在技術更新、產業生態、人才培養等方面的最新進展。
近半年,飛槳有什麼樣的新進展?話不多說,首先讓我們看三大全新發布。
1、生物計算平臺:PaddleHelix螺旋槳
PaddleHelix螺旋槳生物計算平臺將先期開源工具集包括RNA二級結構預測、大規模的分子預訓練、DTI藥物靶點親和力預測以及ADMET成藥性預測等,面向生物信息領域智能交叉學科的學習者、研究者、工作者們提供稱手工具。
其實,在今年疫情期間,百度研究院開發的線性時間算法linearflod就面向全球進行了公益開放,不久後免費開放了全球首個mRNA疫苗基因序列設計算法LinearDesign,在人工智慧技術和生物計算領域進行嘗試探索。近期以百度為發起單位的業內首個生物計算平臺的技術標準也在人工智慧產業協會聯盟大會上進行了立項。
2、飛槳開源框架V2.0RC版:支持動靜統一的編程範式
百度深度學習技術平臺部高級總監馬豔軍帶來飛槳開源深度學習平臺的全新發布——開源框架V2.0RC版,支持「編程一致、動靜統一」的全新開發體驗。
所謂的動靜統一就是用動態圖組網,方便調試編程,能夠一鍵或者用一個非常簡單的代碼就可以轉成靜態圖去訓練部署,從而兼顧兩種編程範式的優勢。
動靜統一的編程體驗有幾個特點:1、功能更加完備,支持Python語法。2、操作簡單,只需要加一個裝飾器,一行代碼可以轉成靜態圖部署。3、存儲模型的接口大量完善,使得靜態圖存儲模型,也能用動態圖加載。
2.0版本的另一大升級是全新API體系,具有體系化、簡潔性及兼容性幾大特點。全新升級的API體系新增200多個API,融合高層API和底層API,實現低代碼開發,並能支持企業開發者實現順暢的程序遷移。
馬豔軍稱,飛槳開源框架V2.0RC版的編程體驗可以更好支持深度概率編程、量子機器學習等更多的前沿研究和探索。
3、AI集成開發環境BML CodeLab:50多項體驗優化,端雲協同
飛槳企業版包括兩大AI開發平臺,一個是針對AI應用開發者的EasyDL零門檻AI開發平臺,另一個就是針對算法開發者的BML全功能AI開發平臺。
本次,百度AI平臺研發部總監忻舟隆重介紹了全新的端雲協同的AI集成開發環境BML CodeLab。BML CodeLab是一個本地的開發環境和客戶端。它解決的主要問題是,現在市面上還沒有一個很好的針對於AI研發的本地客戶端。
簡單來說,今天發布的BML CodeLab基於JupyterLab實現了50多個體驗的優化項目,提升開發體驗;開箱即用的客戶端內置飛槳文心(ERNIE)NLP套件及單機高性能技術引擎,還可無縫擴展到雲端。
除了三大全新發布,本次百度還帶來了飛槳全平臺的三大升級。
1、大規模分布式訓練升級,推出首個通用異構參數伺服器架構
本次,百度還正式推出大規模分布式訓練的升級,帶來業內首個通用異構參數伺服器架構。
馬豔軍公布了一組數據,通過測試,異構參數伺服器架構在相同的硬體下,比單純的非異構的硬體能夠提升65%以上,同時用2個CPU+2個GPU就可以達到4個GPU相應的速度,提高性價比。
2、飛槳企業版:智能數據服務平臺EasyData添新功能
在飛槳企業版方面,本次百度帶來了智能數據服務平臺EasyData的重要進展,包括大幅提升智能標註的效能,新增多人標註能力以及高級智能清洗能力。
其中,智能數據標註功能升級使得標註時長平均減少了74%,物體檢測和圖像分割上分別提升了6.4和3.2個點。多人標註能力也是響應市面呼聲,滿足團隊協作標註需要。在高級智能清洗能力下,飛槳可以基於AI算法對安全生產、視頻監控場景中的無效樣本進行過濾,助開發者提升數據標註效率。
3、開源算法庫升級:140個算法擴充到200+個
今天百度另外一個大升級是開源算法庫同步升級。據悉,開源官方支持的算法從140個擴充到200+個。大多數算法都已升級為動態圖實踐,使開發者二次開發更加容易。
值得一提的是,會上百度還正式推出飛槳硬體生態路線圖。從圖中可知,飛槳目前跟二十家晶片硬體企業達成合作,目前正在適配和已完成適配的晶片和IP型號已有29種,並且在國產的晶片支持上遙遙領先。
可以看到,我們熟悉的英特爾、華為、曙光、英偉達、龍芯、比特大陸等CPU、AI晶片、FPGA等各領域的硬體廠家都在其中。
除此之外,本次百度基於飛槳產品、技術、生態的全面積累,還發布了飛槳「大航海」計劃。此次發布圍繞高校人才培養的啟航計劃,百度承諾未來三年飛槳將投入總價值5億元的資金與資源,支持全國500所高校,重點培訓5000位高校AI教師,聯合培養50萬AI未來人才。
會上,開發者們的老朋友百度CTO王海峰如約發表了自己2020年對行業的最新前瞻看法。
王海峰說,開源開放已經成為驅動技術創新和加速產業發展的核心動能。
他欣慰地細數,當下大量先進的科技論文都基於開源開放的深度學習框架共享成果,其中有眾多是中國科研人員和開發者的貢獻,而同時開源也在加速產業的發展。圍繞開源開放成熟的技術生態與開放平臺,社會各界正在加快融合發展。而聚焦到百度飛槳深度學習平臺,王海峰高興地分享了最新成果:飛槳平臺迄今為止凝聚了265萬開發者,服務了10萬家企業,創造了34萬個模型。
王海峰最後還頗為動情地說,開源開放已經成為推動技術創新和產業發展的核心動能,而驅動這股核心動能的其實是我們每一個人,也包括我們在座的每一個人。
人工智慧開源開放的背後驅動力來自於每一個開發者。百度集團副總裁吳甜用鮮活的案例讓我們對此有所感知。
她講述了幾位開發者的故事,年齡13歲的最小開發者、累計貢獻3600行代碼的晶片工程師、在飛槳社區累計答疑12000次的答疑達人等,這些開發者讓我們看到了飛槳上的人工智慧貢獻者已經突破了年齡和職業的限制,這是當下中國產業智能化進程中一股非常龐大的群體和力量。
而後吳甜公布了一組數據:飛槳社區開源貢獻者超過5000位,發展飛槳開發者技術專家(PPDE)97位,成立了7個興趣小組,有132個城市或高校有自組織社區在自發的進行飛槳社區活動的開展。
在硬體生態方面,飛槳的硬體生態夥伴目前有20家,已經完成適配或者正在適配的IP類型號有29種。
在產業應用方面,飛槳服務了10萬企業,覆蓋到了金融、教育培訓、交通處行等等各行各業,飛槳平臺上已經創造了有34萬模型,這每一個模型的生產其實都代表著一次人工智慧技術和產業的結合落地產生價值。
在人才培養方面,飛槳師資培訓覆蓋到500所高校,支持了200多所高校開設AI學分課程,飛槳的AI大賽覆蓋到全球五大洲22個國家,580所高校。今年自疫情以來,我們加大了線上直播課程的建設,今年已經開設了有176次直播課程,在AI Studio上進行學習的人次超過了290萬。
從這些數據中,我們看到了整個智能時代勃勃跳動的脈搏。
目前,飛槳已經落地應用到各行各業。
以寧德時代新能源電池高精度質量檢測案例為例,2019年寧德時代開始深度學習技術的研究,通過百度飛槳提升檢測精度及預測效率達到實際生產需求。
寧德時代新智能製造部部長張偉說:百度對企業支持提供了非常好的套件,便捷的部署和對人才的支持。(基於飛槳)我們取得了非常顯著的進步,整條產線原來通過人工質檢的工作,現在都用智能化平臺取代了。在非常複雜的設備,面對不同的化學材料,都可以通過深度學習算法來進行檢測識別。
而在崑崙數智的油氣勘探項目中,公司夢想雲平臺基於飛槳(PaddlePaddle)AI框架為現有業務提供AI能力的支撐,推動油氣行業從萬物互聯到萬物智聯的過渡。
崑崙數智人工智慧與物聯網技術總監衛乾說:「坦率地講,人工智慧技術幾乎可以適用於石油能源行業的每一個環節」。而後,衛乾講解了工人施工安全檢測、大型機裝設備的故障診斷、油氣生產優化等油氣勘探地多方面應用。
當然,飛槳在產業的落地遠不止這些,從後面的「飛槳產業應用創新獎」頒獎情況就能體會到。會上,除了以上兩家企業,還有來自智能工業、網際網路、金融、交通等多個行業的企業和案例都獲得了相關獎項。
可以看到,這個中國首屈一指的開源深度學習框架生態已經越來越顯示出蓬勃生機,與各行各業的智能化變革產生深度聯繫。
在這場牽動265萬AI開發者的年終盛會上,百度飛槳推年度三大全新發布、三大更新,並亮出了飛槳產業應用、人才培育、開源共建幾方面的進展,對AI人來說無疑是冬日裡的一場暖陽盛宴。而一個個開發者的努力貢獻,帶來的將是整個AI產業化、產業AI化的進程。
當下,在我國處於經濟結構大變革的歷史節點上,正如總書記所說,掌握著海量數據、先進算法的網際網路巨頭,理應在科技創新上有更多擔當、有更多追求、有更多作為。