百度飛槳PaddleCV全景圖曝光 視覺技術能力三方面重磅更新

2020-12-12 中國青年網

2020年,「新基建」正給中國科技發展帶來新的重大機遇,人工智慧基礎設施面臨全面升級。深度學習框架正是推動產業智能化進階的重要基礎設施。近日,國內唯一開源開放、功能完備的深度學習開源平臺——百度飛槳,在智能視覺領域實現重大升級。

此次,PaddleCV最新全景圖首度曝光。其中,PaddleDetection、PaddleSeg、PaddleSlim和Paddle Lite重磅升級;全新發布3D視覺和PLSC超大規模分類2項能力。同時,PaddleCV新增了15個在產業實踐中廣泛應用的算法,整體高質量算法數量達到73個;35個高精度預訓練模型,總數達到203個。

PaddleCV全景圖

PaddleCV依託於飛槳底層核心技術以及百度大腦軟硬一體AI大生產平臺的優勢,貫通了從核心技術、生態應用,再到商業化解決方案的整套體系,支撐百度視覺成為目前業內規模最大、技術棧最全面、生態體系最完善的視覺技術平臺,形成可自我持續迭代優化的閉環。

如全景圖所示,PaddleCV主要從三方面更新核心技術能力:

第一,核心技術能力升級,基於產業實踐真實場景打磨,多場景視覺任務上模型準確率全面提升。

PaddleDetection模塊種類與性能全面提升,YOLOv3大幅增強,精度提升4.3%,訓練提速40%,推理提速21%;人臉檢測模型BlazeFace新增NAS版本,體積壓縮3倍,推理速度提速122%;新增IoU損失函數類型,精度再提升1%,不增加預測耗時。在模型方面,新增3個類型,基於COCO數據集的精度最高開源模型CBNet,高達53.3%;Libra-RCNN模型精度提升2%;Open Images V5成為目標檢測比賽最佳單模型。

PaddleSeg新增基於HRNet的高精度圖像分割模型,其最大的特點是將圖像在整個處理過程中保持高解析度特徵,這和大多數模型所使用的從高解析度到低解析度網絡產生的低解析度特徵中恢復高解析度特徵有所不同。同時,獲得實時語義分割模型Fast-SCNN,它的最大特點是「小快靈」,即該模型在推理計算時僅需要較小的FLOPs,就可以快速推理出一個不錯的結果。

Fast-SCNN網絡結構圖

PaddleCV還新增了3D點雲分類、分割和檢測的PointNet++和PointRCNN模型。PointNet++在ModelNet40數據集上,分類精度高達90%;PointRCNN在KITTI(Car)的Easy數據子集上,檢測精度高達86.66%。和此前PaddleCV支持的數十種模型一樣,基於飛槳框架,開發者無需全新開發代碼,只要進行少量修改,就能快速在工業領域實現3D圖像的分類、語義分割和目標檢測任務。

圖像分類新增預訓練模型SENet-vd、Res2Net、HRNet系列模型。Res2Net可以更細粒度表示多尺度特徵,HRNet全程都可以保持高解析度。截至目前,飛槳圖像分類模型包含了ResNet、ResNet-vd、ResNet_ACNet、MobileNet、ShuffleNet、EfficientNet等系列近20類圖像分類算法,105個預訓練模型,也可供目標檢測、圖像分割等任務應用。其中,ResNet-vd系列相比ResNet系列模型,在不增加推理耗時的情況下,精度提高1%-2%,EfficientNet推出了small版本,在GPU上速度提升1.59倍。

第二,PaddleCV端到端能力大幅提升,打通了模型開發、訓練、壓縮、部署全流程,更好地服務於產業實踐。

目標檢測模型在實際部署時,由於耗時和內存佔用,仍然存在很大挑戰。基於此,PaddleSlim提供了多種高效的模型壓縮方法,助推PaddleDetection性能到達全新高度。使用蒸餾模型壓縮方案可提升驗證精度2%;裁剪模型壓縮方案大幅降低FLOPs;蒸餾+裁剪模型壓縮方案,基於COCO數據集進行測試,可以加速2.3倍。此外,PaddleDetection還為開發者提供了從訓練到部署的端到端流程,並提供一個跨平臺的圖像檢測模型的C++預測部署方案。

跟目標檢測模型類似,語義分割模型在實際部署時也會面臨耗時、內存佔用的挑戰。PaddleSlim為PaddleSeg提供了多種分割模型的壓縮方案,FLOPs減少51%,提升部署成功率。

針對超大規模人臉識別等應用挑戰,正式發布PLSC超大規模分類工具。一方面,通過多機分布式訓練可以將全連接層參數切分到更多的GPU卡,從而支持千萬類別分類,並且飛槳大規模分類庫在理論上可支持分類類別數隨著使用GPU卡數的增加而增加。另一方面,PLSC的訓練精度和效率高,在多個數據集上得SOTA的訓練精度,同時支持混合精度訓練,單機8張Nvidia Tesla v100 GPU配置下混合精度訓練速度提升42%。PLSC讓開發者通過五行代碼即可實現千萬類別分類網絡的構建和訓練,提供大規模分類任務從訓練到部署的全流程解決方案。同時,支持訓練GPU卡數的動態調整、Base64格式圖像數據預處理。

PaddleCV與飛槳領先分布式訓練能力全面結合,對於人臉識別等廣泛的場景應用提供了強有力的推動作用。3月初,百度開源的「戴口罩人臉識別算法」中,即通過PLSC實現了快速對數百萬ID的訓練數據進行訓練;同時採用飛槳模型壓縮庫PaddleSlim進行模型搜索與壓縮,產出了高性能的人臉識別模型;最後基於Paddle Lite,實現了雲端和移動端的快速部署。

第三,PaddleCV全面打通了模型算法、開發框架和AI晶片,實現軟硬一體化。

首先,PaddleCV基於Paddle Lite多硬體支持能力的優勢,與崑崙晶片進行深度聯合優化,實現端到端軟硬一體能力的完全領先和自主可控。以製造業為例,百度與微億智造聯合打造了智能自動化監測設備「表面缺陷視覺檢測設備」,區別於傳統人工肉眼檢查電子零件的方式,既保障質檢環節的檢查質量與效率,也進一步緩解了由於疫情原因造成的人力缺乏問題。

此次合作,藉由百度崑崙晶片、百度智能雲的加持,以及基於百度飛槳深度學習平臺的目標檢測模型,微億構建完成了一個從智能硬體到算法軟體再到算力供給的智能製造解決方案大閉環,具備了端到端軟硬一體能力,實現了完全的自主可控。此外,在央視《新聞聯播》2月10日報導中還提到,江蘇常州的精研科技藉助「表面缺陷視覺檢測設備」,解決了工人無法復工情況下的生產難題,在精研科技的精密零部件製造車間,十臺無人值守的智能化檢測設備24小時工作,比人工檢測效率提升近10倍。

百度與微億智造打造的工業智能質檢設備

PaddleCV的重磅升級,飛槳為視覺領域提供了更為強大且應用廣泛的工具,加速不同產業的AI落地。除了在視覺領域,飛槳也形成了語音、視覺、NLP等全方位的能力體系。飛槳還充分發揮全硬體平臺能力的優勢,與崑崙晶片深度融合優化,打造技術領先、自主可控的軟硬一體技術平臺。

目前,飛槳已累計服務150多萬開發者,幫助6.5萬企業用戶,作為百度大腦的堅實底座,在很多關乎國計民生的領域,都發揮著實實在在的重要作用。

(來源:中國網科學)

相關焦點

  • 百度大腦論壇如期而至,語音、視覺、語言與知識技術成熱點
    Create 2019 AI 開發者大會如期而至,在上午展示了百度音箱的系列更新、發布鴻鵠晶片、宣布自動駕駛方面的多項合作之後,下午的百度大腦論壇重磅開幕。百度飛槳最新進展及其應用作為百度極力推薦的深度學習平臺,飛槳自然是此次論壇的重點。百度深度學習技術平臺部總監馬豔軍詳細介紹了飛槳在圖像搜索、目標檢測、工業質檢方面的三大進展。
  • 重磅發布開源框架、生物計算平臺螺旋槳,百度飛槳交了年終成績單
    可見飛槳技術與生態發展的步調越來越快。飛槳是一個開源的平臺,既受益於開源,也反過來促進了開源社區的發展。在談到開源開放的重要性時,百度 CTO 王海峰表示,「開源開放對人類社會過去幾百年科學和技術的發展起到非常重要的作用,讓我們可以更快追蹤到最新的技術進展,並將改進意見以及創新思想迅速進行反饋,形成一個正循環,進一步推動科技的創新迭代。
  • 百度飛槳成國內首個量子機器學習DL平臺,推7大新品23項升級
    王海峰宣布,百度飛槳(PaddlePaddle)版圖重磅升級,同時發布量子機器學習開發工具量槳(Paddle Quantum),使飛槳成為了國內首個、也是唯一支持量子機器學習的深度學習平臺。百度集團副總裁吳甜等人也正式對外發布飛槳最新的全景圖,揭秘飛槳開源深度學習平臺的7項新品和23項升級,飛槳企業版EasyDL零門檻AI開發平臺的1項新品和4項升級。2016年,百度深度學習框架PaddlePaddle正式開源,成為中國首個開源開放、功能完備的深度學習框架。
  • 百度鄧凱鵬:飛槳視覺技術解析與應用
    百度鄧凱鵬帶來報告《飛槳視覺技術解析與應用》。鄧凱鵬,2017年本碩畢業於上海交通大學電子信息與電氣工程學院,現於百度深度學習技術平臺部從事CV方向模型研究和優化工作。飛槳視覺技術解析與應用首先,鄧凱鵬老師介紹了當前飛槳框架以及視覺模型庫CV的整體建設情況。飛槳框架是源自產業實踐深度學習框架,同時支持靜態圖和動態圖搭建網絡,支持高效大規模分布式訓練,同時推出了像PaddleSlim模型壓縮還有安全加密的工具,以及在服務端和移動端進行預測部署一些引擎。
  • 百度飛槳全景圖上新 重磅發布PaddleHelix螺旋槳生物計算平臺
    可見飛槳技術與生態發展的步調越來越快。八大亮點發布,夯實AI技術底座,助力產業智能化新基建浪潮下,各行各業都拉開了智能化升級的大幕。百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜通過三組數據揭示出AI加速下沉的產業洞察。
  • 「飛槳產業級深度學習開源開放平臺」發布
    百度首席技術官王海峰出席論壇,並向現場來自全球20多個國家和地區的200多名院士、諾貝爾獎獲得者、世界重要科技組織會員、大學校長和企業家,發布「飛槳產業級深度學習開源開放平臺」最新成果。  王海峰向與會嘉賓表示,人工智慧是新一輪科技革命和產業變革的核心驅動力量,而這一次人工智慧浪潮的核心基礎是深度學習技術。它的發展和突破,使人工智慧切實成為驅動各行各業創新升級的科技力量。
  • 一文速覽百度飛漿八大全新發布與升級 | WAVE SUMMIT2020
    據此前報導,在今年5月的WAVE SUMMIT峰會上,百度飛漿發布35項全面升級以及飛漿全景圖,當時平臺開發者數量、模型數量、服務企業數量分別為190萬、23萬和8.4萬,對比目前來看,飛槳的技術與生態發展顯然正在提速。 接下來,我們來逐一揭秘飛漿的最新升級成果。 百度飛槳首次將行業觸角伸向了全新的生物計算領域。
  • YOLOv3比原作高10個點,飛槳更新至73個視覺算法、203個預訓練模型
    機器之心原創機器之心編輯部兩項全新能力,四項重磅升級,百度飛槳計算機視覺模型庫 PaddleCV 最近迎來了一次全面升級。此外,這一次百度還為 PaddleCV 新增產業應用算法 15 個,並加入了 35 個高精度預訓練模型。
  • 硬核AI開發者大會來襲:飛槳發布2.0 RC版,李宏毅老師課程上線
    而在今年5月的WAVE SUMMIT深度學習開發者峰會上,飛槳的開發者數量還是190多萬,這半年來可謂進步神速。越來越多的開發者加入飛槳,飛槳的技能也在開源社區的幫助下不斷前進。昨天,百度又為飛槳帶來了多項重磅升級更新。
  • 百度吳甜解讀飛槳成長之路:與時代發展脈搏同頻共振
    百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜這樣總結道。12月20日,由深度學習技術及應用國家工程實驗室與百度聯合主辦的WAVE SUMMIT+2020深度學習開發者峰會在北京舉行。吳甜從開發生態、產業應用、人才培養方面分享飛槳最新的發展成果及洞察,並全新發布了基於飛槳的PaddleHelix螺旋槳生物計算平臺。
  • 百度地圖全景能力強勢「吸粉」,360度全景帶你玩轉科技館
    這次,百度地圖幫你把科技館"搬回了家"。10月26日,2018年中國數字科技館共建共享會議在山城重慶成功落下帷幕。百度地圖場景化業務總經理韓秀鋒受邀出席大會,並進行了題為"虛擬漫遊科普資源庫建設的探索與實踐"的演講,從百度地圖在全景產品建設、生態打造和升級三個方面,深入淺出地詮釋了全景虛擬漫遊對數字科普資源共建共享的重大意義。
  • Google AI地標檢索識別競賽雙料獲勝方案|飛槳PaddlePaddle開源
    機器之心發布來源:百度飛槳近日,百度視覺團隊基於飛槳(PaddlePaddle)深度學習平臺,自主研發的地標檢索/識別解決方案,在 Google Landmark Retrieval 2019[1] 和 Google Landmark Recognition 2019[2] 兩個任務中都斬獲第二名
  • 百度發布「新一代人工智慧地圖」生態全景,做產業智能化基礎設施
    什麼是新一代人工智慧地圖生態全景?「全景圖」本身是一個地圖專用名詞。2013年8月百度地圖發布了全景地圖,將街景、酒店、景點、餐廳、房產等內容,以三維立體形式數位化,更加真實地表現現實空間場景。2018年,百度地圖正式確定「新一代人工智慧地圖」的定位,強化更準確、更豐富、更易用三大特點,基於AI技術繼續在交互體驗、位置信息服務、出行服務、出行決策等維度做透做深做精。
  • 百度AI遙感技術勇摘桂冠
    其實,這一賽題實際上就是在考察參賽團隊對遙感技術產生的數據進行解析的能力。得益於百度大腦先進的計算機視覺技術支撐,百度團隊以最高得分和最快模型的成績斬獲該賽事冠軍。百度AI技術實力再獲國際權威認可,也代表了百度在遙感變化檢測領域的技術領先性,並將進一步促進該技術在各個領域的應用。
  • 從0開始的機器學習之旅,GTC大會飛槳顯真章
    一樣的精彩紛呈,一樣的乾貨與技術並重,在去年便貢獻了精彩內容的百度飛槳,今年帶著四場演講回來了。去年GTC,飛槳(PaddlePaddle)秉持技術實踐與理論知識並行的理念,為開發者帶來了一場收穫滿滿的技術公開課。今年,飛槳在GTC2020上帶來的四場演講也是誠意十足,內容覆蓋了飛槳推理引擎、大規模分布式訓練、EasyDL零門檻高精度AI服務定製、機器學習開發環境BMLCodeLab等諸多內容。四場演講將會在GTC2020輪番上陣,讓我們來看一下吧!
  • 百度飛槳用AI打破「次元壁」,WAVE SUMMIT+2020體驗穿越動漫世界
    度曉曉匯聚了百度領先的語音識別、意圖理解、top1智能搜索、NLP多輪對話等多項AI技術,應用國內首個移動端流式唇動預測技術和多情感語音合成技術,是百度AI綜合能力在信息查找+服務滿足+閒聊陪伴+虛擬人應用場景的體現。聽說,度曉曉都能根據用戶的喜好產生不同進化,這意味著與她交流接觸的時間越長,這位虛擬AI助手也就越懂你。
  • 「全景、打車、AI室內通」多重升級,百度地圖雙旦新版本驚喜上線
    面對即將到來的聖誕、元旦出行高峰,近日百度地圖全新發布了V15.3.0「雙旦版」,帶來街景、打車、AI室內通等多項功能升級,多維度滿足用戶出行需求。冬季氣溫低,外出赴約、遊玩找路太痛苦?百度地圖V15.3.0版新增「終點全景圖」功能,全面升級街景時光機體驗,陪伴用戶輕鬆探索廣闊世界。
  • 百度智能雲業務新架構曝光,王海峰重磅發布AI中臺、知識中臺
    百度智能雲新架構首次曝光百度智能雲對業務架構進行了調整,新架構分為三層:底層是百度大腦,包括基礎層、感知層、認知層和安全,是百度核心技術引擎。比如在基礎層是支撐人工智慧發展的算法、算力和數據,而算法平臺就是「飛槳」深度學習平臺;在感知層包括語音、計算機視覺、增強現實、虛擬實境等等;在認知層,則是與人的認知相關的自然語言處理和知識圖譜等等構成的語言和知識技術;中間是平臺,包括通用的基礎雲平臺、AI中臺、知識中臺,以及針對場景的平臺和其他關鍵組件,比如多媒體平臺、雲原生開發平臺、物聯網、區塊鏈等等;
  • Baidu Create 2019:百度地圖+飛槳亮出智能出行產業創新實踐新標杆
    人工智慧技術已來到應用落地的關鍵階段,百度地圖作為百度AI技術落地的關鍵場景,已滲透進人們生活的方方面面。李瑩在演講中表示,「百度地圖與飛槳的深度融合,這種產業實踐能夠為用戶預測出最適合的路線及更精準的用時」。(百度地圖事業部總經理李瑩)「多長時間能到達目的地」是用戶每次出行最為關心的問題,面對紛繁複雜的交通情況,出行時間預估存在著高峰期及平峰時段變化大、路況及天氣影響因素多、事故或臨時管制突發性高、司機駕駛習慣不同而導致的個性化強等難點。
  • 全景地圖、打車多重功能上新迎雙旦,百度地圖V15.3.0新版發布
    其中,終點全景圖充分考慮用戶乘坐公交時的找路需求,提供終點全景圖服務,可360°展示目的地及周邊情況,避免用戶下車後還要頭頂寒風艱難找路。用戶在百度地圖中進行公交路線規劃時,在公交方案詳情頁、公交具體路線圖區以及最後一段步行導航中即可查看終點位置的周邊環境全景,幫助用戶快速準確到達,讓節日聚會等出行找路的「最後一公裡難題」得以解決。