百度飛槳PaddleCV全景圖曝光 視覺技術能力三方面重磅更新

2021-01-11 環球網

【來源:中國青年網】

2020年,「新基建」正給中國科技發展帶來新的重大機遇,人工智慧基礎設施面臨全面升級。深度學習框架正是推動產業智能化進階的重要基礎設施。近日,國內唯一開源開放、功能完備的深度學習開源平臺——百度飛槳,在智能視覺領域實現重大升級。

此次,PaddleCV最新全景圖首度曝光。其中,PaddleDetection、PaddleSeg、PaddleSlim和Paddle Lite重磅升級;全新發布3D視覺和PLSC超大規模分類2項能力。同時,PaddleCV新增了15個在產業實踐中廣泛應用的算法,整體高質量算法數量達到73個;35個高精度預訓練模型,總數達到203個。

PaddleCV依託於飛槳底層核心技術以及百度大腦軟硬一體AI大生產平臺的優勢,貫通了從核心技術、生態應用,再到商業化解決方案的整套體系,支撐百度視覺成為目前業內規模最大、技術棧最全面、生態體系最完善的視覺技術平臺,形成可自我持續迭代優化的閉環。

如全景圖所示,PaddleCV主要從三方面更新核心技術能力:

第一,核心技術能力升級,基於產業實踐真實場景打磨,多場景視覺任務上模型準確率全面提升。

PaddleDetection模塊種類與性能全面提升,YOLOv3大幅增強,精度提升4.3%,訓練提速40%,推理提速21%;人臉檢測模型BlazeFace新增NAS版本,體積壓縮3倍,推理速度提速122%;新增IoU損失函數類型,精度再提升1%,不增加預測耗時。在模型方面,新增3個類型,基於COCO數據集的精度最高開源模型CBNet,高達53.3%;Libra-RCNN模型精度提升2%;Open Images V5成為目標檢測比賽最佳單模型。

PaddleSeg新增基於HRNet的高精度圖像分割模型,其最大的特點是將圖像在整個處理過程中保持高解析度特徵,這和大多數模型所使用的從高解析度到低解析度網絡產生的低解析度特徵中恢復高解析度特徵有所不同。同時,獲得實時語義分割模型Fast-SCNN,它的最大特點是「小快靈」,即該模型在推理計算時僅需要較小的FLOPs,就可以快速推理出一個不錯的結果。

PaddleCV還新增了3D點雲分類、分割和檢測的PointNet++和PointRCNN模型。PointNet++在ModelNet40數據集上,分類精度高達90%;PointRCNN在KITTI(Car)的Easy數據子集上,檢測精度高達86.66%。和此前PaddleCV支持的數十種模型一樣,基於飛槳框架,開發者無需全新開發代碼,只要進行少量修改,就能快速在工業領域實現3D圖像的分類、語義分割和目標檢測任務。

圖像分類新增預訓練模型SENet-vd、Res2Net、HRNet系列模型。Res2Net可以更細粒度表示多尺度特徵,HRNet全程都可以保持高解析度。截至目前,飛槳圖像分類模型包含了ResNet、ResNet-vd、ResNet_ACNet、MobileNet、ShuffleNet、EfficientNet等系列近20類圖像分類算法,105個預訓練模型,也可供目標檢測、圖像分割等任務應用。其中,ResNet-vd系列相比ResNet系列模型,在不增加推理耗時的情況下,精度提高1%-2%,EfficientNet推出了small版本,在GPU上速度提升1.59倍。

第二,PaddleCV端到端能力大幅提升,打通了模型開發、訓練、壓縮、部署全流程,更好地服務於產業實踐。

目標檢測模型在實際部署時,由於耗時和內存佔用,仍然存在很大挑戰。基於此,PaddleSlim提供了多種高效的模型壓縮方法,助推PaddleDetection性能到達全新高度。使用蒸餾模型壓縮方案可提升驗證精度2%;裁剪模型壓縮方案大幅降低FLOPs;蒸餾+裁剪模型壓縮方案,基於COCO數據集進行測試,可以加速2.3倍。此外,PaddleDetection還為開發者提供了從訓練到部署的端到端流程,並提供一個跨平臺的圖像檢測模型的C++預測部署方案。

跟目標檢測模型類似,語義分割模型在實際部署時也會面臨耗時、內存佔用的挑戰。PaddleSlim為PaddleSeg提供了多種分割模型的壓縮方案,FLOPs減少51%,提升部署成功率。

針對超大規模人臉識別等應用挑戰,正式發布PLSC超大規模分類工具。一方面,通過多機分布式訓練可以將全連接層參數切分到更多的GPU卡,從而支持千萬類別分類,並且飛槳大規模分類庫在理論上可支持分類類別數隨著使用GPU卡數的增加而增加。另一方面,PLSC的訓練精度和效率高,在多個數據集上得SOTA的訓練精度,同時支持混合精度訓練,單機8張Nvidia Tesla v100 GPU配置下混合精度訓練速度提升42%。PLSC讓開發者通過五行代碼即可實現千萬類別分類網絡的構建和訓練,提供大規模分類任務從訓練到部署的全流程解決方案。同時,支持訓練GPU卡數的動態調整、Base64格式圖像數據預處理。

PaddleCV與飛槳領先分布式訓練能力全面結合,對於人臉識別等廣泛的場景應用提供了強有力的推動作用。3月初,百度開源的「戴口罩人臉識別算法」中,即通過PLSC實現了快速對數百萬ID的訓練數據進行訓練;同時採用飛槳模型壓縮庫PaddleSlim進行模型搜索與壓縮,產出了高性能的人臉識別模型;最後基於Paddle Lite,實現了雲端和移動端的快速部署。

第三,PaddleCV全面打通了模型算法、開發框架和AI晶片,實現軟硬一體化。

首先,PaddleCV基於Paddle Lite多硬體支持能力的優勢,與崑崙晶片進行深度聯合優化,實現端到端軟硬一體能力的完全領先和自主可控。以製造業為例,百度與微億智造聯合打造了智能自動化監測設備「表面缺陷視覺檢測設備」,區別於傳統人工肉眼檢查電子零件的方式,既保障質檢環節的檢查質量與效率,也進一步緩解了由於疫情原因造成的人力缺乏問題。

此次合作,藉由百度崑崙晶片、百度智能雲的加持,以及基於百度飛槳深度學習 平臺的目標檢測模型,微億構建完成了一個從智能硬體到算法軟體再到算力供給的智能製造解決方案大閉環,具備了端到端軟硬一體能力,實現了完全的自主可控。此外,在央視《新聞聯播》2月10日報導中還提到,江蘇常州的精研科技藉助「表面缺陷視覺檢測設備」,解決了工人無法復工情況下的生產難題,在精研科技的精密零部件製造車間,十臺無人值守的智能化檢測設備24小時工作,比人工檢測效率提升近10倍。

PaddleCV的重磅升級,飛槳為視覺領域提供了更為強大且應用廣泛的工具,加速不同產業的AI落地。除了在視覺領域,飛槳也形成了語音、視覺、NLP等全方位的能力體系。飛槳還充分發揮全硬體平臺能力的優勢,與崑崙晶片深度融合優化,打造技術領先、自主可控的軟硬一體技術平臺。

目前,飛槳已累計服務150多萬開發者,幫助6.5萬企業用戶,作為百度大腦的堅實底座,在很多關乎國計民生的領域,都發揮著實實在在的重要作用。

相關焦點

  • 基於複數神經網絡首發量子機器學習開發工具 「量槳」,飛槳布局...
    (圖:百度首席技術官王海峰)百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜正式對外發布飛槳最新的全景圖,包含飛槳開源深度學習平臺和飛槳企業版兩部分。(圖:飛槳核心框架架構全景)為了滿足時代與政策雙重作用下猛增的「智能化」快速轉型需求,飛槳此次全平臺全新發布和升級35項技術能力。
  • 百度飛槳躍居世界第二、國內第一!看中國AI領頭雁百度的開源進擊之路
    總的來說,飛槳有以下 4 大領先技術。   首先,同時支持動態圖和靜態圖的編程,能夠兼顧易用性和效率。飛槳平臺結合了動態圖的易用性和靜態圖的高性能,使開發者可以兼顧兩者的優勢。第二,針對大規模的工業化場景,飛槳提供大規模分布式訓練能力,在真正的工業場景應對自如。飛槳平臺推出了支持萬億規模參數模型的實時更新能力和訓練能力。
  • 重磅發布開源框架、生物計算平臺螺旋槳,百度飛槳交了年終成績單
    可見飛槳技術與生態發展的步調越來越快。飛槳是一個開源的平臺,既受益於開源,也反過來促進了開源社區的發展。在談到開源開放的重要性時,百度 CTO 王海峰表示,「開源開放對人類社會過去幾百年科學和技術的發展起到非常重要的作用,讓我們可以更快追蹤到最新的技術進展,並將改進意見以及創新思想迅速進行反饋,形成一個正循環,進一步推動科技的創新迭代。
  • GTC大會飛槳專家演講實錄:簡單易用的飛槳分布式訓練功能升級
    12月15日-19日,GTC中國大會首次以線上大會的形式與開發者相見,共組織265場技術演講,演講者分別來自百度、阿里、騰訊、字節跳動等眾多知名企業與清華大學、中科院計算所等知名高校。百度飛槳也貢獻了四個主題演講,現在為您帶來飛槳大規模分布式訓練進展與應用的演講實錄。課程連結:https://nvidia.gtcevent.cn/forum/watch?
  • 百度飛槳秀出最新成績單,產業應用、人才培養、開源生態全面繁榮
    可見飛槳技術與生態發展的步調越來越快。八大亮點發布,夯實AI技術底座,助力產業智能化新基建浪潮下,各行各業都拉開了智能化升級的大幕。百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜通過三組數據揭示出AI加速下沉的產業洞察。
  • 當人工智慧走進垃圾堆 金漉科技用百度飛槳戰勝了垃圾分類
    好在人工智慧、深度學習技術的介入,正在改變這一現狀。5月20日,由深度學習技術及應用國家工程實驗室與百度聯合主辦的「WAVE SUMMIT」2020深度學習開發者峰會召開,除了技術升級與產品更新之外,百度深度學習平臺飛槳還展示了各行業的典型落地案例,其中,金漉科技的案例最接地氣,也與時下社會民生關注的某個熱門話題有關——「垃圾分類」。
  • 史上最全解讀|飛槳模型庫重大升級,主流算法模型全覆蓋
    很多未到場的開發者覺得遺憾,希望可以了解飛槳發布會背後的更多技術細節,因此我們特別策劃了一個系列稿件,分別從核心框架、基礎模型庫、端到端開發套件、工具組件和服務平臺五個層面分別詳細解讀飛槳的核心技術與最新進展,敬請關注。
  • 百度世界2020啟動,百度量子平臺用技術開啟量子時代大門
    百度大腦分論壇成為中國百萬AI開發者的極客盛宴,詮釋著 「AI新型基礎設施」的巨大能量,這也成為國內AI技術的「風向標」。在此次分論壇上,百度研究院量子計算研究所所長段潤堯重點講解了百度量子平臺,展示了百度用量脈+量槳+量易伏賦能新基建、追逐「人人皆可量子」的願景。
  • 為什麼說飛槳宣告百度「倒金字塔」智能經濟布局徹底成型?
    王海峰稱,飛槳把深度學習技術進行了「標準化,模塊化,自動化」,並認為「任何一項能引發產業革命的技術都要有很強的通用性」,顯然,飛槳成為百度搶佔新一輪產業革命核心話語權的要素之一,百度不僅自己下海做AI、推動產業合作,也以賦能開發者和企業自己做AI應用的「AI工業化大生產」方式,幾何式擴大產業智能影響力。
  • 一文速覽百度飛漿八大全新發布與升級 | WAVE SUMMIT2020
    據此前報導,在今年5月的WAVE SUMMIT峰會上,百度飛漿發布35項全面升級以及飛漿全景圖,當時平臺開發者數量、模型數量、服務企業數量分別為190萬、23萬和8.4萬,對比目前來看,飛槳的技術與生態發展顯然正在提速。 接下來,我們來逐一揭秘飛漿的最新升級成果。 百度飛槳首次將行業觸角伸向了全新的生物計算領域。
  • Hi,我們用飛槳做了一個「AI無人售貨櫃」
    全世界流行的深度學習框架有Tensorflow、飛槳、Caffe、Theano、MXNet、PyTorch等。經過綜合考量,我們選擇百度研發的飛槳(PaddlePaddle)框架。之所以選擇這款框架,是因為飛槳發布了許多官方支持的工業級應用模型,這些模型涵蓋了自然語言處理、計算機視覺、推薦引擎等多個領域。
  • PaddlePaddle發布中文名 「飛槳」借指飛快的船 寓意深遠
    「聞說雙飛槳,翩然下廣津」。4月23日,國內首個由百度舉辦的WAVE SUMMIT 2019深度學習開發者峰會「閃亮登場」,深受廣大深度學習開發者喜愛的PaddlePaddle重磅發布中文名「飛槳」,可解釋為「疾速划動的槳,亦借指飛快的船」,寓意PaddlePaddle將與廣大開發者一同飛速成長。
  • 百度飛槳發布工業級圖像分割利器PaddleSeg
    機器之心發布機器之心編輯部近日,飛槳官方發布了工業級圖像分割模型庫 PaddleSeg,給開發者帶來誠意滿滿的三重超值驚喜:①一次性開源 15 個官方支持的圖像分割領域主流模型,大禮包帶來大滿足。②多卡訓練速度比對標產品快兩倍,工業級部署能力,時間節省超痛快。
  • 百度飛槳發布「大航海」計劃:5億資源加碼高校人才培養
    現場,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜通過三組數據揭示出AI加速下沉的產業洞察。百度深度學習技術平臺部高級總監馬豔軍帶來飛槳開源深度學習 平臺的全新發布——開源框架V2.0RC版,「編程一致、動靜統一」的全新開發體驗,將讓開發者驚豔。新框架下,飛槳動態功能走向成熟、API進行了全面升級,同時動靜統一的編程體驗將為深度概率編程、量子機器學習等前沿學術研究提供更好的支持。
  • 11項新升級,免費送億元算力:國產深度學習平臺「飛槳」大更新
    郭一璞 夏乙 發自 香格裡拉量子位 出品 | 公眾號 QbitAI深度學習框架裡的唯一國貨PaddlePaddle,集中迎來一大波更新。百度PaddlePaddle全景圖也首次曝光。飛槳,就是百度版「智能時代作業系統」。作為一個完整的深度學習平臺,它當然包含核心框架部分,支持訓練、預測、組網等等能力。同時,它還提供了視覺、自然語言等領域的模型,形成一個完整的模型庫,以模塊化的方式呈現。
  • 「CCF傑出工程師獎」花落百度飛槳總架構師於佃海
    頒獎會上,百度深度學習平臺飛槳總架構師於佃海榮獲「CCF傑出工程師獎」,以表彰他在機器學習的大規模產業應用方面做出的重要貢獻。「CCF傑出工程師獎」 設立於2016年,每年評選一次,每次獲獎人數不超過兩名,授予在計算機工程技術及應用領域有突出成就和重要貢獻者。
  • 百度深度學習 PaddlePaddle 中文名曝光,打死你也猜不出
    此前在百度舉辦的深度學習開發者峰會上,百度深度學習平臺 PaddlePaddle 首次曝光了其中文名 —— 飛槳,意為快速划動的槳
  • 基於飛槳PaddlePaddle的多種圖像分類預訓練模型強勢發布
    百度視覺技術團隊,基於百度深度學習平臺飛槳,不僅復現了這些技巧,而且對知識蒸餾進行改進,將ResNet50的top1識別準確率從79.29%提升到79.84%,同時將這些技巧用於訓練其他分類網絡結構,提升這些網絡預訓練模型的能力。以下將會對網絡結構微調和知識蒸餾兩部分進行介紹。
  • Google AI地標檢索識別競賽雙料獲勝方案|飛槳PaddlePaddle開源
    機器之心發布來源:百度飛槳近日,百度視覺團隊基於飛槳(PaddlePaddle)深度學習平臺,自主研發的地標檢索/識別解決方案,在 Google Landmark Retrieval 2019[1] 和 Google Landmark Recognition 2019[2] 兩個任務中都斬獲第二名
  • 深度學習開發者的情人節520,飛槳將帶來哪些大消息
    這也是繼2019年春秋兩場WAVE SUMMIT深度學習開發者峰會後,飛槳引領深度學習技術發展,分享產業實踐落地、人才生態建設最新成果的開發者盛會。百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰將做開場致辭。百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜將帶來主題演講。飛槳將帶來數十項重磅升級和發布,以期更好地將深度學習技術賦能產業。