華為田奇:華為雲ModelArts會加速AI在行業落地

2020-12-06 騰訊網

【環球網科技綜合報導】9月25日,在HUAWEI CONNECT 2020期間,華為雲發布ModelArts 3.0,融合骨幹模型、聯邦學習、智能評估、智能診斷和高效算力。

據華為雲AI首席科學家田奇介紹,華為雲長期紮根AI基礎技術研究,覆蓋計算機視覺、語音語義和決策優化三大AI領域,提出了六大基礎研究計劃。這些計劃產生的許多研究成果以即插即用的方式逐步部署於華為雲ModelArts,助力行業AI落地。

田奇表示,ModelArts在多個行業和項目中有了成功落地,這離不開華為雲EI在人工智慧領域的長期投入。

「華為雲長期紮根AI基礎研究,覆蓋計算機視覺、語音語義和決策優化三大領域。我們聚焦於模型高效、數據高效、算力高效、知識高效4大方向,提出了六大基礎研究計劃,包括面向大模型的模型摸高計劃、面向小模型的模型瘦身計劃、面向多模態學習的數據魔方計劃、面向小樣本學習的數據冰山計劃、面向通用知識抽取的萬物預視計劃和面向新學習範式的虛實合一計劃。」

華為雲的許多研究成果,包括自動機器學習、小樣本學習、聯邦學習、預訓練模型等,能夠即插即用地部署於ModelArts使能平臺,助力AI賦能千行百業。

在多項業界公開競賽和測評中,華為雲EI的持續創新研究已經取得了不錯的成果,這些都將應用於ModelArts平臺,提供給全球的開發者使用。

感知方面,華為雲在ImageNet大規模圖像分類、WebVision大規模網絡圖像分類、MS-COCO二維物體檢測、nuScenes三維物體檢測、視覺預訓練模型的下遊 分類/檢測/分割等驗證中,均保持業界領先。目前,ModelArts驅動的感知模型已經在醫療影像分析、油氣勘探、工業故障檢測等領域獲得廣泛應用。

認知方面,依託語音語義和知識圖譜方向的積累,華為雲整合行業數據,對多樣、複雜、孤島化的數據進行治理,實現感知智能到認知智能的飛躍。目前,ModelArts驅動的認知模型已在藥物靶點預測、金融詐騙分析、智能售後客服等多項任務中得到應用。

決策方面,依託運籌優化、強化學習、智能控制等算法,華為雲已經構建起完整的決策底座,使得AI真正實現感知-認知-決策的智能閉環。目前,ModelArts驅動的決策引擎已經應用於機位分配、工業製造、智能交通、遊戲娛樂等領域。

「華為雲發布的ModelArts3.0,是面向AI在行業落地提供的AI開發平臺。在這裡,我和我的團隊主要是從技術領域進行探索和研究,如何通過AI技術高效解決行業挑戰,比如,如何用極少數據訓練出高精度模型?如何降低企業應用AI的門檻?如何解決企業對數據安全使用的顧慮等?最終,我們將骨幹模型、聯邦學習、智能診斷評估優化、和高效算力,很好的融入了ModelArts3.0。」田奇隨後為記者詳細解讀。

華為雲骨幹工具鏈EI-Backbone,整合模型高效、數據高效、算力高效、知識高效,全面提升行業AI落地能力。EI-Backbone的能力,已經在10餘個行業成功驗證,並且斬獲10餘個業界挑戰賽冠軍,發表100餘篇頂級論文。EI-Backbone提供了AI開發的新範式,以肺部醫療影像分割為例來介紹:

過去需要成百上千例標註數據才能進行的訓練,現在有了EI-Backbone,只需要幾十例甚至十幾例標註數據即可完成,節省標註成本90%以上。

過去需要大量專家經驗和試錯成本的模型選擇和超參調節,通過EI-Backbone提供的全空間網絡架構搜索和自動超參優化技術,可在無需人工幹預的情況下快速完成,且精度大幅提升。

此外,過去需要幾周甚至更長時間,從頭開始的模型訓練、測試、驗收和部署流程,在加載EI-Backbone集成的預訓練模型後,可以縮短到幾小時甚至幾分鐘內完成,訓練成本降低90%以上。

基於EI-backbone技術,華為雲ModelArts和杭州雲深處科技有限公司合作,實現了四足機器狗的工業場景巡檢。

華為雲ModelArts 3.0的下一個特性是聯邦學習。眾所周知,數據是AI應用的基礎,只有基於多樣化的數據,才能實現AI智能感知。然而,在實際AI行業落地中,數據是分散在不同的數據控制者之間,這就導致了行業應用的數據孤島問題,使得AI算法訓練效果受到限制。

針對這個問題,華為雲Modelarts提供聯邦學習特性,實現數據不出戶的聯合建模。用戶各自利用本地數據訓練,不交換數據本身,只用加密方式交換更新的模型參數,實現協同訓練。

華為雲EI與中國科學院上海藥物所的蔣華良院士合作,將華為自研的FedAMP算法和AutoGenome算法應用到藥物研發的AI任務中,精準預測藥物水溶解性、心臟毒性和激酶活性,準確度遠超傳統的聯邦學習和深度學習算法。

此外,華為雲提供雲邊協同的服務,支持不同地點、不同客戶的數據進行聯邦訓練,通過加密方式上傳服務端,對全局模型進行更新,再將其下發至邊緣設備,便捷支持同業態的橫向聯邦和跨業態的縱向聯邦學習。聯邦訓練參與者可以通過雲端,也可以通過華為雲邊緣設備(如智能小站)的計算能力參與聯邦訓練,實現行業內聯合建模。

模型在部署上線前,需要進行充分評估,結果優秀的模型直接投入生產環境,差強人意的則需要進一步優化迭代。ModelArts提供了全面的可視化評估、智能化診斷功能,使得開發者可以直觀的了解模型的各方面性能,進而針對性的進行調優或部署生產。

田奇以一個上皮病變細胞分類的模型評估進行詳細講解。

在精度方面,華為雲ModelArts提供了包含準確率、精確率、召回率、F1值、混淆矩陣、ROC曲線等常規指標,還包括了數據敏感度分析模塊,評估模型在不同數據特徵子區間上的表現;

在性能方面,ModelArts提供算子級別的時間、空間消耗統計分析和多種整體的性能指標,並且針對模型的表現給出相應建議,如模型量化、蒸餾等;

在可解釋性方面,ModelArts提供熱力圖,用以展示模型做出推理判斷所依據的區域;

在可信方面,ModelArts內置多種模型可信相關評測方法,提供多角度模型安全能力評估指標,並能依據當前模型表現給出相應的防禦建議。

隨著深度學習分布式訓練的不斷發展,各類模型的訓練對於計算設備的需求越來越大。但由於各種原因,訓練作業的資源還沒有被充分利用。造成資源浪費的原因非常多,主要包括以下幾點:

訓練算法代碼本身質量不高、資源利用率低;模型大小和超參數的設置也會顯著地改變計算資源的利用率;資源池整體利用率存在波動峰谷。類似於「峰谷電」,訓練作業的提交也有高峰期和低谷期,造成很大的資源浪費。

彈性訓練是ModelArts的核心能力之一,可以根據模型訓練速度的需求自適應實現資源的最佳分配。

ModelArts提供兩種模式,一是Turbo模式,可以充分利用空閒資源加速已有訓練作業,訓練速度可提升10倍以上,並且不影響模型的收斂精度;二是經濟模式,可以通過最大化資源利用率給開發者提供極致的性價比,在大多數典型場景下可以提升性價比30%以上。

為了更好地支持超大算力需求的AI研發,華為ModelArts平臺在集群規模,任務數量,以及分布式訓練都做了針對性的優化。

ModelArts研發平臺能夠管理上萬的節點,更好的支持大型訓練任務需求。通過優化服務框架,ModelArts平臺支持10萬級別的作業同時運行、支持萬級晶片的大規模分布式任務。

優秀的分布式加速比是大規模集群分布式訓練的關鍵能力,也是促使用戶選擇使用大規模集群來加速AI業務的關鍵因素。

華為雲ModelArts領先的分布式加速比能力,在MLPerf benchmark Imagenet-1K分類任務上,使用512晶片集群跑出93.6秒的成績,優於NVIDIA V100的120秒。

在骨幹網絡、聯邦學習、模型診斷優化、高效算力的加持下,華為雲ModelArts會加速AI在行業落地。未來,華為雲將持續聚焦於模型高效、數據高效、算力高效和知識高效4個重點方向,紮根於AI基礎研究。在計算機視覺、語音語義、決策優化3大AI領域進行基礎研究計劃投入,

最後,田奇表示:「我們會持續努力,提供強大的AI技術支持每一位開發者發揮所長、創造獨特價值。華為雲將持續踐行普惠AI,與全球開發者共成長。」

相關焦點

  • 華為雲ModelArts 3.0助力行業AI高效落地
    華為雲的表現也沒有讓人失望,經過2年時間的打磨,歷經3次迭代,ModelArts 3.0帶來了一些實用性很強的新功能和新特性,其中最受開發者關注的莫過於四大「黑科技」。ModelArts 3.0的四大「黑科技」,分別指EI骨幹模型、聯邦學習、模型智能評估與診斷,以及高性能AI計算,可以讓開發者可以更簡單、便捷地在各行業中部署AI。它們究竟神奇在什麼地方?
  • 索信達&華為雲:客戶微細分模型上線ModelArts
    索信達聯手華為雲  在ModelArts上線客戶微細分模型啦!  小知識:華為雲AI模型市場  這是國內第一個提供發布及訂閱AI模型服務的平臺,對於各種上線的模型也有著嚴格的審核和篩查。  索信達控股作為聚焦金融行業的人工智慧及大數據科技公司,一直在致力於通過科技驅動金融行業數位化轉型,以人工智慧技術助力包括銀行在內的金融機構實現智能營銷。  索信達和華為雲攜手推出的客戶微細分模型並非簡單的只對用戶結構化數據進行整合細分,而是利用龐大的交易數據,創造性地提出了「數據圖像化」的新思路。
  • 華為雲ModelArts,助力雲原生AI敏捷開發
    華為雲ModelArts 、ModelArts Pro 、HiLens 的專家們,與各行各業專家探討雲原生AI技術前沿發展趨勢,分享行業AI實踐,共同探討「新雲原生企業」的AI成長之道。ModelArts:雲原生AI開發新範式,加速行業落AI落地,踐行普惠AIAI產業面臨的最大的挑戰在於如何落地,在於如何讓AI真正進入千行百業的生產系統,這方面存在很多的痛點與挑戰。
  • 從物流單證到行業AI:華為雲ModelArts Pro的探索與重構
    而從小白工作上的改變,物流行業的定製化AI能力中可以看出,華為雲的ModelArts Pro已經具備了這樣的特徵。行業AI工作流:ModelArts Pro的邏輯重構3月28日,在華為開發者大會HDC.Cloud期間,華為雲正式發布了ModelArts Pro。
  • 華為雲ModelArts再獲行業大獎,持續引領人工智慧產業發展
    2020年,華為雲ModelArts 3.0核心技術全線升級,坐擁四大核心「黑科技」,進一步降低AI開發門檻,加速在行業應用中的落地,助力千行百業迎接智能化未來。華為雲骨幹模型EI-Backbone通過整合模型高效、數據高效、算力高效、知識高效,能夠全面提升行業AI落地能力和體驗聯邦學習打破數據孤島,行業自由聯合建模,協同訓練,利益共享模型智能評估、診斷從精度、性能、對抗性和可解釋性對模型的綜合能力進行智能評估與診斷,使得開發者可以直觀了解模型各方面性能,進而進行針對性的調優
  • 自主掌控AI迭代,華為雲ModelArts Pro讓模型越用越精準
    12 月 12 日,以「ModelArts Pro——行業 AI 落地新利器」為主題的 DevRun 開發者沙龍·華為雲 AI 訓練營在西安順利舉行,現場的華為雲 AI 專家與百餘位行業客戶共聚一堂,共話如何快速構建 AI 能力,實現 AI 的自主迭代,AI 能力的復用,降低行業 AI 落地門檻。
  • 華為雲一站式AI開發平臺ModelArts獲評人工智慧領域最佳產品
    2020年,華為雲ModelArts 3.0核心技術全線升級,坐擁四大核心「黑科技」,進一步降低AI開發門檻,加速在行業應用中的落地,助力千行百業迎接智能化未來。  華為雲骨幹模型EI-Backbone  通過整合模型高效、數據高效、算力高效、知識高效,能夠全面提升行業AI落地能力和體驗  聯邦學習  打破數據孤島,行業自由聯合建模,協同訓練,利益共享  模型智能評估、診斷
  • 華為雲ModelArts新成績,獲評人工智慧領域最佳產品
    2020年,華為雲ModelArts 3.0核心技術全線升級,坐擁四大核心「黑科技」,進一步降低AI開發門檻,加速在行業應用中的落地,助力千行百業迎接智能化未來。華為雲骨幹模型EI-Backbone通過整合模型高效、數據高效、算力高效、知識高效,能夠全面提升行業AI落地能力和體驗聯邦學習打破數據孤島,行業自由聯合建模,協同訓練,利益共享模型智能評估、診斷從精度、性能、對抗性和可解釋性對模型的綜合能力進行智能評估與診斷,使得開發者可以直觀了解模型各方面性能,進而進行針對性的調優
  • 華為雲MVP高浩:華為雲ModelArts打破AI開發瓶頸
    高浩:華為雲MVP,南京航空航天大學碩士畢業,曾就職於某研究所集團公司。先後從事大數據開發與數據挖掘工作,擅長機器學習和數據分析。現任江蘇知途教育科技有限公司人工智慧課程研發負責人,「1+X」 計算機視覺應用開發認證(初級,中級)副主編,高級認證講師。
  • 華為集齊 AI 龍珠,「召喚神龍」為期不遠
    近日在華為開發者大會2020(Cloud)上,MindSpore首席科學家、IEEE Fellow陳雷教授宣布華為全場景AI計算框架MindSpore在碼雲正式開源(開源地址:https://gitee.com/mindspore),並正式登陸華為雲。可以說只有將AI算力上雲才能與行業應用場景全面無縫對接,產生出核效應,創造出新基建的最大價值。
  • 田奇:華為計算機視覺研究計劃與進展丨CCF-GAIR 2020
    在大會第二天的「視覺智能城市物聯」專場上,華為雲人工智慧領域首席科學家、IEEE Fellow田奇教授登臺發表精彩演講,分享了華為在人工智慧領域的理解與實踐。田奇以生成數據訓練和不同模態數據對齊這兩個應用場景為例,介紹了華為如何使用知識蒸餾與自動數據擴增結合的方法讓AI模型高效地挖掘數據中的有用信息。2、模型上,怎樣設計高效的視覺模型。田奇認為在深度學習年代,視覺模型主要包含神經網絡模型設計和神經網絡模型加速兩個場景。
  • 客戶微細分模型上線華為雲ModelArts,索信達以AI科技挖掘金融數據...
    近日,索信達與華為雲強強聯手,在ModelArts上線索信達客戶微細分模型,這個模型也成了首個上線ModelArts的金融營銷模型。在人工智慧強勢賦能金融業的當下,這樣一個模型的推出,又能給行業帶來什麼樣的影響和意義?
  • 華為雲AI訓練營即將開啟
    打開APP 華為雲AI訓練營即將開啟 華為雲 發表於 2020-12-21 10:54:13   當前,隨著人工智慧在各行各業廣泛應用,人們逐漸從重複、繁重的工作中解放出來,但AI 人才和行業數據的緊缺的問題也逐漸顯現:AI 技術門檻高;高端人才成本高;中低端人才難以承擔企業 AI 開發項目的大任;同時,人工智慧應用的開發,需要大量的數據進行支撐。
  • 華為雲地協同加速網絡AI規模商用,使能實現自動駕駛網絡
    【51CTO.com原創稿件】2020年9月23日,以「共創行業新價值」為主題的華為全聯接2020在上海隆重舉辦。25日在大會媒體圓桌現場,華為正式發布了《華為網絡人工智慧引擎 iMaster NAIE 白皮書》,使能自動駕駛網絡。
  • 全場景智慧加速落地成都,成都市與華為聯合打造蓉城智能體
    成都市委副書記、市長王鳳朝,成都市委常委、成都高新區黨工委書記方存好,成都市政府秘書長周先毅,成都高新區管委會主任餘輝,成都高新區管委會副主任趙繼東,華為公司高級副總裁、雲與計算BG總裁侯金龍,華為公司川藏總經理劉嘉,華為公司數據存儲與機器視覺產品線總裁周躍峰,華為公司昇騰計算產品線總裁許映童,華為公司成都總經理魏靖等一行出席了本次籤約儀式。
  • 華為發布計算視覺計劃:三大方向 誠邀全球AI專家加入
    今天(28日)是華為開發者大會2020(Cloud)第二天,除了宣布全場景AI計算框架MindSpore在碼雲正式開源,華為還全面分享了在計算視覺領域的基礎研究成果。同時,華為發布計算視覺研究計劃,並邀請全球AI專家參與研究。
  • 華為雲助力雲南電網電力科學研究院加速業務創新
    作為中國行業數位化轉型的領導者,華為通過雲服務助力雲南電網電力科學研究院加速電力業務創新。  華為雲Stack,助力電力科學研究院數位化轉型邁入新階段  本著「硬體集群,數據集中,應用集成」的原則,華為將電力科學研究院的相關業務系統和開發測試平臺部署到華為雲平臺上,並為其提供計算、存儲、網絡、資料庫以及安全等相關服務資源。
  • 華為雲:賦能應用,使能數據,做智能世界的黑土地
    近日,在2020年華為全球分析師大會上,華為雲首席戰略官餘虎做了《華為云:賦能應用,使能數據,做智能世界的黑土地》主題演講,介紹華為雲戰略和業務發展情況。餘虎表示:「結合過去三十年華為服務政企客戶和華為自身數位化轉型探索的經驗,我們發現,政企客戶在數位化轉型過程中,會遇到四大挑戰:敏捷、創新、安全、協同。
  • 網際網路企業創新提速,華為雲「5G+X聯創營」落地計劃賦能廣東
    走在數位化轉型前列的網際網路行業,在「新基建」風口下,正積極搶佔新一輪信息技術革命的「制高點」,這也讓雲計算廠商看到廣闊的市場。日前,華為雲公布了「5G+X聯創營」在廣東落地計劃,幫助粵港澳大灣區網際網路企業搶佔5G先機。
  • 華為與ECC共建「雲邊智聯聯合創新實驗室」
    打開APP 華為與ECC共建「雲邊智聯聯合創新實驗室」 劉戈雨 發表於 2020-12-17 16:19:24 近日,在北京召開的2020邊緣計算產業峰會上舉行了華為與ECC共建「雲邊智聯聯合創新實驗室」的揭牌儀式,標誌著華為在打造園區邊緣計算物聯解決方案孵化中心,探索5G、PLC-IoT創新技術與邊緣計算深度結合等方面成為了技術創新和實踐落地的排頭兵。