Techo開發者大會,騰訊優圖分享最新研究成果和產業實踐

2020-12-23 YNET.com北青網

12月19日-20日,由騰訊發起的2020 Techo Park開發者大會於北京順利召開。其中人工智慧專場以「人工智慧算法與最佳實踐」為主題,為開發者、業界及生態夥伴呈現了雲計算時代下人工智慧領域的最新前沿技術與最佳行業實踐。

騰訊優圖實驗室的研究員梁晨、王亞彪、姚達、楊博分別圍繞AI視覺傳感器、視覺算法在圖像編輯生成中的研究與應用、TNN跨平臺推理優化、模量化訓練部署及實踐等發表了主題演講,向業界展示了優圖最新研究成果與產業實踐。

自研AI視覺傳感器 VisionSeed , 算法多樣支持二次開發

在論壇上,梁晨給大家介紹了一個有趣的硬體——AI視覺傳感器。什麼是AI視覺傳感器呢?它是由攝像頭、NPU和算法組成的硬體模組,其基本運行原理是:在NPU上運行深度學習算法,能夠直接對攝像頭拍攝到的畫面進行實時分析,並將分析的結果通過數位訊號傳輸給主機。

據梁晨介紹,騰訊優圖推出了一款自研的AI視覺傳感器——VisionSeed,內置優圖領先的視覺AI算法,還提供專業的配套工具和全平臺的SDK作為支撐,讓開發者可以方便的進行二次開發。

騰訊優圖專家研究員 梁晨

算法是AI視覺傳感器的靈魂,VisionSeed具有很強的擴展性,能適應多種算法。一是可以適配SSD、YOLO-V4等開源的目標檢測算法。二是應用於自動駕駛小車競賽領域的車道定位算法,將VisionSeed安裝在AGV小車的前端,獲取第一人稱視角的車道畫面後,通過算法輸出小車在車道內的橫向偏移。這個算法主要通過語義分割進行車道信息提取,再通過回歸模型直接得到定位結果來完成任務,將這兩個交通標識檢測和車道定位模型都部署到AI視覺傳感器中,它就能指揮AGV小車完成複雜的任務。三是OCR算法,VisionSeed適配了基於 PyTorch開源實現的CRNN算法。

VisionSeed將以上算法,在客戶端工具中封裝成可以一鍵下載的模塊,不僅方便用戶下載體驗,還可以進行分類任務訓練。VisionSeed還同時支持UART和USB兩個硬體接口。此外,通過VisionSeed提供的全平臺SDK,開發者僅用10行代碼就可以獲取到AI分析後的結構化結果。

研發圖像編輯生成技術,解鎖圖像和視頻 領域更多可能

什麼是圖像編輯生成?人臉融合、圖像分割、動漫化、視頻換臉、照片驅動……這些都是利用圖像編輯生產技術完成的。演講中,騰訊優圖高級研究員王亞彪重點介紹了視頻換臉、面部屬性編輯、視線編輯、畫質編輯這四項技術,他表示這些技術都會用到GAN生成對抗網絡和Encoder-Decoder框架。

視頻換臉領域早期有一個Deepfake算法,該算法只能對訓練過的兩個特定ID換臉,無法使用各種各樣的人臉去做替換。針對此點不足,優圖提出了SimSwap算法,不僅能滿足不同人臉的替換,還可以做跨性別替換,在正臉和側臉之間也可以進行替換。

騰訊優圖高級研究員 王亞彪

在面部屬性編輯技術研究中發現,模型不同層級的「風格」特徵表示,在某些層級具有很好的可分性,因此優圖提出了SSCGAN算法,該算法採用多級風格跳躍連接(SSC)和空間信息遷移(SIT)兩個模塊,實現整體結構和局部面部屬性的精確編輯。

在視線編輯方面,王亞彪指出,疫情期間在線視頻交流越來越重要,但受限於屏幕和攝像頭之間的物理布局,導致交流過程中缺乏眼神接觸,因此優圖提出Ugaze 算法框架,矯正眼神視線方向。相較於以往基於3D變換的視圖生成和基於生成模型的單目視線編輯, Ugaze 算法主要有兩點創新:一是提出了基於運動流場結合判別器的方案;二是使用了大量人工合成數據,採用域遷移方法,進一步提升了模型矯正精度。

針對畫質編輯,優圖提出了圖像超分RealSR算法。以往的超分算法往往只在特定數據集上有效,難以很好的對真實世界圖像做超分。針對以往算法在高清和低清圖像pair構造上的不足,我們提出了一種新的圖像退化框架,該框架可以估計多樣化的模糊核和真實噪聲分布。RealSR算法獲得了NTIRE 2020挑戰賽冠軍,並受到了眾多社區開發者的關注。

推出統一推理框架TNN,解決產業落地難題

騰訊優圖高級研究員姚達在演講中介紹到,優圖的視覺AI技術如文字識別、圖像識別、美容美化等核心技術,已在零售、工業、支付等多個領域進行應用。但在產業解決方案落地過程中,優圖也遇到了一些難點,比如模型格式不同一、硬體架構眾多、性能低功耗高等。

為解決以上三大難點,優圖聯合騰訊內部多個部門推出了統一推理框架TNN,以滿足算法模型跨平臺、高性能快速部署需求。TNN通過ONNX作為一個中間結構支持PyTorch、TensorFlow等多種模型格式,同時TNN在底層適配了各種各樣的晶片能力。目前在騰訊內部,TNN已在手Q、微視等多個APP端以及微信支付一體機等終端落地,穩定性和可靠性得到廣泛驗證。

騰訊優圖高級研究員 姚達

TNN推理框架是如何進行優化的呢?根據硬體架構基礎和硬體的演進,TNN提出兩個基本準則:一是減少計算量,減少內存讀寫,適配Cache讓內存讀寫更快;二是擴展適配異構計算設備。

基於以上兩個原則,TNN提出了圖優化、算子公式優化、算子手動調優、異構調度優化等多種優化方案。在圖優化中通過常數摺疊和算子融合,避免運行時冗餘計算以及減少內存讀寫次數;在算子公式優化中,利用子圖變換、公式等效和近似計算,減小計算量和內存讀寫總量。在算子手動調優中,針對耗時佔比在70%以上的卷積算子,根據硬體緩存特性設計精細的卷積實現。在異構調度優化中,TNN提出異構單元專職專用,充分利用所有計算設備,根據計算設備特性分配不同計算任務,同時計算設備間進行流水線優化,以此減少計算設備相互等待,提升計算重疊度,減少整體延時。

在硬體適配方面,針對端邊雲硬體架構各異,相互不具備通用性,適配工作量巨大這些難點,TNN和硬體廠商進行了聯合優化,優化後可以達到兩種效果:一是接口統一,用戶只需要通過簡單的參數設置,就可以在CPU、GPU、NPU上運行。二是模型統一,TNN內部通過IR中間件的方式適配各個硬體廠商的自研框架如OpenVINOTensorRT等,用戶僅需轉換TNN模型即可在各硬體平臺部署。

優圖在推理框架TNN下與英特爾合作完成多尺度GEMM優化,使得模型性能提升24%;與英偉達完成低精度量化模型的訓練和推理支持,相比FP32推理提升4倍以上

目前,TNN已經開源,期待更多開發者加入進來,一起協同共建統一的推理框架。

聯合英偉達開發 Int8方案 ,推動模型量化高效升級

騰訊優圖高級研究員楊博在演講中講述了模型量化的背景,他指出業界比較常用的模型量化解決方案是NVIDIA post-train方案,這個方案是在訓練完之後對模型進行校正,使用少量的數據,部署很方便,但有一個缺點是會導致模型效果下降。此外,還有一種是以Tensorflow QAT為代表的解決方案,這種方法在訓練過程中模擬Int8計算,採用Minmax計算量化區間,Finetune補償精度損失,但訓練周期長,而且工具鏈還不是很完善,一些常用的模型無法支持從訓練到部署的轉化。

可以看出,業界傳統的解決算法都存在某些方面的不足,針對以上這些問題,優圖和英偉達合作開發了一個完善的Int8訓練到部署的方案,該方案升級了圖優化匹配模板,支持更多模型QAT圖轉換,其次增加了混合精度量化訓練方式等其他量化模型精度保持方式,最後推理框架(TensorRT、TNN)支持包含quant節點的模型轉換。

騰訊優圖高級研究員 楊博

Int8模型科學機訓練採用的是什麼工作方法呢?首先會做一個BN層的融合,然後是子圖搜索和匹配,匹配到子圖以後,會自動插入量化節點,最後通過建立黑白名單的混合精度策略、動態量化區間統計以及激活層增量量化等方法,來保持模型效果。

Int8模型前向部署主要分為兩部分,一是導出模型到onnx,完成QAT訓練後,對checkpoint進行後處理並導出包含量化op在內的onnx模型;二是採用TensorRT顯示精度的模式完成fp32模型到int8模型的轉換,對相關OP做一些融合,將onnx模型轉換到tensorRT和TNN內。

楊博表示Int8標準模型,在打通Calibration和QAT部署相關工作之後的一些數據效果很好,但會增加耗時,優圖會繼續優化技術,提高研究效率。後續優圖也將繼續和英偉達展開更深度的合作,進一步完善優圖QAT工具,增加對TensorRT後續版本的支持,提供更加易用高效的QAT模型訓練和部署解決方案。

作為騰訊旗下頂級的人工智慧實驗室,優圖一直聚焦計算機視覺,專注人臉識別、圖像識別、OCR、機器學習、數據挖掘等領域開展技術研發和行業落地,未來將持續深耕於此,讓人工智慧更好得助力產業數位化發展。

責任編輯:韓璐(EN053)

相關焦點

  • 騰訊Techo Park開發者大會召開在即,全球200多位專家共話雲計算
    據了解,本次大會將邀請全球超過200位頂級技術專家來到現場,和數千位參會者就雲計算、大數據和人工智慧等前沿技術話題展開深度交流。預計將有超過百萬用戶通過線上和線下方式分享這場技術的年度盛會。通過最純粹的技術分享、最乾貨的應用實踐,和最前沿的技術思考為中國以及全球雲計算愛好者、從業者、開發者提供最具參考價值的創新分享。今年大會將設置1場主論壇,29場垂直技術分論壇以及多場獨具特色的創新互動活動,來自國內外200多位技術大咖將現場為大家帶來一場年度的技術嘉年華。
  • 騰訊Techo Park開發者大會正式召開,重磅發布雲原生線路圖、雲梯計劃
    (原標題:騰訊Techo Park開發者大會正式召開,重磅發布雲原生線路圖、雲梯計劃)
  • 騰訊Techo Park開發者大會正式召開,發布雲原生線路圖、雲梯計劃
    12月19日,在北京舉行的騰訊2020 Techo Park開發者大會上,圍繞新形勢下的技術變革與趨勢,騰訊雲展示了其在雲計算、大數據、人工智慧等眾多領域的最新技術、最新成果、以及最佳實踐。騰訊雲將圍繞成本、安全、創新、工具,以及智能等維度,持續加大基礎設施投入規模和自研技術創新力度,通過構建雲、邊、端一體化產品和服務體系,為千百萬開發者一站式提供設計、開發、測試、運維完整產品矩陣,助力開發者提升效率,快速上雲。」
  • Techo Park開發者大會正式揭幕,騰訊雲發布系列重磅新品和計劃
    12月19日,在北京舉行的騰訊2020 Techo Park開發者大會上,圍繞新形勢下的技術變革與趨勢,騰訊雲展示了其在雲計算、大數據、人工智慧等眾多領域的最新技術、最新成果、以及最佳實踐。騰訊雲將圍繞成本、安全、創新、工具,以及智能等維度,持續加大基礎設施投入規模和自研技術創新力度,通過構建雲、邊、端一體化產品和服務體系,為千百萬開發者一站式提供設計、開發、測試、運維完整產品矩陣,助力開發者提升效率,快速上雲。」
  • 「Game 4 Change」,2020騰訊遊戲開發者大會開啟限量報名
    自2017年創辦以來,TGDC堅持以開發者視角與需求為出發點,結合行業發展趨勢,對大會內容進行不斷升級級和擴充,旨在為國內外遊戲專業人士打造開放的交流分享平臺,推動遊戲行業良性發展、探索遊戲更多可能。2020騰訊遊戲開發者大會來了同時,聚焦中國遊戲產業的訪談式紀錄片《遊衷之言》也將在TGDC首發,該片匯聚手遊、單機、獨立遊戲等多種類型開發者,將帶大家了解一個既熟悉又陌生的中國遊戲產業
  • 騰訊Techo Park開發者大會多樣化計算分論壇:面向未來,探索雲計算...
    12月19日-20日,由騰訊發起的面向全球開發者和技術愛好者的年度盛會「Techo Park開發者大會」在京舉行。大會雲集200多位行業頂尖專家和5000多名開發者,圍繞雲計算、大數據和人工智慧等前沿技術話題進行交流探討,並同步舉辦30多場分論壇,吸引超百萬觀眾通過線上和線下方式參與。
  • 騰訊Techo Park開發者大會區塊鏈分論壇:騰訊雲區塊鏈平臺助力產業...
    12月20日,騰訊Techo Park開發者大會分論壇「數字文明的信任框架」在京召開。騰訊雲區塊鏈領域專家劉長輝、北京微芯區塊鏈與邊緣計算研究院副院長任常銳等業界大咖,以及多家企業合作夥伴齊聚一堂,圍繞區塊鏈現狀、演進方向和前沿技術等話題展開交流探討。
  • 2020騰訊遊戲開發者大會圓滿落幕
    12月10日,由騰訊遊戲學院舉辦的第四屆騰訊遊戲開發者大會(Tencent Game Developers Conference,簡稱 TGDC)圓滿落幕。
  • 騰訊發起Light計劃,優圖VisionSeed全面輸出軟硬體AI能力
    首頁 > 傳媒 > 關鍵詞 > 騰訊最新資訊 > 正文 騰訊發起Light計劃,優圖VisionSeed全面輸出軟硬體AI能力
  • 2020 騰訊遊戲開發者大會圓滿落幕:Game 4 Change,為遊戲人打造更...
    在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。   「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • 騰訊優圖實驗室高級研究員棟豪:時序動作分析技術的研究與應用 |...
    「騰訊優圖專場」,是智東西公開課邀請騰訊優圖實驗室面向開發者和科研人員,專注講解騰訊優圖實驗室前沿研究成果的系列線上公開課,第一階段共計三講。第一講由優圖實驗室資深高級研究員瑋劍主講,主題為《3D人臉重建技術的研究與應用實例》。第二講由優圖實驗室研究員太平主講,主題為《人臉安全技術的研究與應用》。
  • 2020騰訊遊戲開發者大會圓滿落幕:為遊戲人打造更開放的平臺
    在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。 「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • 探索最前沿安全技術,2020 TECHO PARK開發者大會安全分論壇等你來!
    全球開發者和技術愛好者的年度盛會上將為你一一揭曉。12月19-20日,由騰訊主辦的2020 TECHO PARK開發者大會將在北京時尚設計廣場舉辦。本屆大會繼續專注於前沿技術研討,為開發者搭建開放、中立、活躍的技術交流平臺。
  • 騰訊優量匯全面升級 致力成為開發者商業成長合作夥伴
    12月22日,騰訊優量匯2020開發者大會通過線上直播的形式與開發者見面。騰訊優量匯產品運營負責人吳棟輝、騰訊優量匯網服行業負責人金地、騰訊優量匯遊戲行業負責人胡暉、騰訊廣告遊戲優選計劃負責人田宛鷺通過大會向開發者分享了平臺產品與能力,並介紹了垂直行業用戶增長與流量變現一站式服務,多維助力開發者實現收益的提升。
  • 2020 騰訊遊戲開發者大會圓滿落幕: Game 4 Change,為遊戲人打造更...
    12月10日,由騰訊遊戲學院舉辦的第四屆騰訊遊戲開發者大會(Tencent Game Developers Conference,簡稱 TGDC)圓滿落幕。在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • Techo Park開發者大會應用化計算分論壇:如何在雲端快速構建應用
    12月19-20日,騰訊Techo Park開發者大會在北京舉行,200多位行業頂尖專家和5000多名開發者齊聚一堂,共同探討雲計算、大數據和人工智慧等前沿技術話題,並同步舉辦30多場分論壇交流,超百萬用戶也通過線上和線下方式參與到這場技術研討的年度盛會。
  • EasyAR開發者大會成功舉辦,助力上海人工智慧產業發展
    ,愛普生等企業展示了其AR技術與應用的最新產品和創新成果。圖|視辰「增強現實產業研究院」揭牌儀式。從右至左:上海市經濟和信息化委員會技術進步處負責人張宏韜,中國測繪科學研究院名譽院長、中國工程院院士劉先林,視+AR創始人兼CEO張小軍,上海市浦東新區科技和經濟委員會副主任徐敏栩隨後,視+AR宣布成立增強現實產業研究院。
  • AIIA2020人工智慧開發者大會開幕 騰訊多項AI技術通過專業評測認證
    9月28至29日,「AIIA2020人工智慧開發者大會」在北京舉辦。本屆大會以「智慧築基,源聚強國」為主題,聚焦人工智慧技術、產業和應用領域的最新進展和熱點。大會上,騰訊的多項AI技術與產品獲得業界高度認可。
  • 第二屆騰訊遊戲開發者大會全回顧:以交流之名,探索遊戲未來
    8月11日,由騰訊遊戲學院舉辦的第二屆騰訊遊戲開發者大會(Tencent Game Developers Conference簡稱TGDC)在深圳蛇口舉行。
  • 輕量級部署,騰訊優圖開源深度學習推理框架TNN
    6 月 10 日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架 TNN,通過底層技術優化實現在多個不同平臺的輕量級部署落地。該框架性能優異、簡單易用。基於 TNN,開發者能夠將深度學習算法輕鬆移植到手機端並高效執行,開發人工智慧 APP,真正將 AI 帶到指尖。