Techo開發者大會,騰訊優圖分享最新研究成果和產業實踐

2020-12-23 YNET.com北青網

12月19日-20日,由騰訊發起的2020 Techo Park開發者大會於北京順利召開。其中人工智慧專場以「人工智慧算法與最佳實踐」為主題,為開發者、業界及生態夥伴呈現了雲計算時代下人工智慧領域的最新前沿技術與最佳行業實踐。

騰訊優圖實驗室的研究員梁晨、王亞彪、姚達、楊博分別圍繞AI視覺傳感器、視覺算法在圖像編輯生成中的研究與應用、TNN跨平臺推理優化、模量化訓練部署及實踐等發表了主題演講,向業界展示了優圖最新研究成果與產業實踐。

自研AI視覺傳感器 VisionSeed , 算法多樣支持二次開發

在論壇上,梁晨給大家介紹了一個有趣的硬體——AI視覺傳感器。什麼是AI視覺傳感器呢?它是由攝像頭、NPU和算法組成的硬體模組,其基本運行原理是:在NPU上運行深度學習算法,能夠直接對攝像頭拍攝到的畫面進行實時分析,並將分析的結果通過數位訊號傳輸給主機。

據梁晨介紹,騰訊優圖推出了一款自研的AI視覺傳感器——VisionSeed,內置優圖領先的視覺AI算法,還提供專業的配套工具和全平臺的SDK作為支撐,讓開發者可以方便的進行二次開發。

騰訊優圖專家研究員 梁晨

算法是AI視覺傳感器的靈魂,VisionSeed具有很強的擴展性,能適應多種算法。一是可以適配SSD、YOLO-V4等開源的目標檢測算法。二是應用於自動駕駛小車競賽領域的車道定位算法,將VisionSeed安裝在AGV小車的前端,獲取第一人稱視角的車道畫面後,通過算法輸出小車在車道內的橫向偏移。這個算法主要通過語義分割進行車道信息提取,再通過回歸模型直接得到定位結果來完成任務,將這兩個交通標識檢測和車道定位模型都部署到AI視覺傳感器中,它就能指揮AGV小車完成複雜的任務。三是OCR算法,VisionSeed適配了基於 PyTorch開源實現的CRNN算法。

VisionSeed將以上算法,在客戶端工具中封裝成可以一鍵下載的模塊,不僅方便用戶下載體驗,還可以進行分類任務訓練。VisionSeed還同時支持UART和USB兩個硬體接口。此外,通過VisionSeed提供的全平臺SDK,開發者僅用10行代碼就可以獲取到AI分析後的結構化結果。

研發圖像編輯生成技術,解鎖圖像和視頻 領域更多可能

什麼是圖像編輯生成?人臉融合、圖像分割、動漫化、視頻換臉、照片驅動……這些都是利用圖像編輯生產技術完成的。演講中,騰訊優圖高級研究員王亞彪重點介紹了視頻換臉、面部屬性編輯、視線編輯、畫質編輯這四項技術,他表示這些技術都會用到GAN生成對抗網絡和Encoder-Decoder框架。

視頻換臉領域早期有一個Deepfake算法,該算法只能對訓練過的兩個特定ID換臉,無法使用各種各樣的人臉去做替換。針對此點不足,優圖提出了SimSwap算法,不僅能滿足不同人臉的替換,還可以做跨性別替換,在正臉和側臉之間也可以進行替換。

騰訊優圖高級研究員 王亞彪

在面部屬性編輯技術研究中發現,模型不同層級的「風格」特徵表示,在某些層級具有很好的可分性,因此優圖提出了SSCGAN算法,該算法採用多級風格跳躍連接(SSC)和空間信息遷移(SIT)兩個模塊,實現整體結構和局部面部屬性的精確編輯。

在視線編輯方面,王亞彪指出,疫情期間在線視頻交流越來越重要,但受限於屏幕和攝像頭之間的物理布局,導致交流過程中缺乏眼神接觸,因此優圖提出Ugaze 算法框架,矯正眼神視線方向。相較於以往基於3D變換的視圖生成和基於生成模型的單目視線編輯, Ugaze 算法主要有兩點創新:一是提出了基於運動流場結合判別器的方案;二是使用了大量人工合成數據,採用域遷移方法,進一步提升了模型矯正精度。

針對畫質編輯,優圖提出了圖像超分RealSR算法。以往的超分算法往往只在特定數據集上有效,難以很好的對真實世界圖像做超分。針對以往算法在高清和低清圖像pair構造上的不足,我們提出了一種新的圖像退化框架,該框架可以估計多樣化的模糊核和真實噪聲分布。RealSR算法獲得了NTIRE 2020挑戰賽冠軍,並受到了眾多社區開發者的關注。

推出統一推理框架TNN,解決產業落地難題

騰訊優圖高級研究員姚達在演講中介紹到,優圖的視覺AI技術如文字識別、圖像識別、美容美化等核心技術,已在零售、工業、支付等多個領域進行應用。但在產業解決方案落地過程中,優圖也遇到了一些難點,比如模型格式不同一、硬體架構眾多、性能低功耗高等。

為解決以上三大難點,優圖聯合騰訊內部多個部門推出了統一推理框架TNN,以滿足算法模型跨平臺、高性能快速部署需求。TNN通過ONNX作為一個中間結構支持PyTorch、TensorFlow等多種模型格式,同時TNN在底層適配了各種各樣的晶片能力。目前在騰訊內部,TNN已在手Q、微視等多個APP端以及微信支付一體機等終端落地,穩定性和可靠性得到廣泛驗證。

騰訊優圖高級研究員 姚達

TNN推理框架是如何進行優化的呢?根據硬體架構基礎和硬體的演進,TNN提出兩個基本準則:一是減少計算量,減少內存讀寫,適配Cache讓內存讀寫更快;二是擴展適配異構計算設備。

基於以上兩個原則,TNN提出了圖優化、算子公式優化、算子手動調優、異構調度優化等多種優化方案。在圖優化中通過常數摺疊和算子融合,避免運行時冗餘計算以及減少內存讀寫次數;在算子公式優化中,利用子圖變換、公式等效和近似計算,減小計算量和內存讀寫總量。在算子手動調優中,針對耗時佔比在70%以上的卷積算子,根據硬體緩存特性設計精細的卷積實現。在異構調度優化中,TNN提出異構單元專職專用,充分利用所有計算設備,根據計算設備特性分配不同計算任務,同時計算設備間進行流水線優化,以此減少計算設備相互等待,提升計算重疊度,減少整體延時。

在硬體適配方面,針對端邊雲硬體架構各異,相互不具備通用性,適配工作量巨大這些難點,TNN和硬體廠商進行了聯合優化,優化後可以達到兩種效果:一是接口統一,用戶只需要通過簡單的參數設置,就可以在CPU、GPU、NPU上運行。二是模型統一,TNN內部通過IR中間件的方式適配各個硬體廠商的自研框架如OpenVINOTensorRT等,用戶僅需轉換TNN模型即可在各硬體平臺部署。

優圖在推理框架TNN下與英特爾合作完成多尺度GEMM優化,使得模型性能提升24%;與英偉達完成低精度量化模型的訓練和推理支持,相比FP32推理提升4倍以上

目前,TNN已經開源,期待更多開發者加入進來,一起協同共建統一的推理框架。

聯合英偉達開發 Int8方案 ,推動模型量化高效升級

騰訊優圖高級研究員楊博在演講中講述了模型量化的背景,他指出業界比較常用的模型量化解決方案是NVIDIA post-train方案,這個方案是在訓練完之後對模型進行校正,使用少量的數據,部署很方便,但有一個缺點是會導致模型效果下降。此外,還有一種是以Tensorflow QAT為代表的解決方案,這種方法在訓練過程中模擬Int8計算,採用Minmax計算量化區間,Finetune補償精度損失,但訓練周期長,而且工具鏈還不是很完善,一些常用的模型無法支持從訓練到部署的轉化。

可以看出,業界傳統的解決算法都存在某些方面的不足,針對以上這些問題,優圖和英偉達合作開發了一個完善的Int8訓練到部署的方案,該方案升級了圖優化匹配模板,支持更多模型QAT圖轉換,其次增加了混合精度量化訓練方式等其他量化模型精度保持方式,最後推理框架(TensorRT、TNN)支持包含quant節點的模型轉換。

騰訊優圖高級研究員 楊博

Int8模型科學機訓練採用的是什麼工作方法呢?首先會做一個BN層的融合,然後是子圖搜索和匹配,匹配到子圖以後,會自動插入量化節點,最後通過建立黑白名單的混合精度策略、動態量化區間統計以及激活層增量量化等方法,來保持模型效果。

Int8模型前向部署主要分為兩部分,一是導出模型到onnx,完成QAT訓練後,對checkpoint進行後處理並導出包含量化op在內的onnx模型;二是採用TensorRT顯示精度的模式完成fp32模型到int8模型的轉換,對相關OP做一些融合,將onnx模型轉換到tensorRT和TNN內。

楊博表示Int8標準模型,在打通Calibration和QAT部署相關工作之後的一些數據效果很好,但會增加耗時,優圖會繼續優化技術,提高研究效率。後續優圖也將繼續和英偉達展開更深度的合作,進一步完善優圖QAT工具,增加對TensorRT後續版本的支持,提供更加易用高效的QAT模型訓練和部署解決方案。

作為騰訊旗下頂級的人工智慧實驗室,優圖一直聚焦計算機視覺,專注人臉識別、圖像識別、OCR、機器學習、數據挖掘等領域開展技術研發和行業落地,未來將持續深耕於此,讓人工智慧更好得助力產業數位化發展。

責任編輯:韓璐(EN053)

相關焦點

  • 騰訊Techo Park開發者大會召開,發布雲原生線路圖、雲梯計劃
    智東西(公眾號:zhidxcom) 編輯 |年華 智東西12月19日消息,騰訊Techo Park開發者大會正式召開,發布雲原生線路圖、雲梯計劃等產品和戰略。
  • 騰訊Techo Park開發者大會召開在即,全球200多位專家共話雲計算
    12月19日至20日,由騰訊主辦的2020Techo Park開發者大會將於北京召開。據了解,本次大會將邀請全球超過200位頂級技術專家來到現場,和數千位參會者就雲計算、大數據和人工智慧等前沿技術話題展開深度交流。預計將有超過百萬用戶通過線上和線下方式分享這場技術的年度盛會。
  • 實驗室裡的AI激情:騰訊優圖的升級修煉之路
    誕生了機器學習框架TensorFlow的谷歌人工智慧實驗室,孵化出智能助手小冰和小娜的微軟研究院,亦或是國內諸多巨頭的各種實驗室和研究中心,成為智能經濟的重要支撐。其中,作為騰訊AI技術雙引擎之一的優圖實驗室,就是一個不容忽視的存在。
  • 2020 騰訊遊戲開發者大會圓滿落幕:Game 4 Change,為遊戲人打造更...
    在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。   「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • 騰訊發起公益創新挑戰賽,騰訊優圖開放AI助力科技公益
    騰訊雲副總裁、騰訊優圖實驗室總經理吳運聲出席發布會並發表了開場致辭。騰訊雲副總裁、騰訊優圖實驗室總經理 吳運聲「人工智慧已經走過了技術爆發的階段,正在逐漸深入到產業,走進我們生活的方方面面。」吳運聲說道。他表示,多年來,騰訊優圖實驗室始終堅持技術研究和產業落地兩條腿走路的戰略。
  • 2020 騰訊遊戲開發者大會圓滿落幕: Game 4 Change,為遊戲人打造更...
    12月10日,由騰訊遊戲學院舉辦的第四屆騰訊遊戲開發者大會(Tencent Game Developers Conference,簡稱 TGDC)圓滿落幕。在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • 騰訊優量匯全面升級 致力成為開發者商業成長合作夥伴
    12月22日,騰訊優量匯2020開發者大會通過線上直播的形式與開發者見面。騰訊優量匯產品運營負責人吳棟輝、騰訊優量匯網服行業負責人金地、騰訊優量匯遊戲行業負責人胡暉、騰訊廣告遊戲優選計劃負責人田宛鷺通過大會向開發者分享了平臺產品與能力,並介紹了垂直行業用戶增長與流量變現一站式服務,多維助力開發者實現收益的提升。
  • 2021年快來了,Techo Park帶你解密技術趨勢
    這位名為小七的主持人,是由騰訊雲和AI Lab共同打造的首位AI虛擬主持人。作為前沿技術的最新成果,小七的出場為大會定下了技術為先的基調,並為大牛雲集的現場帶來了輕鬆活躍的氣氛。小七邀請的開場致辭嘉賓是騰訊雲副總裁王慧星。在主題為《新形勢下技術變化與趨勢展望》的演講中,王慧星侃侃而談:我們非常希望騰訊的基礎設施能夠給整個產業的變革提供更優的服務和質量。
  • ...Techo Park開發者大會召開 騰訊雲星星海發布新一代自研雙路...
    12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。此外,騰訊雲還分享了在雲計算、存儲、網絡、運維在軟硬一體化趨勢下的創新和實踐。
  • Techo Park開發者大會應用化計算分論壇:如何在雲端快速構建應用
    12月19-20日,騰訊Techo Park開發者大會在北京舉行,200多位行業頂尖專家和5000多名開發者齊聚一堂,共同探討雲計算、大數據和人工智慧等前沿技術話題,並同步舉辦30多場分論壇交流,超百萬用戶也通過線上和線下方式參與到這場技術研討的年度盛會。
  • 踐行科技向善,騰訊優圖聯合騰訊天御發布面向未成年人的內容安全...
    日前,在2020騰訊全球數字生態大會AI雲專場上,騰訊優圖實驗室副總經理黃飛躍發表了以《技術爆炸時代裡的優圖:從跋山涉水,到越過山丘》為主題的演講,並正式發布了面向未成年人的內容安全審核解決方案。這是騰訊優圖首個專門面向未成年人的內容安全審核解決方案,既體現了騰訊的相關技術實力,也是公司整體「科技向善」的最新舉措。
  • 國際人工智慧專家丹尼爾·波維亮相AIIA2020人工智慧開發者大會前瞻
    本屆大會由中關村科技園區管理委員會、北京市石景山區人民政府、中國人工智慧產業發展聯盟(AIIA)、首鋼集團有限公司主辦,中國信息通信研究院、中關村石景山園管理委員會、中關村數智人工智慧產業聯盟等單位共同承辦,大會旨在解讀行業最新動態,共話未來發展新趨勢。一期一會的AIIA2020人工智慧開發者大會,將有哪些大咖亮相呢?讓我們來一起來揭示這個謎底。
  • 嗨美麗SOP系統榮獲騰訊首屆開發者大賽「年度最具商業價值獎」
    12月19日- 20日,由騰訊發起的面向全球開發者和技術愛好者的年度盛會「Techo Park開發者大會」在京舉行。在會上,犀牛雲COO唐嘉求與200多位行業頂尖專家和5000多名開發者,圍繞雲計算、大數據和人工智慧等前沿技術話題進行交流探討。與此同時,開發者大會也在同步舉辦30多場分論壇,吸引超百萬觀眾通過線上和線下方式參與。今年Techo Park開發者大會,首次採用虛擬主持人的形式,由騰訊雲小微和AI Lab聯合打造的小7為與會人員提供講解與支持。
  • STM32合作夥伴 | 2020 RT-Thread 開發者大會等你來,共享饕餮盛宴...
    每年一度的 RDC (RT-Thread Developer Conference, RT-Thread 開發者大會)為眾多開發者展示了 RT-Thread 的最新開發和生態建設成果,並攜手合作夥伴及資深開發者呈現了 AIOT 行業前沿的技術和創新,分享了最佳技術實踐, 成長為 AIOT 領域備受矚目的大型年度技術盛會
  • 貝殼·如視惠新宸出席騰訊雲開發者大會 展望沉浸式服務新時代
    12月19日,騰訊雲2020 Techo Park開發者大會正式啟幕,超過200位頂級技術專家和數千位參會者匯聚一堂,面向全球開發者和技術愛好者分享雲計算、大數據和人工智慧方面的創新和實踐。貝殼找房副總裁、騰訊雲TVP創始委員惠新宸,貝殼找房如視事業部技術負責人楊永林受邀出席此次大會,並就TRTC(實時音視頻)、VR等尖端科技在居住服務等領域的應用進行深度交流,為參會嘉賓提供極具參考價值的經驗分享。
  • 2020 Techo Park:騰訊安全攜手全球頂級安全專家揭秘前沿安全技術
    在12月20日北京舉行的2020 Techo Park開發者大會上,由騰訊安全主辦的「揭秘前沿安全技術」分論壇匯聚了來自中國科學院信息工程研究所、頂級開源項目Rizin團隊、滴滴出行、騰訊安全雲鼎實驗室等國內外多位安全專家,攜手帶來了二進位安全、AI+安全、漏洞挖掘等多項安全研究成果,共同推進億萬用戶數據安全生態建設。  層出不窮的軟體漏洞如何實現規模化檢測?
  • 貝殼·如視惠新宸出席騰訊雲開發者大會,展望沉浸式服務新時代
    12月19日,騰訊雲2020 Techo Park開發者大會正式啟幕,超過200位頂級技術專家和數千位參會者匯聚一堂,面向全球開發者和技術愛好者分享雲計算、大數據和人工智慧方面的創新和實踐。貝殼找房副總裁、騰訊雲TVP創始委員惠新宸,貝殼找房如視事業部技術負責人楊永林受邀出席此次大會,並就TRTC(實時音視頻)、VR等尖端科技在居住服務等領域的應用進行深度交流,為參會嘉賓提供極具參考價值的經驗分享。疫情催生VR應用新機遇 貝殼攜手騰訊雲重塑居住服務行業突如其來的疫情,在不同程度上重塑了各行各業的商業模式和運營理念。
  • 2020啟智開發者大會開幕 百度飛槳正式發布「OpenI-星辰PPSIG共建...
    2020年12月2日,「OpenI/O 2020啟智開發者大會」在北京國家會議中心召開。大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。
  • 「OpenI/O 2020啟智開發者大會」共話開源 百度飛槳引領行業發展
    2020年12月2日,「OpenI/O 2020啟智開發者大會」在北京國家會議中心召開。大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。
  • 2020 Techo開發者大會召開,騰訊多媒體實驗室推出AI媒體內容生產...
    12月19日至20日,由騰訊主辦的年度技術盛會2020Techo Park開發者大會於北京順利召開。本次大會邀請了200多位海內外專家和和數千位參會者就人工智慧、多媒體等前沿技術話題展開交流。在視頻通信雲分論壇上,騰訊多媒體實驗室總監李松南進行了《智媒-多模態與內容生產》的主題分享。