騰訊優圖開源深度學習推理框架TNN 助力AI開發降本增效

2021-01-11 中國新聞網

騰訊優圖開源深度學習推理框架TNN 助力AI開發降本增效
2020-06-10 16:58:07 來源:中國新聞網 作者:於曉 責任編輯:於曉

  中新網6月10日電 從學界到工業界,「開源」已經成為AI領域的一個關鍵詞。一方面,它以「授人以漁」的方式為AI構建了一個開放共進的生態環境,幫助行業加速AI應用落地;另一方面,在解決行業實際問題時持續更新和迭代,源源不斷地給AI領域輸送重要的技術養料和創造力,可以說開源是AI落地和繁榮不可或缺的源動力。

  6月10日,騰訊優圖實驗室宣布正式開源新一代移動端深度學習推理框架TNN,通過底層技術優化實現在多個不同平臺的輕量部署落地,性能優異、簡單易用。基於TNN,開發者能夠輕鬆將深度學習算法移植到手機端高效的執行,開發出人工智慧 APP,真正將 AI 帶到指尖。

  輕量級部署,TNN助力深度學習提速增效

  深度學習對算力的巨大需求一直制約著其更廣泛的落地,尤其是在移動端,由於手機處理器性能弱、算力無法多機拓展、運算耗時長等因素常常導致發熱和高功耗,直接影響到app等應用的用戶體驗。騰訊優圖基於自身在深度學習方面的技術積累,並借鑑業內主流框架優點,推出了針對手機端的高性能、輕量級移動端推理框架TNN。

  TNN在設計之初便將移動端高性能融入核心理念,對2017年開源的ncnn框架進行了重構升級。通過GPU深度調優、ARM SIMD深入彙編指令調優、低精度計算等技術手段,在性能上取得了進一步提升。

  低精度計算的運用對TNN的性能提升發揮了重要作用。在神經網絡計算中,浮點精度在許多研究和業務落地成果上都被證明存在一定冗餘,而在計算、內存資源都極為緊張的移動端,消除這部分冗餘極為必要。TNN引入了INT8、 FP16、 BFP16等多種計算低精度的支持,相比大部分僅提供INT8支持的框架,不僅能靈活適配不同場景,還讓計算性能大大提升。TNN通過採用8bit整數代替float進行計算和存儲,模型尺寸和內存消耗均減少至1/4,在計算性能上提升50%以上。同時引入arm平臺BFP16的支持,相比浮點模型,BFP16使模型尺寸、內存消耗減少50%,在中低端機上的性能也提升約20%。驍龍615平臺實測:通用、輕便是TNN框架的另一大亮點。長久以來,不同框架間的模型轉換都是AI項目應用落地的痛點。TNN設計了與平臺無關的模型表示,為開發人員提供統一的模型描述文件和調用接口,支持主流安卓、iOS等作業系統,適配CPU、 GPU、NPU硬體平臺。企業一套流程就能部署到位,簡單易用、省時省力。同時, TNN通過ONNX可支持TensorFlow, PyTorch, MXNet, Caffe等多種訓練框架,目前支持ONNX算子超過80個,覆蓋主流CNN網絡。TNN所有算子均為源碼直接實現,不依賴任何第三方,接口易用,切換平臺僅需修改調用參數即可。

  開源文化興起,AI底層技術助推產業發展

  事實上,作為騰訊旗下頂級AI實驗室,騰訊優圖長期致力於AI基礎設施的研發和推進。此前,騰訊優圖已開發了Rapidnet 前向計算框架、RapidAIoT 邊緣計算框架,實現了業界首個專注移動端的推斷框架ncnn的開源,並在業界受到廣泛推崇。從2017年開源至今,ncnn在GitHub上star(8.9k)和 fork(2.3k)數均領先於其它各大推理框架。

  據悉,TNN已於3月中旬在騰訊內部開源,為騰訊QQ、QQ空間、騰訊微視、騰訊雲、天天P圖等多款產品和服務中持續提供技術能力,釋放出更多效能。

  「TNN已在GitHub上開源,歡迎業界人士參與協同共建,共同打造更優的移動端推理框架。「騰訊優圖實驗室副總經理吳永堅介紹,騰訊優圖後續將在現有CV業務的基礎上研發更多的AI推理模型,如語音、NLP等相關業務,同時開展針對CPU、GPU伺服器端的服務,為業界公司提供更廣泛的優化服務。 「作為產業發展的高速公路,以深度學習框架、組件為代表的AI基礎設施將是未來的主流趨勢,騰訊優圖也將以此為著力點,助推產業發展。」吳永堅表示,騰訊優圖還將持續開發模型訓練組件、模型壓縮組件、基礎算法組件,並擇機開源,希望從框架到平臺、到算法,打造一體化的AI基礎設施,降低AI門檻,加速產業發展。

  隨著以開源為代表的新代碼文化的興起,騰訊近年來在開源領域表現亮眼:在全球最大的代碼託管平臺GitHub上,騰訊發布的開源項目已經超過一百個,涵蓋雲原生、大數據、AI、雲計算、安全、硬體等多個熱門的技術方向。

  通過開源協同,騰訊將各個事業群最底層和共性的技術能力進行梳理和拉通,在業務實踐和海量用戶檢驗下,優質的內部開源項目不僅在公司層面推廣復用,同時也對外貢獻整個開源社區。僅在Github上,騰訊的開源項目就收穫了30w+star數,躋身國際上有影響力的開源企業之一。

  在開源的道路上,騰訊不僅將內部優質項目持續對外開放,也積極與開源社區協同合作,發揮中國企業的科技力量,推動開源和開放進一步升級。

  開源地址:https://github.com/Tencent/TNN

相關焦點

  • 騰訊優圖開源深度學習推斷框架TNN - 軟體與服務 - 中國軟體網...
    6月12日消息,騰訊優圖實驗室宣布開源新一代移動端深度學習推理框架TNN。騰訊優圖希望通過底層技術優化幫助用戶實現人工智慧在多個不同平臺的輕量部署落地。據悉,基於TNN,開發者能夠輕鬆將深度學習算法移植到手機端高效的執行,開發出人工智慧 APP,將 AI 帶到指尖。
  • 2020年成國內深度學習框架開源元年 曠視科技開源天元加速AI落地與...
    人工智慧時代,開源作為算法創新與迭代的重要驅動力,在深度學習領域發揮著至關重要的作用。全球諮詢機構IDC《中國深度學習平臺市場份額調研》指出,在AI技術使用方面,接受調研的企業和開發者中,86.2%選擇使用開源的深度學習框架。
  • 騰訊優圖2020疫情下再出發!專利800+項,AI落地直面碎片化
    溝通會最後,智東西等少數媒體對騰訊優圖實驗室副總經理黃飛躍 、騰訊優圖實驗室總監任博及總監吳永堅進行了專門提問。  黃飛躍首先通過騰訊會議的案例對此進行了解讀。  黃飛躍表示,在騰訊會議使用過程中有許多碎片化的需求,為此優圖進行了許多技術開發。比如聚焦用戶開會背景中有私密性元素的問題,優圖提供了基於人像分割技術的虛擬背景,使得邊緣分割精度達像素級,並保證視頻幀間的穩定處理。比如針對開會視線偏離及走神問題,優圖研發並落地了眼神矯正算法。
  • 35 萬行代碼,曠視重磅開源天元深度學習框架 ,四大特性實現簡單開發
    全球AI開發框架又添一員,曠視開源「天元」  曠視天元開源之時,正值深度學習框架百花齊放的時代。  自2007年Theano誕生以來,經過十餘年發展,深度學習技術與應用突飛猛進,深度學習框架也處在不斷迭代與進化的過程;另一方面,開源的概念在全球範圍內越來越深入人心,這使得人工智慧開發依賴的環境安裝、部署、測試,以及不斷迭代改進準確性和性能調優的工作變得更加簡單,在人工智慧領域,開源深度學習框架已經成為開發者離不開的平臺和工具。
  • 騰訊優圖:做產業網際網路時代的π型實驗室
    12月30日,騰訊優圖2020年度溝通會於海南正式舉辦,騰訊優圖實驗室總經理、騰訊雲副總裁吳運聲、騰訊優圖實驗室副總經理黃飛躍、騰訊優圖實驗室總監吳永堅、騰訊優圖實驗室總監任博,騰訊研究院高級研究員徐思彥等大咖出席了活動,並就2020年的業務進展和人工智慧趨勢做了完整的解讀和分享。
  • 曠視天元深度學習框架全球首發!3個實習生寫下一行代碼,27項全球AI...
    天元項目負責人兼曠視研究院高級技術總監田忠博指出,這次開源的天元是一套訓練推理一體化、動靜態合一的工業級深度學習框架,採用訓練與推理在同一個框架、同一個體系內完整支持的設計,讓開發者真正體驗到「訓得好」、「訓得動」、「訓得快
  • 華為深度學習框架MindSpore正式開源:自動微分不止計算圖
    今年的華為開發者大會 HDC 2020 上,除了昇騰、鯤鵬等自研晶片硬體平臺之外,最令人期待的就是深度學習框架 MindSpore 的開源了。今天上午,華為 MindSpore 首席科學家陳雷在活動中宣布這款產品正式開源,我們終於可以在開放平臺上一睹它的真面目。
  • 騰訊AI Lab 2020 年度回顧
    GROVER 是業界首個開源的基於深度圖神經網絡的圖數據的大規模預訓練模型,研究人員可以快速將其作為基礎組件應用到需要對小分子進行編碼的藥物研發相關研究中,助力藥物研發相關應用,例如分子屬性預測、虛擬篩選等任務。
  • 深度學習框架比較,我該選擇哪一個?
    PaddlePaddle同時支持稠密參數和稀疏參數場景的超大規模深度學習並行訓練,支持千億規模參數、數百個幾點的高效並行訓練,也是最早提供如此強大的深度學習並行技術的深度學習框架。PaddlePaddle擁有強大的多端部署能力,支持伺服器端、移動端等多種異構硬體設備的高速推理,預測性能有顯著優勢。
  • 基於動態編譯(Just-in-Time)的全新深度學習框架
    基於動態編譯(Just-in-Time)的全新深度學習框架 風君子 發表於 2020-11-25 11:08:37 據官方消息,清華大學計算機系圖形實驗室宣布開源一個全新的深度學習框架
  • 華為開源自研AI框架MindSpore!自動微分、並行加持,一次訓練,可多...
    乾明 發自 凹非寺  量子位 報導 | 公眾號 QbitAI  華為的開源AI框架,來了!  剛剛,華為宣布正式開源自研深度學習框架MindSpore,代碼已經上線。  MindSpore是一款支持端邊雲全場景的深度學習訓練推理框架,主要應用於計算機視覺、自然語言處理等AI領域,面向數據科學家、算法工程師等人群,提供設計友好、運行高效的開發體驗。
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    ,由總部位於美國舊金山的商業智能和企業軟體公司Skymind牽頭開發,並得到了騰訊的投資。Deeplearning4j團隊在官網表示,他們希望通過一些深度學習算法的開發,將商業帶入智能化數據的時代。也正是為了實現這一理想,惠及更多的用戶,因此選擇了移植性更好的Java環境來實現這些算法。目前,Deeplearning4j的這些算法已經在谷歌、Facebook和微軟等平臺得到了廣泛應用。
  • 十行代碼就能搞定深度學習?飛槳框架高層API,輕鬆玩轉AI
    機器之心發布機器之心編輯部嚮往深度學習技術,可是深度學習框架太難學怎麼辦?百度傾心打造飛槳框架高層 API,零基礎也能輕鬆上手深度學習,一起來看看吧?為了簡化深度學習的學習過程、降低深度學習的開發難度,百度飛槳框架歷經近一年的打磨,不斷地優化深度學習 API,並針對開發者的使用場景進行封裝,在飛槳框架的最新版本中,推出了高低融合、科學統一的飛槳全新 API 體系。飛槳框架將 API 分為兩種,基礎 API 和高層 API。
  • 清華自研深度學習框架「計圖」開源!多項任務性能超過PyTorch
    值得一提的是,這也是首個來自中國高校科研機構的開源深度學習框架,之前,業內來自「高校」的還有加拿大蒙特婁大學的Theano,UC伯克利的Caffe。與主流的深度學習框架TensorFlow、Pytorch不同,Jittor是一個完全基於動態編譯(Just-in-time)、使用元算子和統一計算圖的深度學習框架。
  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    ,由總部位於美國舊金山的商業智能和企業軟體公司Skymind牽頭開發,並得到了騰訊的投資。Deeplearning4j團隊在官網表示,他們希望通過一些深度學習算法的開發,將商業帶入智能化數據的時代。也正是為了實現這一理想,惠及更多的用戶,因此選擇了移植性更好的Java環境來實現這些算法。目前,Deeplearning4j的這些算法已經在谷歌、Facebook和微軟等平臺得到了廣泛應用。
  • 專訪騰訊雲機器學習平臺技術負責人:揭秘騰訊深度學習平臺DI-X背後...
    那麼最新推出的DI-X和騰訊去年開源的大數據框架Angel以及Mariana究竟有何聯繫?和其它平臺相比,DI-X又有何特點呢?為此,雷鋒網採訪了騰訊T4專家、騰訊雲機器學習平臺技術負責人Andy。DI-X的設計理念是打造一個一站式的機器學習平臺,集開發、調試、訓練、預測、部署於一體,  讓算法工程師和數據科學家,無須關注機器學習(尤其是深度學習)的底層工程繁瑣的細節和資源,專注於模型和算法調優。DI-X的最終目的是成為一個時尚,強大而智能的機器學習平臺,讓機器學習充滿樂趣,助力人工智慧。
  • 騰訊優圖推出卷積神經網絡深度學習算法模型
    騰訊優圖實驗室聯合廣東省肺癌研究所吳一龍教授/鍾文昭教授團隊,與清華大學以及國內多家中心呼吸科/放射科團隊等共同開發了基於卷積神經網絡算法的肺結節診斷模型,近日,該初步研究成果已被全球癌症領域知名醫學期刊《腫瘤學家》(《The Oncologist》)收錄並全文發表。
  • PyTorch版《動手學深度學習》開源了,最美DL書遇上最贊DL框架
    機器之心報導項目作者:ShusenTang參與:思想要入門最前沿的深度學習,想要玩最常見的深度學習框架?那就用 PyTorch 版的《動手學深度學習》吧,零基礎也能入門 DL。李沐等人的開源中文書《動手學深度學習》現在有 PyTorch 版實現了。不論是原書中的示例代碼,還是實戰項目,原來的 MXNet 都可以無縫轉化到 PyTorch 代碼。項目作者在保持原書內容基本不變的情況下,將 MXNet 代碼都轉換為了 PyTorch,想要學習 DL 和 PyTorch 的小夥伴們可以試試啊。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    世界人工智慧大會倒計時 20 天】大會早鳥票已經售罄,現正式進入全額票階段。今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等領域
    通過將CME和SME集成到現成的2D網絡中,騰訊優圖最終獲得了用於動作識別的全面運動特徵學習方法。騰訊優圖的方法在三個公共數據集上取得了有競爭力的表現:Something-Something V1&V2和Kinetics-400。特別是在時序推理數據集Something-Something V1和V2上,當使用16幀作為輸入時,騰訊優圖的方法比之前最好的方法高2.3%和1.9%。