騰訊優圖技術研究全景圖公開 2018主攻三大方向

2020-12-13 手機鳳凰網

原標題:騰訊優圖技術研究全景圖公開 2018主攻三大方向

智東西(公眾號:zhidxcom)
文 | 心緣

2018年AI產業波瀾叢生,智能化開始深入各行各業,AI落地潮空前火熱。騰訊優圖實驗室在今年的落地潮中表現尤為亮眼,它成立於2012年,專注在圖像處理、模式識別、機器學習、數據挖掘等領域開展技術研發和業務落地,是騰訊的三大人工智慧實驗室之一。

今天,騰訊優圖實驗室創始人兼總監黃飛躍、騰訊優圖實驗室總監吳永堅、騰訊優圖實驗室總監任博、騰訊研究院研究員俞點、廈門大學教授紀榮嶸分享了AI學術和產業落地方面的進展,並與智東西等媒體深入交流了AI技術的相關趨勢和短板。

黃飛躍認為現在AI技術的最大短板是在線下複雜的真實場景做識別,吳永堅說技術差異化還包括工程交付效率、方案完整度等方面的綜合實力,任博則談到減少對數據的依賴是非常有意義的事情。

一、以計算機視覺為基礎,全面輸出AI能力

騰訊優圖的技術研究以「計算機視覺AI」為基礎,全面輸出AI能力,著力成為騰訊雲與智慧事業群的底層支撐。

其團隊成員超過百人,大都為清華、北大、中科院、上海交大、南大等頂級院校的博士、碩士,皆具有較深厚的學術研究背景和較強的工程實踐能力,擁有超過160篇AI專利,其研究成果多次在MegaFace、LFW, ICDAR, MIREX等AI國際權威比賽中創造了世界紀錄。

優圖實驗室以產品為核心,以AI技術落地為導向。通過騰訊雲及「騰訊優圖開放平臺」對外輸出團隊核心的技術能力,建立AI雲生態,帶動行業的智能化變革。

騰訊優圖首個AI開源項目ncnn於2017年7月正式開源,促進AI移動端生態的創新和部署,推動AI領域的技術革新。2018年,優圖實驗室升級為騰訊計算機視覺研發中心。

二、聯合騰訊明星產品,主攻三大應用方向

如今優圖AI技術已經廣泛應用在金融、鑑黃、安防、醫療等領域,和微信支付、微視、QQ音樂、全民K歌、騰訊覓影等明星產品合作,例如優圖的OCR文字識別技術每天都會被海量調用,協助騰訊進行內容審核。優圖還與福建公安廳、順豐等多家政企客戶合作。

騰訊優圖實驗室總監吳永堅介紹到,優圖實驗室在2018年主攻三大重點方向,分別是核身、安防與智慧零售、軟硬體一體化。

1、深耕核身,發力刷臉支付

為了應對高效準確辨別是否為本人的核心挑戰,騰訊優圖實驗室打造了從線上到線下的身份驗證。

騰訊身份驗證方案經過4年的迭代,從早期的唇動和數字語音,到3D結構光活體,其技術演進的趨勢是交互越來越簡單,準確率越來越高。

優圖實驗室聯合微信支付,整合了人臉識別、會員認證、免密支付等核心技術,幫助提高購物體驗和收益效率。比如騰訊和家樂福打造了合作下的首家智慧門店「Le Marche」,將騰訊智慧零售工具矩陣會全部投入使用,為顧客提供零售全鏈條的智慧體驗。

2、夯實安防,賦能智慧零售

多地公安逐漸應用人臉識別,科技企業、傳統商家紛紛布局智慧零售,其技術難點在於如何在茫茫人海去精準識別出這個人的身份。

在模型演進過程中,識別效果越來越好,模型也越來越深,結構更加複雜。

以安防需求為導向的優圖天眼,支持億級別庫的人臉檢索系統,毫秒級識別速度,目前已在福建省公安廳「牽掛你」防走失平臺、蘇州公安等成功落地,協助找回走勢人口和實現車輛全城追蹤。

優圖實驗室還與騰訊雲聯合打造基於騰訊優Mall智能零售系統,可以輕鬆識別顧客身份,根據購買記錄提供個性化推薦和優惠券推送等,顧客也能用「刷臉」支付。商店也能藉助此系統分析用戶信息和優化運營方式。目前,該系統已通過百麗落地。

3、軟硬一體化研究與探索

想要更好適配算法和場景,需要與之更為匹配的硬體來增強識別效果,AI算法和AI晶片結合已經成為AI軟硬體一體化趨勢。對此,優圖實驗室實現從軟體到硬體方案的開拓。

CPU為了保證通用處理器性能,部分面積用於控制單元,致使算力有限。GPU為並行計算、圖形處理涉及,其中包含大流量並行運算單元,算力強,但同時功耗也較高。

隨著架構的演進,專用AI晶片開始湧現在半導體市場,它們為AI加速設計,算力更強、功耗更低。晶片性能不斷提升,單位算力功耗越來越低,計算從雲端走向邊緣。

通過軟硬體協同,騰訊優圖打造了成本更低、性能更佳、體驗更優的行業解決方案,比如優圖人臉識別一體機、優圖盒子、騰訊優圖AI攝影機等硬體產品,在一定程度上解決算力的困難。

三、AI技術的趨勢和短板

騰訊優圖實驗室創始人兼總監黃飛躍認為,去年很多技術集中式爆發,今年AI技術更多在垂直應用場景做的更深更透,但技術本身沒有很大的突破性進展。

黃飛躍說,現在AI技術的最大短板在於落地,在線下複雜的真實場景做識別,其難度遠高於理論環境,因此需要非常大的投入和持續的積累。

騰訊優圖實驗室總監吳永堅表示,當前大家會把AI能力持續提高,在行業野蠻生長的過程中,到底誰來做事並沒分那麼清楚,關鍵是如何適配場景,推動產業往前發展。

關於技術同質化的問題,吳永堅也給出了自己的看法。

他認為,當前說不上是技術同質化,技術差異化不只體現在競賽榜單上,算法差異可能沒有本質區別,但當數據規模增大,算法實力的差距也會體現出來。另外,工程交付的效率、方案的完整度等相互配合,也會拉大實力的差距。

騰訊優圖實驗室總監任博則從技術本身的角度切入,他看到深度學習幾個方向開始相互交叉,比較明顯的特點是NLP領域的技術進步更快,因此可能在NLP技術上要給予更多的關注。

另外,過去如GAN等技術的理念很好,但實用性較差,今年的技術實用性明顯得到很大改善,很可能明年GAN在應用結合方面會有很多創新。GCN研究也很有意義,任博預測這項研究在2019年會火。

任博還談到了數據問題,現在一些容易獲得數據的場景已經被廣泛布局,但對於餘下場景來說,可能收集數據本身就是一大難題。因此,如何減少對數據的依賴,使之在數據缺失的場景有更多的應用,是非常有意義的事情。

除此之外,任博認為現在的AI算法被預期過高,它的通用性和標準性沒那麼強,需要根據客戶需求進行改善和優化。黃飛躍也補充說,如何高效的把數據運用起來是一大問題。

優圖會與AI晶片的生態去結合,吳永堅表示期望AI晶片彎道超車,他也分享了關於深度學習平臺趨勢的觀點。

吳永堅認為,深度學習平臺呈現從單機到多機的趨勢,隨著數據越來越龐大,需要多機之間的整合,在量化方面,深度學習需要更少的比特位數來表達信息,剪枝、壓縮也是技術領域很明確的趨勢。

他還提到,邊緣計算加雲端是一大趨勢,但隨著從4G過渡到5G,網絡量級將有很大提升,為雲端計算的傳輸等帶來更多優化,未來硬體底層可能有多種方案。

四、騰訊研究院對AI的理解和期望

騰訊研究院研究員俞點從更加宏觀的角度去分享了騰訊研究院對全球AI趨勢的觀察、理解和一些建議。

1、中美AI企業PK

今年中國AI企業的數量達到1011家,比去年足足增加了420家,在全球AI企業數量排行僅次於美國,令人感到意外的是,印度超越英國、以色列、加拿大排名世界第三。

目前AI企業的九大熱點領域分別是語音識別、自然語言處理、機器學習應用、智慧機器人、計算機視覺與圖像、技術平臺、自動駕駛/輔助駕駛、計算機/晶片和智能無人機。

九大熱點領域創業偏重不同,其中自然語言處理、計算機視覺與圖像、晶片和語音識別領域為最熱門領域。在投資方面,2017年,晶片領域狂攬321億元投資居首,機器學習應用領域以306.8億元位居第二。

從2017年的數據來看,中國AI企業在計算機視覺與圖像領域的佔比最高,為24.7%,站在世界前沿。但我國在處理器/晶片領域積貧積弱,多集中在智能開發定製化晶片,在通用晶片領域還相對空白。

儘管美國在處理器晶片領域的企業看起來並沒有比中國多太多,但美國的33家中英特爾、英偉達等頂尖的半導體公司,相比較而言,中國在企業、人才和投資全方位都與美國有不小差距。

2、九大黃金應用場景

俞點還介紹了AI企業的九大黃金應用場景,包括人臉識別、視頻及監控分析、圖片識別分析、自動駕駛、三維圖像視覺、工業視覺檢測、醫療影像診斷、文字識別、圖像及視頻編輯。

其中人臉識別更加普及,應用拓展廣泛,目前在網際網路金融、銀行、安防、交通等行業應用廣泛,泡沫問題並不突出,多數資本趨於理性。

目前網際網路創企蹲AI熱點雖然比較普遍,但多數真正擁有AI核心技術的公司普遍成長狀況良好,整體呈良性發展。

3、AI新風口

俞點重點介紹了智慧零售、AI+反欺詐(風險控制)以及其他AI落地的風口。

智慧零售以人臉識別、體感識別和生物支付等計算機視覺技術為核心,需解決如何保證顧客優質體驗、滿足個性化高品質需求、提供更高級的服務功能等問題。

在AI+反欺詐領域,機器學習成為關鍵性技術,國外AI反欺詐公司併購事件頻發,國內亦有同盾科技、猛獁反欺詐等多家反欺詐公司。

其他AI落地領域諸如機器翻譯、AI+製藥研發、AI+智慧財產權,其市場前景都十分廣闊。

4、產業問題:人才不足,鴻溝難越

目前,全球AI專業排名前20的高校有16所在美國,AI人才青黃不接,供應數量和預估質量遠小於而技術是行業發展最底層的東西,因此必須重視人才。

全球現有367所設有AI方向的高校,所需AI人才數量超過百萬,而現存的人才僅有30萬,每年以3-5萬人遞增。

大廠招聘的馬太效應正在顯現,D輪以上企業對人才需求更多。有52.8%的AI企業職位要求求職者最低學歷至少為碩士。

科技創新企業在上升發展階段會遇到層層阻礙和壁壘,必須跨越技術鴻溝、產品鴻溝和市場鴻溝,才能繼續發展。

5、一些小建議

最後,俞點也為中國AI之路提供了一些建議。

在政府層面,應增設AI二級學科,提高新生人才數量,吸引歸國高端人才,給予AI產業適當政策傾斜,完善AI領域的法律法規和行業標準。

在企業層面,要把握產業大趨勢,找準發展方向,聯合高校培養AI人才,開展企業公開課,幫助中小企業轉型升級。

高校、協會也應積極與企業合作,完善交流平臺,形成更好的高校-協會-企業聯合合作機制(OTL流程),從而進一步提升教育水平,助力人才培養更上一層樓。

結語:推進AI技術落地,走差異化之路

今年是AI落地飛速發展的一年,巨頭們持續加大研發力度和人才儲備,AI創企們在各類垂直市場開始站穩腳跟,AI技術已經在安防、家居、醫療、教育、金融、零售等與人們息息相關的各行各業廣泛鋪開。

智能化升級顯然已經成為多個產業走上轉型之路的選擇,技術掌握在誰手中,誰就掌握了連接起生態的關鍵。經過良性的切磋,各家科技公司的AI技術和解決方案在大面積落地的同時,如何走出差異化路線,是所有AI公司都必須面臨的考驗。

相關焦點

  • Techo開發者大會,騰訊優圖分享最新研究成果和產業實踐
    騰訊優圖實驗室的研究員梁晨、王亞彪、姚達、楊博分別圍繞AI視覺傳感器、視覺算法在圖像編輯生成中的研究與應用、TNN跨平臺推理優化、模量化訓練部署及實踐等發表了主題演講,向業界展示了優圖最新研究成果與產業實踐。
  • ImageNet新記錄誕生,騰訊優圖協助創造全新「AI速度」
    也正是因為騰訊在人工智慧領域全面、體系化的技術、人才積累,才最終創造出此次全新的「AI速度」。 而AI「學習」速度的提升,將極大地降低AI應用的開發成本,加速AI應用落地。
  • 萬字長文詳解騰訊優圖 CVPR 2019 入選論文
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇。此次,騰訊公司有超過 58 篇論文被本屆 CVPR 接收,其中騰訊優圖實驗室 25 篇、騰訊 AI Lab 33 篇,以下便是對騰訊優圖實驗室 25 篇被錄用論文的詳細介紹。1.
  • 騰訊優圖實驗室發布「優圖AI手語翻譯機」
    首頁 > 見聞 > 關鍵詞 > 騰訊最新資訊 > 正文 騰訊優圖實驗室發布「優圖AI手語翻譯機」
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等領域
    本次AAAI 騰訊優圖實驗室共入選了11篇論文,涉及動作識別、人群密度估計、人臉安全等領域,展現了騰訊在計算機視覺領域的技術實力。騰訊優圖的方法在多達四個公開數據集上取得了優異的性能。此外,為了緩解離群點對聚類的阻礙,騰訊優圖採用最大均值差異(MMD)來校正樣本特徵分布與先驗分布的差異,以增強聚類的可靠性。實驗結果表明騰訊優圖的方法(D2AM)優於傳統的域泛化方法,包括使用域標籤的方法,為實際場景下活體技術的應用提供了有效框架。
  • 輕鬆化身「和平精英」,與火箭少女101一起解鎖騰訊優圖人臉融合新...
    近日,火箭少女101主題活動已登陸手遊「和平精英」,通過騰訊優圖實驗室最新的人臉融合技術,即可解鎖變臉新玩法,化身遊戲中的「和平精英」與火箭少女101同框合影。在本次活動中,玩家可以通過拍攝或直接上傳自己的照片,只需幾秒時間,就可以自然融入遊戲場景之中,輕鬆實現跨次元的人像轉換,在這個「合照神器」的背後,依託的是騰訊優圖最新推出的人像轉換技術——DittoGAN。
  • 騰訊優圖實驗室13篇論文入選ICCV2019
    兩年一度的國際計算機視覺大會 (International Conference on Computer Vision,ICCV) 將於 2019 年 10 月 27 日 - 11 月 2 日在韓國首爾舉行,近日論文收錄名單揭曉,騰訊優圖共有 13 篇論文入選,居業界實驗室前列,其中 3 篇被選做口頭報告(Oral
  • 微眾銀行、騰訊雲安全和騰訊優圖共同打造光線活體黑科技
    (原標題:微眾銀行、騰訊雲安全和騰訊優圖共同打造光線活體黑科技)
  • 擊敗馬來西亞的主攻方向(圖)
    SPORTS.SOHU.COM  2004年6月4日10:10 體壇周報   記者傅亞雨香河報導 雖然阿里·漢並沒有親口對隊員們說出「我們打馬來西亞就要從邊路突破」,但國家隊從3日的兩次訓練來看,老漢心中已經有了擊敗馬來西亞的主攻方向
  • 88米世茂深坑酒店驚豔世界 騰訊優圖實驗室助力打造全流程「刷臉...
    深入地下88米、總投資超過20億元、耗時12年、獲得41項專利建築技術專利……以「世界海拔最低的五星級酒店」聞名,名列「世界十大建築奇蹟」的上海佘山世茂洲際酒店(以下簡稱「世茂深坑」)近日刷爆了社交平臺。更值得驚喜的是,這座人文史上的奇觀在人工智慧的加持下,煥發出獨特的科技魅力。
  • 2020中國零信任全景圖
    12月4日-6日,上海2020CSA大中華區大會成功舉辦雲安全聯盟大中華區領銜聯合騰訊安全、奇安信、天融信發布《2020中國零信任全景圖》↓>聯盟從甲方視角針對國內零信任廠商、優秀的零信任實踐甲方及第三方等共計60多個樣本單位進行了問卷調查和訪談,基於這些數據編製成第一版零信任全景圖,並將每年持續更新。
  • 騰訊 Robotics X 實驗室研究首次...
    這兩項進展均來自騰訊Robotics X 實驗室,屬於移動方向上的技術突破,也是機器人最基礎的能力之一。騰訊 Robotics X 實驗室於2018年成立,致力推進人機協作的下一代機器人研究,打造虛擬世界到真實世界的載體與連接器。
  • ICCV2019 |騰訊優圖13篇論文入選,其中3篇被選為Oral
    兩年一度的國際計算機視覺大會 (International Conference on Computer Vision,ICCV) 將於 2019 年 10 月 27 日 - 11 月 2 日在韓國首爾舉行,近日論文收錄名單揭曉,騰訊優圖共有13篇論文入選,居業界實驗室前列,其中3篇被選做口頭報告(Oral),該類論文僅佔總投稿數的4.3%(200/4323)。
  • 全景航拍2018長春國際馬拉松線路圖 沿途美景盡收眼底
    2018長春國際馬拉松賽將於5月27日上午7點30分鳴槍開賽,與2017年相比,今年的路線有了不小的變化。這組全景圖,通過無人機航拍視角,展現不一樣的2018長春國際馬拉松路線。今年的長春國際馬拉松起點是從長春體育中心出發。圖為:2018長春國際馬拉松賽起終點區域全景圖。
  • 指掌易入選《2020中國零信任全景圖》多個領域
    12月08日,雲安全聯盟大中華區(以下簡稱聯盟)正式發布在2020雲安全聯盟大中華區大會上發布《2020中國零信任全景圖》(以下簡稱全景圖)。作為零信任安全體系的先行者和踐行者,指掌易憑藉多年研究與豐富的項目實踐,優勢入選此次全景圖下6大分類的15個領域。
  • 迪斯尼首對外公開全景圖 上海迪士尼城堡露「真容」
    全球最高、最大的迪士尼城堡——上海迪士尼奇幻童話城堡日前露出「真容」,上海迪士尼度假區首次對外公開了這項正在建造的中心景點的全景圖,優雅經典的藍色尖頂、美輪美奐的外牆設計將帶領遊客走進奇幻的迪士尼世界。   據介紹,在建中的奇幻童話城堡使用了運用建築信息模型(BIM)技術,開發過程中數位化生成並管理建築的結構和設施。
  • 360度全景圖的拍攝
    360度全景圖也稱之為三維全景圖,我們一般都是叫全景環視圖,這也是比較專業的叫法,360度全景技術是一種運用數位相機對現有場景進行多角度環視拍攝之後,再利用計算機功能進行一個後期縫合處理,並且有多角度圖拼接而成的,並還要360度全景播放程序來完成的一種三維虛擬展示技術,這樣一來就可以展現每一個角落
  • 全景圖怎麼做成360度效果圖?圖片拼接全景圖製作方法
    全景圖怎麼做成360度效果圖?圖片拼接全景圖製作方法。相信全景圖的拼接和360度效果圖的實現使很多剛接觸vr全景的人感到疑惑。如果想要學習vr全景製作,這些也都是必不可少的步驟;下面這裡就為大家講解一下。
  • 騰訊安全亮相Zeronights2018峰會 首度揭秘GPU虛擬化攻擊手法
    11月20-21日,Zeronights2018國際網絡安全峰會在俄羅斯聖彼得堡舉行,金屬朋克風的展臺、隨處可見的塗鴉文化、裝扮成原油桶的演講臺,為這次極客盛會營造了濃濃的藝術氣息。作為歐洲一年一度的極客盛會之一,本屆Zeronights吸引了來自全球的安全領域研究者、技術人員以及安全愛好者前來,就前沿的網絡安全技術和研究成果展開交流、學習。
  • 騰訊雲攜大數據AI新技術亮相2017數博會
    在本屆數博會現場,騰訊雲作為騰訊技術能力的對外開放窗口,重點展示了多項大數據及人工智慧領域的技術應用,如大數據可視化交互系統、騰訊優圖海量人臉檢索系統、VR虛擬實境體驗區、綠幕摳圖直播體驗區、QQ-AR技術急救包、騰訊雲反詐騙平臺等創新黑科技。