把視頻玩出花的快手來到CVPR ,解密背後AI能力,落地空間有多大?

2020-11-30 和訊

  郭一璞 發自 凹非寺

  量子位 報導 | 公眾號 QbitAI

  AI研究,從論文到應用有多遠?

  我們見到的不少有趣的AI應用,修改圖片,編輯視頻,生成音樂,絕大多數都是乖乖躺在論文裡,好心的作者會開源到GitHub上,分享Demo讓大家體驗。

  但感受AI技術帶來的樂趣,門檻還是很高,普通人,比如你老家的大爺大媽,是很難去打開一個Colab,運行Demo的。

  不過,「讓村裡的老大爺體驗到AI樂趣」這件事,快手做到了。無論他們用的是硬體多麼低配的千元機、百元機,通過快手一系列的AI技術積累和算法優化,普通人也能夠體驗到基於人臉識別、肢體識別、手勢識別、人體分割、AR等技術的魔法表情,享受前沿科技帶來的樂趣。

  比如讓「哥斯拉」來到工地現場。

  △來自快手用戶 星雲『Xy』

  又比如,用「萌面」魔法表情,闔家換上綠色爆炸頭跳一段最流行的拳擊舞,帶上頭套也不耽誤展示各種表情。

  △來自快手用戶 張小姐教穿搭

  近日,快手一項最新AI互動裝置更是引爆了美國加州CVPR2019的會場,引得全場參會者駐足體驗,連聲稱讚:nice! 有趣!甚至被本屆CVPR主席朱松純教授贊為最出色的展廳。

  通過多模態融合人臉識別技術、肢體識別技術、手部動作識別三項AI技術的識別結果,該互動裝置能夠讓虛擬3D形象實時複製體驗者面部表情、肢體動作、手部動作。

  通過人臉關鍵點識別和人臉表情識別,虛擬形象能跟隨體驗者實時做出微笑、閉眼、張嘴、吐舌頭等50餘種細微表情。

  通過三維人臉重建技術,恢復出人臉的三維幾何信息及人頭在世界坐標空間中的姿態,用來精準的驅動人頭轉動和人臉朝向。

  此外,也充分考慮了肢體運動的物理限制,有效規避出現真實人體無法完成的動作。

  這一技術也早在兩個月前使用在快手APP中,讓多個知名短視頻動漫IP形象開啟直播,跟用戶實時互動。一禪小和尚3D形象首次直播的49分鐘時間裡,就獲得了64.9萬個點讚,觀看人數超過25萬人,不少用戶都被暖心的一禪小和尚治癒。

  這些多種多樣的AI玩法,背後都有怎樣的技術基礎?

  在今年的CVPR上,快手Y-tech西雅圖人工智慧實驗室和FeDA商業化Y-tech聯合實驗室負責人劉霽、快手Y-tech矽谷實驗室負責人王華彥兩位揭開了背後的秘密。

  七大支撐,三大實驗室

  在快手,AI技術不僅被用於常規的內容分發、廣告推薦上,更為重要的則是短視頻、直播相關的內容生產。

  這背後,倚賴的是快手的計算機視覺、圖像處理、語音識別、多模態理解等多重技術,以及七大AI技術構成的技術平臺與底層支撐。

  針對用戶行為的推薦,需要高效的離線及在線學習訓練服的推薦系統,能將萬億級特徵大數據進行全鏈路實時在線學習。這裡,快手的廣告推薦離線訓練系統達到了百T數據,百G特徵,1小時以內訓練完成。

  將技術落地到手機端,需要基於深度學習的模型壓縮與AutoML,快手利用自創的端到端模型壓縮算法,不僅發表了多篇論文,更是在線上的實際表現中,超越了以往常用的經典算法。

  而從遊戲到廣告出價,AI系統的決策能力也在受到考驗,快手的專家團隊用強化學習的方法,將多種智能決策技術應用在用戶每天看到的短視頻中。

  而背後的神經網絡基礎,則是依靠快手自研的YCNN深度學習推理引擎,針對不同手機硬體做了適配與優化,這樣,無論哪裡的用戶,在拍攝各種特效時都能保證實時性和流暢性。

  此外,在機器學習方面,快手有自己的機器學習平臺,結合自研的伺服器資源虛擬化技術、RDMA高速網絡、CPU/GPU/F- PGA異構計算系統與共享存儲系統,提供了快手公司內部的AI基礎功能。還專門推出亞瑟自助式機器學習開發平臺,用全自助的方式簡化機器學習開發的操作。

  有了工具,還需數據的支持。快手自由大數據平臺,提供了海量多模式數據存儲、異構資源調度,以及Tensorflow/Mxnet/XDL/MPI等多種主流機器學習引擎 的分布式化訓練與預測。

  在7大平臺之外,快手在美國還有西雅圖、矽谷、聖地牙哥三大實驗室的人才與技術支撐。

  快手Y-tech西雅圖人工智慧實驗室

  快手Y-tech西雅圖人工智慧實驗室、FeDA商業化Y-tech聯合實驗室負責人劉霽教授從事機器學習以及人工智慧研究已經超過15年了。

  此前,劉霽教授和快手創始人宿華一同獲得了2017麻省理工中國35歲以下35位最佳創新人才獎,兩人也剛好在頒獎時相遇。同樣研究機器學習領域,相似的經歷讓他們一見如故。

  在這樣的緣分之下,劉霽教授在去年10月加入快手,成為西雅圖兩個實驗室的負責人,同時他現在還在羅切斯特大學計算機系和電子工程系任教。

  西雅圖實驗室是快手在美國的三個實驗室之一,主要聚焦於智能決策問題,承擔了大量快手的主要業務,如商業化廣告推薦、競價、大規模離線訓練平臺,遊戲AI以及遊戲關卡自動生成,手機端的AI模型優化以及AutoML,視頻圖像的分析、理解與生成等。

  對於一項AI技術的研發來說,在有數據的基礎上,必須合理的設計模型並訓練,才能讓AI系統真正運行起來。不過,對於快手來說,要讓AI模型服務於使用千元機的大眾群體,模型壓縮是關鍵的一步(Model compression)。

  劉霽教授介紹說,讓AI技術落地,越是在這樣效果性能並不是那麼好的機型上面,對技術的挑戰越大,而模型壓縮這項任務就是專門為了讓AI能力服務每一個用戶的關鍵一步,這也是西雅圖實驗室除了訓練AI模型之外主要承當的一項任務。

  因此,像這樣的娛樂效果,把熊二帶入現實,或是變身雷神,無論是強大的旗艦機,還是普通的千元機,快手都能保證實現。

  △ 來自快手用戶 任性卟卟乖巧

  △ 來自快手用戶 拉麵哥-辛拉麵

  除了短視頻平臺,快手的業務也涉及廣告和遊戲。在廣告方面,西雅圖實驗室主要運用強化學習等方法,實現廣告的推薦、競價等功能。

  劉霽也帶領FeDa商業化Ytech聯合實驗室也在廣告推薦方面做了一些技術革新。此前,針對一種廣告推薦商業化平臺,行業內的通行做法是用CPU做,效率較低。劉霽團隊改良了這一做法,換成了GPU方法來做,單機的效率提高了640多倍。此前需要50臺CPU機器訓練20個小時的數據,現在只要一塊GPU訓練1個小時就夠了。

  在遊戲方面,快手擁有近100款自己開發的小遊戲,AI也被應用在遊戲方面,一塊是遊戲AI,另一部分是遊戲關卡的自動生成和難度評定,還有遊戲數據分析和智能運營。

  比如三消類遊戲,需要更新全新的關卡,但人工設計關卡、測試關卡工作量非常大,因此,在快手,通過AI系統來自動生成關卡、自動測試難度,得出的通關率相當精準,誤差率只在7~8%左右。

  目前,雖然西雅圖實驗室只有十餘人,但效率非常高,在研究方面,今年已經有7篇論文被各大會議接收;而在落地方面,通常只要一周左右,就能把實驗結果落地,並正式投放市場。

  快手Y-tech矽谷實驗室

  快手Y-tech矽谷實驗室負責人王華彥本碩皆畢業於北大,後來到斯坦福AI Lab讀博,在加入快手前,王華彥曾在矽谷AI創業公司Vicarious任高級研究員。

  矽谷實驗室坐落在斯坦福校園附近,與前面介紹的西雅圖實驗室不同,快手矽谷實驗室更注重計算機視覺,用AI的方式創造各種特效,供用戶在創作短視頻的時候增添豐富多彩的內容。

  比如有這樣:

  還可以實現這樣的變化,將一張靜態照片直接變成延時攝影,白天變夜景:

  將這些功能實現並部署在用戶的手機上,就是矽谷實驗室的核心技術挑戰。

  「這個裡面就有兩個很大的挑戰,一個是我們需要以非常高效的方式來訓練和開發模型,另一個是我們也需要讓這些模型以最高的效率在移動的設備上運行起來,所以就需要在數據和計算上都達到非常高的效率」王華彥說。

  比如,在視頻圖像分割人物中,現行的方法是通過標註大量圖像,作為數據集進行監督學習,訓練出模型。但這種方式並不十分有效,相比人類的只需要少量樣本的學習方式,效率更低。

  也正是因此,快手矽谷實驗室正在不斷延攬人才,提升AI算法,提高數據和計算兩方面的效率,讓模型的訓練和部署都能高效完成。

  傳送門

  最後,快手Y-Tech西雅圖AI Lab聯合羅切斯特大學等研究者提出了一種基於能耗建模的壓縮方法,該工作的論文也被CVPR2019收錄,需要的朋友可自取~

  ECC: Platform-Independent Energy-Constrained Deep Neural Network Compression via a Bilinear Regression Model

  作者:Haichuan Yang, Yuhao Zhu, and Ji Liu

  https://arxiv.org/abs/1812.01803

  作者系網易新聞·網易號「各有態度」籤約作者

本文首發於微信公眾號:量子位。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

(責任編輯:李顯傑 )

相關焦點

  • 快手隱秘投資版圖浮出水面
    4G為短視頻平臺插上翅膀,5G及更遠的通信技術所能誕生的機會在哪裡?這是快手需要思考的。每一次底層技術變革都會催生出新的場景和平臺,AR可能是5G下最核心的場景之一,隨著全球5G的加速,AR眼鏡也將打破空間和物理的界限,實現用戶和等比例大小的明星、景區等虛擬形象進行互動,從而帶來沉浸式體驗和顛覆性的交互範式,更好地連接人與技術,進而去定義下一個十年。
  • 抖音快手「脫鉤」短視頻
    快手和抖音都有自身在用戶心目中的刻板印象,快手的前身是gif平臺,自身帶有惡搞的內生基因,加之快手初期的增長中,內容更依賴用戶的自主偏好,平臺對內容的頂層設計較少,因此,快手常給人一種「接地氣」的感覺。常有視頻博主模仿各平臺的內容風格。
  • AI碰撞短視頻,從推薦到直播,快手探索了這些ML新思路
    id=3351014EIUM:講究根源的快手短視頻推薦短視頻推薦是一種序列推薦系統,它致力於分析用戶的歷史行為序列,並滿足用戶的當前需求。因為我們的興趣會隨著時間的變化而變化,因此序列推薦模型需要捕捉這種動態變化的過程,並給出合理的解釋,這樣推薦的視頻才是我們希望看到的。注意上面有兩個重點,即用戶的動態興趣遷移和可解釋的推薦。
  • 短視頻的第二戰場:抖音、快手、B站剪輯軟體PK
    導讀:如同微信公眾號有秀米、135等圖文編輯軟體一樣,抖音、快手、B站上各種炫酷的視頻,也離不開視頻剪輯軟體。抖音的剪映APP、快手的快影APP、B站的必剪APP等視頻剪輯軟體爭相推出,掀起了短視頻領域的第二戰場。三款視頻剪輯軟體,各有什麼特點?剪輯工具暗戰的背後,是怎樣的排兵布陣?
  • 風眼 | 快手「失速」
    短視頻與以往任何一種視頻形式都不同,讓人們從單純的圍觀變成參與其中,更多的參與感讓用戶對短視頻的粘性越來越高,人們願意停留在短視頻APP裡面,或觀看已有內容或自製視頻上傳。 在短視頻一路高歌猛進的過程中,背後一直伴隨著內容低俗不合規的爭議。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    七八月50餘項能力的開源開放及升級,是夏日火熱的積澱,希望可以幫助您更高效實現產業智能化應用落地,快來一同閱讀您最關心的內容吧。醫美視覺方案 黑眼圈/眼袋檢測能力開放邀測提供精準的黑眼圈/眼袋檢測能力,毫秒級識別響應,並分類別返回對應位置信息,實現黑眼圈/眼袋的像素級語義分割,對醫美、互動娛樂及美顏等場景有較高的應用價值。
  • 快手「淘寶」電影宣發 短視頻商業化加速
    「黃渤在個人快手號為了這部電影推出了一個十天倒計時活動,累積播放總量超過1億。」快手品牌運營負責人告訴鳳凰網科技 ,《一齣好戲》是第一部與快手全面深度合作進行宣發的影片。緊隨《一齣好戲》之後於8月31日在中國大陸上映的《碟中諜6:全面瓦解》也與快手在宣發上進行合作。
  • 短視頻行業深度報告:快手,「商業化加速」進行時
    巨量引擎是字節跳動旗下綜合的數位化營銷服務平臺,整 合了今日頭條、抖音、西瓜視頻、懂車帝、Faceu 激萌、輕顏、皮皮 蝦等字節系多元產品的營銷能力,穿山甲主要負責外部非字節系產品 的投放。磁力引擎中的「磁力」二字,脫胎於快手的「老鐵經濟」。快 手不止希望「用流量變現」,而是想從用戶間基於信任感的「人+內容」 中,挖掘出更大的商業價值。
  • 快手將GPU推理在商業化場景全量落地,機器成本優化超20%
    機器之心發布 機器之心編輯部 快手商業化進程開始加速,這對底層計算能力提出挑戰。快手決定將 GPU 推理在商業化場景全量落地。
  • 丁丁張走心對話快手女團KSGirls揭秘網紅背後的故事
    由搜狐視頻獨家播出的都市女性情感觀察真人秀——《送一百位女孩回家》第四季11月25日暖心回歸!觀察者丁丁張再度出發,解鎖新時代女性的背後故事和能量,用鏡頭記錄生活,探索她們的心路歷程。在本期節目中,丁丁張通過與快手女團KSGirls的交流,發掘到女孩們背後來自原生家庭的傷害,以及在流量時代被流量所困的苦惱。「勇敢做自己,很好。」通過與丁丁張的交流,女孩們能否順利找回屬於自己的勇敢?
  • 韓星玩快手、日妹迷抖音,這波輸出很厲害
    有些日本中學生利用課間兩三分鐘的時間拍攝視頻,上傳後往往能得到超過1000個點讚;也有同學說,Youtube上的視頻有15分鐘,太長了,而Tiktok看視頻很容易;甚至有中學生把以前玩兒INS的時間都用來玩兒Tiktok了。
  • 快手上的太空飛行是什麼意思 快手超火遊戲#太空飛行怎麼玩
    越來越多的人選擇了玩快手,那麼你知道快手上的太空飛行是什麼意思呢?今天給大家帶來快手超火遊戲#太空飛行怎麼玩,一起來看看吧。
  • 企業紛紛入局 UGC 短視頻,背後的原因是什麼?
    因為快手的創始人很早就明白,必須做和微博「維護大V和粉絲之間的關係」不一樣的事,否則不論是什麼形式(圖文、短視頻或直播)都逃不出微博的手掌心,因此才定位在幫助「低線城市的普通人自我發聲,記錄和分享生活的平臺」。快手上不是不會出現網紅,相反快手上有大量的原生網紅,但快手不會把重心放在「讓頭部網紅和他的粉絲之間更好地互動」,那是微博擅長的事。
  • 飛瓜快手——專業的快手直播電商及短視頻數據分析平臺
    有如下功能:一、快手熱門素材實時抓取快手熱門素材數據,並通過算法為你綜合排序展現。讓你快速發現平臺最新熱點,把握熱門趨勢,追熱點快人一步。3、視頻詳情點擊視頻詳情後,可以看到這條視頻的全部評論和評論熱詞Top10。視頻可以點擊直接電腦播放或者用手機APP掃碼播放,有價值的視頻還可以點擊收藏。
  • 15位產業領袖縱論中國AI現狀:價值重估,落地為王
    一個企業一定要有他核心的競爭力。」他認為,在今天這個時代,最核心的就是要打造數據中臺。一個企業擁有了數位化能力,就擁有了對未來的預測能力,擁有更加長遠的可擴展可複製的能力。尤其是傳統行業,許多企業規模做到一定程度,若是沒有經過數位化改造的話,是不可能繼續擴展的。
  • 快手老鐵的極限在哪裡?
    」 對快手而言,這意味著電商直播還有很大的商業化空間。 明星的入場導致達人、行業收費水漲船高,電商直播瘋狂期仍在持續。與此同時,快手也不得不面對另一個更具流量優勢的競爭對手——字節跳動。 在618前,字節跳動正式組建電商部門,統籌抖音、西瓜視頻等多個平臺的電商業務。
  • 短視頻大戰!抖音快手誰更出眾?|精品研究院短視頻APP熱度榜
    有趣的是一些社會新聞類短視頻分享平臺在榜單中取得了不俗的成績,比如動新聞APP還有齊魯壹點,算是眾多以搞笑娛樂類為主的短視頻平臺中的一股清流。風口之下,短視頻APP競爭日趨激烈,能夠獨佔鰲頭的抖音實力不容小覷。抖音在去年冠名《中國有嘻哈》後一夜爆紅,背後資金鍊強大。
  • 快手和A站,居然真有cp感
    這家中國最早的彈幕視頻網站,其創辦甚至早於愛奇藝和騰訊視頻,但空有高質量、高黏性的硬核二次元用戶,在反覆的震蕩中,急需一位能讓其恢復正常運營、乃至重拾輝煌的戰略投資者。快車道上的快手選擇A站也很好理解。A站對於快手拓展用戶圈層具有戰略意義,A站的二次元內容、長視頻內容能對快手原內容體系形成有益擴展。用金錢換時間,用「聯姻」去標籤,A站成為快手第一筆大收購。
  • 快手雁南飛是誰?雁南飛個人背景資料及快手倒流直播視頻
    快手上面的人才很多,最近有一位疑似老闆的人,那就是快手雁南飛,被很多人說倒流(意思介紹),到底快手雁南飛是什麼人呢?下面就由小編為您詳細介紹雁南飛的個人背景資料哦。  快手雁南飛介紹:  玩快手的都對這個老吳不陌生,快手吳召國就是思埠集團的主要創辦人之一,現任思埠集團董事會主席,執行長CEO、思埠集團董事長、花都區政協委員。(微信:sibu88887)為您講解。  吳召國,男,漢族,山東臨沂人,生於1986年。
  • 首檔漫綜、音樂欄目...抖音快手初露音綜IP野心
    可以看到,這兩年在音樂生態布局不斷「加速」與拓展邊界的抖音快手,展現出了更大的野心。反觀短視頻平臺手握大量音樂人與流量資源,加上固有的社交屬性以及爆款孵化力,未來深度入局音綜、團綜等領域,似乎也是指日可待。