有的人,一趟韓國旅行回來,就被海關攔下查護照核身份……
有的人,傻傻分不清王珞丹和白百合,也常把郭冬臨大哥和芙蓉姐姐搞混……
在騰訊,有這樣一群IT男。
和「悶騷」、「死宅」的「臉盲症」族群不同,他們洞悉人臉的每個細節,只要運用技術,一秒即可識別出真面目。
誇張一點說,他們是一群「靠臉吃飯」的IT男。
拿下一個又一個獎項,兩個好哥們依然笑得很靦腆(左:黃飛躍,右:吳永堅)
近年來,「騰訊優圖」頻頻見諸國際賽事的獲獎名單。
人臉檢測評測集比賽FDDB世界第一、國際Pascal VOC2012 物體分類賽平均總分第一、國際權威音頻檢索評測大賽MIREX兩個世界第一……
這個在人臉、圖像、音頻識別領域都頗有建樹的團隊,卻曾差點把產品「做死」了。
擁抱移動互聯大潮
幾個技術大牛差點把產品「做死」了。
領導問,為什麼我還要再給你機會做新產品?
黃飛躍低頭抿著嘴唇想了一會:我真的有信心,只要3個月就夠了。
2011年,移動網際網路浪潮抬頭,新產品形態如過江之鯉。誕生不久的圖像組(優圖團隊的前身),只有幾名圖像處理方面的博士。
雖然博士們的技術很強大,在項目和產品上卻「使不上勁兒」,手頭的產品「QQ影像」一直不見起色。
騰訊內部優勝劣汰、競爭激烈,找不到好的突破口,很容易「被逼到了牆角」。
這是圖像組負責人黃飛躍最低谷的時期。
遠離騰訊大本營,黃飛躍一直都「缺乏安全感」
一個失眠的夜裡,他無意中發現一款國外圖像處理軟體,得到了啟發——騰訊業務的帶寬成本一直居高不下,圖片壓縮技術正是一個絕佳切入口。
「別人都覺得,視覺無損圖像壓縮根本連一項業務都算不上,」作為黃飛躍多年的老搭檔,吳永堅不禁唏噓。
但,這兩個「好哥們」卻堅持「死磕」。「優圖」的名字,也由此而來。
這倆堪稱「最懂人臉細節」的技術大牛,「管理」起自己的臉,還是有點難度
在攝影師的鏡頭下,他們的微笑略帶靦腆。
「優圖壓縮」第一款DEMO面世後,兩個技術帝化身「地推人員」,到處「推銷」自家產品。
就這樣,黃飛躍用真誠打動了易迅,拿下了項目。半年時間,優圖壓縮為易迅降低了近30%的帶寬,節省了千萬成本。
團隊也漸漸找到方向——技術在手,總會找到前進的路。
幾萬次人工標註探索
有了人臉識別這項技術做「藉口」,優圖團隊順理成章地「愛上自拍」。
沒法拿別人的臉做測試,只好為技術「犧牲」自我——團隊裡每個人的臉都被吳永堅「深入仔細研究」過。
圖片壓縮業務穩定後,黃飛躍和吳永堅再次進入迷霧區。
「作為一個技術團隊,」黃飛躍撓撓頭,「只是提供底層支撐,仍然是不夠的。」
只有技術和產品更緊密結合,才能發生曼妙的化學反應。
他們嘗試與多個產品合作,進行了智能剪裁和人臉檢測等功能的研發提供。「這些產品都是趣味性的,但都是一個個點,並無一個主線」。
一次,優圖與QQ空間合作中發現新的產品方向——當用戶在QQ空間中上傳圖片,系統自動找到照片中的人臉,並且提醒用戶標註。
這就是騰訊優圖「人臉識別」技術最初的應用。
2013年的人臉應用場景少之又少,黃飛躍卻始終相信,這是未來的發展趨勢
這群「技術宅」變得異常地興奮,因為橫亙在他們面前,是一個全新、未知的領域。
儘管人臉識別技術從20世紀80年代就出現了,但直到2013年,全球的技術仍停留在學術研究的階段,並沒有殺手級的工業界應用。
當時,優圖團隊正在研發人臉五官定位技術,需要大量標註了五官定位信息的人臉圖片。
打開圖片,標註五官,打開圖片,標註五官.這樣的動作,團隊累計做了幾萬張次。
開會時,吳永堅常常把自己和同事的「自拍」列印出來貼在白板上作分析
很快,藉助自身的技術積累和QQ空間的圖像數據,QQ空間面孔牆落地。
實用、新鮮玩法,也得到了用戶的認同。
2014年,面孔牆曾取得了一天幾百萬新識別用戶的峰值,積累了上億不同用戶的人臉識別能力。
「有種柳暗花明又一村的感覺,」吳永堅稍稍舒了一口氣。
今年五一假期,一段「由140張QQ空間網友照片」組成的視頻,這背後的圖像識別技術,正是來自優圖
經此一役,優圖人臉識別技術基本成型,搭建的圖像深度學習系統也為後面更多的技術落地提供了可能性。
國際大獎賽連破紀錄
一下飛機,黃飛躍的手機彈出了幾百個「謝謝老闆」的表情。又錯過「幾百個億」了,他不禁暗暗地想。
李克強總理參觀微眾銀行時,整個騰訊都歡呼雀躍。唯獨黃飛躍,還趕在出差的航班上。
真正使優圖人臉識別走紅的,是微眾銀行的人臉核身。
只要上傳個人資料,在攝像頭前遠程核實個人身份,完成活體檢驗,就能完成微眾銀行的開戶動作。
2015年1月,國務院總理李克強見證了微眾銀行的第一筆無抵押貸款業務,優圖研發的人臉識別核身技術,也在現場「露了一手」。
李克強總理體驗微眾銀行人臉識別核身技術
「一下飛機就收到上千條消息,手機都快爆了」,黃飛躍低頭看了看手機,又一條新通知。
「這真是夢幻開局」、「最牛新春福利」,微眾的同事紛紛在朋友圈曬出總理視察的照片。
出差,曾讓黃飛躍錯過了紅包無數。但每一次,都是技術推廣之旅。有選擇的錯過,往往能有更大的收穫。
2014年9月,微眾銀行正在為人臉核身物色團隊,在QQ空間老朋友的推薦下,他們決定見見優圖。
當時,黃飛躍正在去寶安機場回上海的路上。
「不去啦不去啦,掉頭回去吧,」接完電話他激動不已。司機一頭霧水,怏怏掉頭。
從幾家國內頂尖的人臉技術團隊中,微眾銀行最終選擇了優圖。於是,有了總理考察微眾的那一幕。
進行試驗的辦公間,同事的人臉被「供奉」起來
名聲大噪後,優圖還不忘在人臉識別國際大獎賽中「刷臉」。
2015年6月,在國際權威人臉識別資料庫LFW上,騰訊優圖團隊提交了在無限制條件下人臉驗證測試(unrestricted labeled outside data)中的最新成績,99.65%。
一舉打破了之前Facebook、Face++、Google等團隊創造的紀錄。
從「種子打擊」到主動識別
鑑黃師曾是個神秘的職業。他們有的鑑黃到吃不下飯,有的要看心理醫生。
為了完善智能鑑黃產品,吳永堅狡黠笑笑說,團隊也沒少看過黃圖。
背靠騰訊億級的數據資源,優圖的深度學習系統也開始展現威力。
「深度學習」到底是什麼東西?
吳永堅作了個比喻:比如一張杯子的圖片,傳統方法是人工設定一定的特徵後,機器雖然也可以判別,但是效果不好,再出現一個不一樣的杯子,可能就判別錯誤了。
然後在深度學習系統,提供足夠的訓練數據,系統從中自動學習、分析各種的特徵,再出現個不一樣的杯子,系統也能準確辨別。
吳永堅說起技術,就特別起勁
吳永堅靈機一動:這個在鑑黃識別上,特別適用。
此前的鑑黃還是使用傳統方法:需要和庫裡相同或者相近的黃色圖片(種子圖片)才能識別出來,不在庫裡面的新黃圖則無能為力。
但隨著海量數據日新月異,新黃圖的出現速度越來越快,數量越來越大,傳統方法也跟不上時代的發展。
此時,由於深度學習的鑑黃識別方法具有不依賴於圖庫的主動識別能力,能很好的適用。
於是,基於機器大量黃色圖片素材加以訓練,優圖推出了業界領先的基於深度學習的鑑黃識別功能。
(戳此體驗)
一時間,新聞都這樣形容優圖團隊:他們不但要把鑑黃師「解脫」出來,還要讓他們「失業」。
讓代碼聽得懂哼唱
有一段時間,優圖團隊每人每天都要唱一首歌「交作業」。
「小時候的音樂是體育老師教的,沒想到這技能居然又用上了」,優圖的董意足半開玩笑說。
除了「看」的識別,優圖還要做「聽」的識別。
音頻識別技術落地到QQ音樂的哼唱識別上,準確率高達80%。
但功能上線前,是吳永堅最緊張忐忑的時候。擔心效果不夠好,於是他就把自己關在會議室裡對著手機唱歌,一唱就是一個下午。
「簡直進入了痴迷狀態,」他笑笑,「無論走到哪裡,一想到熟悉的音樂就想拿出手機來哼唱測試一下。」
要擴大測試的音頻庫,一個人唱還不夠。他發動整個研發中心的同事:每個人每天都要錄一首「飲歌」。
在粵語裡,「飲歌」指的是一個人最擅長的歌,廣東人吳永堅得意的笑笑
而他的「飲歌」,竟然是兒歌《兩隻老虎》。最頻繁的時候,一天可以唱上五十次。
大家都當他「走火入魔」,他也就靦腆笑笑,不說話。
開放能力探索風口
在不斷拓展的同時,優圖團隊的「野心」,遠不止把技術落地到自家產品上。
在騰訊連接一切的戰略下,他們搭建騰訊優圖開放平臺(戳此進入官網),把看家本領通通開放出去。
騰訊雲平臺上,餓了麼、鬥魚、滴滴出行等公司已經或正在接入,也都將應用優圖的各種能力。
騰訊雲上的萬象優圖鑑黃系統,能瞬間判定圖像屬於正常、性感or色情
鑑黃、人臉識別、音頻識別,只要有企業有這類業務需求,不用自我投入大量人力財力,即可以將這些技術運用到產品上。
擁抱技術,才能擁有未來。除了當下最火熱的深度學習之外,計算機視覺、聊天機器人等領域中,每一個都有優圖的「觸角」……
如今,優圖團隊已經有近70名成員,將近四分之一是博士
在明年啟用的的騰訊全球新總部—濱海大廈,人臉識別正在進行更多炫酷的嘗試。
比如,無論你是低頭看手機,還是東張西望,機器都能敏銳捕捉你的容顏,迅速識別你的身份並「放」你進門——就是如此「聰明」。
比如,人流熱力圖,基於對人臉和人頭監測的技術,可以判定某個辦公區域的人流聚集情況。要去吃飯之前,就能告訴你飯堂的人數。
就在這個月,優圖團隊已經成長為公司級的優圖實驗室。這意味著,他們將更自主地做前瞻性的研究。
在新一輪技術創新的浪潮下,這群「閱臉無數」的隊友們,正往下一個風口趕去。
第一時間解讀鵝廠最新動態
獨家放送內部爆料互動福利
長按識別二維碼→馬上關注