智東西(公眾號:zhidxcom)
文 | 四月
導語:去年,馬雲刷臉在淘寶上買下漢諾瓦展郵票,「刷臉場景」火遍大江南北。實際上,除了金融支付,當單位門禁、課堂考勤識別從指紋換成人臉時,人臉識別類應用已經被頻繁應用。未來,分散在各地的攝像頭連接成一個有機的巨大「天網」,「刷臉」應用將成為下一代重要的交互模式。
人臉識別,類屬視覺模式的一個細分領域,成為繼智能語音後的又一塊技術熱點。不限於好萊塢科技電影中炫酷的「天眼」掃描場景,人臉識別技術已經滲透到多類日常應用。
所謂「計算機視覺」,即讓計算機模仿人的雙眼,完成相關任務和指令。如獲得物體信息,識別有意義的概念、與此前知識體系匹配,進行判斷和解讀。這一系列看似簡單的任務,對機器來說卻並不那麼容易實現。
要完成人臉識別的工作,首先需要進行準確的「人臉檢測」,即計算機在圖像或視頻中找到人臉的位置,只需要判斷目標圖像是不是人臉。例如當前大部分照相機,及手機攝像頭都有人臉檢測功能,可以自動獲得人臉位置,從而對圖片作一些自動調焦和優化。
隨後,計算機會針對圖像的具體信息進行提取,包括人臉部件點定位,人臉圖像的對齊和歸一化,人臉圖像質量選取,特徵提取,特徵比對等。此時,可以對人臉進行一些身份信息判讀,包括性別、年齡,甚至顏值。
值得強調的是,在金融支付與身份驗證場景中,多將人臉檢測作為輔助性手段,使用者往往需要提前出示自己的身份。這是一種「1:1」的身份驗證,計算機對當前人臉和庫存人臉進行比對,是對其他驗證方式的一種輔助,從而提高身份驗證的可靠性。
但在一些偵查類戲劇作品中,警察通過聯機查保存了所有通緝犯數據的人臉庫,將所獲取的通緝犯信息放到通緝犯資料庫中去逐個比對,以獲取匹配度最高的嫌疑犯。每次人臉識別計算機要作n次人臉比對,這就是「1:n」的人臉查找。
如果要求計算機只憑人臉識別出一個人的身份,就是最常見的「1:n」模式,其目標人臉庫由n個人臉組成,隨著n的增大,準確識別的難度也會增大,一次識別所需要的計算時間也會增加。一個普通的人能對數十量級上進行判斷人臉的準確識別,隨著n的增加,計算機識別的優勢得到凸顯。
人臉識別技術的比較維度很多,除了常見1:1,1:n比對級,還包括n:n,其衡量的標準不同。單從精確度上看,國內外視覺識別技術公司的識別正確率差異多體現在小數點上,比較意義不大。商業適用性則成為更加最關鍵的強化方向,以及實際使用場景中的準確率和可靠性。
目前國內人工智慧方向的創業公司約200家左右,其中一半獲得了投資,超過70%的公司主攻圖像或語音識別兩個分類,其中部分人臉識別水平可比肩甚至超過美國。諸如Face++、Sensetime等初創公司,正在不遺餘力地引進尖端人才方面。包括漢王、大恆、奧普光電等上市公司已經在B端市場的安防、工業製造領域佔據領先份額。
計算機視覺已成為人工智慧板塊最受投資青睞的領域。 據數據網站顯示,國內計算機視覺領域公司約30家,其中完成融資的公司接近80%。換個說法,凡是公司的業務與技術以計算機視覺應用為主,那麼被投資的概率就是80%。這樣的資本青睞程度放到整個網際網路圈都是十分可怕的。
另一方面,相比於小規模創業者的做法,擁有海量數據與龐大業務規模的網際網路巨頭們開始了從內向外的創新和布局。騰訊在內部組建了人臉識別團隊優圖實驗室。百度人臉識別也依靠龐大的數據資源得到指數級積累,阿里巴巴控股某人臉識別企業,將結合自家平臺人臉數據優勢,推動人臉識別2C的發展。
但此類公司對機器視覺產業的開發主要還是集中在工具化方面,例如騰訊的鑑黃服務、百度的識圖功能等,主要應用在自有的產品體系中。
視覺嘗試盈利模式、換取利潤的同時,也積累了大量的底層影像和圖片數據。圖片數據支持著相關技術算法的優化,在機器視覺技術越來越先進的同時,也將會滲透到更多的場景當中去,例如電商的圖片檢索、機器人模塊植入等。
巨頭和初創們在起跑線擺出了火拼的架勢,商業大戰前的硝煙味在瀰漫。
目前,人臉識別技術重點應用的領域是安防和金融。前不久,科大訊飛在年度會議上推出的「曉曼機器人」,可替代銀行櫃檯人員完成交易,稱明年三月產品將落地。
據統計,國內至少已有多家銀行開始試水人臉識別技術,不用帶卡就可以從ATM機上「刷臉」取款。比較早的有招商銀行、上海銀行。另外,中國銀聯也聯手Linkface打造人臉識別網際網路+金融支付新產品,並試點於徽商銀行。此外還在以下領域得到應用。
布局金融人臉識別的大佬已排滿,看看其他領域還可分杯羹嗎?
1)身份驗證
今年十一月滴滴引入了人臉識別技術,以此來提高安全係數。據悉,滴滴順風車新車主首次接單前需通過人臉識別系統審核後才能在平臺接單,以防止私換司機等違規行為,保障乘客安全。
順風車系統會要求車主通過搖頭、眨眼等動作進行人像採集,並將車主上傳的面部信息及其註冊時使用的證件信息與公安部資料庫進行比對,成功後才能正式接單。而採用人臉識別技術是為了保證司機註冊帳戶和本人信息相符。
2)公共安全
在旅客進行正常的安檢工作的同時,人臉識別系統會自動將旅客證件照片與之核對,識別旅客身份,其準確率遠高於人眼識別,即使旅客換了髮型、化了濃妝也沒關係。
國家網絡安全宣傳周上獲悉,目前「人臉識別技術」已經用於反恐活動中,該技術為動態識別,每秒鐘能夠識別5-8個人的身份。今年6月份已在廣州地鐵站進行試點。
此外,人臉識別門禁應用也在萬科、金地、廣州越秀、四川藍光等智慧小區落地。通過人臉識別對訪客、外來人員、周邊服務人員起到良好的管理作用,並提升O2O服務水平和保障。
3)娛樂社交
微軟曾推出刷臉應用 ——「微軟我們」(TwinsOrNot.net),只需任意上傳兩張人物照片,就可以知道他們長的有多像,比如,測試你是否和某個明星長得很像,或者夫妻/男女朋友是不是有夫妻相等。
How-Old.net風靡全球,它們都很巧妙地將人臉辨認與社交網絡中的人際交往結合在一起,年齡、性別、顏值、測測就知道。
時拍照貼臉錄像的娛樂性app–臉優。臉優是利用人臉多個特徵點,實時完成「貼臉」的功能。
4)物件籤收
今年十月,中國郵政與騰訊達成全面戰略合作,EMS將充分利用微信公眾號與手機QQ平臺,實現』預約-寄件-支付-查詢-收件』的自有平臺一站式服務。
據介紹,未來騰訊優圖人臉識別技術也將廣泛應用於EMS的政務、貴重物品和重要文書快遞中。這也意味著,以後去取快遞可以直接「刷臉」。
現在不管是國際、國內,針對人臉識別還沒有(行業)標準,處於比較混沌的早期狀態,具有實力的公司在未來還有很大機會脫穎而出。
人臉識別技術在使用方式上,辨識方便性上,留存現場使用者人像照片上均有非常明顯的優勢,在ImageNet等國際測試中準確率不斷被刷新,但在實際場景的應用中還存在些許的發展瓶頸。
第一,視頻傳感設備的制約。人臉識別技術成像必須依靠攝像頭採集深度信息,常採用紅外光和可見光兩種方案。
對於近紅外技術而言,人臉識別的攝像頭模組需專門的模組提升辨識精度,勢必降低其攝像頭的兼容性;而可見光技術,理論上任何普通攝像頭均可使用,但是當前攝像頭行業中在視頻清晰度、光線適應性上缺乏明確標準,聚焦方式和聚焦能力也各不相同。
在一定程度上,攝像頭本身的發展速度,制約著人臉識別技術的拓展以及普及性,也勢必制約大市場的爆發和使用的辨識效率。
第二,由於軟體開發以及各種半導體零部件佔據了絕大多數成本,而其中較為核心的零部件還需要進口、底層軟體開發方面在國內更是存在大量市場空白。
第三,易受到光照,角度,人臉部的裝飾物等各種因素的影響。這也不難解釋為什麼人臉識別技術目前還沒有大量應用在日常生活中,大部分人只能在科幻電影中接觸人臉識別了。
第四,活體識別。能區分真人和照片的技術,這個研究領域叫liveness detection,中文叫做「活體取證」。
因為現在社交網絡、電子成像產品很發達,人們可以很方便獲取他人的人臉照片,進而來欺騙人臉識別系統,所以區分系統前的人臉是真的人臉,還是照片/視頻/三維面具,就變得非常重要。
對於照片欺騙,主要是根據解析度(翻拍的照片解析度比直接從真人上採集的照片在質量、解析度上有差別)、三維信息、眼動等來區分。對於視頻欺騙,根據三維信息、光線等來區分。對於三維面具欺騙,這方面的研究還很少(實際欺騙場景也相對較少)。
計算機算法是可以區分照片和真人的。但是人臉活體取證在實際應用中,還有很大局限性。現在的算法基本還是基於實驗室數據,離實用存在一段距離。
另外,在指紋、虹膜等模式識別上也面臨這個問題。
歷經兩起兩落,人工智慧技術在第三次高潮的推動下初見落地之勢。基於深度學習神經網絡算法在語音和視覺識別上的進展,識別率分別超過了99%和95%,感知智能時代已經逼近。最初在工業領域應用的機器視覺,逐步在日常生活場景中得到落地,從平面的圖像識別向含有深度信息的人臉和其他模式識別過渡。
但據業內人士透露,國內人臉識別廠商在核心算法上擁有自主智慧財產權的極少,大部分國內外的人臉識別技術多數在OpenCV等開源庫上進行新規則添加,或使用其它公司的收費SDK等。並且該領域的創業公司整體規模仍較少,從側面也反映出其技術門檻和對口人才稀缺。
從總體上來看,從機器視覺產業的構成來看,視覺處理軟體、鏡頭、工業相繼、圖像處理單元、圖像採集卡都是必不可少的幾個環節。未來,視覺識別技術公司對於晶片和模塊廠商的支持需求旺盛,雙方將走得更近,另外,創業公司的產品在擴寬渠道和領域時會偏更向消費者市場,如機器人和無人機等產品。上周,鴻海集團旗下子公司FOXTEQ HOLDINGS 參投了Face++ 2000萬美元投資,不無與富士康投資的Pepper合作可能。
從產業鏈上發力,創業公司可能尋找到更多的投資機會。
趨勢·深度·犀利·乾貨,最專業的行業解讀
深喉爆料、投稿:guoren@zhidx.com