2018年11月17日,首屆極光開發者大會在深圳召開。本次大會由國內領先的移動大數據服務平臺——極光大數據舉辦,近千位網際網路公司技術領袖、合作夥伴、開發者齊聚一堂,圍繞大數據、人工智慧、移動開發等廣受關注的熱點話題,共同探討了在移動開發的下半場,如何構建健康的開發者生態。
曠視科技副總裁敖翔先生作為重要嘉賓出席本次大會,並發表《視覺智能助力大數據風控升級》的主題演講。
視覺智能助力大數據風控升級
主講人:曠視科技副總裁敖翔
大家好,我叫敖翔。很高興來到極光開發者大會,分享關於機器視覺跟風控之間的關係。
視覺的應用領域現在已經很廣了,從安防到個人用戶,都需要智能識別。關於視覺的未來前景,毫無疑問是非常豐富的,在此我就不展開了。今天想跟大家分享視覺和風控的結合,是因為我們的產品Face++跟這個有一定關係。
現在是網際網路的時代,網際網路創造了一個全新的維度,一種前所未有的人和人之間的大規模的社會化協作。在這個空間裡面,我們不用見面就可以完成溝通、合作、交易。那麼隨之而來的就是相應的大數據風控,大數據風控是基於事實數據、背景信息和我們在網際網路上留下的痕跡等來計算,目前來看,它已經非常發達了。
1、大數據風控面臨怎樣的缺失
回到過去,小到向別人借錢,大到公司併購這樣的交易,第一步當然是了解背景信息。如果這個人過去風控不好,我們自然不會把錢借給你;如果公司有點差,這個交易也無法完成。第二個環節,我們一定要做的一件事情,是面對面,更直接的就是面試。我相信各位可能曾經當過面試官,對一個人感覺不好,就把他拒掉,這是很普遍的。最後這兩個環節合起來,我們會說達成交易。這種比較之下,我們會發現基於網際網路的大數據風控可能是有缺口的,而更完整地處理信息,才可能達到更好的效果。
有一個詞叫做相由心生,一個詞叫做以貌取人。這兩個詞都不算是褒義詞,但都包含了人性。其實很簡單,假設去奢侈品店裡面買東西,你可能時不時會受到營業員目光的打量,他們非常會通過看人來了解一個人是不是他們的目標對象。這說明,大腦裡複雜的神經系統和我們長期進化的記憶合在一起會構成非常有效的判決體系,這套體系可能不在我們目前的風控體系之內。我認為機器視覺有義務把這些結合起來達成一個最好的結果,這就是我說的關於人的左腦和右腦的結合。我們不僅要靠客觀事實,用左腦,也要用右腦,通過主觀判斷來做決定。從科學角度來說,就是要用更多不可解釋的數據做出一個模型來。它必須基於相信,因為不可解釋。
2、計算如何演化到認知
接下來我們來看一個獨特的角度,它跟大數據風控也許沒有什麼關係,但我覺得非常有價值,就是關於計算的演化。計算機從它發明以來,就有一個存在目的叫計算,算飛彈的軌跡,算密碼。第二個階段叫做系統代理。現在我們的手機、電腦能上網,就是因為計算機是整個網際網路的代理。第三個階段也是現在,我們的手機成為肢體的衍生,成為千裡眼、順風耳,幫助我們做所有的事情。計算的演化,變成了一個獨立人格。舉一個智能音響的例子,它是一個獨立的東西,你跟它交互不是簡單的,而是深入的溝通。同樣地,對系統來說,如果把它當作一個生命來看待,它必須主動感知一切,而不是被動地灌輸。我覺得這是現在一個非常重要的趨勢——會感知的技術。
現在最常談到的感知是視覺感知。在無處不在的計算的時代,視覺作為90%的信息的通道,被大量使用。如果把這些信息結合起來,對風控是有價值的。
3、視覺計算如何影響風控
關於視覺計算,一個很重要的應用就是刷臉。在座各位應該對刷臉都不陌生了。現在要消費分期、在線貸款、成為滴滴司機、在線考試、在Airbnb租房……可能都會涉及到強風險認證,而主要手段就是靠人臉識別。曾經有人問我一個問題,你們做識別,跟做指紋識別、虹膜識別有什麼差別。我說你這樣說是對的,但也不全對,因為我有一個機會讓你看到這個人,但你看到指紋就沒有用,指紋只能證明你是你,虹膜也只能證明你是你。但是人臉不一樣,人臉的豐富程度前所未有。除了驗證你是你以外,面部識別還有大量的信息。相由心生、以貌取人,這是人的能力,而機器並不具備,但我們想讓它有。
曠視科技在這個領域耕耘了很久,目前還在識別階段,我們要把它往前推,進入到很多環節。以網際網路金融領域為例,我們希望它不僅應用在反欺詐領域,而是參與到定價、評分,以及真正的風控上去,賦予風控一雙眼睛。
每個人在做人臉識別驗證的時候,信息量是很大的,我們可以提出大量特徵,這也是可解釋特徵。這些特徵上和一些固定關鍵詞,比如「預期」是有關聯度的。比如外貌、穿戴、環境等圖像特徵。
視覺信號的奇妙之處就是能夠給你全新的視覺維度去做更多事情。除了表象的特徵,表情也是人臉具備的獨一無二的特徵。我們在偵探類作品中常看到讀心術,其實不是讀心,而是讀微表情。鏡頭可以捕捉人的微表情,當它看夠了一萬個人,判斷力是遠超過你的。
綜合這個結果的數據,再結合傳統大數據的數據,綜合建模,可能會拿到一些風險跟信號特徵,這個其實構成了整個我今天講的最主要的主題。
我們看一些實驗結果。這是一個風控模型裡面的關鍵指標,到0.2說明這個模型是有一定效果的,數值越高,說明效果越好。單僅依託視覺特徵的效果並不好,KS值只有0.13。這個時候,如果加一點點傳統的大數據,就可以到0.2,0.2就是有效的了。如果再加上一點點視覺信號,這個KS值就會上到0.25,這個模型就會有所提升。如果加入更多的視覺信號,效果的提升會非常明顯。怎樣才能做到更好呢?神經網絡可以做端到端的學習,照片直接進去以後,可能圈出更有效的模型。再跟傳統的風控數據做結合,區分度可以達到0.29。這只是一個沒有特別調整過的簡單模型,如果數據量更大的話,效果會更驚人。
這就是我想在今天的演講中想說的最重要的東西,通過加入一個全新的維度可以帶來什麼,以及你必須放棄左腦,放棄解釋它,用你的右腦去做,從而來看可以獲得什麼,。
我相信在這樣的趨勢下,未來會有更多視覺信號的產品,能幫助我們在風控上做得更好。
這是我的報告,謝謝大家。
關於極光
極光(納斯達克股票代碼:JG)成立於2011年,是中國領先的移動大數據服務平臺。極光專注於為移動應用開發者提供穩定高效的消息推送、即時通訊、統計分析、社會化組件和簡訊等開發者服務。截止到2018年9月份,極光已經為36.9萬移動開發者和99.1萬款移動應用提供服務,其開發工具包(SDK)安裝量累計近174億,月度獨立活躍設備近10.3億部。基於海量數據和洞察積累,極光已將業務拓展至大數據服務領域,包括精準營銷(極光效果通)、金融風控、市場洞察以及商業地理服務(極光iZone)。極光將繼續藉助人工智慧與機器學習為移動大數據賦能,致力於為社會和各行各業提高運營效率,優化決策制定。