近年來,消費金融行業快速發展,在金融回歸本源大趨勢下,線上線下的大量消費場景得到開發,但風控始終是消費金融發展的基石,在越來越強調普惠金融、服務效率、用戶體驗、消費者權益保護的當下,消費貸款的審批對IT系統尤其是對核心風控決策系統提出了很高的要求和挑戰。
首先,消費貸款的客單價只有3000-4000元,如何做到較低的審批成本,較高的審批通過率和較低的逾期率,是最關鍵也是最大的一個挑戰;第二,相對於傳統銀行,網際網路消費金融公司從線上線下全國多渠道獲客,客戶流量容易出現突發性,且全自動審批,依靠大量數據做決策,體現出高並發、大數據的特性;第三,消費金融業務大多發生在實時借貸場景,這決定了審批授信的速度對用戶體驗非常關鍵,如何做到極致的審批速度,提升用戶體驗,增加獲客成功率也是一大挑戰。
針對消費金融業務場景的特點與挑戰,馬上消費金融進行了一些創新性探索,其搭建的基於大數據消費金融智能決策平臺可以做到全自動審批(無人工處理)、提供24小時不間斷服務並且具有高並發、大數據、人工智慧等能力,其關鍵創新點如下:
一、審批數據的接入與管理
馬上消費金融作為網際網路消費金融持牌機構除了直連央行徵信外,也會接入公安、芝麻等數十個外部數據源,以及自建數據源,在審批過程中將並行調用這些數據源服務,瞬時產生大量的數據作為自動決策的依據基礎。
數據對於審批至關重要,馬上從數據源管理制度和IT系統建設兩方面做了大量的工作,設有專門的團隊負責數據源發現、商務談判、評測、生產效果跟蹤、下線等工作;在IT系統方面,自主研發了統一數據接入系統,滿足數據源接入需求,目前已升級到3.0版本,具有少量編碼即可完成開發、靈活的mock測試支持、調用可精細化追蹤、數據成本可精細化管理與分攤、穩定的服務、自動服務切換、關鍵數據源的動態配額、精細的數據質量與服務穩定性監控、數據安全控制、高並發與大數據量存儲支持、可在大數據平臺準實時分析數據的能力。
二、自建與應用人工智慧技術
對於小額、分散、高頻、大量的消費金融業務,傳統的人工審批已經不再適合,以馬上消費金融公司為例,日審批峰值100萬單,假設1人平均1單審批耗時5分鐘,1日工作8小時測算,1000000/(8*60/5)=10416,最多需要1萬人做審批,招聘1萬專業的審批人員是不可能完成的任務,且成本巨大,假設人均工資年薪20萬,則年人力成本:10416*200000=2083200000,約20億RMB,加上為1萬人提供的場地等附加費用,實際成本將更加巨大,可見在消費金融領域,人工智慧有著很好的應用場景,也是消費金融公司的核心能力。
馬上消費作為一家金融科技公司,在人工智慧領域做了相當多的投入,目前擁有超過百人的人工智慧專家團隊,主要服務於以下4個方面:
1, 反欺詐與授信模型:基於存量用戶數據、外部接入數據、自建數據,圍繞信貸審批,利用傳統、機器學習方法訓練模型,用於自動識別用戶欺詐行為和給予合理的授信額度,目前已經建立了幾十萬的變量特徵庫和上百個模型,用於不同的數據源、產品和審批階段,組合應用後效果顯著,做到較高的通過率和較低的逾期率;
2, 人臉識別:自研Face X活體人臉識別技術,經過幾十億樣本數據的訓練與生產應用的不斷優化,目前識別精準度高達99%,可以應對絕大部分複雜環境,對於檢驗是否是真人以及是否是客戶本人起到了非常好的效果,有效降低了欺詐的概率,馬上消費自研的人臉識別技術效果優與市面上通用產品,其中有2點關鍵的因素:一是在業務開展中積累了大量的照片庫,而這些照片均來自消費金融這個業務領域,更利於訓練出符合該領域特徵的模型;第二:建立了欺詐份子的照片庫,對於欺詐份子的照片可以做單獨的處理,進一步提升效果。
3, 文本識別:應用NLP的語意分析等技術識別文本語意,應用在智能客服和輿情監控方面,馬上消費金融自研的智能客服系統對客戶的問題解決率超過80%,達到一流水準,大幅降低了語音客服的佔比,降低客服成本的同時改善了客服體驗。
4, 語音識別:自研語音識別技術,目前應用在催收和客服場景,未來會拓展到貸前環節,應用到反欺詐領域。
三、審批規則引擎
對於自動化風控決策,馬上消費金融公司在多年的實踐下,逐漸形成以模型為主、規則為輔的審批策略,以便做到更高的通過率和更低的逾期率,圍繞該策略,創新性的研發出為消費金融領域獨有的決策規則引擎,該規則引擎主要特點如下:
1, 輕規則、重模型:模型可以綜合更多維度的數據做出最佳判斷,而規則更適合強因素的判斷,比如:黑名單;
2, 具有變量池和規則池,可以更好的做到變量共享和規則共享;
3, 支持A/B test、空轉測試功能;
4, 支持線下效果評測,在開發新規則/模型或者調整規則/模型時,模擬生產環境,應用真實數據評測新規則/模型效果
5, 精細化的監控機制,可以快速發現規則/模型異常和任何規則變化對審批效果的影響分析。
四、審批工作流系統
在用戶申請貸款的審批過程中,需要經過多個決策環節,總體上可以歸類為3個環節,1:合規性判斷;2:反欺詐;3:信用與額度評估,這些大的環節下可能會有一些小的環節,每個小環節對應一到多個工作流節點,通常是一個小環節由2個工作流節點組成,第一個節點負責並行調用決策依賴的原始數據或者模型數據,第二個節點調用規則引擎進行決策,一個正常的用戶通常會走完整個流程,而不合規用戶則在第一個大的環節被拒絕,欺詐用戶在第二個大的環節被拒絕,對於走完整個流程的正常用戶審批耗時最長,由於消費金融通常是在消費場景下開展放貸業務,所以對實時性要求較高,是決定用戶體驗的很重要一個因素,馬上消費金融目前已經做到平均亞秒級授信。
除了速度快的特點外,還有如下特點:
1, 適合金融風控:具有延遲審批、限流、全自動、與決策規則引擎配合等功能;
a、 延遲審批:當審批依賴的數據、系統異常或者系統容量不足時,暫時掛起該申請單,當具備條件後再繼續審批,不放棄任何一個用戶,同時保護系統的穩定;
b、 限流:當流量過大時,啟動限流機制,確保審批系統的穩定性;
c、 全自動:無人工環節,根據規則引擎返回結果自動流轉;
d、 與決策規則引擎配合:打通決策流程與決策規則系統,支持灰度發布、線上A/B test, 線下審批效果評測等功能。
2, 支持高並發和大數據:審批工作流在流程流轉過程中將產生大量流程數據和業務數據,馬上消費金融公司最高日審批百萬單,峰值200單/秒,產生數據峰值超過1000萬條/秒(在自動審核1個用戶的過程中,將調用上十個原始數據服務,上十個變量服務,產生數據總量可達十萬級),採用大數據分布式存儲技術和分布式緩存技術支持大量數據的高並發讀寫,架構支持在線無感知擴容,理論上支持任意流量。
3, 完善/精細的業務監控,比如:審批通過率異動監控,這是非常複雜的工作,不同產品、渠道,以及申請時間所屬的周天和時段不同,產品進件體量不同均有不同的通過率波動,會參考歷史數據並充分考慮業務差異,做精細化的監控策略,儘量及時、準確的判斷出異常波動,相關人員及時跟進,減少損失, 如果判斷出現較大誤差,則真假難辨,監控實則無效。
五、支撐審批的大數據技術
離線計算平臺
放貸審批業務具有典型的數據驅動特性,審批規則的形成、模型訓練、反欺詐方案的形成都非常依賴對數據理解、挖掘和加工,這些是風控業務必不可少的核心工作,如何通過IT方式支持好該工作,對於風控至關重要。
馬上消費金融公司對於該IT需求,提供了一套整體的解決方案:整合元數據系統、數據質量系統、調度系統、數據交換平臺、大數據計算與存儲平臺、數據開發平臺、變量管理系統、模型訓練平臺、審批效果預測平臺等系統,形成統一的離線計算平臺,從數據來源、管理、存儲、計算、應用、分發、安全形成整體的方案,支持到大數據倉庫、大數據分析、變量開發、模型訓練、安全合規、提數等業務。
統一變量計算平臺
通過規則/模型做實時決策時需要依託計算的變量,變量計算在規則/模型訓練佔據非常重要的作用,在開發階段如何快速開發,上線後如何快速計算並且提供良好的管理與監控功能,以及如何提升規則/模型崗與IT技術崗的協作效率,提升規則/模型迭代速度,這些是金融風控面臨的核心問題,為解決這些問題打造了統一變量計算平臺,該平臺具有如下功能或者特性:
1, 從變量需求、開發、上線、監控進行全生命周期支持;
2, 形成變量池,高效共享變量;
3, 零編碼,只需提供sql或者配置化即可完成絕大部分變量的開發,由於採用sql和配置化的開發方式,大大降低了變量開發的難度,實現非技術崗的規則/模型師可以自助完成變量開發,避免需求提交給IT時,走IT研發過程帶來的時間消耗,大幅提升開發效率,從而實現規則與模型的快速迭代上線,快速提升風控能力,提升審批通過率,降低逾期率;
4, 執行引擎採用基於開源技術擴展後的大數據流計算技術,做到高效開發與運行,計算速度與傳統多線程計算相比提升巨大,比如:人行徵信5000個變量只需20ms計算完成;
5, 打通離線與實時計算,避免離線跑批計算與生產實時計算技術不同帶來的研發和時間損耗。
複雜網絡
借款欺詐中,團夥或者類團夥(後續均稱為團夥)欺詐通常會帶來巨大的逾期損失,是重點防範對象,基於圖技術的複雜網絡可以實時識別出團夥欺詐,在複雜網絡中放入用戶的身份證號、電話、關鍵的行為數據等,形成用戶的個人檔案,並且與其他用戶的檔案相關信息建立關聯,實現毫秒級追蹤,大幅提升實時反欺詐的效果。
實時數倉
在實時決策中,需用到帳務、支付、審批等系統的最新數據,基於這些數據加工成審批規則/模型的變量,整個過程需毫秒級完成。實時數倉項目提供2種創新方案:
1,實時同步全公司所有庫表數據到同一個大數據資料庫,並且自研分布式sql查詢引擎,實現二級索引和跨表join查詢;
2,不移動數據,直接在業務系統從庫實現跨庫跨表聯合查詢。
以上2種方案均可以實現跨異構資料庫、大數據量、實時聯合查詢。
實時數倉的建立進一步提升實時審批決策能力,並且可以優化整個公司的數據架構、降低數據應用難度並避免了數據服務化需開發與排期的工作,讓數據應用像水電煤一樣快捷與方便。
結語:
消費信貸審批,如何把資金給到真正需要的客戶,滿足各種場景的消費需求,而不是流入欺詐份子,更好的實踐普惠金融,在金融科技上還需不斷創新,並且對已有科技能力不斷深化,這是長期持續的工作。