秦蒼科技數據科學家沈贇:AI在消費金融產品優化以及風險控制中的...

2020-12-08 雷鋒網

中國消費金融市場的用戶大致可以劃分為四種類型:1.白領和自僱人群;2.藍領;3學生;4.農民。其中,前兩者為主力消費人群,市場規模十分廣闊。白領和自僱人群往往擁有央行徵信報告,主要使用銀行信用卡,以及BAT和京東等大型企業提供的消費金融產品。而多達2.5億的藍領則主要為薄文件人群(央行徵信報告能夠採集到的數據非常少),他們具有很強的消費衝動,是網際網路金融產品的主要目標。而由於傳統銀行放款周期過長,無法滿足他們的需求;即時高效的網際網路消費金融產品也就成了他們的最佳選擇。

那麼,網際網路消費金融企業如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創公開課,雷鋒網(公眾號:雷鋒網)邀請到了秦蒼科技數據科學家沈贇博士,為大家分享AI在消費金融產品優化以及風險控制中的應用。

內容介紹:

本次公開課包含以下內容:

1. 根據用戶多維弱變量數據的綜合信用評分

2. 社交網絡算法應用於金融反欺詐

3.基於機器學習模型的額度策略

4 基於機器學習的金融產品設計

5.人工智慧應用的前沿探索:用戶生命周期管理

嘉賓介紹

沈贇博士,秦蒼科技數據科學家,具有9年金融領域機器學習研究開發經驗。擁有德國柏林工業大學電子信息科學與技術博士學位、上海交通大學計算機科學與技術碩士學位、德國柏林工業大學電子信息科學與技術碩士學位、上海交通大學計算機科學與技術本科學位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機器學習、神經網絡以及應用數學等領域的頂級期刊和會議上發表多篇學術論文。

曾任職德國LOBSTER Data 量化分析師,分析處理高頻Nasdaq數據,輔助完成產品上線。現擔任秦蒼科技數據科學家,率領團隊構建基於機器學習的信用評分、額度策略、反欺詐以及用戶生命周期內的自動化動態調頻系統等。成功打造了基於用戶數據1秒內完成信用評分的評分機制,相比傳統模型提高了25%AUC。

(本期公開課完整視頻,共51分鐘)

以下為雷鋒網對嘉賓分享內容的實錄精編。

風險控制

信用評分

風險控制是消費金融領域的一大核心問題,信用評分機制則是控制風險的有效手段。信用評分機制可以簡化為分類問題,即根據用戶歷史上的行為,來判斷他是「好人」還是「壞人」。假如一個用戶逾期幾個月,那麼我們就認定他是「壞人」,若沒有逾期行為,則為「好人」。

我們採用了機器監督學習中的經典分類算法來進行用戶信用評分。評分過程可以分為以下幾步:

數據導入和清洗。因為數據採集過程中可能會採集到髒數據,此外,我們還需要剔除部分不可用、不可計算的數據,以及空數據。

特徵提取。採集數據時,我們通常會採集多達一萬多個數據點,然後通過特徵提取的方式提取幾百個特徵點。

模型選擇。在模型中,我們會運用到一些機器學習算法,比如邏輯回歸、隨機森林、AdaBoost、XgBoost、神經網絡等。選擇模型時,我們會採取cross validation的方式,同時運用基於ROC的AUC來決策模型的好壞。

決策。決策過後,我們可以觀察用戶表現,重新提取數據訓練模型,形成正向反饋循環。也就是說,隨著收集到更多、更新的數據,我們的模型將不斷迭代和進化。

從應用結果來看,AI決策相比傳統手工開發的算法決策,可以把決策時間從分鐘級別縮短至0.1秒,同時降低25%的壞帳率,每年為企業節約高達上千萬的成本。

在大家熟知的,使用深度神經網絡解決圖像識別和雲識別的問題中,一般而言,採集的數據越多,訓練出的模型就越好。但金融領域不同,金融數據具有非常強的時間效應,越靠近現在的數據越具備預測效力。並不是說擁有的數據越多,模型效果就越好。因此,不斷定期更新模型至關重要。

模型是基於歷史數據訓練出來的,在未來不發生異常事件的前提下,可以保持預測效力;一旦出現異常事件,模型的效力就有可能下降。為了保證系統預測的穩定性,我們會同時開發多個模型彼此競賽。

比方說,我們訓練出了三個模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時間後,我們可以收集到各個模型的表現,根據其準確率動態調節流量。如果某個模型表現好,就多分配一些流量,反之則減少流量。如果這個模型的效力長時間內持續下降,就將逐漸被淘汰,與此同時會有新的模型加入競爭。總而言之,多模型並行,擇優進化,對於保持系統的穩定性十分重要。

通過社交網絡分析反欺詐

消費金融產品風險控制中,另一個非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網絡分析。用於社交網絡分析的數據通常基於手機號碼,比方說手機緊急聯繫人、通聯紀錄、通訊錄等。

上面是一張社交網絡關係結構示意圖,圖中每個點代表一個用戶,通過線段連接的兩個點互為手機聯繫人。其中某些用戶可以通過一個共同的節點聯繫到一起,那麼我們就將其看作一個團。以團為單位,可以提取到一些社交網絡特徵:

團內其他用戶的表現,比方說逾期率、通過量等。這一特徵判斷的核心思想可以歸納為「近朱者赤,近墨者黑」。

團本身的特性,比方說節點數、團內用戶的連接緊密程度等。

團內用戶的屬性,比方說團內的女性人數、地區分布、平均借款額度等。一般而言,團內女性人數佔比越大,團內用戶是「好人」的概率就越大。

從社交網絡中提取的特徵主要可應用於兩大方面:

一、將特徵數據加入信用評分模型,提升其準確度。根據以往的經驗,加入這些數據後,AUC值可以提升3-5%。

二、通過無監督的聚類方法來預防欺詐。我們將某個地區的所有用戶進行特徵分析後,投影到二維平面,通常可以發現兩到三個異常點,他們距離其他用戶非常遠。這時候就會觸發我們的調查機制,調查這個用戶是否真的存在欺詐行為。實踐檢驗,這種異常值檢測的方法可達到60%左右的準確率,證明對於預防欺詐,社交網絡特徵分析確實行之有效。

產品優化

優化金融產品參數

消費金融產品主要指分期借貸,我們可以把它想像成信用卡,其主要參數有額度、利率和期數。設計這些參數時,我們主要需要考慮兩個方面:

產品的接受度。我們向用戶推薦產品時,用戶是否會接受?一般而言,產品額度越大、利率越低,用戶接受的可能性就越大。

風險控制。隨著用戶接受度提高,風險也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來。

產品的接受度和風險彼此衝突,我們需要尋找折中方案。

下面介紹一個我們開發的基於貝葉斯算法的框架。在消費金融場景中,簡單來說,可以把用戶劃分為「好人」和「壞人」。在給定用戶表現和金融產品參數的前提下,基本可以確定這款產品能夠帶來的受益。但同一個用戶在不同時期的表現是不一樣的。比方說,用戶這段時間經濟狀況較好,能夠及時還款;一段時間後他經濟狀況變壞了,就很有可能還不上。用戶是「好人」還是「壞人」,是個概率性問題。

上面的公式中,p代表在給定某個金融產品和用戶的前提下,這個用戶是「好人」還是「壞人」的概率。統籌考慮所有情況後,就能得出這個用戶身上的期望收益。

我們希望通過調整產品參數將收益最大化,同時也需要關注用戶逾期的風險。在給定某個產品的前提下,我們希望用戶是「好人」的概率大於某個值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來的損失。

上圖展示了我們對「用戶是『好人』還是『壞人』」的概率估計情況。其中x軸代表額度,y軸代表期數,z軸代表用戶是「好人」的概率,每一個曲面對應一位用戶。從圖中可以看出,有些用戶對於額度和期數不太敏感。雖然隨著額度和期數增加,他們是「好人」的概率有所下降,但始終高於某個數值。有些用戶則對額度和期數非常敏感。通過大量提取用戶特徵,我們可以不斷對模型進行優化,為每個用戶量身打造合適的金融產品。

那麼,這個模型的效力究竟如何呢?上圖進行了展示。圖中x軸代表風險閾值,左端表示閾值非常低,我們可以冒巨大的風險;右端表示閾值非常高,放款策略趨於保守。y軸則代表我們針對某個用戶預測的放款金額,與其歷史放款金額的比例關係。若比例大於1,就說明預測的放款金額高於歷史放款金額,同理反推。從圖中可以看出:

在同一風險閾值下,「好人」(黑色)獲得的額度總是高於「壞人」(橙色)。

隨著風險閾值提高,用戶獲得的放款額度逐漸下降。

在給定風險閾值的前提下,「好人」獲得的預期額度總是高於歷史額度,「壞人」則恰恰相反。

結果和預期完全相符,這證明了我們基於貝葉斯算法的分析框架確實行之有效。

延長用戶生命周期

企業總是希望用戶能儘可能長時間地使用自己的產品。因此新用戶借款並如期還款後,企業還會向其推薦其他金融產品。那麼,如何最大限度地留住客戶,延長其生命周期呢?

在用戶的整個還款周期中,我們可以通過用戶在每一個還款節點的表現,判斷其是「好人」還是「壞人」,並作出相應調整。如果用戶還款表現好,可適當提升額度或降低利息,鼓勵其使用我們的其他產品。若用戶表現差,則可以降低額度和提高利息,以防控風險。極端情況下,將啟動調查或催收機制。

藉助這些手段,企業可以提升用戶黏性,並將收益最大化。

馬爾科夫決策過程-增強學習

為實現這一目的,我們採用了深度學習以及運籌學中非常經典的馬爾科夫決策過程進行建模。企業關注的是用戶在整個生命周期中帶來的累積收益,因此不同於前面提到產品參數優化。產品參數優化是單步決策,而收益最大化是多步決策問題,需要在每一步決策中不斷優化我們的策略。

上圖中的公式中,r是一個reward函數,它取決於st和θt兩個變量。st和θt分別代表當前帳期下用戶的表現(逾期或提前還款等)以及企業的決策(提額或降息等)。π則代表企業在每個帳期中的單步策略累計而成的整體策略。通過這個公式,我們可以得到預期的最大收益。

昨天阿爾法go再次戰勝了中國著名棋手柯潔。阿爾法go用到的一個核心算法叫做增強學習,增強學習的本質其實也是馬爾科夫決策過程。它用到了不斷迭代的online learning算法來解決多步決策問題。

馬爾科夫決策應用到消費金融場景,過程大致如下:新用戶進來後,系統會抽取他的個人特徵,同時根據其當前還款狀態,以及在這個時間點上帶來的利潤或者損失,優化value function和state representation。value function和state representation是通過分析和學習用戶歷史數據得來的,加入新的數據後,系統會不斷校正value值。如果某一步決策對我們不利,那麼其value值就會降低,反之則value值提高。如此不斷循環往復。

總結

前面提到,AI在消費金融風險控制以及產品優化方面,能夠發揮巨大重要。但需要強調的是,現在AI概念非常熱門,大家都希望學到最新的算法;但要把AI算法落地到實際生產和業務中,還是應該立足業務本身,不斷挖掘數據優化模型。選擇什麼模型不重要,模型好壞最終還是要看它是否能夠給業務帶來增長。最理想的狀態是,企業能夠通過模型優化業務流程,獲取更多數據,然後利用新的數據進一步優化模型,形成良性循環。

QA:

1.除了風險控制,未來AI還可以應用到消費金融的哪些環節,將給行業帶來怎樣的改變?

前面已經提到了產品結構優化。通過優化產品參數和結構,來提升用戶黏性,將收益最大化,這對於企業來說非常重要。除此之外,AI還可以用於產品推廣,比如通過現有的社交網絡,向其他用戶推薦適合他們的金融產品。

2.在目前技術條件下,AI風控相比傳統風控存在哪些不足?未來如何提高?

AI技術立足於大數據。如果我們能夠獲取足夠多、足夠新的,具有表徵能力的數據, AI風控一定能夠打敗傳統風控。但很多時候,企業獲取的數據往往不夠充分。這時候,基於長期經驗積累的傳統風控往往能夠提供行之有效的風險控制手段,雖然他們的方案不一定是最優的。如果未來AI能夠進化到擁有學習和推理能力,那麼它完全能夠取代傳統風控,不過短期內還很難實現。

3.隨著人工智慧發展趨於成熟,未來消費金融行業必然會大規模引進這項技術,這是否會帶來風險評估同質化的問題?企業該如何進行產品的差異化開發?

這個問題確實存在,未來同一個行業用到的AI算法大多類似。但每個企業採集到的數據端不同。如果企業能夠採集到足夠新、足夠可靠的數據,其風險控制能力將顯著提升。因此,問題的本質在於如何獲取儘可能多的優質數據。

4.人工智慧能否代替個人徵信的作用?

我個人認為是可以的。央行的徵信系統能夠做到多好,取決於大型機構,比如銀行和BAT等大企業,願意在多大程度上貢獻數據。如果這些機構願意將數據完全共享出來,那麼央行的徵信系統可以做到非常完善,但其中存在非常大的阻力。企業們還是更願意基於自己採集到的數據,儘可能把風控模型做到最好。如果央行無法採集到足夠多的數據,其徵信系統不見得一定比企業的風險控制系統更好。

5.入門應該如何學習AI

個人認為可以分兩個層面:首先可以上網搜索一些教程,比如說雷鋒網硬闖公開課上的教程;另外還可以通過實現現有的、開發好的AI程序,提升自己的動手能力。總之,學習和實踐相結合。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 萬億消費金融市場角力,小花錢包用金融科技突圍
    作為持續推動中國經濟增長的「主引擎」,消費正迎來新一輪升級浪潮。消費升級加速的背景下,消費金融也保持著良好的增長勢頭。消費金融的萬億賽道正湧入越來越多參與者,各大消費金融巨頭都在布局競逐這一前景廣闊的市場。與之相伴的,自然還有來自金融監管部門的強監管政策。
  • 正確理解消費金融風險的含義——訪上海新金融研究院副院長劉曉春
    為此,本刊針對當前消費金融行業存在的問題,以及如何防範金融風險,促使消費金融行業健康發展等,採訪了上海新金融研究院副院長劉曉春。《金融博覽》:首先,非常感謝劉院長接受本刊的採訪,您認為消費金融的核心是什麼?劉曉春:中國有句古語,「名不正則言不順,言不順則事不成」。對事物的正名還是必須的,尤其是金融業務和產品。
  • 銀保監會:消費金融公司和汽車金融公司須提高風險識別和應對能力
    引導消費金融公司和汽車金融公司樹立可持續發展的經營理念,結合國家政策導向、經濟金融發展規律和市場環境變化趨勢,明確與商業銀行差異化、專業化的發展定位,探索優勢細分領域,優化業務模式,加快核心數據及客戶資源積累,不斷提升自主展業能力。(二)打造核心風控能力。
  • 從線下場景切入消費金融,拍拍貸針對「藍領」的消費分期產品怎麼做
    為了把沉澱9年的大數據風控系統價值最大化,特立獨行的P2P平臺拍拍貸從去年下半年開始推出「拍分期」產品,專注線下資產的開發。這款產品目前正在開拓東北、西北、上海周邊地區的藍領消費市場,針對3C產品推出分期信用貸款,對純線上信用貸款的資產是個補充。
  • 未央海外遊學計劃——美國矽谷金融科技之旅
    與行走在網際網路金融前沿的人直面溝通,來到矽谷用一周的時間展望Fintech行業的方向。【專家同行】本次活動特邀金融科技領域專家教授以及國內知名企業高管同行,隨團剖析最新行業發展、解讀國內外最新商業模式,與您共同探討金融科技的未來。
  • 金融科技在銀行間債券做市及風險管理中的應用
    (三)金融科技大發展為做市帶來新的機遇除了市場本身的發展,近年來金融市場正站在時代和行業巨變的風口,金融科技和人工智慧將成為金融市場的交易模式帶來重大變革。在債券交易業務領域,利用金融科技手段打造自動化的交易系統,實現高效的風險管理,提高市場流動性,這是科技賦能業務的大膽嘗試和創新。
  • 金融科技企業如何在開放金融中創新發展?
    開放金融是一種平臺化的金融發展模式,金融機構通過與金融科技企業、數字科技企業以及商業生態系統的市場主體等共享數據、算法、交易、流程和業務功能,創造新的金融服務價值,打造新的金融服務能力。在開放金融的發展過程中,金融科技企業和數字科技企業的角色和作用越來越重要。
  • 數博會|同盾科技三大技術體系 助力防範金融風險
    貴陽市副市長王玉祥代表貴陽市政府向與會嘉賓表示熱烈歡迎,他表示貴陽在近幾年發展大數據金融的過程中,主要是立足於兩個重點:一個是要普惠,另一個是要防控風險。希望通過與會專家、學者、企業家和監管機構的嘉賓們的共同參與,碰撞出智慧的火花,把大家的智慧匯聚起來,指導貴陽大數據防控金融風險的平臺建得更加好。
  • 5G技術助力金融科技在普惠金融風控中創新演變
    本文聚焦新時代背景下我國經濟對外開放的新格局,首先探討5G技術對於金融領域的影響,其次搭建未來金融科技手段作用於普惠金融風險防控新場景,從大數據、雲計算、區塊鏈以及物聯網角度,探討金融科技在普惠金融風險防控中的創新應用。
  • 2020-2026年中國消費金融行業現狀調研分析及發展趨勢研究報告
    中國消費信貸市場規模及增速  《2020-2026年中國消費金融行業現狀調研分析及發展趨勢研究報告》在多年消費金融行業研究結論的基礎上,結合中國消費金融行業市場的發展現狀,通過資深研究團隊對消費金融市場各類資訊進行整理分析,並依託國家權威數據資源和長期市場監測的資料庫,對消費金融行業進行了全面、細緻的調查研究。
  • ...港滬京深躋身全球十大金融中心;芬蘭創企Enfuse推出消費碳足跡...
    在11月20日金融科技的分論壇現場,由小米金融CTO劉黎領隊的小米金融科技團隊,亦結合消費信貸、NFC、支付、供應鏈金融等業務,從開發技術維度,在論壇現場就大數據、人工智慧、區塊鏈、雲計算、5G等各方面進行了精彩分享。
  • 對資本市場造假「零容忍」、高度重視金融產品風險問題……金融委...
    保持流動性合理充裕、對資本市場造假行為「零容忍」、高度重視金融產品風險問題……5月4日,國務院金融穩定發展委員會(以下簡稱「金融委」)召開第二十八次會議,再次釋放重磅信號。
  • 汽車消費金融:發現下一輪市場增長動能|行業報告
    從風險管理的角度出發,按是否承擔壞帳風險和是否掌握交易場景來看,商業銀行既不掌握交易場景也不承擔壞帳風險,由於控制著資金供給端,商業銀行在產業鏈中處於強勢地位,通常會讓渠道方兜底壞帳;汽車金融公司、汽車集團財務公司掌握4S店渠道,掌握交易場景,同時需承擔壞帳風險;融資租賃公司掌握交易場景,同時承擔壞帳風險;第三方汽車金融服務公司是純粹的金融服務方,一般不掌握交易場景
  • 行為數據在線上消費信貸反欺詐中的應用
    本文將結合實例,對行為數據在線上消費信貸反欺詐中的應用,進行簡要的介紹與探討。一、「握不住的沙」:銀行反欺詐工作面對移動端詐騙的猖獗攻擊數位技術與金融的融合,以及金融科技的發展和其對傳統金融行業的滲透正成為一種不可逆的潮流,金融行業新模式、新業態不斷呈現。
  • CB Insights:2017全球AI企業100強(附下載) | 網際網路數據資訊網...
    不需要複雜的AI算法和技術,Bonsai 人工智慧引擎讓開發人員更高效地編碼,以更好地控制和優化硬體和軟體。15. Cape Analytics該公司使用人工智慧立即自動從地理空間圖像中提取恰當的屬性數據。這些數據可在全國範圍內獲得,並且很容易和保險公司和其他財產持有整合。16.
  • 央行數字貨幣研究所所長姚前:本質上金融科技風險依然是金融風險
    當前,金融科技已成為我國金融發展的新模式、新業態與新動能。本文從流程、組織、體系三個層次剖析了科技發展帶來的金融變革,並從監管哲學和方法論的角度討論了科技與金融風險的辯證關係、金融科技監管的考量因素、最優監管均衡點的尋找方法、數據主體權利保護規定對區塊鏈的適用性以及金融標準化建設工作的重點。
  • 日新月異的金融科技
    同年10月,央行聯合國家市場監督總局發布了《金融科技產品認證目錄》以及《金融科技產品認證規則》,制定了金融科技產品的認證依據及標準;11月,央行又發布了《關於發布金融行業標準加強移動金融客戶端應用軟體安全管理的通知》,旨在有效保障金融科技創新產品的安全應用。
  • 央行副行長範一飛:金融科技重新定義數據價值
    之所以說「正式」,是因為在此之前,金融科技更多時候是作為一種新的模式、理念,或者技術,融入到既有的商業生態中。對於金融科技公司/行業,一直沒有特別清晰的定位。一個成熟的市場需要有標杆型企業、完善的監管體系、廣泛被認可的商業模式,以及足夠大的資本空間。毫無疑問,這一場IPO將金融科技帶入了一個全新的階段。
  • 金融科技生態圈的構建與革新深度研究:螞蟻集團業態剖析
    此外在金融科技架構體系搭建過程中,也可持續賦能生態圈布局,對內加強場景應用,助力業務降本增效,強化風險管理,打造客戶極致體驗,提升業務競爭力;對外輸出創新科技及服務,加快科技成果轉化,促進行業整體科技水平提升。產品應用層:第三方支付入手,「金融+科技」模式漸成網際網路技術已充分應用於金融體系,「金融+科技」的模式漸成。
  • 創新監管策略,構建金融科技生態治理體系
    《2020胡潤全球獨角獸榜》數據表明,排名前四的螞蟻集團、陸金所、微眾銀行和京東數科估值合計15500億元,在前18家金融科技行業獨角獸企業中佔比高達94.86%,市場集中度高企。其二,企業間數據共享與整合不足。客戶和數據是金融業的重要資源,企業間存在一定的競爭和衝突,因而共享不足。數據的孤立和競爭使得數據獲取成本高,利用效率低。其三,存在數據安全風險。