秦蒼科技數據科學家沈贇:AI在消費金融產品優化以及風險控制中的...

2021-01-18 雷鋒網

中國消費金融市場的用戶大致可以劃分為四種類型:1.白領和自僱人群;2.藍領;3學生;4.農民。其中,前兩者為主力消費人群,市場規模十分廣闊。白領和自僱人群往往擁有央行徵信報告,主要使用銀行信用卡,以及BAT和京東等大型企業提供的消費金融產品。而多達2.5億的藍領則主要為薄文件人群(央行徵信報告能夠採集到的數據非常少),他們具有很強的消費衝動,是網際網路金融產品的主要目標。而由於傳統銀行放款周期過長,無法滿足他們的需求;即時高效的網際網路消費金融產品也就成了他們的最佳選擇。

那麼,網際網路消費金融企業如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創公開課,雷鋒網(公眾號:雷鋒網)邀請到了秦蒼科技數據科學家沈贇博士,為大家分享AI在消費金融產品優化以及風險控制中的應用。

內容介紹:

本次公開課包含以下內容:

1. 根據用戶多維弱變量數據的綜合信用評分

2. 社交網絡算法應用於金融反欺詐

3.基於機器學習模型的額度策略

4 基於機器學習的金融產品設計

5.人工智慧應用的前沿探索:用戶生命周期管理

嘉賓介紹

沈贇博士,秦蒼科技數據科學家,具有9年金融領域機器學習研究開發經驗。擁有德國柏林工業大學電子信息科學與技術博士學位、上海交通大學計算機科學與技術碩士學位、德國柏林工業大學電子信息科學與技術碩士學位、上海交通大學計算機科學與技術本科學位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機器學習、神經網絡以及應用數學等領域的頂級期刊和會議上發表多篇學術論文。

曾任職德國LOBSTER Data 量化分析師,分析處理高頻Nasdaq數據,輔助完成產品上線。現擔任秦蒼科技數據科學家,率領團隊構建基於機器學習的信用評分、額度策略、反欺詐以及用戶生命周期內的自動化動態調頻系統等。成功打造了基於用戶數據1秒內完成信用評分的評分機制,相比傳統模型提高了25%AUC。

(本期公開課完整視頻,共51分鐘)

以下為雷鋒網對嘉賓分享內容的實錄精編。

風險控制信用評分

風險控制是消費金融領域的一大核心問題,信用評分機制則是控制風險的有效手段。信用評分機制可以簡化為分類問題,即根據用戶歷史上的行為,來判斷他是「好人」還是「壞人」。假如一個用戶逾期幾個月,那麼我們就認定他是「壞人」,若沒有逾期行為,則為「好人」。

我們採用了機器監督學習中的經典分類算法來進行用戶信用評分。評分過程可以分為以下幾步:

數據導入和清洗。因為數據採集過程中可能會採集到髒數據,此外,我們還需要剔除部分不可用、不可計算的數據,以及空數據。

特徵提取。採集數據時,我們通常會採集多達一萬多個數據點,然後通過特徵提取的方式提取幾百個特徵點。

模型選擇。在模型中,我們會運用到一些機器學習算法,比如邏輯回歸、隨機森林、AdaBoost、XgBoost、神經網絡等。選擇模型時,我們會採取cross validation的方式,同時運用基於ROC的AUC來決策模型的好壞。

決策。決策過後,我們可以觀察用戶表現,重新提取數據訓練模型,形成正向反饋循環。也就是說,隨著收集到更多、更新的數據,我們的模型將不斷迭代和進化。

從應用結果來看,AI決策相比傳統手工開發的算法決策,可以把決策時間從分鐘級別縮短至0.1秒,同時降低25%的壞帳率,每年為企業節約高達上千萬的成本。

在大家熟知的,使用深度神經網絡解決圖像識別和雲識別的問題中,一般而言,採集的數據越多,訓練出的模型就越好。但金融領域不同,金融數據具有非常強的時間效應,越靠近現在的數據越具備預測效力。並不是說擁有的數據越多,模型效果就越好。因此,不斷定期更新模型至關重要。

模型是基於歷史數據訓練出來的,在未來不發生異常事件的前提下,可以保持預測效力;一旦出現異常事件,模型的效力就有可能下降。為了保證系統預測的穩定性,我們會同時開發多個模型彼此競賽。

比方說,我們訓練出了三個模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時間後,我們可以收集到各個模型的表現,根據其準確率動態調節流量。如果某個模型表現好,就多分配一些流量,反之則減少流量。如果這個模型的效力長時間內持續下降,就將逐漸被淘汰,與此同時會有新的模型加入競爭。總而言之,多模型並行,擇優進化,對於保持系統的穩定性十分重要。

通過社交網絡分析反欺詐

消費金融產品風險控制中,另一個非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網絡分析。用於社交網絡分析的數據通常基於手機號碼,比方說手機緊急聯繫人、通聯紀錄、通訊錄等。

上面是一張社交網絡關係結構示意圖,圖中每個點代表一個用戶,通過線段連接的兩個點互為手機聯繫人。其中某些用戶可以通過一個共同的節點聯繫到一起,那麼我們就將其看作一個團。以團為單位,可以提取到一些社交網絡特徵:

團內其他用戶的表現,比方說逾期率、通過量等。這一特徵判斷的核心思想可以歸納為「近朱者赤,近墨者黑」。

團本身的特性,比方說節點數、團內用戶的連接緊密程度等。

團內用戶的屬性,比方說團內的女性人數、地區分布、平均借款額度等。一般而言,團內女性人數佔比越大,團內用戶是「好人」的概率就越大。

從社交網絡中提取的特徵主要可應用於兩大方面:

一、將特徵數據加入信用評分模型,提升其準確度。根據以往的經驗,加入這些數據後,AUC值可以提升3-5%。

二、通過無監督的聚類方法來預防欺詐。我們將某個地區的所有用戶進行特徵分析後,投影到二維平面,通常可以發現兩到三個異常點,他們距離其他用戶非常遠。這時候就會觸發我們的調查機制,調查這個用戶是否真的存在欺詐行為。實踐檢驗,這種異常值檢測的方法可達到60%左右的準確率,證明對於預防欺詐,社交網絡特徵分析確實行之有效。

產品優化
優化金融產品參數

消費金融產品主要指分期借貸,我們可以把它想像成信用卡,其主要參數有額度、利率和期數。設計這些參數時,我們主要需要考慮兩個方面:

產品的接受度。我們向用戶推薦產品時,用戶是否會接受?一般而言,產品額度越大、利率越低,用戶接受的可能性就越大。

風險控制。隨著用戶接受度提高,風險也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來。

產品的接受度和風險彼此衝突,我們需要尋找折中方案。

下面介紹一個我們開發的基於貝葉斯算法的框架。在消費金融場景中,簡單來說,可以把用戶劃分為「好人」和「壞人」。在給定用戶表現和金融產品參數的前提下,基本可以確定這款產品能夠帶來的受益。但同一個用戶在不同時期的表現是不一樣的。比方說,用戶這段時間經濟狀況較好,能夠及時還款;一段時間後他經濟狀況變壞了,就很有可能還不上。用戶是「好人」還是「壞人」,是個概率性問題。

上面的公式中,p代表在給定某個金融產品和用戶的前提下,這個用戶是「好人」還是「壞人」的概率。統籌考慮所有情況後,就能得出這個用戶身上的期望收益。

我們希望通過調整產品參數將收益最大化,同時也需要關注用戶逾期的風險。在給定某個產品的前提下,我們希望用戶是「好人」的概率大於某個值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來的損失。

上圖展示了我們對「用戶是『好人』還是『壞人』」的概率估計情況。其中x軸代表額度,y軸代表期數,z軸代表用戶是「好人」的概率,每一個曲面對應一位用戶。從圖中可以看出,有些用戶對於額度和期數不太敏感。雖然隨著額度和期數增加,他們是「好人」的概率有所下降,但始終高於某個數值。有些用戶則對額度和期數非常敏感。通過大量提取用戶特徵,我們可以不斷對模型進行優化,為每個用戶量身打造合適的金融產品。

那麼,這個模型的效力究竟如何呢?上圖進行了展示。圖中x軸代表風險閾值,左端表示閾值非常低,我們可以冒巨大的風險;右端表示閾值非常高,放款策略趨於保守。y軸則代表我們針對某個用戶預測的放款金額,與其歷史放款金額的比例關係。若比例大於1,就說明預測的放款金額高於歷史放款金額,同理反推。從圖中可以看出:

在同一風險閾值下,「好人」(黑色)獲得的額度總是高於「壞人」(橙色)。

隨著風險閾值提高,用戶獲得的放款額度逐漸下降。

在給定風險閾值的前提下,「好人」獲得的預期額度總是高於歷史額度,「壞人」則恰恰相反。

結果和預期完全相符,這證明了我們基於貝葉斯算法的分析框架確實行之有效。

延長用戶生命周期

企業總是希望用戶能儘可能長時間地使用自己的產品。因此新用戶借款並如期還款後,企業還會向其推薦其他金融產品。那麼,如何最大限度地留住客戶,延長其生命周期呢?

在用戶的整個還款周期中,我們可以通過用戶在每一個還款節點的表現,判斷其是「好人」還是「壞人」,並作出相應調整。如果用戶還款表現好,可適當提升額度或降低利息,鼓勵其使用我們的其他產品。若用戶表現差,則可以降低額度和提高利息,以防控風險。極端情況下,將啟動調查或催收機制。

藉助這些手段,企業可以提升用戶黏性,並將收益最大化。

馬爾科夫決策過程-增強學習

為實現這一目的,我們採用了深度學習以及運籌學中非常經典的馬爾科夫決策過程進行建模。企業關注的是用戶在整個生命周期中帶來的累積收益,因此不同於前面提到產品參數優化。產品參數優化是單步決策,而收益最大化是多步決策問題,需要在每一步決策中不斷優化我們的策略。

上圖中的公式中,r是一個reward函數,它取決於st和θt兩個變量。st和θt分別代表當前帳期下用戶的表現(逾期或提前還款等)以及企業的決策(提額或降息等)。π則代表企業在每個帳期中的單步策略累計而成的整體策略。通過這個公式,我們可以得到預期的最大收益。

昨天阿爾法go再次戰勝了中國著名棋手柯潔。阿爾法go用到的一個核心算法叫做增強學習,增強學習的本質其實也是馬爾科夫決策過程。它用到了不斷迭代的online learning算法來解決多步決策問題。

馬爾科夫決策應用到消費金融場景,過程大致如下:新用戶進來後,系統會抽取他的個人特徵,同時根據其當前還款狀態,以及在這個時間點上帶來的利潤或者損失,優化value function和state representation。value function和state representation是通過分析和學習用戶歷史數據得來的,加入新的數據後,系統會不斷校正value值。如果某一步決策對我們不利,那麼其value值就會降低,反之則value值提高。如此不斷循環往復。

總結

前面提到,AI在消費金融風險控制以及產品優化方面,能夠發揮巨大重要。但需要強調的是,現在AI概念非常熱門,大家都希望學到最新的算法;但要把AI算法落地到實際生產和業務中,還是應該立足業務本身,不斷挖掘數據優化模型。選擇什麼模型不重要,模型好壞最終還是要看它是否能夠給業務帶來增長。最理想的狀態是,企業能夠通過模型優化業務流程,獲取更多數據,然後利用新的數據進一步優化模型,形成良性循環。

QA:

1.除了風險控制,未來AI還可以應用到消費金融的哪些環節,將給行業帶來怎樣的改變?

前面已經提到了產品結構優化。通過優化產品參數和結構,來提升用戶黏性,將收益最大化,這對於企業來說非常重要。除此之外,AI還可以用於產品推廣,比如通過現有的社交網絡,向其他用戶推薦適合他們的金融產品。

2.在目前技術條件下,AI風控相比傳統風控存在哪些不足?未來如何提高?

AI技術立足於大數據。如果我們能夠獲取足夠多、足夠新的,具有表徵能力的數據, AI風控一定能夠打敗傳統風控。但很多時候,企業獲取的數據往往不夠充分。這時候,基於長期經驗積累的傳統風控往往能夠提供行之有效的風險控制手段,雖然他們的方案不一定是最優的。如果未來AI能夠進化到擁有學習和推理能力,那麼它完全能夠取代傳統風控,不過短期內還很難實現。

3.隨著人工智慧發展趨於成熟,未來消費金融行業必然會大規模引進這項技術,這是否會帶來風險評估同質化的問題?企業該如何進行產品的差異化開發?

這個問題確實存在,未來同一個行業用到的AI算法大多類似。但每個企業採集到的數據端不同。如果企業能夠採集到足夠新、足夠可靠的數據,其風險控制能力將顯著提升。因此,問題的本質在於如何獲取儘可能多的優質數據。

4.人工智慧能否代替個人徵信的作用?

我個人認為是可以的。央行的徵信系統能夠做到多好,取決於大型機構,比如銀行和BAT等大企業,願意在多大程度上貢獻數據。如果這些機構願意將數據完全共享出來,那麼央行的徵信系統可以做到非常完善,但其中存在非常大的阻力。企業們還是更願意基於自己採集到的數據,儘可能把風控模型做到最好。如果央行無法採集到足夠多的數據,其徵信系統不見得一定比企業的風險控制系統更好。

5.入門應該如何學習AI

個人認為可以分兩個層面:首先可以上網搜索一些教程,比如說雷鋒網硬闖公開課上的教程;另外還可以通過實現現有的、開發好的AI程序,提升自己的動手能力。總之,學習和實踐相結合。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 用科技賦能消費金融,中騰信大放異彩
    作為金融科技企業的代表,中騰信憑藉過硬的技術實力,不斷提高消費金融環節的效率,助力消費金融的長遠發展。據悉,中騰信作為深耕消費金融領域多年,在提高獲客能力、降低獲客成本方面擁有極大的優勢。其通過自主研發的精準營銷引擎,集合先進的大數據和人工智慧技術,能夠精準刻畫用戶畫像,並對用戶進行有效分層,匹配不同營銷策略,功能涵蓋數據挖掘、營銷模型、客群策略、產品匹配、數據監控、存量經營等模塊,可根據合作夥伴的要求靈活配置,讓獲客成本控制在可控範圍內,實現最大化的利用。
  • 中原消費金融以管理機制優化為核心 加速自身發展
    今年是金融科技爆發的一年,也是消費金融機構紛紛轉型的一年。中原消費金融轉型之路與眾不同,既保持金融科技的活力又時刻防範金融風險,逐漸摸索出一套適合中原消費金融實際情況的發展道路。中原消費金融總經理周文龍接受《中國經營報》記者專訪時透露,開業4年以來,中原消費金融始終堅持小額、分散、線上化的普惠原則,目前公司所有的組織、人力以及體系建設均圍繞這一方向開展。作為擁有10餘年金融行業經驗的從業者,周文龍認為,消費金融公司護城河的打造,其核心在於管理機制,精細化運營是重中之重。
  • 「守正」六年背後:海爾消費金融的科技支撐力
    一旦文件落地,很多小型網絡小貸公司將難以為繼,而市場風險的出清,也為持牌消費金融正規軍進入高質量發展提供了沃土。站在更寬廣的視角上,有效的監管是消費金融有序、高效發展的驅動力。然而,在政策紅利、市場逐漸規範下,持牌機構如何走好下一步?如何主動適應國家降低實體經濟融資成本導向,最大限度降低利率水平?如何進一步強化產品結構,推動消費金融創新?
  • 通付盾榮登央行金融電子化「2020年度金融科技產品創新突出貢獻獎...
    來自金融機構、行業協會和學會、第三方支付公司、金融科技公司,以及信息產業界的200多家單位與會。通付盾研發的「基於大數據的App風險防控」項目與其他優秀產品一起入圍評選,最終榮獲「2020年度金融科技產品創新突出貢獻獎「。
  • 中原消費金融以自身金融實力 不斷助力消費增長
    如今已經有越來越多的人開始使用消費金融平臺,中原消費金融憑藉服務態度好、審核快、期限短等特點,深受消費者的喜愛。如今,中原消費金融還開展公益事業、助力實體經濟發展,在消費增長和消費升級的大潮流中扮演著重要角色。當下,普惠金融和科技金融,已經成為適應實體經濟、緩解金融供需矛盾的重要抓手,更是深化金融供給側結構性改革、支持實體經濟發展的關鍵舉措。
  • 中國金融科技報告2020
    大數據+金融典型應用包括:1)客戶畫像:大數據根據客戶人口統計學特徵、消費能力數據、興趣數據、風險偏好等,捕捉潛在需求,實現精準營銷與獲客。2)大數據徵信:基於金融大數據,開發授信評估、信用報告、貸中預警等服務,降低信用評估成本,將審核周期縮短至秒級。
  • 黃奇帆:金融科技應該舉什麼旗?走什麼路? ——5G背景下金融科技的...
    構建產業網際網路是產業價值鏈重塑的過程,產業鏈上的每一個環節都需要做數位化升級,產業生態不再只是傳統意義上把原材料變成產品,還要加工「數據」要素、把數據變成產品的一部分,並進而通過數據產品和服務拓展產業鏈的價值空間。在發展產業網際網路的過程中,傳統產業要進行大膽的變革,敢於拋棄落後的商業模式,對組織架構、組織能力進行升級迭代,提高組織內部協同效率,更好更快地為數位化轉型服務。
  • Live預告|淘金者科技首席科學家許意華:AI+金融為什麼這麼熱?聊一...
    AI進入金融領域早已不是什麼新鮮事了,在整個發展歷程中,金融科技目前歷經了3個階段。金融科技1.0時代,即金融IT階段,金融行業通過傳統IT的軟硬體應用來實現辦公和業務的電子化、自動化;金融科技2.0時代,即網際網路金融階段,金融業搭建在線業務平臺,利用網際網路匯集海量的用戶和信息,使得金融業務渠道互聯互通,實現信息共享和業務融合。如今,迎來了金融科技3.0時代。
  • 金融科技「監管沙箱」一周年:穩推進與控風險
    自2019年12月底北京率先開啟創新監管試點後,目前中國版金融科技「監管沙箱」已試行一周年,除了試點項目不斷擴容,試點地區也已全面鋪開。12月27日,北京商報記者梳理發現,從這一年試行情況來看,作為監管創新工具,金融科技「監管沙箱」穩步推進,從事前、事中、事後有一系列流程規範,同時,「監管沙箱」也強調嚴控風險,在風險防範和風險補償機制上不斷優化。
  • 任澤平:中國金融科技報告2020
    如恆豐銀行利用自主研發的企業級大數據技術平臺,提供客戶360視圖、產品貨架與優化組合方案、客戶風險預警等,實現團隊協作和精準營銷技術支撐,系統中的產品推薦和智能獲客功能有效增加了新客戶增長和產品持有,從2016年2月至2017年4月使用前後數據看,客戶增長率、價值客戶增加率、重點產品持有率分別上漲2.2%、3.6%、3.5%。精準識別客戶資質,實現恰當準入。
  • 星環與安碩攜手進軍金融大數據市場
    近日,星環信息科技(上海)有限公司(以下簡稱星環科技)與國內領先的的金融行業應用提供商安碩信息技術股份有限公司(以下簡稱安碩信息)正式籤署戰略合作協議,雙方將攜手推進金融大數據應用解決方案的研發和市場推廣,合作範圍涵蓋信貸管理、數據集市、數據倉庫、數據分析和挖掘、風險管理及大數據應用平臺等領域。
  • 創新監管策略,構建金融科技生態治理體系
    《2020胡潤全球獨角獸榜》數據表明,排名前四的螞蟻集團、陸金所、微眾銀行和京東數科估值合計15500億元,在前18家金融科技行業獨角獸企業中佔比高達94.86%,市場集中度高企。  其二,企業間數據共享與整合不足。客戶和數據是金融業的重要資源,企業間存在一定的競爭和衝突,因而共享不足。數據的孤立和競爭使得數據獲取成本高,利用效率低。  其三,存在數據安全風險。
  • 陸書春:疫情下金融科技發展的優勢與展望
    得益於日益完善的行業信息化基礎設施,金融行業在疫情期間為各種新型網絡消費提供了高效、便捷、安全的線上支付等服務,支撐電子商務、在線教育、網絡娛樂等網絡消費以及綠色消費、健康消費等新型消費逆勢呈現出較為活躍的發展態勢,從而進一步釋放了居民消費特別是網絡消費和新型消費的潛力,更大程度地對衝疫情對居民消費的負面影響。為疫情防控提供網絡平臺和科技支撐。
  • 平安消費金融首款產品「平安小橙花」發布 打造年輕人專屬首選消金...
    作為全國首家定位"科技+金融"的消費金融公司,平安消費金融自2019年末籌建開始,依託平安集團強大的"金融+科技"力量,充分運用大數據、雲計算、人工智慧等先進技術打造用戶體驗極致、銷售多元化、風險管理智能的消費金融平臺,為用戶提供及時、便捷、智能化的金融服務。2020年4月,公司獲銀保監會批覆消費金融牌照。4月23日平安消費金融正式開業,註冊資本50億元人民幣。
  • 金融科技步入新技術革命時代 閃銀開啟優化金融服務之路
    從2013年的網際網路金融元年到2017年金融科技元年,四年的時間,網際網路金融已經成為中國與創新、變革關係最緊密的行業之一。現如今,在監管、科技、流量等多因素的推動下,這個行業邁向了新的臺階,步入了下半場。在這個新的賽場上,科技是核心,以科技賦能為出發點,與傳統的金融機構攜手帶來更多的可能性,成為各大企業最大的核心競爭優勢。
  • 騰躍科技:為何金融科技發展前景廣闊
    金融科技使金融服務變得簡單易用。除了在數字資產方面提供的優勢外,FinTech還能夠抵禦經濟衰退和提供友好的投資空間。隨著技術創新的加強和金融包容性的提升,以及金融科技所帶來的良好用戶體驗,FinTech已成為經濟發展的重要組成部分。到2022年,金融科技行業的產值預計將達到26.5萬億美元。
  • 築牢AI技術研發 薩摩耶數科數據中臺助金融機構顯「魔力」
    數據是走向智能的「前奏」。而數據中臺是基礎信息建設的「底座」,既能打通底層特徵,以統一的標準和流程規範,又可解決企業的信息孤島、信息資產管理缺失、重複投入等問題。隨著金融行業信息化建設的不斷深入,信息種類豐富、規模龐大,金融科技企業通過對信息的洞察、分析,進而實現降本提效,革新升級業務。
  • 金融科技、數字普惠金融與國家金融競爭力
    轉載於:金融監管與風險觀察作者:胡濱、程雪軍摘要:隨著以網際網路、人工智慧、區塊鏈、雲計算、大數據為代表的金融科技迅猛發展,尤其是近年來大數據與深度學習不斷進化、金融服務模式與產品發生重大變革,全球普惠金融經歷了「微型金融 → 普惠金融 → 數字普惠金融」的演進與發展。
  • 整體謀劃 系統重塑 全面提升 充分發揮金融科技規劃的引領作用
    一、金融科技規劃在戰略上應注重整體謀劃和頂層設計金融科技規劃應服務全局,以全行戰略高度謀劃,加強頂層設計與總體規劃。一是健全金融科技治理體系。優化金融科技管理委員會機制,理順金融科技管理和創新關係,切實發揮科技引領驅動作用。
  • 薩摩耶數科以F.I.R.S.T戰略展示金融科技2.0時代核心增長動力
    據了解,薩摩耶數科在金融科技的風控、反欺詐、信用評分、流量經營等垂直領域,已經構建了強大的技術壁壘。風險控制能力是薩摩耶數科的核心競爭力。通過多年積累及市場驗證,薩摩耶數科已樹立了良好的風控口碑,建立了「風控技術」護城河。在風險識別模型應用上,薩摩耶數科獨創的審件機器人Alpha-S,可將自動審件率的理論水平提升至90%以上,過件率和過件後風險水平與三到五年經驗的授信人員相當。