...金融產品優化以及風險控制中的應用(附PPT+視頻) | 雷鋒網公開課

2021-01-20 雷鋒網

中國消費金融市場的用戶大致可以劃分為四種類型:1.白領和自僱人群;2.藍領;3學生;4.農民。其中,前兩者為主力消費人群,市場規模十分廣闊。白領和自僱人群往往擁有央行徵信報告,主要使用銀行信用卡,以及BAT和京東等大型企業提供的消費金融產品。而多達2.5億的藍領則主要為薄文件人群(央行徵信報告能夠採集到的數據非常少),他們具有很強的消費衝動,是網際網路金融產品的主要目標。而由於傳統銀行放款周期過長,無法滿足他們的需求;即時高效的網際網路消費金融產品也就成了他們的最佳選擇。

那麼,網際網路消費金融企業如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創公開課,雷鋒網邀請到了秦蒼科技數據科學家沈贇博士,為大家分享AI在消費金融產品優化以及風險控制中的應用。

內容介紹:

本次公開課包含以下內容:

1. 根據用戶多維弱變量數據的綜合信用評分

2. 社交網絡算法應用於金融反欺詐

3.基於機器學習模型的額度策略

4 基於機器學習的金融產品設計

5.人工智慧應用的前沿探索:用戶生命周期管理

嘉賓介紹

沈贇博士,秦蒼科技數據科學家,具有9年金融領域機器學習研究開發經驗。擁有德國柏林工業大學電子信息科學與技術博士學位、上海交通大學計算機科學與技術碩士學位、德國柏林工業大學電子信息科學與技術碩士學位、上海交通大學計算機科學與技術本科學位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機器學習、神經網絡以及應用數學等領域的頂級期刊和會議上發表多篇學術論文。

曾任職德國LOBSTER Data 量化分析師,分析處理高頻Nasdaq數據,輔助完成產品上線。現擔任秦蒼科技數據科學家,率領團隊構建基於機器學習的信用評分、額度策略、反欺詐以及用戶生命周期內的自動化動態調頻系統等。成功打造了基於用戶數據1秒內完成信用評分的評分機制,相比傳統模型提高了25%AUC。

(本期公開課完整視頻,共51分鐘)

以下為雷鋒網(公眾號:雷鋒網)對嘉賓分享內容的實錄精編。

風險控制信用評分

風險控制是消費金融領域的一大核心問題,信用評分機制則是控制風險的有效手段。信用評分機制可以簡化為分類問題,即根據用戶歷史上的行為,來判斷他是「好人」還是「壞人」。假如一個用戶逾期幾個月,那麼我們就認定他是「壞人」,若沒有逾期行為,則為「好人」。

我們採用了機器監督學習中的經典分類算法來進行用戶信用評分。評分過程可以分為以下幾步:

數據導入和清洗。因為數據採集過程中可能會採集到髒數據,此外,我們還需要剔除部分不可用、不可計算的數據,以及空數據。

特徵提取。採集數據時,我們通常會採集多達一萬多個數據點,然後通過特徵提取的方式提取幾百個特徵點。

模型選擇。在模型中,我們會運用到一些機器學習算法,比如邏輯回歸、隨機森林、AdaBoost、XgBoost、神經網絡等。選擇模型時,我們會採取cross validation的方式,同時運用基於ROC的AUC來決策模型的好壞。

決策。決策過後,我們可以觀察用戶表現,重新提取數據訓練模型,形成正向反饋循環。也就是說,隨著收集到更多、更新的數據,我們的模型將不斷迭代和進化。

從應用結果來看,AI決策相比傳統手工開發的算法決策,可以把決策時間從分鐘級別縮短至0.1秒,同時降低25%的壞帳率,每年為企業節約高達上千萬的成本。

在大家熟知的,使用深度神經網絡解決圖像識別和雲識別的問題中,一般而言,採集的數據越多,訓練出的模型就越好。但金融領域不同,金融數據具有非常強的時間效應,越靠近現在的數據越具備預測效力。並不是說擁有的數據越多,模型效果就越好。因此,不斷定期更新模型至關重要。

模型是基於歷史數據訓練出來的,在未來不發生異常事件的前提下,可以保持預測效力;一旦出現異常事件,模型的效力就有可能下降。為了保證系統預測的穩定性,我們會同時開發多個模型彼此競賽。

比方說,我們訓練出了三個模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時間後,我們可以收集到各個模型的表現,根據其準確率動態調節流量。如果某個模型表現好,就多分配一些流量,反之則減少流量。如果這個模型的效力長時間內持續下降,就將逐漸被淘汰,與此同時會有新的模型加入競爭。總而言之,多模型並行,擇優進化,對於保持系統的穩定性十分重要。

通過社交網絡分析反欺詐

消費金融產品風險控制中,另一個非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網絡分析。用於社交網絡分析的數據通常基於手機號碼,比方說手機緊急聯繫人、通聯紀錄、通訊錄等。

上面是一張社交網絡關係結構示意圖,圖中每個點代表一個用戶,通過線段連接的兩個點互為手機聯繫人。其中某些用戶可以通過一個共同的節點聯繫到一起,那麼我們就將其看作一個團。以團為單位,可以提取到一些社交網絡特徵:

團內其他用戶的表現,比方說逾期率、通過量等。這一特徵判斷的核心思想可以歸納為「近朱者赤,近墨者黑」。

團本身的特性,比方說節點數、團內用戶的連接緊密程度等。

團內用戶的屬性,比方說團內的女性人數、地區分布、平均借款額度等。一般而言,團內女性人數佔比越大,團內用戶是「好人」的概率就越大。

從社交網絡中提取的特徵主要可應用於兩大方面:

一、將特徵數據加入信用評分模型,提升其準確度。根據以往的經驗,加入這些數據後,AUC值可以提升3-5%。

二、通過無監督的聚類方法來預防欺詐。我們將某個地區的所有用戶進行特徵分析後,投影到二維平面,通常可以發現兩到三個異常點,他們距離其他用戶非常遠。這時候就會觸發我們的調查機制,調查這個用戶是否真的存在欺詐行為。實踐檢驗,這種異常值檢測的方法可達到60%左右的準確率,證明對於預防欺詐,社交網絡特徵分析確實行之有效。

產品優化
優化金融產品參數

消費金融產品主要指分期借貸,我們可以把它想像成信用卡,其主要參數有額度、利率和期數。設計這些參數時,我們主要需要考慮兩個方面:

產品的接受度。我們向用戶推薦產品時,用戶是否會接受?一般而言,產品額度越大、利率越低,用戶接受的可能性就越大。

風險控制。隨著用戶接受度提高,風險也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來。

產品的接受度和風險彼此衝突,我們需要尋找折中方案。

下面介紹一個我們開發的基於貝葉斯算法的框架。在消費金融場景中,簡單來說,可以把用戶劃分為「好人」和「壞人」。在給定用戶表現和金融產品參數的前提下,基本可以確定這款產品能夠帶來的受益。但同一個用戶在不同時期的表現是不一樣的。比方說,用戶這段時間經濟狀況較好,能夠及時還款;一段時間後他經濟狀況變壞了,就很有可能還不上。用戶是「好人」還是「壞人」,是個概率性問題。

上面的公式中,p代表在給定某個金融產品和用戶的前提下,這個用戶是「好人」還是「壞人」的概率。統籌考慮所有情況後,就能得出這個用戶身上的期望收益。

我們希望通過調整產品參數將收益最大化,同時也需要關注用戶逾期的風險。在給定某個產品的前提下,我們希望用戶是「好人」的概率大於某個值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來的損失。

上圖展示了我們對「用戶是『好人』還是『壞人』」的概率估計情況。其中x軸代表額度,y軸代表期數,z軸代表用戶是「好人」的概率,每一個曲面對應一位用戶。從圖中可以看出,有些用戶對於額度和期數不太敏感。雖然隨著額度和期數增加,他們是「好人」的概率有所下降,但始終高於某個數值。有些用戶則對額度和期數非常敏感。通過大量提取用戶特徵,我們可以不斷對模型進行優化,為每個用戶量身打造合適的金融產品。

那麼,這個模型的效力究竟如何呢?上圖進行了展示。圖中x軸代表風險閾值,左端表示閾值非常低,我們可以冒巨大的風險;右端表示閾值非常高,放款策略趨於保守。y軸則代表我們針對某個用戶預測的放款金額,與其歷史放款金額的比例關係。若比例大於1,就說明預測的放款金額高於歷史放款金額,同理反推。從圖中可以看出:

在同一風險閾值下,「好人」(黑色)獲得的額度總是高於「壞人」(橙色)。

隨著風險閾值提高,用戶獲得的放款額度逐漸下降。

在給定風險閾值的前提下,「好人」獲得的預期額度總是高於歷史額度,「壞人」則恰恰相反。

結果和預期完全相符,這證明了我們基於貝葉斯算法的分析框架確實行之有效。

延長用戶生命周期

企業總是希望用戶能儘可能長時間地使用自己的產品。因此新用戶借款並如期還款後,企業還會向其推薦其他金融產品。那麼,如何最大限度地留住客戶,延長其生命周期呢?

在用戶的整個還款周期中,我們可以通過用戶在每一個還款節點的表現,判斷其是「好人」還是「壞人」,並作出相應調整。如果用戶還款表現好,可適當提升額度或降低利息,鼓勵其使用我們的其他產品。若用戶表現差,則可以降低額度和提高利息,以防控風險。極端情況下,將啟動調查或催收機制。

藉助這些手段,企業可以提升用戶黏性,並將收益最大化。

馬爾科夫決策過程-增強學習

為實現這一目的,我們採用了深度學習以及運籌學中非常經典的馬爾科夫決策過程進行建模。企業關注的是用戶在整個生命周期中帶來的累積收益,因此不同於前面提到產品參數優化。產品參數優化是單步決策,而收益最大化是多步決策問題,需要在每一步決策中不斷優化我們的策略。

上圖中的公式中,r是一個reward函數,它取決於st和θt兩個變量。st和θt分別代表當前帳期下用戶的表現(逾期或提前還款等)以及企業的決策(提額或降息等)。π則代表企業在每個帳期中的單步策略累計而成的整體策略。通過這個公式,我們可以得到預期的最大收益。

昨天阿爾法go再次戰勝了中國著名棋手柯潔。阿爾法go用到的一個核心算法叫做增強學習,增強學習的本質其實也是馬爾科夫決策過程。它用到了不斷迭代的online learning算法來解決多步決策問題。

馬爾科夫決策應用到消費金融場景,過程大致如下:新用戶進來後,系統會抽取他的個人特徵,同時根據其當前還款狀態,以及在這個時間點上帶來的利潤或者損失,優化value function和state representation。value function和state representation是通過分析和學習用戶歷史數據得來的,加入新的數據後,系統會不斷校正value值。如果某一步決策對我們不利,那麼其value值就會降低,反之則value值提高。如此不斷循環往復。

總結

前面提到,AI在消費金融風險控制以及產品優化方面,能夠發揮巨大重要。但需要強調的是,現在AI概念非常熱門,大家都希望學到最新的算法;但要把AI算法落地到實際生產和業務中,還是應該立足業務本身,不斷挖掘數據優化模型。選擇什麼模型不重要,模型好壞最終還是要看它是否能夠給業務帶來增長。最理想的狀態是,企業能夠通過模型優化業務流程,獲取更多數據,然後利用新的數據進一步優化模型,形成良性循環。

QA:

1.除了風險控制,未來AI還可以應用到消費金融的哪些環節,將給行業帶來怎樣的改變?

前面已經提到了產品結構優化。通過優化產品參數和結構,來提升用戶黏性,將收益最大化,這對於企業來說非常重要。除此之外,AI還可以用於產品推廣,比如通過現有的社交網絡,向其他用戶推薦適合他們的金融產品。

2.在目前技術條件下,AI風控相比傳統風控存在哪些不足?未來如何提高?

AI技術立足於大數據。如果我們能夠獲取足夠多、足夠新的,具有表徵能力的數據, AI風控一定能夠打敗傳統風控。但很多時候,企業獲取的數據往往不夠充分。這時候,基於長期經驗積累的傳統風控往往能夠提供行之有效的風險控制手段,雖然他們的方案不一定是最優的。如果未來AI能夠進化到擁有學習和推理能力,那麼它完全能夠取代傳統風控,不過短期內還很難實現。

3.隨著人工智慧發展趨於成熟,未來消費金融行業必然會大規模引進這項技術,這是否會帶來風險評估同質化的問題?企業該如何進行產品的差異化開發?

這個問題確實存在,未來同一個行業用到的AI算法大多類似。但每個企業採集到的數據端不同。如果企業能夠採集到足夠新、足夠可靠的數據,其風險控制能力將顯著提升。因此,問題的本質在於如何獲取儘可能多的優質數據。

4.人工智慧能否代替個人徵信的作用?

我個人認為是可以的。央行的徵信系統能夠做到多好,取決於大型機構,比如銀行和BAT等大企業,願意在多大程度上貢獻數據。如果這些機構願意將數據完全共享出來,那麼央行的徵信系統可以做到非常完善,但其中存在非常大的阻力。企業們還是更願意基於自己採集到的數據,儘可能把風控模型做到最好。如果央行無法採集到足夠多的數據,其徵信系統不見得一定比企業的風險控制系統更好。

5.入門應該如何學習AI

個人認為可以分兩個層面:首先可以上網搜索一些教程,比如說雷鋒網硬闖公開課上的教程;另外還可以通過實現現有的、開發好的AI程序,提升自己的動手能力。總之,學習和實踐相結合。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • SLAM,讓機器人知行合一 | 雷鋒網公開課
    提到SLAM就會想到SLAMRTEC的思嵐科技是一家提供消費級產品領域的高性能機器人定位導航解決方案及相關核心傳感器的公司。主要產品有低成本360度雷射掃描測距雷達(RPLIDAR)、基於雷射的模塊化自主定位導航解決方案(SLAMWARE)與適於商業環境的通用型服務機器人平臺(ZEUS)。此
  • ppt教學:怎樣在ppt中插入視頻,如何設置視頻更美觀?
    ppt不僅是常用的教育教學工具,也是培訓講座的載體。一個高大上的ppt不僅有美觀的圖文,更有調動觀眾各路感官的美觀的的音視頻。那麼如何在ppt中插入視頻並優化設置呢?視頻格式設計點擊視頻工具欄的「播放」,可對視頻進行編輯,添加書籤,播放等相關設置。添加書籤是指剪輯視頻的過程中對當前時間點進行書籤設置,下次可直接跳到此次時間點。
  • 用了3個月HTC Vive,我們有這9個發現 | 雷鋒網公開課
    雷鋒網(公眾號:雷鋒網)按:本文是來自「硬創公開課Online |  HTC Vive」的分享紀要。A:不說Vive了,我說通用的技術瓶頸吧,給大家一些「為什麼設計VR應用和普通應用不同「的地方的參考。首先,是暈眩。在解決了設備上的問題後,剩下引發眩暈的原因是生理上的。只要人看到的和感覺到的不一致,就可能暈眩。比如暈車。比如在VR裡你用手柄控制自己移動但實際沒動。
  • iDST院長金榕IJCAI演講:阿里巴巴的深度學習應用(附PPT)
    雷鋒網 AI科技評論按:深度學習過去十年在各個領域都取得了巨大的成功,但當把深度學習技術應用到實際問題中時,常會遇到諸多挑戰。阿里巴巴作為在電商領域有諸多業務的企業,對深度學習有很大的需求,不可避免地當他們將深度學習應用到業務中時會遇到許多學界人士不可能遇到的問題。
  • AI浪潮下,語音識別建模技術的演進 | 雷鋒網公開課
    本期硬創公開課邀請到了搜狗語音交互中心語音技術部負責人陳偉來為大家分享伴隨著本輪人工智慧浪潮下語音識別建模技術的演進,希望能夠幫大家理清主流的識別建模脈絡以及背後的思考。搜狗知音引擎是搜狗公司自主研發的一項專注於自然交互的智能語音技術,於2016年8月3日正式對外發布,該技術集合了語音識別、語義理解、語音交互、以及提供服務等多項功能,不僅能聽會說,還能理解會思考, 本文將結合知音引擎中語音識別建模技術的使用來為大家講解。
  • 侯維棟:金融科技豐富的應用場景以及巨大的市場空間會進一步提高...
    談及提升上海國際金融科技中心能級建設,侯維棟認為可以從以下幾方面入手:一是要吸引更多金融科技企業落戶上海;二是激活產品應用與技術驅動相結合的場景化生態環境;三是隨著上海國際金融中心進入更高發展階段,複合型人才成為最寶貴和稀缺的生產要素;四是作為排名第三的國際金融中心,上海應積極在前沿領域探索性先行先試,以及在制度創新上爭取先行先試。
  • 品鈦執行副總裁李惠科:AI金融產品,不標準、不成活
    如果沒有足夠標準化的產品、沒有十倍領先於行業的商業價值,面對磨刀霍霍的金融機構,面對虎視眈眈的網際網路企業,創業公司沒有未來。什麼樣的AI產品,才能讓「金融科技企業」活下來?為此,雷鋒網(公眾號:雷鋒網)《AI金融評論》策劃了「AI能否解決金融剛需問題」系列選題,借同一個話題,對不同背景的受訪者、產品和客群各異的企業們進行採訪,期望在不同的商業和技術認知下捕捉觀點碰撞的火花。在前兩篇採訪中,我們採訪了冰鑑科技CEO顧凌雲、慧安金科CEO黃鈴。
  • 虎博科技技術副總裁譚悅:為什麼你需要一個金融版「谷歌」?
    AI金融評論公開課,以「如何利用NLP釋放搜索框潛能,提升金融業客戶服務品質」為題,從NLP在金融領域的落地出發,詳細分析了面向行業的搜索框需求所在,以及打造搜索框的技術門檻。關注微信公眾號  AI金融評論 ,在公眾號聊天框回復「聽課」,進群可收看本節課程視頻回放。以下是譚悅演講全文與精選問答內容:NLP+金融的6大應用場景人工智慧這個概念已經火了很長一段時間,但自然語言處理的應用其實才剛剛開始。從技術和應用具體劃分,一般來講金融科技分成三層。
  • 41頁PPT深入解析高通量計算在大規模視頻處理中的特點、挑戰及應用...
    出品 | 智東西公開課講師 | 郭南 中科睿芯的應用創新研發總監導讀:中科睿芯的應用創新研發總監郭南去年8月曾在智東西公開課進行了計算機視覺應用合輯第一講的直播講解,主題為《高通量計算在大規模視頻處理中的應用》。
  • 深度乾貨:詳解基於視覺+慣性傳感器的空間定位方法 | 雷鋒網公開課
    在今年的Oculus Connect大會上,扎克伯格公布了一款正在開發的VR一體機產品——Santa Cruz。細看報導你會發現,這款產品除了將計算單元都集成到頭盔中,還在前面增加了4顆攝像頭。馬博士曾任三星中國研究院(SAIT China)首席研究員與研發主任,是三維顯示與人機互動技術以及虛擬實境技術的專家,為Timothy Sauer所著教科書《Numerical Analysis》的譯者。以下內容整理自馬賡宇博士本次公開課演講,您將看到以下內容:
  • 「硬創公開課6」「焰火工坊」婁池:200元能做出市場需要的VR設備
    ,這就VR硬體而言,谷歌的產品是cardboard(谷歌也在研究VR版的安卓作業系統),婁池認為目前它在技術方面與上述三家不可相提並論,但普及最廣泛。此外,國內的PC應用開發者少之又少;而過去五年隨著行動裝置的普及,行動裝置的應用開發者廣泛,基於谷歌cardboard的應用已近兩千款,且以遊戲為主,這說明確實有很多移動端開發者願意開發VR內容。
  • 【碩士課程】深圳大學南特商學院2020級金融科技與風險控制理學...
    深圳大學與法國南特高等商學院2020級中外合作辦學項目金融科技與風險控制理學碩士金融科技與風險控制專業是中國教育部批准的由深圳大學與法國南特高等商學院共同推出的中外合作辦學項目
  • 雷鋒網公開課 | 騰訊孫馳天:遊戲技術助力,突圍自動駕駛仿真刺激...
    基於此,騰訊推出了三大自動駕駛核心產品:大數據云平臺、仿真測試平臺和高精度地圖平臺,助力車企開發自己的算法和數據平臺。2018年推出的騰訊自動駕駛仿真平臺TAD Sim,是騰訊結合專業遊戲引擎、工業級車輛動力學模型、虛實一體交通流等技術,打造的虛實結合、線上線下一體的自動駕駛仿真測試系統。
  • 2020,百度智能雲的「AI 金融」排兵布陣
    李碩介紹,百度智能雲依託知識中臺,可以幫助金融機構將門類繁多的零售金融產品構建出一套知識體系,產品的銷售將基於這套智能知識體系,在手機App、營業廳坐席、商超裡的服務大屏為每一位用戶提供最佳的銷售服務體驗。每一臺手機、屏幕和ATM都能夠成為業務辦理和成交的終端,這相當於為每一位用戶在場景中配置了一位AI客戶經理。
  • 通付盾榮登央行金融電子化「2020年度金融科技產品創新突出貢獻獎...
    來自金融機構、行業協會和學會、第三方支付公司、金融科技公司,以及信息產業界的200多家單位與會。通付盾研發的「基於大數據的App風險防控」項目與其他優秀產品一起入圍評選,最終榮獲「2020年度金融科技產品創新突出貢獻獎「。
  • 新富人群投資偏好生變:從房地產轉向低風險金融產品
    中國新富人群已經逐步意識到財務規劃和多元化投資的重要性,並積極著手制定財務規劃,優化資產配置。  11月27日,上海交通大學上海高級金融學院(以下簡稱「上海高金」)與嘉信理財(Charles Schwab)共同發布了「2020年中國新富人群財富健康指數」。
  • 薩摩耶金服官網:依託金融科技,高效服務金融機構
    據數據統計,2018年我國消費金融市場規模約8.45萬億元,預計 2020年將達12萬億元,滲透率將達25.1%,與美國 40%滲透率相比,發展前景廣闊。基於網際網路與消費金融發展的大環境,也促使金融與科技更完美的融合,從產品設計到精準營銷,從流程優化到風險防控,越來越多的金融產品和服務依賴於科技,科技這座資源寶庫正成為金融升級的關鍵生產要素。
  • 資料|MATLAB優化算法案例分析與應用(進階篇)
    from=leiphonecolumn_res0817內容簡介 · · · · · ·《MATLAB優化算法案例分析與應用(進階篇)》是深受廣大讀者歡迎的《MATLAB優化算法案例分析與應用》一書的姊妹篇,即進階篇。本書全面、系統、深入地介紹了MATLAB算法及案例應用。
  • 推動金融機構開展環境風險分析
    國內外的最新實踐表明,「強化金融機構的環境風險分析和管理」可以有效抑制汙染和高碳投資,應該成為綠色金融體系中重要的、有機的組成部分。在此背景下,本刊邀請監管機構領導、行業領軍人物和國內外專家學者,介紹了當前國內外金融機構環境風險分析的現狀、先進方法和案例應用,內容涵蓋服務於銀行、資管機構和保險公司的多種方法和工具,希望能夠在填補環境氣候風險分析的認知空白方面發揮一定作用,並帶動更多金融機構和研究機構投身於該領域的研究,推動我國綠色金融體系健康發展。