行為數據在線上消費信貸反欺詐中的應用

2020-12-10 未央網

本文共字,預計閱讀時間

文/TalkingData 耿舒天

(本文為「2020金融文字節——銀行數位化創新主題徵文大賽」投稿文章。)

隨著技術的革新,金融行業的新模式、新業態不斷湧現,對公共安全和社會治理也提出了諸多新挑戰,如何有效管控這些新模式、新業態,使其朝著正確的軌道穩步前進,是擺在行業和監管部門面前的共同難題。近年來,數字金融行業呈現出涵蓋廣、多元化、增長迅速的特點;與此同時,也有部分欺詐者利用技術、監管和公眾意識等方面的不完善,演繹著千變萬化、層出不窮的欺詐行為。攻堅戰迫在眉睫,數據是排頭兵。本文將結合實例,對行為數據在線上消費信貸反欺詐中的應用,進行簡要的介紹與探討。

一、「握不住的沙」:銀行反欺詐工作面對移動端詐騙的猖獗攻擊

數位技術與金融的融合,以及金融科技的發展和其對傳統金融行業的滲透正成為一種不可逆的潮流,金融行業新模式、新業態不斷呈現。金融科技的應用大幅降低了金融領域的信息不對稱性,為健全多層次金融市場做出極大貢獻。然而這樣的融合也是一把雙刃劍,技術在創造便利的同時,也帶來了風險——利用技術手段的新型金融欺詐變化多端、如影隨形。金融欺詐行為已呈現出高頻化、產業化、隱蔽化等新特徵,對傳統的反欺詐手段形成極大挑戰:

  • 高頻化:移動終端是眾多消費信貸業務的流量入口。每年,全球針對移動端的詐騙攻擊增長率約為24%;其中,消費金融壞帳的損失超50%都源於金融欺詐;
  • 隱蔽化:移動端便捷、高效,但隱匿性強、難於追蹤,已成為滋生欺詐的「溫床」;
  • 產業化:欺詐行為已越來越群體化:專門設備、專業團隊、專人設局、專人銷贓,形成有組織、成規模、分工明確、合作緊密、協同作案和「黑色產業鏈」,從業人數超150萬。

很多業內人士感慨:「信用風險尚且可控,欺詐行為卻防不勝防。」

因此,針對金融領域的反欺詐技術也應不斷革新,既要精準打擊存在的風險,也要執棋先行,做到防患於未然。

二、「劍走偏鋒」:行為數據對反欺詐模型的加持

大數據技術,使得更具前瞻性和精準性的反欺詐手段成為可能。而其中的行為數據具有體量大、直觀性強的優勢,但因其不是傳統的「數字」形式,一直以來都是一片很容易被忽略其價值的領域。實際上,相較於傳統手段,行為數據可作為有效的補充對反欺詐流程和規則形成「加持」。運用行為數據重構線上反欺詐方案,優勢明顯:它能夠覆蓋營銷、貸前、中、後四階段,運用數學、統計學以及人工智慧的方法,精確識別異常行為。

(一)流程優化

圖表 1:行為數據反欺詐對整體反欺詐工作的流程優化

行為數據可作為前置「鋒線」,以更為直觀、更易理解、更高速快捷的方式,對交易方是否涉嫌欺詐進行快速篩選,從而在大大提高效率的同時,也有效提高預測精度。

(二)規則優化

圖表 2:行為數據反欺詐對整體反欺詐工作的規則優化

以行為變量為基礎設計反欺詐策略的主要工作,一是基礎規則的開發和規則風險等級劃分;二是決策規則開發,以對整個風控策略形成一定補充,更早地識別客戶風險水平。通過設備埋點,獲取和積累大量線上交易行為數據;經過脫敏清洗與整理,將特徵行為進行標準化提取,設計反欺詐策略;當設備行為反欺詐策略運營一定時間後,積累了一定客戶數據和欺詐表現,即可開發反欺詐模型並制定評分規則,優化設備行為策略。

這一方案設計的大前提是,「事出異常必有妖」——認為在欺詐過程中,一定存在異於常人的行為,且能夠被清晰捕捉。例如,輸入用戶名密碼時的按鍵行為——第N個按鍵按下與彈起的時間(按鍵時長);2個按鍵之間間隔時長(移動距離);誤按漏按行為模式;明顯變慢/猶豫-明顯變快/按鍵使用手指邊緣;使用其與歷史紀錄的偏離度作比較、打分等。再比如,根據登錄時間、上網環境等判斷——如果一個用戶總是在東八區的凌晨三點頻繁登錄進行交易,那欺詐的可能性就會比在正常作息的用戶高。

三、「初露鋒芒」:實戰中的反欺詐策略設計

(一)數據獲取

基於行為數據的反欺詐方案設計的基礎是用戶行為數據的積累,在實踐中通過設備埋點獲取。

對基於用戶行為的數據平臺來說,發生在用戶界面的、能獲取用戶信息的觸點就是用戶數據的直接來源,而建立這些觸點的方式就是埋點。當這些觸點獲取到用戶行為、身份數據後,會通過網絡傳輸到伺服器端進行後續的處理。

從準確性角度考慮,埋點分為客戶端埋點和服務端埋點。客戶端埋點,即在客戶操作界面中,當客戶產生動作時對其行為進行記錄,這些記錄只會在客戶端發生,不會傳輸到伺服器端;而服務端埋點,則通常是在程序和資料庫交互的界面進行埋點,這時的埋點會更準確地記錄數據的改變,同時也會減小由於網絡傳輸等原因而帶來的不確定性風險。

通過埋點,我們能夠獲取帳戶註冊、認證行為、登陸行為、借貸申請行為、網絡信息等五大類信息,經過加工形成變量,為後續策略設計提供了大量數據基礎。

圖表 3:埋點收集信息的維度

圖表 4:埋點信息和加工變量列表(部分)

(二)策略設計

這一步是整個方案設計的重中之重,需要將具象化的、各異的行為數據進行抽象化、總結性、標準化的清洗和描述,綜合數學、統計學、網絡工程學、生物學、社會學等多學科知識,結合專家判斷,進行量化研究和策略設定。

下表是一個示例:

圖表 5:反欺詐規則列表(部分)

策略提取後,還需對各規則進行具體量化設計,設定閾值,並綜合運用聚類分析、AHP等統計學方法,對規則進行「高中低」不同風險等級的分類,在實際運行中不斷校正,為後續模型構建和決策建議設計做準備。

(三)模型構建和決策建議

當設備行為反欺詐策略運營一定時間後,積累了一定客戶數據和欺詐表現,即可開發反欺詐模型並制定評分規則,指定標準評分,優化設備行為策略。

(四)模型校驗

在本次實例中,採用KS值對模型進行評價,KS值越大則表示模型能夠將正、負客戶區分開的程度越大,通常來講KS>30%即表示模型有較好的預測準確性。此次模型KS值為41.19%,說明好壞樣本區分度高,模型效果良好。

圖表 6:反欺詐模型校驗結果

(五)實戰效果

經過行為數據加持,反欺詐模型區分度較原有策略提升50%以上,運行一段時間後,新客戶壞帳率下降30%,充分體現了行為數據在線上消費反欺詐應用中的價值。

四、結語

從基於大數據的金融反欺詐的實踐經驗來看,反欺詐之戰不是某一種技術或方法的單打獨鬥,而是一場集數據、技術和機制於一體的綜合防禦戰。其中,數據是反欺詐體系建設的核心和根基,技術是打贏反欺詐之戰的重要支撐,機制是優化反欺詐效果、提升反欺詐能力的重要保障。行為數據的應用,為大數據風控領域開拓了一條新的思路,合理高效應用行為數據,能夠進一步夯實「數據」這一反欺詐體系建設的核心根基。「路漫漫其修遠兮,吾將上下而求索」,只有立淨化行業之志、舉全行業之力,在反欺詐體系建立上加強合作、信息共享、共防共御,良性健康的數字金融生態圈才能逐步形成。

[Source]

本文系未央網專欄作者發表,屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!

本文為作者授權未央網發表,屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!

本文版權歸原作者所有,如有侵權,請聯繫刪除。

相關焦點

  • 反欺詐乾貨丨複雜網絡及其應用簡介
    從算法的物理背景上考慮,又可以將其分為基於網絡拓撲結構的算法,基於網絡動力學的算法,基於Q函數優化的算法及其他算法。那麼網絡社團結構分析有哪些應用呢?一個比較有趣的場景就是個性化推薦系統。講道理的話,同類的人群更傾向於擁有更相似的行為,如在電子商務網站上更傾向於購買同類的物品,在同類的社團中更傾向參加同類的活動等等。
  • 360金融智能反欺詐成效顯著
    安全成為大問題,360智能反欺詐的機會來了。媒體訓練營5月10日報導文/左遠良近年來,隨著消費金融競爭的愈演愈烈,也給不法分子創造了機會,導致金融詐騙類案件頻發,甚至一些黑產團夥,已經開始用上大數據、AI技術等手段製造騙局,新型網絡詐騙手段層出不窮。
  • 明特量化趙亮:大數據是Fintech的靈魂
    而大數據的積累及應用,不僅拓展了金融服務的邊界,也提升了金融服務的效率。  可以說,數字新經濟時代創造了一個虛擬但直觀的世界。對此,政府、傳統銀行、新金融機構都面臨很大的機遇和挑戰。近年來,如火如荼的消費金融就與大數據風控的發展息息相關。  「大數據和算法是金融創新的底層技術,也是風險控制的命門。」
  • 百融雲創打造諦聽設備反欺詐 賦能金融機構增強風險識別能力
    作為人工智慧與大數據應用平臺,百融雲創自2014年成立以來堅持科技創新,依託機器學習、深度學習、自然語言處理、知識圖譜等底層核心技術,不斷幫助客戶升級智能風控解決方案。百融雲創從信用評估、反欺詐、貸後管理等領域為金融機構的風險防禦提供了強有力的保障。
  • PPmoney 六年風控新成果:神經網絡已運用於反欺詐領域
    隨著AI應用升級,基於大數據處理技術的智能風控模型形成定量標示和定性分析風險防控模式,已經能夠實現精準的欺詐風險識別。12月12日,PPmoney萬惠集團在6周年活動現場展示了平臺AI風控技術的最新成果——將神經網絡運用至平臺反欺詐及貸後環節,這一最新風控案例引發關注。
  • 芝麻信用消費金融領域負面信息披露成為新亮點
    剛剛過去的兩會,國務院總理李克強在2016年度的《政府工作報告》首次提到「要在全國開展消費金融公司試點,鼓勵金融機構創新消費信貸產品。」 擁有廣闊前景的消費金融領域市場,也迎來了眾多公司紛紛搶灘。  螞蟻金服旗下獨立第三方徵信機構芝麻信用已經在消費金融領域開展多種形式的應用,提供芝麻信用評分(準入和信用評價)、行業關注名單(過濾高風險不良客戶,幫助合作夥伴建立聯防聯控機制)、反欺詐IVS信息驗證服務(基於實名用戶的欺詐風險識別,幫助提升合作夥伴反欺詐識別能力)、芝麻數據變量服務DAS(還原用戶畫像,個性化的策略模型)、負面信息披露、還款提醒等服務,還將推出芝麻認證身份驗證工具。
  • 金融大數據的應用現狀、存在的問題及相關建議
    隨著大數據技術的廣泛普及和發展成熟,金融大數據應用已經成為行業熱點趨勢,在交易欺詐識別、精準營銷、黑產防範、消費信貸、信貸風險評估、供應鏈金融、股市行情預測、股價預測、智能投顧、騙保識別、風險定價等涉及銀行、證券、保險、支付清算和網際網路金融等多領域的具體業務中,得到廣泛應用。對於大數據的應用分析能力,正在成為金融機構未來發展的核心競爭要素。
  • ZRobot拒做「大數據公司」背後的數據技術商業邏輯
    京東金融與美國大數據公司 ZestFinance聯合發起成立ZRobot日前宣布開業,主要提供數據建模、信用評分、資產定價、欺詐識別、精準營銷等能力在內的數據增值與技術應用服務,面向銀行、汽車金融、消費金融、小貸公司等各類金融及非金機構,為其在信貸領域提供數據技術服務,提升金融及非金機構的大數據分析應用能力以及防控風險
  • 多家機構探路同業徵信模式 剔除弱相關大數據
    據統計,目前我國個人有徵信記錄的僅約3.2億人,約佔人口的23%,央行徵信數據覆蓋率明顯不足。目前流行的大數據,利用每個個體大量的網絡行為數據,刻畫個人信用畫像,試圖彌補個人信用記錄缺乏的問題。他認為,大數據在與信用行為表現之間的相關性較弱,在數據的準確性、可利用性上都只是一種嘗試階段,目前缺乏有效科學的計算方法。「美國著名P2P公司Lending Club曾與Facebook合作,試圖通過社交網絡信息應用在風控模型中。但兩年多過去,研究進展緩慢。通過大數據工具獲取的相關數據或形成的風險指標,回歸到信貸風控模型中,目前還難以與還款行為表現建立線性關係,難以與信貸風控體系形成有機的聯繫。
  • 秦蒼科技數據科學家沈贇:AI在消費金融產品優化以及風險控制中的...
    那麼,網際網路消費金融企業如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創公開課,雷鋒網(公眾號:雷鋒網)邀請到了秦蒼科技數據科學家沈贇博士,為大家分享AI在消費金融產品優化以及風險控制中的應用。內容介紹:本次公開課包含以下內容:1.
  • 大數據、人工智慧、人像對比,技術真能阻擋互金黑產?-虎嗅網
    中國的反欺詐有多難?「2011年至2015年,五年共造成經濟損失550億元,」 通付盾創始人董事長兼CEO汪德嘉,在2017消費金融CRO全球峰會上稱,看看中國黑產的規模,就知道反欺詐有多難。一、五類信貸資產 我們總結2017年整個中國信貸市場上信貸資產的特點,可以分為五大類:1、線下消費貸。
  • 網貸天眼每周聚焦:和信貸涉嫌非吸被立案調查央行摸底線上聯合消費貸
    7月30日,處置非法集資部際聯席會議組織召開2020年防範和處置非法集資年中工作座談會,會議要求,要積極穩妥推動網貸風險處置出清。中國人民銀行近期下發了《關於開展線上聯 合 消費貸款調查的緊急通知》。特別值得注意的是,銀行除了要上報聯 合 消費貸的餘額、利率、不良率之外,還要單獨匯報與螞蟻集團合作的「借唄」、「花唄」的相關數據。
  • 聯邦學習+風控,會是信貸業務的N95嗎?
    而現在,得益於大數據下的信貸風控技術提升,除了強關聯數據,非信貸場景下的弱相關變量也開始更多地被納入考量。她表示,除了用戶本人的基本資料和借貸記錄,在判斷個人信貸風險時,其網絡行為、社交數據、消費記錄等信息都能為大數據風控模型提供判斷依據。可以看出,數據無疑是信貸風控的源頭活水,但想要獲得海量、多維度的數據談何容易。
  • 信也科技發布《2019中國消費信貸市場研究報告》: 中國狹義消費...
    隨著國民消費水平的不斷提升以及年輕一代消費觀念的變化,中國的消費信貸市場亦不斷增長。近日,中國領先的金融科技平臺信也科技(NYSE:FINV)結合數據與自身的專業視野發布了《2019中國消費信貸市場研究報告》(以下簡稱《報告》)。
  • WePay機器學習反欺詐實踐:Python+scikit-learn+隨機森林
    【編者按】將機器學習算法用於金融領域的一個很好的突破口是反欺詐,在這篇博文中,WePay介紹了支付行業構建機器學習模型應對很難發現的shell selling欺詐的實踐心得。WePay採用了流行的Python、scikit-learn開源學習機器學習工具以及隨機森林算法。
  • 6個方面分析:知識圖譜的價值和應用
    在風控領域中,知識圖譜產品為精準揭露「欺詐環」、「窩案」、「中介造假」、「洗錢」和其他複雜的欺詐手法,提供了新的方法和工具。儘管沒有完美的反欺詐措施,但通過超越單個數據點並讓多個節點進行聯繫,仍能發現一些隱藏信息,找到欺詐者的漏洞,通常這些看似正常不過的聯繫(關係),常常被我們忽視,但又是最有價值的反欺詐線索和風險突破口。
  • 中智誠的 「閃蝶」模式(下)|FinTech情報局獨家
    中智誠的 「閃蝶」模式(上)  【財新網】(記者 張宇哲)數據質量是徵信工作的生命線。與國外已成體系的消費金融業不同,中國的網貸平臺五花八門,缺乏統一的信貸業務標準和會計記帳標準,又如何保證數據質量?  數據共享機制的第一個問題是數據真實性。
  • 汽車消費金融:發現下一輪市場增長動能|行業報告
    在貸後處置行為的合規監管方面,2018年中國網際網路金融協會下發《網際網路金融逾期債務催收自律公約(試行)》,暴力催收或催收不當被界定為「違法」,規範了網際網路金融逾期債務催收行為。3. 信貸消費貸款、稅收、財政等方面政策對我國汽車信貸消費有重要影響。
  • 民生銀行大數據體系架構設計與演進
    行為數據平臺自2015年上線到現在為止,已經接入了手機銀行、直銷銀行、樂收銀及客戶化運營等民生銀行大部分APP應用,對這些應用中的用戶的行為數據進行採集,2017年又增加了對網頁端行為數據採集的功能。