近年來全球欺詐趨勢如何演變?潛伏在流量中的欺詐行為有哪些特點?無監督AI技術如何幫助企業風控管理者提升效率?其原理如何解釋?如何利用無監督技術建模?
近日,DataVisor維擇科技中國區技術負責人崔宏宇做客「51CTO大咖來了」,就上述問題帶來分享。現在就讓維擇課代表帶你回顧直播精彩內容吧!
傳統行業數位化轉型中面臨的風控挑戰
如今,各大傳統行業紛紛開始數位化轉型,希望能夠藉助網際網路浪潮加速自身發展。然而傳統行業與網際網路行業本身存在很大不同:傳統行業缺乏網際網路基因,對網際網路風險的認識也有待加強,因此在轉型過程中面臨著諸多挑戰。
網際網路飛速發展使得欺詐模式更加複雜
隨著移動網際網路技術的發展,單一功能網站轉型多功能平臺,線上交易行為可能會受到來自多方的有組織攻擊,比如撞庫、盜號、薅羊毛、虛假粉絲、虛假好友、虛擬貨幣、洗錢、交易欺詐、釣魚攻擊等。欺詐手法多變,甚至出現多環節聯動的情況,多數欺詐行為還會潛伏較長時間來模擬正常客戶的行為,使普通風控系統無法檢測出異樣行為,風控環節面臨著巨大挑戰。
金融行業在數位化轉型的過程中業務範圍越來越廣,各個環節都存在著被黑產攻擊的可能性。在申請階段存在惡意逾期、中介代辦、團夥欺詐等風險;在交易環節中,常見的有盜卡盜刷、養卡套現,甚至洗錢行為;營銷階段的欺詐更加嚴重,很多金融機構為拉新用戶,給新用戶發放紅包獎勵,但是這些獎勵很多情況下都流入了黑產的口袋,金融機構因此遭受損失。黑產活動已經滲透到金融業務全流程,這對傳統金融行業的風控能力提出了更高的要求。
那麼,為何傳統金融行業在轉型過程中更容易遭到黑產威脅?
崔宏宇說:「打擊黑產的過程就是風控人員和黑產之間的一場博弈。」我們可以從三個方面進行解讀:
首先是利益驅動方面,黑產的欺詐行為會帶來巨大的經濟利益,同時受巨大利益驅使會產生罕見的積極性和驅動力,而風控從業人員相對利益獎勵遠遠不足。
其次在分工合作方面,黑產已經形成專業、分工明確的產業鏈,產業交流頻繁,對新技術非常敏感且快速學習迭代。而風控在企業中為成本中心,受預算限制,團隊規模相對較小且同行技術交流也沒有那麼頻繁。
最後,黑產僅需在風控體系中尋找個別漏洞即可大規模複製盈利,實現「一招鮮,吃遍天」的單點突破。而對於防守方來說,風控人員需搭建全面風控管理體系,任何一塊防範不到位都會出現明顯「木桶效應」,做到段時間內攔截欺詐是十分巨大的挑戰。
知己知彼:揭秘黑產技術及其新型攻擊手段
黑產產業鏈條
黑產分工逐漸精細化,形成了完整的上、中、下遊的產業鏈條:黑產攻擊的第一步是進行大規模惡意註冊,然後利用群控軟體進行同屏傳輸與批量控制、自動化運行、虛擬定位、一鍵新機串號設置、定時任務、萬能表單輸入、手機分組管理、萬能腳本/自定義腳本等手段實現套利。另外,技術迭代後為減少成本,黑產利用安卓模擬器可以在PC端模擬任意手機、修改設備參數、多開模擬、虛擬定位,提高其效率減少人力成本,形成了完整的產業鏈。
崔宏宇介紹道:「有一部分黑產專門向不法分子提供普通用戶個人身份信息,例如將身份證、銀行卡、預留手機號、銀行U盾打包成四件套,售價800到1000多元不等,這些信息被賣給違法犯罪份子,用來進行虛假借貸等操作,從而獲得巨大利益。」
黑產常用工具有貓池、清機軟體、安卓模擬器、群控軟體、GPS模擬器、雲手機等等。
貓池(配合養卡軟體)
利用群控軟體同時控制多部手機
無監督反欺詐優勢明顯
技術手段愈加豐富,風控人員與黑產之間的博弈也愈演愈烈。面對快速迭代的欺詐模式,傳統反欺詐方案的不足漸漸凸顯出來,而無監督機器學習提供了一個比較好的方向。傳統的風控手段更多的是被動防範,欺詐損失產生後才能亡羊補牢,而這種反應方式最快也要幾個小時。如今,新的欺詐模式層出不窮,在標籤數據嚴重缺乏的情況下,無監督機器學習(UML)成為近年來反欺詐的新寵。
無監督機器學習成為反欺詐新寵
傳統無監督機器學習是一種在無標籤的數據中提取其中隱藏信息(數據結構和模式)的算法,主要應用於數據挖掘、模式識別,優點是不需要標籤。但傳統無監督機器學習在應用上同樣面臨結果難以評估、時間複雜度高等難題,無法很好地滿足客戶需求。
DataVisor維擇科技研發了一套專門應對團夥欺詐的無監督算法,目前已經應用到社交平臺的批量註冊、電商平臺的薅羊毛、APP的虛假註冊、金融領域的可疑交易、保險領域的虛假理賠等多樣場景。
DataVisor維擇科技的無監督機器學習算法在高維特徵空間中對用戶進行聚類,通過整體分析用戶行為,能從不同維度聚類出相似的用戶,以此檢測出可疑的用戶行為。無監督機器學習算法有三個明顯優勢:一是自動挖掘和檢測各種已知、未知的欺詐行為;二是自動產生標籤,用於機器訓練檢測模型;三是自動產生規則,免除費時的人工規則調試。
最後是網友提問環節:
1.無監督算法怎樣與規則、黑白名單技術進行配合?
崔宏宇:傳統的規則、黑白名單、有監督模型在風控過程中也能起到一定效果,而無監督算法能夠從不同角度覆蓋更多新型欺詐風險。對於一個比較完善的風控體系來說,規則、黑白名單、有監督、無監督都是必不可少的,多種技術之間可以相互融合。
2.一般企業的業務數據都涉及隱私,DataVisor維擇科技是以產品方式還是項目方式為客戶服務的?
崔宏宇:現在是兩種方式都有,一些敏感行業比如金融行業對數據隱私的要求是非常嚴格的,這種情況下我們需要去客戶的環境進行建模服務。在以產品方式為客戶服務時,我們會把無監督建模平臺、變量計算平臺、規則引擎等一系列產品提供給客戶,由客戶自己使用。還有一些客戶的數據經過脫敏後可以進行雲上的分析和處理。
3.每一個具體的欺詐場景是不是都要選擇一套合適的算法?
崔宏宇:理想狀態下,每一個具體的欺詐場景最好都有一個單獨的模型,因為這樣模型會專注於這個場景,但是不一定每個場景都需要不同的算法。無監督適用很多場景,例如批量註冊、垃圾信息、廣告行為這種團夥欺詐行為利用無監督都可以解決。
嘉賓簡介:
崔宏宇
DataVisor 中國區技術負責人
現任DataVisor中國區技術負責人,自2015年起,在DataVisor開發使用分布式無監督機器學習算法進行反欺詐檢測。負責過如Pinterest、Yelp、阿里巴巴和獵豹移動等大型網際網路企業的機器註冊、虛假評論、垃圾郵件、欺詐交易和虛假應用安裝等場景的反欺詐建模
。在模型調優、特徵工程和算法開發等領域都有著豐富的經驗。