晉梅:金融知識圖譜的應用探索

2020-11-23 未央網

本文共字,預計閱讀時間

為了傳播金融創新典範,推進金融供給側結構性改革,推動金融業服務實體經濟,以及促進實現經濟高質量、發展的目的,由北京市地方金融監督管理局指導,清華大學五道口金融學院、清華大學金融科技研究院主辦,未央網承辦推出「首都金融創新與發展」公開課,邀請金融行業嘉賓分享金融項目的創新模式,以及對行業未來發展前景的深度思考。

在首都金融創新與發展公開課的第四模塊「金融科技創新與賦能」中,我們非常榮幸邀請到了頂象首席金融風控專家晉梅做客直播間,帶來《金融知識圖譜的應用探索》主題分享。以下整理來自嘉賓分享實錄:

金融知識圖譜的概念和應用

在信息爆炸時代,對客觀事實的各種描述是海量的、無序的、混亂的信息,而知識被定義為是對客觀規律和信息的歸納總結。基於此概念,知識圖譜是一種用圖的結構對知識進行表達的方式,它的基本組成要素是節點和邊,節點用於表示實體,邊用於呈現關係。實體代表可以區別的、獨立存在的某種事物,關係即實體之間的關係。

在日常生活中,知識圖譜的應用廣泛滲透到C端用戶生活的方方面面。比如智能搜索,實際上「知識圖譜」概念最早由谷歌在2012年提出,它能夠在反饋正確結果、給出全面總結、更深入廣泛探索三大方面提高搜索效果。再比如電商智能推薦,阿里巴巴從2017年開始搭建的電商認知圖譜,將用戶需求表達成圖中的節點,並將需求點和電商領域的商品、類目、電商外部的通用領域知識等關聯起來,從中挖掘客戶的購物偏好和潛在的感興趣的商品,使客戶與商品和場景更好地連接。此外,還有O2O領域線上線下生活場景圖譜,以美團為例,美團點評在2018年開始建立基於知識圖譜的美團大腦,在客戶、線下店鋪和商品以及不同的消費場景之間構建知識關聯,從而優化客戶的使用體驗。

在B端,知識圖譜在企業關聯和企業分析方向也有很好的應用。比如企業的法人或高管、企業之間的投資關係和關聯風險分析,呈現在圖譜上就會顯得非常直觀,將海量信息以非常有效的方式在很短時間內觸達使用者。

知識圖譜應用於金融領域的意義和價值

聚焦零售金融領域,團夥性風險威脅業務全生命周期。具體舉例,常見的團夥性風險會發生在貸款申請階段,存在以欺詐為目的貸款中介包裝機構,他們把申請人信息根據金融場景的風控要求量身定做並進行虛假包裝,騙過網貸申請,最後他們經手的客戶可能會在短時間內出現爆發式的不良或者逾期,這將給金融機構帶來較大的經濟損失。在支付交易階段,由於風險不同,通常,用信用卡取現比支付消費的費率更高、條件更嚴苛,並且額度上有限制,但存在一些商戶通過欺詐手段幫持卡人做虛假交易,將取現偽裝成消費交易,使金融機構以較低風險的定價為客戶提供高風險服務,而團夥性操作進一步加大發卡機構要承擔的風險。放眼更廣泛的資金交易場景,存在洗錢資金交易和異常資金歸集的風險,比如團夥性進行消費貸款後把資金歸集並投入房市、經營等實際用途與申報用途相左的場景、甚至遊戲、賭博等高風險違規場景。

目前團夥性風險趨於組織團夥化、攻擊隱蔽化、內外勾結化、手段複雜化,因此傳統的防控手段已經出現較大局限性。其短板和盲區可以歸納為三點:首先是人工防控效率和準確率低,因為防控效率會依賴於審核人員自身經驗和對場景的理解,也會受到操作風險的影響;同時基於個體的風險評分沒有充分考慮個體與個體之間、個體在時間軸上的行為演變、個體在不同產品上的表現差異,因而無法應對團夥性的網狀攻擊;第三是靜態防控無法應對快速進化的攻擊手段。

突破上述局限性的關鍵在於對用戶行為的深層解讀和本質洞察,需要在特定場景下能夠評估個體的特性、個體之間的交互以及個體所在群體的屬性。這些可以通過知識圖譜實現,將複雜的信息有機結合,把關聯關係數位化,把用戶行為網絡化。具體地,知識圖譜技術能夠幫助風險評估與反欺詐;能夠豐富客戶畫像,了解客戶的風險偏好、信用資質,以及客戶對其他金融產品的喜好,從而進行交叉營銷和智能營銷;此外還能夠提供可視化表達,加深對場景特點和客群行為的深層次理解,大大提高營銷人員、風控人員、運營人員等的工作效率和準確度。

金融知識圖譜在風控場景的實戰案例

下圖是知識圖譜的風控方案概覽。

首先將跨業務、跨部門的各個類型數據按照金融場景的業務架構打通,構建金融領域知識圖譜的本體層框架。打通包括全業務鏈路的打通,以貸款為例,貸款的全生命周期包含渠道進件、貸款申請、信用風險評估和審批、交易、貸款還款,以及可能的逾期或不良和後續的催收。構建圖譜要將上述業務全鏈路過程中沉澱的數據,以業務的思維邏輯打通。此外,還需要跨業務和跨部門的打通,一個成熟的金融機構僅在零售板塊通常有幾十甚至上百種金融產品存在,每個金融產品的設計會充分考慮客群、場景和渠道等差異性,所有產品在運營中沉澱的數據也需要在圖譜上圍繞客戶為中心縱橫打通。比如圍繞同一個客戶,其信用卡相關的申請和交易等可形成一個子網絡,其網貸相關的申請和交易又而可以構建子網絡,這兩個產品的子網絡可以基於客戶進行打通。此外客戶之間在金融場景中通過金融產品和交易發生關係,可以產生客戶關係網絡,同樣的,可以手機電腦等設備、交易訂單、工作單位、居住地等為中心構建不同主題的網絡。

構建知識圖譜後,客戶經理操作業務系統時,可以非常直觀地看到跟客戶相關的信息,比如經常發生交易的對象,或者在某筆貸款上和客戶申請互為擔保的對象,或者其關聯企業,這些全面了解都可以在幾秒內實現,而不是在電腦前花一整天去調用很多系統和權限去尋找信息。它可以提供可視化的呈現、交互式的查詢,並進行關聯指標和標籤的輸出。

面對業務矩陣複雜的機構時,更高階的應用是引入機器學習和圖挖掘算法,從圖譜中的異常結構裡尋找到有風險、有傳播性的團夥,並挖掘其關聯關係,進行定性和量化的分析,其中包括基於壞樣本的研究分析和挖掘,也包括對壞樣本較少的場景用半監督或者無監督學習的算法,依據風險傳播理論進行挖掘。這樣可以把其中的風險實體和異常子圖(團夥)挖掘出來,並且把團夥中成員的風險係數以量化形式呈現出來,幫助線下人員進行有針對性的、有優先級的排查。

算法挖掘出的洞見可以通過特徵、標籤和指標的方式被應用到各個環節的模型中,形成上圖的閉環,也可以被應用到結合金融機構的業務場景、基於關聯圖譜專門定製運營監測平臺裡。在知識圖譜的賦能下,運營監控平臺可以根據機構偏好把重要的、與主要業務和場景相關的的風險挑選出來,再根據各個部門人員的權限進行科學配置。這樣可以把相關的風險和披露信息及時地推送到相關部門有權限的運營和風控人員帳戶下,幫助他們更及時、更全面地了解風險情況,並規劃下一步工作,實現對金融機構海量數據資產的價值變現。

具體地,以信貸業務的進件審批為例,上述知識圖譜的挖掘和監控平臺在業務流程中發揮著重要作用。首先,當有業務進件以後,機構有模型和策略可以對客戶數據進行自動化審批,而這些模型和策略的原材料來自關聯的圖譜系統,來自從底層知識圖譜中挖掘出的指標,或者直接根據圖譜建設的模型,讓審批能全面捕捉到團夥性風險的指標和預警。通過自動化審批後仍然會存在一些灰色區域的客戶,銀行會進行人工審批,對其中比較異常客戶或者申請額度較大的客戶進行覆核,這個環節中,圖譜可以把它挖掘到的關聯性信息,比如客戶與其他客戶、其他產品及其歷史信息,通過可視化系統展示給人工審批團隊。最後的審批結果本身又可以作為有效數據回流到關聯圖譜中,作為訓練關聯圖譜的新的原材料。關聯圖譜每天都會納入增量數據進行更新,重新挖掘和團夥風險指標的打標。

總的來看,應用知識圖譜防控團夥性欺詐風險,具有四大優勢:第一是滿足可視化需求;第二是決策有依據,在尋找風險團夥時,圖譜可以幫助溯源,復現團夥犯案的方式和手段,因此不是基於黑盒子模型做決策,而是有據可依的風險決策;第三是線上線下聯動,把線下業務人員多年從業的業務經驗以數位化的模式沉澱到圖譜之上,並及時在動態更新的圖算法風險挖掘中發揮價值;第四是風險實時防禦,是更及時、有效、動態地對團夥性欺詐的防控。

金融市場快速創新,誕生了很多衍生產品,這些產品涉及的金融機構很多、涉及的人多、交易結構複雜,使得現在金融機構在各個市場中的關聯程度非常高,風險的傳導性也日益加劇。中長期來看,如果金融知識圖譜在金融風險防控上的應用可以從單個機構內部拓展到機構之間,再拓展到不同的市場之間,對於有效防控這樣的系統性風險或者複雜金融產品的風險,甚至更高層次上維護國家金融安全,都是有非常重要的意義。

[Source]

本文系未央網專欄作者發表,屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!首圖來自圖蟲創意。

本文為作者授權未央網發表,屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!首圖來自圖蟲創意。

本文版權歸原作者所有,如有侵權,請聯繫刪除。首圖來自圖蟲創意。

相關焦點

  • 愛分析·中國知識圖譜應用趨勢報告
    知識圖譜應用場景地圖如下圖所示:  2.3知識圖譜各場景應用分析  通過知識圖譜應用場景地圖可以看出,目前在六大行業中,金融行業以及政府與公共服務行業知識圖譜落地場景較多,其中主要以金融行業內的營銷與風控場景和公共安全行業的業務場景居多。本章節將結合各行業具體落地場景分析目前知識圖譜的應用現狀。
  • 知識圖譜在金融資管領域的應用、實踐與展望
    知識圖譜是人工智慧的一個重要分支,對可解釋人工智慧具有重要作用。金融知識圖譜作為專業領域知識圖譜,在智能投研、智能風控、智能客服、智能合規等領域有著重要的應用價值。本文綜合熵簡科技三年以來的產業實踐,結合知識圖譜領域的技術前沿,以及資管場景的落地應用,淺談知識圖譜在金融資管領域的發展現狀與應用展望。
  • 是時候該關注「知識圖譜」了!
    編者按隨著大數據、自然語言處理、人工智慧等技術的發展,知識圖譜成為近幾年的熱點技術,在生活服務、醫療輔助、金融風控等不同行業和領域,實現了眾多的智能化應用。知識圖譜是表示關係的最有效的方式,提供了從「關係」的角度分析問題的能力,讓機器能夠像人一樣理解世界、獲取知識,進而做出決策和行動。在大數據的推動下,知識圖譜受到了業界和學術界的廣泛關注。自2012 年Google推出第一版知識圖譜軟體,相繼湧現出一大批面向不同領域和應用的知識圖譜,如Yago,DBpedia,MusicBrainz,PubMed等,為各類智能應用帶來了大量結構化知識。
  • 6個方面分析:知識圖譜的價值和應用
    儘管各個風險場景的業務風險不同,其欺詐方式也不同,但都有一個非常重要的共同點——欺詐依賴於信息不對稱和間接層,且它們可以通過知識圖譜的關聯分析被揭示出來,高級欺詐也難以「隱身」。凡是有關係的地方都可以用到知識圖譜,事實上,知識圖譜已經成功俘獲了大量客戶,且客戶數量和應用領域還在不斷增長中,包括沃爾瑪、領英、阿迪達斯、惠普、FT金融時報等知名企業和機構。
  • 蘇寧金融科技運用知識圖譜提升「千言」客服機器人效能
    為專注好服務,蘇寧金融科技打造的「千言」智能客服機器人上線後,不斷在功能和算法方面進行優化。近日,「千言」機器人開始引入知識圖譜,強化機器人的知識構建能力,提升整體服務效能。據了解,知識圖譜(Knowledge Graph)是以結構化的形式描述客觀世界中概念、實體及其關係,將網際網路的信息表達成更接近人類認知世界的形式,是一種更好地組織、管理和理解網際網路海量信息的能力。利用知識圖譜技術可以將當前靜態無關聯的單條知識,轉換為具有一定關聯的圖結構,從而使機器人具有一定的推理能力,回答問題更加精準和多樣,提升機器人的智能化水平。
  • 知識圖譜構建的研究已走入下半場,但大規模落地應用仍需時間
    ,已廣泛應用在金融、電商、醫療、政務等眾多領域,經過短短幾年的發展,熱度依舊不減,未來,知識圖譜又將解決哪些其他技術無法解決的問題呢?知識圖譜的缺點本質上都是「二元一階謂詞邏輯」作為知識表示的本身缺陷帶來的。知識表示是長久以來研究者孜孜不倦追尋探索的話題,完全依靠(頭實體、關係、尾實體)這樣的命題,儘管能表示大部分簡單事件或實體屬性,對於複雜知識卻束手無策。
  • 知識圖譜如何打破人工智慧的認知天花板?
    近年來,知識圖譜技術熱度不減,作為實現認知智能的核心驅動力,已廣泛應用在金融、電商、醫療、政務等諸多領域。 知識圖譜究竟能解決哪些問題、應用在哪些場景?其技術架構如何發展演變?又將如何支撐實現認知智能的終極目標?成為技術圈熱議的焦點。
  • 這是一份通俗易懂的知識圖譜技術與應用指南
    在一項任務中,只要有關係分析的需求,知識圖譜就「有可能」派的上用場。2. 什麼是知識圖譜?從學術的角度,我們可以對知識圖譜給一個這樣的定義:「知識圖譜本質上是語義網絡(Semantic Network)的知識庫」。但這有點抽象,所以換個角度,從實際應用的角度出發其實可以簡單地把知識圖譜理解成多關係圖(Multi-relational Graph)。
  • 知識圖譜的皇冠:知識圖譜推理的前世今生
    [ 導讀 ]業界和學界對知識圖譜的關注主要集中於兩大領域,分別是知識圖譜的構建和知識圖譜的應用。 前者聚焦於通過對結構化、非結構化數據的整合,實現統一形式的數據存儲;後者則著眼於通過算法對海量知識圖譜數據進行學習與挖掘,從而推理出新的知識,服務於具體行業應用。
  • 究竟知識圖譜是什麼?它又與人工智慧有著怎樣的聯繫呢?
    然而,當各行各業關注於這些時代熱詞,探索研發新的AI場景時,卻常常忽視了最成熟也很重要的AI技術——知識圖譜。 或許你說不出知識圖譜的具體定義,但其實處於資訊時代的我們早已離不開它。反過來,因為更強大的人工智慧,可以幫我們更好地從客觀世界中去挖掘、獲取和沉澱知識,這些知識和人工智慧系統形成正循環,兩者共同進步。」 更具體而言,知識圖譜可以說是AI應用行業的先決條件。目前,人工智慧已受到各行各業的關注,不只是BAT在戰略投資人工智慧,金融、汽車、零售、娛樂、製造等等行業都在積極擁抱人工智慧技術。
  • 試驗知識圖譜分析
    、知識圖譜方面的應用研究。前言:知識圖譜是知識工程不斷發展衍生出的新一代知識工程技術,知識圖譜的概念最早是由谷歌在2012年正式提出,最初僅應用在智能搜索領域,目前已應用在多垂直領域,比如金融行業、醫療衛生、政府、能源與工業得到廣泛的應用。本期課程重點分為以下四個方面:試驗知識綜述、試驗知識圖譜分析、試驗知識圖譜構建技術和試驗知識圖譜技術展望。
  • 知識圖譜改變銀行業務模式?基於GraphDB探索FIBO
    譯者:AI研習社(季一帆)雙語原文連結:Exploring FIBO Using the Inference and Property Path Features of GraphDB簡介本體或知識圖譜可不是隨拿隨用的,使用者需要做出相應的努力才能發揮其作用,使其成為有效可用的工具
  • 實戰課堂丨大數據關係信息挖掘:知識圖譜應用案例分享
    負責聯想創投大數據機器智能產品和行業應用模型開發。擁有多年高性能計算、大數據、人工智慧行業經驗 。畢業於美國紐約州立大學,曾在IBM認知團隊任行業解決方案專家。榮之聯實戰課堂第4期的《解讀大數據分析:新技術,新實踐》主題沙龍上,聯想創投(香港)機器智能實驗室高級產品經理錢廣銳跟大家分享了《大數據關係信息挖掘:知識圖譜應用案例分享》。
  • 百分點認知智能實驗室:信息抽取在知識圖譜構建中的實踐與應用
    百分點認知智能實驗室在實踐探索中,通過利用自然語言處理技術獲取結構化的信息抽取能力,探索出了一套行業知識圖譜構建流程方法。尤其是基於深度遷移學習,幫助構建法律百科詞條、公安文本知識圖譜等行業項目中,在實體抽取、關係抽取、事件抽取等方面都取得了理想的實踐效果。本文將從概念辨析、技術路徑、實踐總結,由虛到實、由淺入深引導大家理性看待知識圖譜技術的能與不能,以更好地在實踐中運籌帷幄。
  • 2020年中國面向人工智慧「新基建」的知識圖譜行業白皮書
    本報告從善政、惠民、興業、智融四個部分對知識圖譜技術在其他行業中的代表性應用場景進行梳理,對知識圖譜未來的發展和應用做出展望,同時對人工智慧「新基建」下,城市數位化、智慧化發展的創新場景進行展示。
  • 艾瑞諮詢《知識圖譜白皮書》(2020)發布,深擎科技榜上有名!
    2020年11月底,艾瑞諮詢從善政、惠民、興業、智融四個部分對知識圖譜技術在其他行業中的代表性應用場景進行梳理,發布了《知識圖譜白皮書》。深擎科技「乾坤袋」知識圖譜引擎與騰訊雲、百度雲、阿里雲等品牌共同作為代表性應用被納入金融領域產業鏈與參與者圖譜。
  • 明略科技HAO圖譜Open API:開放企業級知識圖譜構建能力
    機器之心報導機器之心編輯部首個語音實時生成圖譜的企業級知識圖譜開發工具包。由深度學習掀起的這波 AI 浪潮極度依賴數據,經過 10 年的發展,深度學習在一些場景應用上已經面臨瓶頸。知識圖譜技術在產業界正經歷著應用的高速增長,學術領域前沿成果與實際落地應用場景間依然存在著巨大的鴻溝,設計、開發、部署一套知識圖譜系統,會面臨數據標註、模型訓練調優、高並發高可用等一系列問題。「目前業內仍缺少一個工業級的穩定工具,HAO 圖譜是第一個語音實時生成圖譜的企業級知識圖譜開發工具包。」張杰表示。在實際的知識圖譜構建流程中,標註數據、訓練模型需要花費大量時間。
  • 白話知識圖譜及其在CMDB中的應用
    本文主要包含兩塊內容:1、對知識圖譜的基本概念和思想起源做一個簡單的介紹;2、知識圖譜對CMDB的啟發以及我們的實踐成果。閱讀時間約20分鐘1、什麼是知識圖譜你可以沒聽過知識圖譜,但一定聽過人工智慧。人工智慧可以簡單的分為兩大類:感知智能和認知智能。感知智能即視覺、聽覺、觸覺的感知能力。
  • ...曲線分析|gartner|知識圖譜|生成對抗網絡|intelligence|人工智慧
    通用知識圖譜,是以百科類知識為主,強調知識的廣度,數據來源一般較為單一,比如我們常用的搜尋引擎,就是通用知識圖譜。行業知識圖譜是面向專業領域的專有應用,基於每個行業的知識來進行構建(比如金融、電力、公安等)知識庫,以知識的深度為特性,數據來源則更為豐富。因此,行業知識圖譜,對於各垂直領域的細分場景,更能凸顯價值。
  • 明略科技入選愛分析中國知識圖譜廠商全景報告
    近日,中國領先的產業數位化研究與諮詢機構愛分析發布《中國知識圖譜廠商全景報告》,在金融、政府與公共服務、能源與工業、零售4大行業的13個應用場景中,明略科技均被評為具備成熟解決方案和落地能力的知識圖譜廠商。  在數字經濟時代,數據是重要的生產要素。數據挖掘能力是企業數位化轉型成功的基石。