ThoughtWorks中國首席金融數據科學家常國珍:金融數據治理應當以...

2020-12-02 創業邦

12月19日,創業邦100未來商業峰會暨2019創業邦年會在北京四季酒店舉行,ThoughtWorks中國首席金融數據科學家常國珍發表了「價值導向的金融數據治理」為主題的演講。

犀利觀點如下:

1.幹數據的人員需要有個特點,脾氣要好,因為你發現哪個跟你對接的人脾氣都比你差。

2.數位化無非就是把那些存在於個人腦子裡的隱性知識顯性化,顯性知識固化在系統中,讓系統吸收業務人員的智慧。

3.數據治理目的就是讓我們的數據更好用,我們說數據治理好就是數據治理要體現商業的價值。

大家上午好。我們知道,世界上唯一不變的就是變化本身,因此變革管理是商業永恆的話題。

變革管理的兩個重要工具便是數據資產管理和精益流程管理。

前者使得機構「知炎涼,知利害「,後者使得機構明白自身特點,做到上令下達,這裡我們只說前者。「知炎涼「是一個下情上傳的過程,從業務數據採集到數據挖掘模型實現洞察,為組織的決策機構提供制定策略的依據。比如在根據客戶提供的信息預測出如果賒銷或授予貸款後違約的可能性。」

知利害「是組織中各級管理者分析決策過程,經常需要結合各種報表和可視化工具進行決策支持。報表體系是對最終經營指標的逐級拆分,比如著名的杜邦財務分析體系,將製造業企業的資產收益率這個最終企業價值衡量指標拆解為由收入、成本和周轉率組成的業務部門可操縱的KPI指標。又比如,在信貸業務中,將產品利潤率拆分為貸款利率、獲客成本率、審批通過率、不良率等。最低層次的指標,比如不良率指標,可以通過上面提到的數據挖掘模型對每個申請者未來的不良率進行預測。

策略制定者根據每個潛在貸款用戶的不良率的預測值,以產品總的利潤率最大化為目標,對申請者進行取捨。說到這裡,讀者就明白了數據人的兩個基本工作,那就是製作匯報報表和建立數據挖掘模型。如下圖所示,左側的任務是對接各數據源,根據業務部門認可的標準,核定數據質量和含義,根據計算方法製作報表,供決策人員使用;右側的任務是對每個用戶、產品和渠道打標籤,在業務主題之下建立算法模型並根據每個個體的預測值過濾名單,並在決策引擎中配置相應的業務執行策略,實現信貸審批或精準營銷自動化,最後還有評價閾值選取和策略的執行效果,作為下一步優化的依據。

以上說的應用點比較抽象,下面列舉一下數據挖掘的常見業務場景。

客戶智能主要是基於對客戶的洞察,以實現客戶全生命周期價值提升為目的的分析場景。比如在初次獲客時識別高價值客戶,並進行重點營銷,提高單客價值。這裡的風險智能指的是狹義的信貸風險,主要是指授信業務前識別出申請者的還款意願、還款能力和真實意圖,降低違約成本。財務智能則是關注機構資金的運行效率和流動性安全,需要對宏觀和行業指標進行精確預測,合理分配資金資源,降低無效配置成本。運營智能可以識別並發現不合理事件,降低操作風險的成本。

數據資產在為企業提供價值的時候,會遇到很多問題,主要表現為以下三點:

1)部門各自為政,數據反覆清洗加工、分析工具重複採購、挖掘成果小範圍使用、先進經驗未能共享;

2)數據割裂:管理條線間數據割裂、數據來源間未能打通、數據脫敏後喪失價值,比如我們在做洗錢交易識別時發現交易對手的唯一標示全部是星號,這就是選取了錯誤的脫敏方式導致的不可恢復的錯誤後果;

3)缺乏系統性管理:缺乏全面的圍繞客戶、風險、運營、財務等全面規劃分析場景,執行過程隨意,流程體系不健全,保障不到位,數據和模型資產流失嚴重。

數據治理便是為數據資產保值增值而服務的。

其目標是消除歧義、減少數據孤島,降低數據使用成本,提高對業務的響應,提高對數據隱私安全保護。

實施數據治理可以為數據管理提供可信任的數據,減少數據重複,增強業務和IT對於數據的信心,改善數據的及時性和可用性,建立通用的數據詞彙表,以確保訪問正確的信息,定義企業範圍(或站點/項目範圍)的值以獲取公共參考數據,提供信息和指導,以協助有關數據的合規性和監管工作。

過去提到數據治理,更多的被認為是IT部門的事,其實不是這樣的。

就拿數據質量舉例吧,數據來自業務,它產生於業務,獲取自業務系統,數據質量標準也是業務部門訂的,數據人只是幫業務人員落地質量檢驗,但是數據有質量問題,是不能直接解決的。業務部門如果不太關心數據質量,比如說最近金融監管部門對洗錢行為監管更嚴格了,很多銀行希望買套系統或者寄希望於AI算法識別洗錢行為,但是很多金融機構對最基本客戶信息還不了解,連客戶基本的聯繫方式和地址都存在大量缺失,這很難保證客戶的真實性。

舉個例子,一間屋裡註冊了六家公司,這些公司肯定是空殼公司。數據質量如果由IT負責很難滿足要求,因為業務人員辦理業務的時候根本不去核實這個地址的真實性,地址寫不寫他都不太關心。把數據質量提升的工作壓到IT人員根本解決不了問題。

數據治理在國外自上世紀80年代應企業自身數據資產管理訴求而內生發展起來。我們企業最早於2003年提出數據治理概念,之後銀行業應監管要求,自2005年逐步加強對數據治理的重視和投資力度。取得了豐碩的成果,但是往往帶有「運動」的特徵。一提到數據治理,更多的是關注自頂向下的制度設計,而忽視自底向上業務的驅動。很多時候是IT閉門造車,還提出基於IT架構的數據治理。

感覺這很專業啊,但是我舉個例子,比如我今天想吃飯了,得看看家裡有什麼菜,至於符不符合口味不知道,有什麼就吃什麼。

這是基於IT架構的數據治理,只管盤點現有系統和現有數據。這個方法確實有其用處,但是不應該作為數據治理的主導。因此,以往的數據治理經常出現有數據治理組織架構,卻無合適的人到崗;有數據標準等規章制度,而在新舊系統上無法落地。

因此,ThoughtWorks數據智能事業部呼籲國內企業回到價值導向的數據治理的初心,提出精益數據治理,不僅從上至下,並且自底向上,圍繞業務場景,以價值驅動數據治理的具體體現。

精益數據治理講求價值驅動,圍繞場景,減少浪費,持續改進。

體現為以下五個特點:

1)從業務願景出發識別價值,在適當的時間為內部客戶提供價值是精益數據治理的關鍵要求,通過對齊業務戰略和目標來識別有價值的數據利用場景。

2)構建價值流,識別出場景後,在源數據和場景之間建立價值流,價值流是將產品或服務帶給用戶所需的資源和信息流,需要構建和改進價值流,避免浪費。

3)使價值從源頭流向用戶,「流」使價值能夠以經過最少的階段和活動便能交付,無縫流是精益數據治理的關鍵要求。減少浪費是精益數據治理的重要策略,我們發現,所有的數據質量的問題,都能夠與精益思想的7種浪費一一對應起來,解決了數據生產的浪費問題,就大部分解決了數據質量問題。

4)拉動價值流,只有在內部客戶有需求時,流程才能運行,此階段強調僅在有需求時才需要響應。

5)不斷迭代,精益求精,持續改進以追求完善,實現可持續變革。

ThoughtWorks數據智能事業部根據多年輔導企業數位化轉型的實踐,推出價值導向的數據治理實施路徑。

其有三點異於傳統數據治理實施路徑:

1)以數據探查代替需求訪談。

精益數據治理是以在數據應用為綱,但是在數據治理初期,企業管理人員對數據應用的價值認識是模糊的,有些只是一些想法,往往難以指導數據應用規劃的制定。因此我們借用敏捷開發的工具,創造出精益數據探索工作坊,幫助企業構建數據驅動的創新戰略,發現數據創新場景,驗證和制定數據應用創新計劃;

2)IT部門數據中臺敏捷開發。

以往數據治理往往分為諮詢、落地等多個階段,並且把數據標準落地、質量監控這些重要任務留給甲方自行完成。根據我們的觀察,數據標準落地部門往往缺乏新IT系統上線評審的話語權,導致有標準無法落、無人落、無力落的尷尬局面。數據治理平臺的快速建設是治理制度落地的有力保障,實現端到端的快速落地,體現治理成果;

3)業務部門開展數據賦能,能力提升大比拼,以「用」促」治」。

數據資產管理講求「看選用治評」,其中「選」是難點。業務人員從拍腦袋做事到用數據說話,這是一個能力和意願的組合問題。因此我們在數據治理同期提供數據分析人才培訓(含認證)和內部項目實訓,解決分析能力短缺和實際項目經驗匱乏問題,並且結合內部數據分析項目評優,激發業務人員用數據的熱情。解決數位化賦能過程中數據人才選拔缺標準、難動員、分工不明的問題,得到一舉多得的功效。避免數據治理業務效果不明確時一開始自上而下命令導致業務部門的消極態度,IT部門自說自話、數據治理團隊脫離業務運轉的尷尬狀況出現。

相關焦點

  • 《中國金融》|數據基礎設施支撐金融科技創新
    導讀:華為利用自身在數據存儲、傳輸和安全等方面的技術優勢,以用戶需求為導向,積極參與銀行業數據基礎設施建設 作者|康曉宇「華為數據存儲與機器視覺中國區總裁」 文章|《中國金融
  • 劉志勤:中國應當設立金融法庭
    作者:劉志勤瑞士蘇黎世州銀行北京代表處首席代表近日,中國加快了對金融領域的改革步伐,設立溫州金融試驗區,逐步開放金融領域。而國際貨幣基金組織總幹事拉加德也在北京提出,希望中國要進一步對外開放金融和資本市場。這對中國是個極其重要的信號,但問題是:中國已經做好準備了嗎?在逐步開放金融市場的同時,中國還應當做哪些準備工作?筆者認為,提前做好法律準備應當是主要的任務。中國的經濟改革已經進入攻堅克難的階段,要順利渡過這個難關,維護金融業的健康發展,成為至關重要的大事。
  • 人民數據金融數據中心成立「人民啟信」 APP同日上線
    會上,中國網際網路發展基金會理事長馬利,人民網董事會秘書李奇、人民網·人民數據(國家大數據災備中心)總經理鄭光魁、人民網 ·人民數據金融數據中心主任鎮立新等相關領導分別為大會致辭,大家對人民數據金融數據中心的建設發展提出了殷切希望。
  • 2020年金融數據和社會融資統計數據顯示:
    央行1月12日發布的2020年金融數據和社會融資統計數據顯示,全年人民幣貸款增加19.63萬億元,同比多增2.82萬億元;社會融資規模增量累計為34.86萬億元,比上年多9.19萬億元,這與此前央行方面的預判相契合。去年6月,央行行長易綱在陸家嘴論壇上曾指出,預計全年人民幣貸款新增近20萬億元,社會融資規模增量將超過30萬億元。
  • 康曉宇:數據基礎設施支撐金融科技創新
    來源:中國金融雜誌作者|康曉宇『華為數據存儲與機器視覺中國區總裁』文章|《中國金融》2020年第22期近年來,隨著中國銀行業開啟數位化轉型的新徵程,金融科技正成為銀行競爭的利器,有望引領銀行業高質量發展
  • Hortonworks通過Hortonworks DataPlane Service提升全球數據管理
    全球數據管理解決方案領先提供商Hortonworks, Inc.® (NASDAQ: HDP)今天宣布推出Hortonworks DataPlane Service(簡稱「Hortonworks DPS」)。該服務重新構想現代數據架構的提供,並使其實現自動化。
  • 金融大數據的應用現狀、存在的問題及相關建議
    金融機構已經意識到需要有效地管理其日益重要的數據資產,正在主動思考和實踐數據資產治理的方法。目前,金融機構正在加大在數據治理項目中的投入,結合大數據平臺建設項目,構建企業內統一的數據池,實現數據的「穿透式」管理。大數據時代,數據治理是金融機構需要深入思考的命題,有效的數據資產管控,可以使數據資產成為金融機構的核心競爭力。  在國內,金融機構對大數據的認知已經從探索階段進入到認同階段。
  • 京東數科退出金融大數據公司費馬科技股東
    金融大數據解決方案提供商北京費馬科技有限公司日前發生多項工商變更,上海峰瑞創業投資中心(有限合夥)、京東數字科技控股有限公司、青島泰屹投資發展有限公司、北京臻雲智能創業投資有限公司、 蘇州金沙江朝華創業投資合夥企業(有限合夥)以及李愷威 、朱曉偉、劉磊、 韓文弢退出股東序列,此外該公司註冊資本也由
  • 復旦泛海FEMBA二期班鄭斌:阿里首席科學家的「數據賦智人生」| 同窗
    ——鄭斌數據安全成熟度模型「國家標準」的締造者,2017年中國IT年度人物大數據傑出貢獻獎獲得者,阿里巴巴數字鄉村實驗室首席科學家,武漢大學經濟學與管理信息系統「文理兼修」的學霸……只因為一句「數據能改變的不僅是城市」,在數據行業早已功成名就的鄭斌,正帶著他的「數位化鄉村」夢想一路狂奔。
  • 大數據賦能金融:文思海輝金融流式大數據處理平臺解決方案
    流式大數據:實時的大數據處理技術然而,現有的傳統批量數據處理方式在數據時效性等方面相對滯後,已無法滿足金融機構大量的數據處理需求,流式大數據處理技術隨之興起。流式大數據又被稱為實時大數據,能夠極大限度地挖掘數據潛在價值,在複雜情況下可以滿足金融機構對數據處理分析的及時性、準確性需求。
  • 人民數據、啟信寶聯合成立金融數據中心
    近日,人民網·人民數據(國家大數據災備中心)與啟信寶聯合宣布人民數據金融數據中心正式成立,啟信寶成為人民數據的技術及產品合作夥伴。   據悉,人民數據金融數據中心將為金融行業提供權威、專業、真實、高效的企業徵信大數據,助力金融行業提升風險防控能力,形成金融數據融合應用新格局。
  • ...組織研製人工智慧、區塊鏈、大數據、雲計算等17項金融科技標準
    楊富玉在論壇上透露,目前人民銀行正在抓緊組織研製人工智慧、區塊鏈、大數據、雲計算等17項金融科技標準。他還透露,人民銀行在組織中國金融電子化公司、CFCA等單位爭取在中國基於LEI的數字身份識別項目試點,希望商業銀行積極支持並參與。
  • 創新監管策略,構建金融科技生態治理體系
    近年來,企業越發重視金融科技及其賦能作用,金融科技產業迎來了高速發展。本文從生態治理視角入手,為平衡創新與監管提出了新的思路,即建立生態內部治理與外部監管創新的治理體系,從價格競爭、數據競爭轉向系統性的生態內外部治理,實現產業的整體共振與可持續發展。
  • 國務院新聞辦就2020年金融統計數據舉行發布會
    近年來,人民銀行通過綠色金融支持綠色發展和生態文明建設,受到國際社會廣泛好評。目前我國綠色信貸餘額已居世界第一位,綠色債券的存量規模居世界第二位。金融統計數據就是金融系統的「成績單」。在保持物價穩定的同時,通過宏觀審慎政策來防範資產價格大起大落帶來的宏觀金融風險,以切實維護金融穩定。謝謝。美國國際市場新聞社記者:有兩個關於數據的問題。央行發布的社融數據中,貸款核銷的數額與銀保監會的數字有差別,請問其中的原因是什麼?另外社融數據中委託貸款、信託貸款和票據融資這三項統計,在影子銀行總量中大概佔比率有多少?是否能提供一下影子銀行總體量的統計?謝謝。
  • 百萬條國內金融客戶信息在「暗網」叫賣?涉事機構回應:數據系不法...
    用戶名為togoodforthisshit的用戶稱出售多家國內銀行、保險等金融機構的一百多萬條客戶信息數據,包括約80萬條上海銀行客戶信息、46萬條興業銀行信用卡客戶信息、10萬條平安保險客戶信息、10萬條浦發銀行客戶信息、6.3萬條招商銀行客戶信息。對此,多家金融機構稱數據系不法分子偽造,販賣的數據關鍵要素與真實客戶信息不匹配。
  • 助力金融原力覺醒,2020數字金融峰會 圓滿落幕!
    來源:時刻頭條7月3日,Top智匯主辦的2020數字金融峰會在滬圓滿落幕!本次大會由上海市經信委軟體和信息服務業處指導,上海市軟體行業協會與中國雲體系產業創新戰略聯盟協辦,同時得到了上海首席信息官聯盟和上海國際金融與經濟研究院的大力支持。
  • 清華大學金融科技研究院副院長張曉燕:金融創新的根本是數據
    11月27日,2020北京國際金融安全論壇在北京金融安全產業園召開,本屆論壇主題為「新金融 新基建 新安全」。清華大學金融科技研究院副院長張曉燕出席論壇並發表演講。清華大學金融科技研究院副院長張曉燕  在張曉燕看來,數字經濟時代的金融科技對金融安全的挑戰和機遇並存。
  • 網際網路金融行為風險的表現、產生原因及治理對策
    上述行為風險表現,只是「中國式」網際網路金融企業經營中不當行為的一個縮影。在中國,網際網路金融產品如不能按期兌付,往往引發群體聚集事件,不僅對社會安全問題造成負面影響,也迫使政府部門及監管機構投入大量資源進行善後。
  • ...QFIN.US)首席科學家做客InfoQ大咖說:AI時代 誰是數據安全保衛者
    話題:360數科(QFIN.US)首席科學家做客InfoQ大咖說:AI時代 誰是數據安全保衛者   11月25日,360數科(QFIN.US)首席科學家張家興博士做客InfoQ《大咖說》欄目,在直播中分享 AI 技術在金融領域的落地現狀、普惠金融的整體邏輯和技術發展路線等話題。
  • 薩摩耶數科林建明:金融科技的未來,不在金融,在數字中國的全景
    數位化轉型從金融延展到各行各業,金融科技所具備的新興科技先發優勢,也迎來一個更大的機遇,即用科技賦能數字中國。近些年實體因數位化轉型需求而產生的市場缺口非常大,特別是疫情之後,零售、餐飲、教育培訓、醫療、製造業等場景急需線上化、智能化改造。這種數位化改造既包含內部治理數位化,又涉及對外服務的數位化,給金融科技服務商的業務拓展帶來諸多機會。