12月19日,創業邦100未來商業峰會暨2019創業邦年會在北京四季酒店舉行,ThoughtWorks中國首席金融數據科學家常國珍發表了「價值導向的金融數據治理」為主題的演講。
1.幹數據的人員需要有個特點,脾氣要好,因為你發現哪個跟你對接的人脾氣都比你差。
2.數位化無非就是把那些存在於個人腦子裡的隱性知識顯性化,顯性知識固化在系統中,讓系統吸收業務人員的智慧。
3.數據治理目的就是讓我們的數據更好用,我們說數據治理好就是數據治理要體現商業的價值。
大家上午好。我們知道,世界上唯一不變的就是變化本身,因此變革管理是商業永恆的話題。
變革管理的兩個重要工具便是數據資產管理和精益流程管理。
前者使得機構「知炎涼,知利害「,後者使得機構明白自身特點,做到上令下達,這裡我們只說前者。「知炎涼「是一個下情上傳的過程,從業務數據採集到數據挖掘模型實現洞察,為組織的決策機構提供制定策略的依據。比如在根據客戶提供的信息預測出如果賒銷或授予貸款後違約的可能性。」
知利害「是組織中各級管理者分析決策過程,經常需要結合各種報表和可視化工具進行決策支持。報表體系是對最終經營指標的逐級拆分,比如著名的杜邦財務分析體系,將製造業企業的資產收益率這個最終企業價值衡量指標拆解為由收入、成本和周轉率組成的業務部門可操縱的KPI指標。又比如,在信貸業務中,將產品利潤率拆分為貸款利率、獲客成本率、審批通過率、不良率等。最低層次的指標,比如不良率指標,可以通過上面提到的數據挖掘模型對每個申請者未來的不良率進行預測。
策略制定者根據每個潛在貸款用戶的不良率的預測值,以產品總的利潤率最大化為目標,對申請者進行取捨。說到這裡,讀者就明白了數據人的兩個基本工作,那就是製作匯報報表和建立數據挖掘模型。如下圖所示,左側的任務是對接各數據源,根據業務部門認可的標準,核定數據質量和含義,根據計算方法製作報表,供決策人員使用;右側的任務是對每個用戶、產品和渠道打標籤,在業務主題之下建立算法模型並根據每個個體的預測值過濾名單,並在決策引擎中配置相應的業務執行策略,實現信貸審批或精準營銷自動化,最後還有評價閾值選取和策略的執行效果,作為下一步優化的依據。
以上說的應用點比較抽象,下面列舉一下數據挖掘的常見業務場景。
客戶智能主要是基於對客戶的洞察,以實現客戶全生命周期價值提升為目的的分析場景。比如在初次獲客時識別高價值客戶,並進行重點營銷,提高單客價值。這裡的風險智能指的是狹義的信貸風險,主要是指授信業務前識別出申請者的還款意願、還款能力和真實意圖,降低違約成本。財務智能則是關注機構資金的運行效率和流動性安全,需要對宏觀和行業指標進行精確預測,合理分配資金資源,降低無效配置成本。運營智能可以識別並發現不合理事件,降低操作風險的成本。
數據資產在為企業提供價值的時候,會遇到很多問題,主要表現為以下三點:
1)部門各自為政,數據反覆清洗加工、分析工具重複採購、挖掘成果小範圍使用、先進經驗未能共享;
2)數據割裂:管理條線間數據割裂、數據來源間未能打通、數據脫敏後喪失價值,比如我們在做洗錢交易識別時發現交易對手的唯一標示全部是星號,這就是選取了錯誤的脫敏方式導致的不可恢復的錯誤後果;
3)缺乏系統性管理:缺乏全面的圍繞客戶、風險、運營、財務等全面規劃分析場景,執行過程隨意,流程體系不健全,保障不到位,數據和模型資產流失嚴重。
數據治理便是為數據資產保值增值而服務的。
其目標是消除歧義、減少數據孤島,降低數據使用成本,提高對業務的響應,提高對數據隱私安全保護。
實施數據治理可以為數據管理提供可信任的數據,減少數據重複,增強業務和IT對於數據的信心,改善數據的及時性和可用性,建立通用的數據詞彙表,以確保訪問正確的信息,定義企業範圍(或站點/項目範圍)的值以獲取公共參考數據,提供信息和指導,以協助有關數據的合規性和監管工作。
過去提到數據治理,更多的被認為是IT部門的事,其實不是這樣的。
就拿數據質量舉例吧,數據來自業務,它產生於業務,獲取自業務系統,數據質量標準也是業務部門訂的,數據人只是幫業務人員落地質量檢驗,但是數據有質量問題,是不能直接解決的。業務部門如果不太關心數據質量,比如說最近金融監管部門對洗錢行為監管更嚴格了,很多銀行希望買套系統或者寄希望於AI算法識別洗錢行為,但是很多金融機構對最基本客戶信息還不了解,連客戶基本的聯繫方式和地址都存在大量缺失,這很難保證客戶的真實性。
舉個例子,一間屋裡註冊了六家公司,這些公司肯定是空殼公司。數據質量如果由IT負責很難滿足要求,因為業務人員辦理業務的時候根本不去核實這個地址的真實性,地址寫不寫他都不太關心。把數據質量提升的工作壓到IT人員根本解決不了問題。
數據治理在國外自上世紀80年代應企業自身數據資產管理訴求而內生發展起來。我們企業最早於2003年提出數據治理概念,之後銀行業應監管要求,自2005年逐步加強對數據治理的重視和投資力度。取得了豐碩的成果,但是往往帶有「運動」的特徵。一提到數據治理,更多的是關注自頂向下的制度設計,而忽視自底向上業務的驅動。很多時候是IT閉門造車,還提出基於IT架構的數據治理。
感覺這很專業啊,但是我舉個例子,比如我今天想吃飯了,得看看家裡有什麼菜,至於符不符合口味不知道,有什麼就吃什麼。
這是基於IT架構的數據治理,只管盤點現有系統和現有數據。這個方法確實有其用處,但是不應該作為數據治理的主導。因此,以往的數據治理經常出現有數據治理組織架構,卻無合適的人到崗;有數據標準等規章制度,而在新舊系統上無法落地。
因此,ThoughtWorks數據智能事業部呼籲國內企業回到價值導向的數據治理的初心,提出精益數據治理,不僅從上至下,並且自底向上,圍繞業務場景,以價值驅動數據治理的具體體現。
精益數據治理講求價值驅動,圍繞場景,減少浪費,持續改進。
體現為以下五個特點:
1)從業務願景出發識別價值,在適當的時間為內部客戶提供價值是精益數據治理的關鍵要求,通過對齊業務戰略和目標來識別有價值的數據利用場景。
2)構建價值流,識別出場景後,在源數據和場景之間建立價值流,價值流是將產品或服務帶給用戶所需的資源和信息流,需要構建和改進價值流,避免浪費。
3)使價值從源頭流向用戶,「流」使價值能夠以經過最少的階段和活動便能交付,無縫流是精益數據治理的關鍵要求。減少浪費是精益數據治理的重要策略,我們發現,所有的數據質量的問題,都能夠與精益思想的7種浪費一一對應起來,解決了數據生產的浪費問題,就大部分解決了數據質量問題。
4)拉動價值流,只有在內部客戶有需求時,流程才能運行,此階段強調僅在有需求時才需要響應。
5)不斷迭代,精益求精,持續改進以追求完善,實現可持續變革。
ThoughtWorks數據智能事業部根據多年輔導企業數位化轉型的實踐,推出價值導向的數據治理實施路徑。
其有三點異於傳統數據治理實施路徑:
1)以數據探查代替需求訪談。
精益數據治理是以在數據應用為綱,但是在數據治理初期,企業管理人員對數據應用的價值認識是模糊的,有些只是一些想法,往往難以指導數據應用規劃的制定。因此我們借用敏捷開發的工具,創造出精益數據探索工作坊,幫助企業構建數據驅動的創新戰略,發現數據創新場景,驗證和制定數據應用創新計劃;
2)IT部門數據中臺敏捷開發。
以往數據治理往往分為諮詢、落地等多個階段,並且把數據標準落地、質量監控這些重要任務留給甲方自行完成。根據我們的觀察,數據標準落地部門往往缺乏新IT系統上線評審的話語權,導致有標準無法落、無人落、無力落的尷尬局面。數據治理平臺的快速建設是治理制度落地的有力保障,實現端到端的快速落地,體現治理成果;
3)業務部門開展數據賦能,能力提升大比拼,以「用」促」治」。
數據資產管理講求「看選用治評」,其中「選」是難點。業務人員從拍腦袋做事到用數據說話,這是一個能力和意願的組合問題。因此我們在數據治理同期提供數據分析人才培訓(含認證)和內部項目實訓,解決分析能力短缺和實際項目經驗匱乏問題,並且結合內部數據分析項目評優,激發業務人員用數據的熱情。解決數位化賦能過程中數據人才選拔缺標準、難動員、分工不明的問題,得到一舉多得的功效。避免數據治理業務效果不明確時一開始自上而下命令導致業務部門的消極態度,IT部門自說自話、數據治理團隊脫離業務運轉的尷尬狀況出現。