本文系中國建設銀行數據管理部總經理劉靜芳女士於11月29日上午在「2019智慧中國年會」分論壇——「數據治理與標準化研討會」上的演講,內容通過現場速記整理,未經本人審核。
「中國建設銀行數據管理部總經理 劉靜芳」
非常榮幸受邀給大家分享中國建設銀行作為一家國有大行在數據治理方面的實踐,以及在智慧政務方面對數據標準化的探索。
我們已進入數字經濟時代,大數據正顛覆傳統,帶來大變革、大機遇。整個社會環境變化日新月異、充滿不確定性,數據流開始引領人才流、資金流、物質流和技術流,這在很多領域已不再是趨勢而是常態;「得數據者得天下」,「經驗驅動」正向「數據驅動」轉化。
習總書記在2017年12月中共中央政治局第二次集體學習時強調「審時度勢、精心謀劃、超前布局、力爭主動,實施國家大數據戰略,加快建設數字中國」「善於獲取數據,分析數據,運用數據,是領導幹部做好工作的基本功」,可見數據的重要性;十九大四中全會,中央首次明確「『數據』可作為生產要素按貢獻參與分配」,數據與勞動、資本、土地、知識、技術、管理一起成為生產要素,這不僅僅是一種提法,也是真實發生的事情。
銀行作為一種數據密集型金融機構,對數據依賴度高。亞馬遜前任首席科學家說「數據是新的石油」,對銀行來說,數據是一種戰略資產,對戰略資產進行管理必然會構成一個組織的核心競爭力,數據是核心競爭力重要組成部分。建設銀行早已認識到數據治理工作對整個銀行業務發展、經營管理的重要支撐作用,並開展了諸多探索和實踐。我今天給大家分享的主要是兩方面:一是建設銀行數據治理實踐,二是政務數據標準化初步探索。
一、建設銀行數據治理實踐
(一)數據治理發展歷程
不同行業有很多共性的問題,數據治理就是其中之一。銀行是金融領域應用信息技術較早和較深的機構,因此建設銀行對數據治理問題的認識與整個信息化的進程密不可分。從上世紀80年代初開始單點業務電算化,建設銀行經歷了對數據治理「不關注、起步、打基礎、體系化、持續優化」的發展階段。建設銀行的數據治理實踐「起步」於對數據質量的關注,到最後建設完整的體系,經歷了十多年。2003年建設企業級數據倉庫,開始把「對數據內容的管控、對數據隱藏含義的解讀」從IT系統的部署過程中分離出來,成為獨立環節;2011年建設新一代核心系統,開始認識並確認數據可復用、可單獨管理、是一種新的生產要素。也就是說,建設銀行對數據治理問題的理解和認識也是一個不斷深化的過程。
(二)曾經面臨的問題
建設銀行的信息化發展走的是「分散化」開發道路,所以不可避免地出現了一些問題,比如:①缺陷。數據存在不完整、不準確、不及時、不一致、不安全、有冗餘等結構缺陷,難以利用。②冗長。系統林立、數出多門。雖有海量數據但可用信息缺乏,系統開發周期冗長,響應慢。③散落。知識領域分散、不統一、非全貌,系統功能弱、不開放、創新難,成果散落,難繼承、難擴展。這些問題造成建設銀行與未來發展脫節,難以參與網際網路時代的競爭,在「以客戶為中心」「敏捷性」「互操作性」等方面落後於一些新興行業的競爭者。
為此,建設銀行黨委高管層下定決心重構建設銀行的核心系統(涉及所有對客戶的服務、內部風險防控及整個運營體系等)。從2011年啟動重構到2016年11月份系統上線,歷時6年半(有專家預測需要14年),9000多人參與工程開發,積累了大量經驗。正是在新一代核心系統建設過程中,建設銀行對數據治理有了更深的認識和了解,建立起建行的數據治理體系。建行的新一代核心系統工程於2018年榮獲「人民銀行科技發展特等獎」,獲業界高度讚譽。
(三)數據治理目標
數據治理是通過規劃並實施一系列的政策、實踐和項目,對數據資產進行全生命周期管理,保障數據資產的質量和供應,為經營管理決策提供多形式的數據服務和應用支持。其最根本的目標是讓使用者在正確的時間、正確的環境、以正確的方式獲得正確的數據和服務,促進商業智能提升。
我們認為,數據治理包含數據管理和數據應用兩大體系。數據的管理和應用,分別對應數據的供給側和消費側。管理好兩大體系,才能共同搭建起我們的數據環境。最重要的是,我們要打破「找不到數據→隨意製造數據→不一致的數據→用戶不信任數據」的惡性循環,建立起「數據充分共享→按需增加數據→一致的數據→用戶信任數據」的良性循環。
(四)數據能力框架
既然是體系,必然存在架構。建設銀行的數據能力框架,是基於對DAMA等理論學習、實踐過程中的經驗提煉及建行實際總結出來的,指導著建設銀行推進數據治理工作。整個框架除了底層的技術環境(技術的實施支撐),還包括元數據管理、數據規範管理、數據安全、數據供應鏈、數據質量管理、數據管控機制、數據應用等內容。
(五)數據治理工作總體思路
建設銀行專門成立「數據治理委員會」,委員會主任由建設銀行行長擔任,辦公室設在建設銀行數據管理部。從管理視角來看,建設銀行的數據治理工作可概括為:業務數據化、數據資產化、資產價值化、價值最大化/數據業務化。整個數據治理按照數據價值鏈的全流程,形成了持續迭代提升的循環。
1、業務數據化
業務數據化,是指用數據來描述、表達、定義、度量業務,用數據形式量化經營管理全過程,規範、準確地記錄、保存和展示。
(1)制定企業級數據標準
建設銀行認為,實現業務數據化首先要制定企業級數據標準,從業務術語開始統一「語言」,制定數據標準,建立完整的數據規範,從源頭上保證數據一致性。已建成完整的企業級數據邏輯模型、數據標準、衍生數據視圖、業務術語、業務指標等數據規範,共8萬餘個數據項。而在整套企業級數據規範體系中,最核心的是企業級數據模型,因為數據和數據之間並不都是「並行」,中間會有「交叉」,它們之間邏輯關係的表達需要用數據模型。
建行在研究學習業界領先的行業數據模型基礎上,結合建行實際,搭建了自己的企業級數據模型——「CCBDM」, 對業務信息進行了規範化、概括性的描述,並包含對數據實體、屬性和數據項間關聯關係的定義;模型向上貫通業務視角(描述業務,讓業務部門都能理解),向下貫通技術視角(支持系統開發和設計),為A、B、C、C'、D五級(依次對應統一數據概念、規範業務術語、企業級數據模型、系統級邏輯模型、系統實現級物理模型),其中最核心的是滿足第三範式需求的C級模型。通過實施數據建模,為數據的互聯共享奠定基礎,為全行用數能力提升創造條件。
(2)數據供應鏈全流程管控
落地企業級數據模型CCBDM,包括數據「採集、傳輸、整合、應用」的全流程管控機制。採集階段按照數據標準採集,傳輸過程遵循標準接口互通,整合階段建立全景數據視圖,支持多種應用方式。從CCBDM的這張示意圖,我們可以看到,業務系統A、業務系統B和數據倉庫D系統是並行開發的,如何保證它們數據的一致性?就是把邏輯數據模型的C模型當成模板、約束條件和依據,來設計系統級的數據模型、定義資料庫。我們把每個數據項的英文縮寫欄位進行了統一規範的命名,不存在數據項命名重複,保證了A系統、B系統的數據模型都依賴於統一的源頭。數據規範,是約束信息系統開發,從根源避免數據質量問題的一種方法。
這種方法已在建設銀行核心系統中全部使用,好處是大大減少了數據關聯、整合等必須進行的清洗、轉換工作,因為從數據採集端開始就已遵守規範、符合標準。
2、數據資產化
數據資產化,是指建立並執行統一的數據規範,打通縱向橫向存在的數據壁壘,實現數據互聯互通,集成整合為高品質的可用資產。
(1)企業級數據倉庫集石成鑽
一個單獨的數據項或獨立的數字可能沒多大價值,但把它們關聯起來意義可能非凡,比如17和7,加上納米、晶片,含義就完全不一樣了。這就是數據關聯集成整合在一起的價值;又好比一堆碎石,把「碎石」關聯集成後,其價值就顯現出來了,可能成為「鑽石」。
我們認為,企業級數據倉庫是最強大的數據資產寶庫和引擎,通過打破數據孤島、打通數據壁壘,把不同源信息關聯整合變成可用的數據資產。我們的數據倉庫已涵蓋行內近2百個多組件系統結構化、非結構化數據;不僅包含範式化模型,從業務視角基於公共訪問數據還建立了多維模型,抽象出9大基礎維度,43個交叉維度;基礎指標1萬餘個,衍生指標1萬5千餘個;提供總分行業務用戶直接使用;全面落地我行新一代企業級C模型,從業務主題劃分,實體和屬性全面遵守規範,涵蓋我行所有業務數據。同時,也建立了元數據管理平臺、數據質量管理平臺,幫助建設銀行全面管理數據資產。
(2)建立數據管控體系
除技術支撐體系外,還必須建立完整的數據管控體系,才能保證資產保值增值,在「量」上不斷擴充的同時保證「質」。數據管控機制涉及政策、組織、技術、流程等,為數據管理核心領域(包括數據需求、數據規範、數據質量、數據安全、元數據、數據供應鏈等)提供保障和規範,同時配套進行風險管理、審計。總之,只有依靠完整的數據管控,數據資產才會可用、好用。
3、資產價值化
資產價值化,是指深入挖掘、分析各種類型的數據資產,研發數據產品,從中獲得洞察、預測能力,發現規律,支持業務經營管理。
(1)數據→知識→價值
數據資產應該能帶來價值,但數據只有在被應用時才能產生價值。從大量繁雜的數據中,洞察我們所不知道的情況、發現一些新趨勢等,就是數據挖掘和分析的工作。
2015年,建設銀行在上海建立了大數據分析中心,現稱「大數據智慧中心」,專門進行數據挖掘和分析。數據挖掘和分析確定的智慧因子:①量化,統一尺度(不能定義就不能測量,不能測量就不能管理),將相應數據關聯採集、集成整合;②洞察,在大量繁雜數據中發現現狀的真相;③預測,從中發現規律、預測未來趨勢,以便贏得競爭先機;④智慧,通過對數據的量化、洞察、預測來驅動行動決策。
大數據智慧中心的數據挖掘和分析致力實現四個智能:客戶智能、產品智能、風控智能、運營智能。客戶智能是洞察客戶需求,支持差異服務;產品智能是引導產品創新,強化綜合定價;風控智能是預測市場變化,有效預警風險;運營智能是支持流程優化,降低運營成本。
(2)豐富的數據應用模式
數據應用模式必須豐富多樣,才能讓數據發揮更大的價值。
(3)眾創眾惠的數據生態環境
要讓更多的人來使用,需要搭建眾創眾慧的數據生態環境,給不同的人提供適合的方式來獲取數據的訪問。例如,我們搭建的企業級數據應用平臺,就能根據不同的應用場景,及用戶對數據、工具掌握程度不同,提供多樣、靈活、自主的數據訪問方式,降低數據價值探索與發現的門檻。
4、價值最大化/數據業務化
價值最大化/數據業務化,是指推動數據產品和信息知識的廣泛共享、直達迭代、嵌入到業務流程中,便捷應用以獲得更大成效。
(1)成果共享
要價值最大化,一定是通過共享來實現。通過數據應用成果推廣共享,讓數據創造更大價值。建行企業級數據應用平臺支持自主定製數據模塊,通過應用商店的分享功能將先進數據應用成果在全行快速分享,使得「單點創新、全行受益」有了系統層面的有力保障;建立大數據成果快速複製推廣機制,依託大數據平臺,配合總行相關業務條線積極做好在全行範圍內的推廣複製工作;推進全行數據應用經驗交流分享,包括在全行層面組織高級研修班、數據應用培訓班、工作研討會等。
(2)公共數據產品
這裡介紹一個建行面向社會設計的公共數據產品——「龍信商」。為了解決房價高、房炒不住等住房租賃市場混亂問題,我們提出了住房租賃戰略(建設銀行三大戰略之一)。建設銀行通過利用自身數據,研發了「龍信商」,用評分高低代表誠信程度,增加租戶和房主之間的信任。當然前提是取得客戶授權。目前「龍信商」已取得註冊商標,已經較好在多個場景中應用。
(3)服務社會需求
在大數據挖掘和分析方面,我們還提煉了住房價格指數、住房租賃指數、普惠金融指數等一系列大數據產品。建行住房價格指數和住房租賃指數真實地反映一定時期全國住房銷售和租賃市場價格總水平變動趨勢和變動程度。
(六)數據治理實踐得到業界認可
建設銀行的數據治理實踐,得到業界的廣泛認可。比如,我們參與了國標的《數據能力成熟度評價模型》的制訂,也受邀參與了銀保監會《銀行業金融機構數據治理指引》的編制研討。另外,我行的「大數據驅動小微業務價值提升項目」獲得了《亞洲銀行家》雜誌頒發的「亞太最佳數據分析項目獎」等等。
二、政務數據標準化初步探索
(一)履行社會責任,支持智慧政務建設
建設銀行積累了先進科技研發能力、方法論,具備一支金融科技隊伍。我們主動承擔社會責任,助力智慧政務的建設。在智慧政務方面,已籤約的各級政府有195個,覆蓋180個省市縣地區。同時,網際網路+不動產、網際網路+監管等領域我行都有參與。
(二)設計政務數據模型,支持政務數據標準化
我們把國家政務服務標準、政務服務數據接口、不動產抵押登記、網際網路+監管、公租房數據標準等信息歸攏在一起,按照建行C模型的建模方法,建設了GSDM(政務服務數據模型)。
政務數據模型GSDM依據國務院辦公廳電子政務辦公室發布的政務服務數據標準,結合建行智慧政務相關的政務事項數據接口、不動產抵押登記、網際網路+監管以及公租房數據標準等數據需求,進行綜合分析,將政務數據歸納為五大類主題概念域,政府機構(參與方)在什麼地點(地理位置)受理了誰(自然人或法人)哪個行政業務(政務事項)的申請(行政辦件+辦件文檔)。所有的政務相關數據都可以分配到這五個數據概念域中。目前,設計的政務服務數據邏輯模型已包含200多個實體,3400多項屬性。
本世紀初,為了提升聯邦政府服務於民的能力,美國政府提出一套聯邦企業架構參考模型來指導其電子政務戰略實施。這套架構模型包括績效、業務、服務、數據、技術五個子模型,是政府規劃和實施各類電子政務的參考基礎;其中數據參考子模型通過數據描述、數據背景、數據共享等內容模塊來實現數據標準化,以促進聯邦政府能夠跨機構識別、使用和共享數據和信息。我們的政務數據模型GSDM,其內容類似於聯邦數據參考模型,但比它的內容更細、更全,包括政務事項數據的定義,對數據的含義、取值、格式等進行明確定義。政務數據模型中數據的取值、格式等內容就為政務數據共享制訂了基礎標準,促進數據的互聯互通和共享;政務模型中的數據,與政務事項結合在一起,就可對關鍵政務數據進行了分級、分類,從而方便地確定可信數據源和進行數據部門認責。另外,政務數據模型還為政務大數據中心進行數據收集、整合,政務數據倉庫建設提供了模型參考。因此,借鑑建行的實踐來看,政務數據模型對於促進智慧政務建設有著非常大的價值。
(三)探索政務數據價值,助力營商環境
在助力智慧政務建設過程中,建設銀行也與很多國家部委、省農委等有合作,比如我行與某部委聯合建立大數據實驗室來探索其部數據的價值;與某市政府大數據中心嘗試構建市民信用體系;與某省農委創新「智慧鄉村」系列普惠金融產品;支持某省政府建立監管數據平臺,探索提升社會治理的水平等。
(四)建設銀行數據治理工作體會
在數據治理工作開展過程中,建設銀行是有一些深刻工作體會的:一是高層推動,頂層設計;二是標準先行,持續管控;三是責任落實、機制保障;四是數據素養,文化建設。管好數據,用好數據,讓數據帶來更大價值,建行願意與各位攜手合作、一起努力,為國家治理現代化作出貢獻。我的分享就到這裡,謝謝!
申明:本文版權歸國脈互聯所有,未經許可不得轉載。轉載請聯繫授權。
附:國脈「一網通辦」核心支撐系統(GDBOS),助力數字政府建設
數字政府2.0作業系統、政務數據體系2.0基礎標配、政務服務一體化升級方案。又名「政府數據業務作業系統」(GDBOS), 是基於國家有關政策要求、各地實踐經驗、數據體系理論、微服務技術架構,圍繞「大數據、大系統、大平臺」融合一體思路,為各地數字政府升級而量身打造的一套作業平臺。運用數據體系、標準治理、業務再造、組織進化等工具和方式,可從結構、標準、模塊架構上對當前政務服務平臺體系進行優化、重組和升級。有效適配部委、省、市、縣(區)不同層次需求,支撐數據整合共享、政務流程再造和服務模式升級,全面提升政務服務能力,夯實數字政府基礎,為國家治理能力現代化提供重要支撐。
依託"產品+數據+標準"框架,構建"標準支撐、數據體系、業務再造、數據治理、管理賦能"五大體系,無縫銜接既有業務系統,有效驅動政務服務整體運作:①落腳在「辦成」,把政務數據歸集到一個功能性平臺,企業和群眾只進一扇門就能辦成不同領域事項;②綜合提升政府政務服務、數據整合與治理能力,並最終實現數位化轉型升級與智慧組織進化。
註:獲取更多會議資訊及嘉賓演講資料,歡迎登錄「2019智慧中國年會官網」。