騰訊雲胡利明:金融機構分布式資料庫轉型的要點和路徑

2020-12-16 中國電子銀行網

近日,《金融科技時代》(2020年第5期)刊發了騰訊金融雲總經理胡利明的專題文章——《分布式資料庫在金融行業的應用和展望》,文章全面回顧了資料庫技術的形成過程、分布式資料庫的分類以及雲原生資料庫對分布式資料庫發展的影響,深入分析了金融機構分布式資料庫轉型需關注的要點和轉型的主要路徑,詳細闡述了分布式資料庫應用於金融行業的主要發展方向,最後介紹了騰訊雲在分布式資料庫領域的技術探索和實踐,包括分布式資料庫TDSQL、分布式HTAP資料庫TBase。

騰訊金融雲總經理 胡利明

以下正文是重點內容的摘要:

一、資料庫技術的發展歷程和主要分類

目前資料庫技術的發展經歷了三個階段

第一階段是系統層次和網狀資料庫管理系統,主要代表是IBM公司在1969年研製出的層次模型資料庫管理系統;第二階段是系統關係資料庫管理系統,IBM公司的研究員E.F.Codd在題為《大型共享資料庫數據的關係模型》的論文中提出了資料庫的關係模型,Oracle基於關係型資料庫的技術進步打造了Oracle資料庫系統;第三階段是新一代資料庫技術的研究和發展,一是在資料庫的模型建立方面出現了面向對象的資料庫模型,二是傳統的資料庫技術和其他計算機技術的結合、互相滲透,建立和實現了一系列新型的資料庫,如分布式資料庫、並行資料庫、演繹資料庫,三是面向專門應用領域的資料庫技術不斷產生,在傳統資料庫基礎上結合特有應用領域和場景,出現了如工程資料庫、統計資料庫、科學資料庫、空間資料庫等。

分布式資料庫主要分為以下三種類型

一是分片式(Sharding),分片式是在傳統單機資料庫上進行數據分片,通過業務層或者一個中間路由層(Proxy)將不同的請求發送給不同的資料庫實例。分片為了滿足資料庫架構要求而犧牲業務層的應用性能和靈活性。

二是共享存儲(Shared-everything),分為SharedDisk和SharedLog。SharedDisk是將多個資料庫引擎節點底層掛載在一個共享的存儲系統上,各個資料庫引擎都可以看到所有的數據,在多個資料庫引擎實例之前加載一個類似負責均衡的資料庫代理層,將資料庫負載分布到不同的引擎上,從而達到擴展整個資料庫系統處理能力的目的。SharedLog是面向雲端的分布式存儲設計的分布式資料庫,通過利用分布式存儲的優勢,將資料庫日誌和分布式存儲結合,實現資料庫日誌的一致性和高可用性,日誌落地後其他數據再通過緩存逐漸落地,通過這種方式提高資料庫的處理能力。

三是純分布式架構(Shared-nothing),純分布式架構是目前業界最新的全分布解決方案,具有單點、無中心、無限平,在資料庫領域是非常有利的特性,同時具備自動分片,無關聯的請求沒有公共的依賴路徑。

二、分布式資料庫轉型需要關注的要點

金融行業大量使用了傳統的集中式資料庫,並具有長期運維的經驗,如何快速有效地實現從傳統的集中式資料庫轉型到分布式資料庫,成為金融機構必須面對的新課題。在啟動分布式資料庫轉型之前,金融機構需要關注以下要點:

一是系統適配。分布式資料庫通過將資料庫處理的任務分散到多個處理節點上來達到提高性能的目標,所以在原有的業務邏輯上要進行相應的適配,對業務系統進行分層解耦,確定應用層、服務層及數據層的邊界,以適應系統彈性擴展的需求。

二是數據分區。分布式資料庫要對數據進行分區,比如按照時間做Range分區、按照記錄的某個特徵值做Hash分區。保持每個分區的大小適中,才能更好的實現系統的負載均衡、調度以及擴展性。

三是並行處理。充分理解分布式資料庫的工作邏輯,從業務上要儘量利用分布式的並行處理能力,將不同的任務並行處理,從而提高整體效率。同時要理解分布式帶來的是整體效率的提升,針對具體的處理邏輯在低負載的情況下不一定比原有的集中式資料庫效率更高。

三、金融機構分布式資料庫轉型的路徑

一是按照先增量後存量順序。

對於網際網路跨界融合等增量業務,因為安全性要求較低,不會發生金融安全風險,可以先行替換試驗。當新上線分布式事務資料庫能夠滿足業務需求,並且相關業務人員已經適應相關操作方法和模式後,通過切割流量的方法逐步對存量的核心業務進行替換。在存量業務替換的同時,需要同時維護原系統的備份作為災備方案,當新系統穩定運行得到驗證後,逐步下線原系統。

二是按照業務性能瓶頸順序。

分布式事務資料庫會提供強大的吞吐/處理能力,金融機構可對當前各類業務性能瓶頸進行分析評估,找出急需分布式事務資料庫方案解決瓶頸問題的業務,按照一定的優先級順序,逐輪進行流量分割處理,在緩解現有業務壓力的同時,驗證新系統的各項能力,層層遞進。

三是按照業務不同的技術實現類型規劃。

金融機構的業務紛繁複雜,各類業務對信息系統的技術要求並不相同。例如轉帳業務主要要求大並發的事務能力,批量計提結息業務要求大規模數據的並行處理能力,日誌分析要求實時大規模數據的分析能力。所以金融機構可以按照不同業務對技術的要求安排改造順序,從而逐步驗證分布式事務資料庫能力。

四是注重知識儲備和傳遞。

分布式資料庫在業界處於實踐起步階段,金融機構應用分布式資料庫,需要在實施階段首先進行深入的知識傳遞和過渡。

四、騰訊雲分布式資料庫的探索和實踐

·分布式資料庫TDSQL

TDSQL是騰訊基於MySQL/Mariadb社區版本的基礎之上打造的一款面向金融行業的分布式資料庫。在內核層面,TDSQL針對MySQL社區版本和Mariadb社區版本的內核做了深度的優化,通過對數據複製模塊進行多線程的改造,使得TDSQL具備了一主多從的數據強一致同步能力,極大地提升了數據安全性和整體能力的可擴展性。相對原生內核的半同步複製機制,TDSQL強一致複製的性能也有極大提升,具備主備強一致切換與秒級恢復、自動化監控與運維等特點。

TDSQL提供了noshard與shard兩種使用模式

Noshard模式,就是單實例模式,不做自動的分庫分表,在語法和功能上完全兼容於MySQL,缺點是只支持垂直擴容,這會受限於單實例伺服器的性能和容量上限,無法進行水平擴展。

Shard模式即AutoSharding模式,通過TDSQLSQLEngine模塊,實現資料庫的Sharding和分布式事務功能,底層的數據打散在多個資料庫實例上,對應用層還是統一的單庫視圖。Shard模式可以實現容量和性能的水平擴展,通過兩階段XA支持分布式事務和各種關聯操作。

TDSQL對內支撐騰訊公司近90%的金融、交易、計費類業務,2014年TDSQL首次嘗試對外輸出,成功應用於微眾銀行的核心系統,開始商業化探索。2019年TDSQL成功應用到張家港農商行新核心系統,成為國內第一家投產於銀行傳統核心系統的分布式資料庫,這是TDSQL又一個裡程碑式的發展。到目前為止,TDSQL已全面應用於國有大型商業銀行、股份制商業銀行、城市商業銀行和農村商業銀行等各類型的銀行

·分布式HTAP資料庫TBase

Tbase是騰訊雲基於PostgreSQL內核打造的一款分布式資料庫,經過騰訊內部多年業務的打磨,在2017年更名為TBase後,正式對外推出。TBase以其功能強大、運行穩定、高性能高可靠性的特性得到用戶的普遍認可,目前已在金融、政務、醫療、公安、消防、電信等行業的解決方案中大量應用。

TBase的核心能力如下:

一是具備HTAP能力(即事務和分析混合處理技術),Tbase經過專門的設計很好地做到了HTAP,同時具備高效的OLAP能力和海量的OLTP處理能力。Tbase系統可以支持每分鐘完成的事務量超過310萬,系統的事務吞吐量會隨著集群規模準線性提升。

二是支持企業級特性,業務無需關注資料庫的事務特性,Tbase資料庫內核支持完整的分布式事務,保證事務的ACID,同時具備良好分布式查詢支持能力、高效的在線線性擴容能力。當前Tbase能夠兼容SQL2003標準,同時還能夠兼容常見的ORACLE語法,可以方便ORACLE深度用戶的遷移。

三是數據安全能力強,TBase設計了全面的數據安全體系,一是三權分立,把資料庫系統dba的角色分解為三個相互獨立的角色,安全管理員,審計管理員,數據管理員,這個三個角色之間相互制約;二是強制安全規則,通過安全管理員制定的強制安全規則,可做到行級可見和列級可見,進而限制用戶看到的數據,對不同的用戶做到權限的行列混合控制。三是透明數據脫敏管理,TBase實現了業務的透明脫敏,業務只需要根據自己的業務規則結合TBase的脫敏語法,設計業務邏輯,TBase內部就可以做到數據的脫敏;四是審計能力,Tbase設計了自己的審計系統,在內核中實現了審計的核心功能,做到在兼顧高精準的審計粒度的同時還能保證系統的性能。

原載《金融科技時代》(2020年第5期),經作者授權發布!


責任編輯:王超

相關焦點

  • 胡利明:金融機構分布式資料庫轉型的要點和路徑
    本文轉自【TechWeb】;近日,《金融科技時代》(2020年第5期)刊發了騰訊金融雲總經理胡利明的專題文章——《分布式資料庫在金融行業的應用和展望》,文章全面回顧了資料庫技術的形成過程、分布式資料庫的分類以及雲原生資料庫對分布式資料庫發展的影響,深入分析了金融機構分布式資料庫轉型需關注的要點和轉型的主要路徑,詳細闡述了分布式資料庫應用於金融行業的主要發展方向
  • 騰訊金融雲:新基建+新連接,助力銀行數位化轉型
    近日,騰訊金融雲總經理胡利明接受了《財資中國》的專訪,基於騰訊金融雲近幾年的業務發展歷程,向我們介紹了未來騰訊金融雲業務戰略方向,聚焦金融新基建與數字新連接,為銀行等金融機構打造面向未來金融場景與金融業務創新的技術支撐體系;同時發揮騰訊金融雲客戶端和產業端豐富的生態場景,以及自身技術優勢和網際網路運營經驗,賦能銀行業務場景打造,提升與用戶的連接能力,以科技助力銀行數位化轉型。
  • 騰訊和平安有何不同?騰訊金融雲胡利明:騰訊的定位主要是在底層
    圖為:騰訊金融雲總經理胡利明在圓桌對話環節,上海高級金融學院實踐教授胡捷表示,像騰訊來自科技企業,現在進入了金融企業,和平安這樣的傳統公司是沿用了不同的路徑,但都是奔著同一個目標在前進,那各自肯定都有自己的優勢和挑戰
  • 騰訊雲攜手長亮科技,國產分布式「資料庫+核心應用」落地崑山農商...
    據了解,該系統將採用長亮科技最新「微服務+單元化」架構核心系統建設方案,並將國產分布式資料庫騰訊雲TDSQL作為核心系統承載,有效解決傳統集中式核心系統性能瓶頸,提升高可用性和動態擴容能力。此外,基於騰訊雲完善的數據技術培訓體系和專家認證機制,騰訊雲將持續為崑山農商銀行提供資料庫開發、運維等方面知識轉移和專業人員培養,能夠支撐崑山農商銀行運行更多高質量的各類銀行分布式應用。目前,分布式資料庫已經成為金融行業IT建設中一項重要的基礎技術趨勢。
  • 騰訊金融雲業務戰略升級,一次性秀出技術和流量的「肌肉」丨2020騰訊全球數字生態大會
    9月10日,在騰訊全球數字生態大會金融專場上,騰訊雲宣布升級金融雲業務戰略,立足於金融行業全面數位化轉型趨勢,未來將聚焦金融新基建和數字新連接,助力金融機構打造面向未來金融場景的技術底座,支撐業務持續創新。
  • 打破Oracle獨大局面 金融機構加速資料庫轉型
    金融業資料庫再迎重大進展。9月27日,北京商報記者獲悉,中國工商銀行開始採用螞蟻自研資料庫OceanBase,對公(法人)理財系統完成從大型主機到OceanBase分布式架構的改造。此外,騰訊雲也自研了金融級分布式資料庫產品TDSQL,微眾銀行已實現核心系統資料庫軟硬體全國產化。
  • 打破Oracle獨大局面,金融機構加速資料庫轉型
    9月27日,北京商報記者獲悉,中國工商銀行開始採用螞蟻自研資料庫OceanBase,對公(法人)理財系統完成從大型主機到OceanBase分布式架構的改造。此外,騰訊雲也自研了金融級分布式資料庫產品TDSQL,微眾銀行已實現核心系統資料庫軟硬體全國產化。在業內人士看來,當前,金融機構資料庫轉型方面動作頻頻,打破Oracle(甲骨文)的壟斷,對於完善自身業務布局、擴大營收方面具有積極意義。
  • 深證通新一代金融雲正式上線,騰訊雲助力打造證券行業新基建
    作為證券行業的數字新基建,深證通新一代金融雲將面向證券行業提供包括IaaS、PaaS以及行業SaaS在內的全棧雲服務,助力深交所集團、證券金融機構和監管機構降低金融科技創新門檻,應對業務發展挑戰,加速數位化轉型升級。深交所總工程師喻華麗,深證通董事長劉江紅、總經理王海,騰訊公司副總裁、騰訊雲總裁邱躍鵬,騰訊金融雲總經理胡利明出席線上發布會。
  • 大型機下移,國產分布式資料庫上線,金融機構技術安全可控邁出關鍵...
    據業內人士透露,平安銀行這一突破性的成就背後也有科技企業的助力,在新系統研發過程中,騰訊雲自主研發的金融級分布式資料庫TDSQL提供了技術支持。包括TDSQL團隊與平安銀行團隊針對銀行高可用要求,聯合研發了跨DCN容災高可用系統架構的解決方案,以及針對銀行微服務場景,聯合研發數據同步運維方案,打造新一代A+核心系統。
  • 騰訊雲升級金融雲業務戰略,聚焦新基建與新連接
    來源:環球網9月10日,在騰訊全球數字生態大會金融專場上,騰訊雲宣布升級金融雲業務戰略,未來將聚焦金融新基建和數字新連接,助力金融機構打造面向未來金融場景的技術底座,支撐業務持續創新;並結合騰訊豐富的用戶端和產業端生態場景以及網際網路運營經驗,幫助金融機構升級服務模式和場景,打造無處不在的用戶連接能力。
  • 微眾銀行核心資料庫實現軟硬體國產化,背後英雄是騰訊雲TDSQL
    本網5月22日訊 目前微眾銀行在銀行業內首次實現了核心系統資料庫軟硬體全國產化。具體而言,騰訊雲自研分布式資料庫TDSQL日前與國產ARM伺服器平臺完成適配互認證,微眾銀行率先將支撐中間業務支付系統的TDSQL資料庫,從X86伺服器平臺遷移到國產ARM伺服器平臺。
  • 騰訊雲推出企業級分布式資料庫TDSQL
    北京商報訊(記者 魏蔚)12月24日,騰訊雲宣布,未來騰訊雲原有的TDSQL、TBase、CynosDB三大產品線將統一升級為「騰訊雲企業級分布式資料庫TDSQL」。騰訊雲TDSQL將涵蓋分布式、分析型、雲原生等多引擎融合的完整資料庫產品體系。
  • 騰訊雲資料庫品牌升級「企業級分布式資料庫TDSQL」引領技術前沿
    12月24日,騰訊雲正式宣布其資料庫品牌TDSQL的全新戰略升級計劃及未來發展戰略。未來,騰訊雲原有的TDSQL、TBase、CynosDB三大產品線將統一升級為「騰訊雲企業級分布式資料庫TDSQL」。全新升級後的騰訊雲TDSQL將涵蓋分布式、分析型、雲原生等多引擎融合的完整資料庫產品體系。
  • 騰訊雲資料庫客戶數超50萬,攜手合作夥伴共建資料庫生態
    騰訊雲將持續提供更加優質的雲資料庫服務,攜手合作夥伴,助力更多企業數位化、智能化轉型。騰訊雲資料庫矩陣不斷完善林曉斌透露,騰訊雲資料庫的客戶中不乏擁有超過1萬個資料庫實例的存在,這樣的服務規模對客戶運維團隊和雲資料庫服務團隊來說都是不小的挑戰。雲資料庫已經進入智能化和去服務化時代。
  • 騰訊雲資料庫品牌戰略升級 「企業級分布式資料庫TDSQL」亮相
    12月24日,騰訊雲正式宣布其資料庫品牌TDSQL的全新戰略升級計劃及未來發展戰略。未來,騰訊雲原有的TDSQL、TBase、CynosDB三大產品線將統一升級為「騰訊雲企業級分布式資料庫TDSQL」。
  • 崑山農商銀行啟動新一代核心系統建設,資料庫採用騰訊雲TDSQL
    據了解,該系統將採用長亮科技最新「微服務+單元化」架構核心系統建設方案,並將國產分布式資料庫騰訊雲TDSQL作為核心系統承載,有效解決傳統集中式核心系統性能瓶頸,提升高可用性和動態擴容能力。此外,基於騰訊雲完善的數據技術培訓體系和專家認證機制,騰訊雲將持續為崑山農商銀行提供資料庫開發、運維等方面知識轉移和專業人員培養,能夠支撐崑山農商銀行運行更多高質量的各類銀行分布式應用。目前,分布式資料庫已經成為金融行業IT建設中一項重要的基礎技術趨勢。
  • 金融企業選擇與應用分布式資料庫的7個核心問題
    接手騰訊分布式資料庫以來,主要負責騰訊雲分布式資料庫功能策劃、市場能力建設、服務支撐能力建設和團隊建設等。 大家好,我是來自騰訊雲的蘇強。從騰訊雲分布式資料庫商用那天起,我就在分布式資料庫團隊裡,所以可以很自豪地說,我是最了解騰訊雲分布式資料庫的人之一。今天我將和大家分享近兩年來分布式資料庫在金融行業裡真實應用的細節與核心。
  • 騰訊雲資料庫客戶數超50萬 攜手合作夥伴共建資料庫生態
    騰訊雲將持續提供更加優質的雲資料庫服務,攜手合作夥伴,助力更多企業數位化、智能化轉型。在此次資料庫專場上,騰訊雲還重磅發布了基於黑石一體化框架結構,集成了騰訊雲強大的硬體技術產品能力和公有雲上最成熟的分布式資料庫TDSQL的一體機櫃,讓企業在本地IDC環境下即可獲得與公有雲上一致的雲資料庫產品體驗,實現金融級分布式資料庫的輕鬆部署和運維。
  • 服務客戶數超50萬,騰訊雲資料庫優勢持續領先
    騰訊雲將持續提供更加優質的雲資料庫服務,攜手合作夥伴,助力更多企業數位化、智能化轉型。 騰訊雲資料庫矩陣不斷完善 林曉斌透露,騰訊雲資料庫的客戶中不乏擁有超過1萬個資料庫實例的存在,這樣的服務規模對客戶運維團隊和雲資料庫服務團隊來說都是不小的挑戰。
  • 騰訊雲再次打破國外壟斷!圖資料庫TGDB為國產資料庫爭光
    6月1日,騰訊雲正式發布分布式圖資料庫產品騰訊雲數圖TGDB(Tencent Graph Database),這款資料庫能夠實現萬億級關聯關係數據實時查詢,打破了國產資料庫的技術&34;。更令人欣喜的是,TGDB的推出打破了主流圖資料庫被國外廠商壟斷的現狀!