微眾銀行區塊鏈開源數據治理通用組件 WeBankBlockchain-Data

2020-12-23 開源中國

隨著信息化、數位化、智能化的進程加速,特別是後疫情時代,數據在全球經濟運轉中的價值日益凸顯。今年三月底,數據更是被作為一種新型的生產要素寫入中央文件,與土地、勞動力、資本、技術等經典生產要素並列。

數據最終的價值來源於治理。只有經過採集、清洗、分析和處理後的數據,才能在流通中更順暢地使用,其價值才能得到更充分地挖掘。同時,隨著區塊鏈技術的蓬勃發展,區塊鏈漸趨規模化應用,鏈上數據總量呈指數級增長,其中蘊藏的巨大價值,也需要通過高效、規範的數據治理,才能得到充分彰顯。

微眾銀行區塊鏈在多年技術研究和應用實踐的基礎上,積極分析、總結行業需求,研發了一套數據治理通用組件(WeBankBlockchain-Data)解決區塊鏈數據治理的技術難題,多維提升開發、運營、運維效率。

目前,WeBankBlockchain-Data已在金融、公益、農牧產品溯源、司法存證、零售等多個行業落地和使用,歷經多個內外部生產環境項目的打磨,不斷以「輕量化、模塊化、通用化」的設計哲學進化,具備處理海量數據、高可用、可審計等能力。

為助力全行業夥伴提升區塊鏈數據治理的效率,實現數據從要素到資源的轉化,我們秉持一貫開源開放的理念,將WeBankBlockchain-Data面向社區和公眾完全開源,誠邀各行業夥伴攜手共建區塊鏈數據治理體系,為數據價值的全面釋放提供有效路徑。

數據治理通用組件解決什麼問題?

在區塊鏈底層和區塊鏈應用之間,橫亙著一條區塊鏈技術、業務和產品的鴻溝,存在著區塊鏈數據擴容難度大、鏈上數據難以查詢和分析、典型場景缺乏通用化產品或組件支持等多種挑戰。

社區也經常會有朋友問到:

區塊鏈節點伺服器的磁碟快滿了,該怎麼辦?

如何批量查詢智能合約裡的數據?

我想查詢某個帳號發過的所有交易怎麼查?

微眾銀行區塊鏈對帳方案是怎麼做的,有沒有通用的解決方案?

……

為什麼強大的區塊鏈還有這些問題呢?

首先,隨著區塊鏈數據的「爆炸式」增長,鏈上已經積累了億計的交易、幾T的數據,節點伺服器逐漸無法滿足交易數據的存儲需求,單純對節點存儲空間進行擴容不僅開發成本高、硬體成本高,而且在數據擴容過程中因技術要求較高,易引發系統性風險,且不能一勞永逸地解決問題。另一方面,大量交易冷數據不僅浪費空間,而且會影響區塊鏈節點出塊和執行交易的性能。

其次,區塊鏈由於特定的鏈式存儲結構,鏈上數據只能通過智能合約接口的方式獲取和調用,不僅執行效率低下,且隨著鏈上數據的增加,其查詢和計算性能逐級衰減,無法滿足大數據分析和複雜查詢的訴求,比如需要檢索已經部署在鏈上的所有合約。基於特定場景的數據導出解決方案,由於智能合約存在較大差異,需要針對智能合約做特定開發,成本很高,不能復用。

最後,基於區塊鏈的可信數據缺乏通用的產品和可復用的組件,部分場景之間存在類似的需求,比如業務對帳、區塊鏈瀏覽器、業務分析、監管審計等。不同項目之間存在著大量重複的開發,費時費力,同時區塊鏈應用的開發者完成工作目標需要經歷陡峭的學習曲線,還可能在開發、測試中引入各類風險。

WeBankBlockchain-Data 從底層數據存儲層、智能合約數據解析層和應用層等多個層次入手,提供區塊鏈數據挖掘、裁剪、擴容、可信存儲、抽取、分析、審計、對帳、監管等數據治理方面的關鍵能力,滿足數據治理全流程開發場景的需求,如下圖所示:

區塊鏈數據經過區塊鏈共識節點的多方共識,一旦生成就不會被修改。

在運維層,區塊鏈的歷史區塊數據可被數據倉庫組件完整或部分導出到本地。作為可信存儲鏡像,導出的數據僅在本地有效,被修改不會影響鏈上共識。我們建議使用方建立管理方法,限制對本地數據的修改。

在應用數據層,數據導出組件支持導出源數據、初步解析和基於合約解析的多維數據。所有參與者均可部署自己的導出服務,作為本地查詢或分析的可信數據源。

在業務層,業務對帳組件支持機構內外部對鏈上鏈下業務數據進行對帳。

數據治理通用組件包含哪些子組件?

目前,WeBankBlockchain-Data由數據倉庫組件(Data-Stash)、數據導出組件(Data-Export)、數據對帳組件(Data-Reconcile)三個相互獨立、可插拔、可靈活組裝的組件構成,後續會根據業務和場景訴求提供更多的功能和解決方案子組件。

Data-Stash為區塊鏈底層平臺FISCO BCOS提供節點數據擴容、備份、裁剪及快速同步的能力。用戶可基於Binlog協議同步區塊鏈底層節點全量數據,實現冷熱數據分離,支持斷點續傳、數據可信驗證,並提供快速同步機制,助力FISCO BCOS輕鬆應對節點海量數據的運維場景。

Data-Export支持將鏈上數據導出到MySQL、ES等便於進行大數據處理的存儲介質中,解決區塊鏈數據複雜查詢、分析和處理的問題。 開發者幾乎無需編碼,只需要簡單配置,即可實時導出個性化的業務數據,提升二次開發的效率,降低開發成本。

同時,Data-Export支持分庫分表、多活部署、兼容分布式存儲系統等特性,具備金融級高並發、高可用、支持海量數據導出的能力。

Data-Reconcile抽象了交易系統的通用對帳流程,提供靈活可配置的區塊鏈數據對帳解決方案,支持自定義對帳數據和對帳格式,支持定時對帳和觸發對帳任務,提供多種擴展點,以便對帳處理模塊二次開發。

需要指出的是,Data-Reconcile不僅適用於狹義上的交易對帳,而且適用於任何需要進行數據核對的業務場景。

數據治理通用組件能怎麼用?                            

企業級區塊鏈應用存在多元化角色參與,諸如業務角色、運營人員、開發角色、運維角色等。針對區塊鏈數據,每一個特定的角色都有著不同的數據治理訴求。WeBankBlockchain-Data分別從區塊鏈底層節點數據維護、應用數據處理和業務數據應用三個維度,抽象、設計了對應的組件來滿足不同角色的對數據治理的需求。

場景1:節點數據維護

數據倉庫組件Data-Stash是一款針對區塊鏈節點數據處理的輕量化、高安全、高可用組件,主要面向運維人員和開發人員。

數據備份:Data-Stash可以通過Binlog協議對區塊鏈節點數據進行準實時全量備份,區塊鏈節點可以根據實際情況進行冷熱數據裁剪和分離,在確保數據安全可信的基礎上,解決節點擴容問題,降低開發和硬體成本。在解決節點擴容問題的同時,可以使得節點「輕裝上陣」,不僅能夠減少節點空間的開銷,而且能夠有效提升節點執行交易的性能。

數據同步:對於加入區塊鏈網絡的新節點,可以通過Data-Stash,在Fisco Sync工具的配合下,快速同步區塊鏈網絡的數據,確保節點以最快的速度參與到區塊鏈網絡的「工作」中,降低新節點因等待數據同步而造成的時間浪費。

場景2:應用數據處理

數據導出組件Data-Export 提供了導出的區塊鏈標準數據、自動基於智能合約代碼智能分析而生成的定製數據,存儲到MySQL和ElasticSearch等存儲介質中,主要面向開發人員。

複雜查詢與分析:現有區塊鏈對查詢功能不太友好,且鏈上計算非常寶貴,Data-Export支持將鏈上存儲的區塊鏈數據導出到鏈下的分布式存儲系統中。開發者可以基於已導出的區塊鏈系統基礎數據,智能合約部署合約帳戶、事件和函數等數據,進行二次開發,定製複雜查詢和數據分析的邏輯,快速實現業務需求。例如,開發者可對交易明細根據業務邏輯進行統計和關聯查詢分析,開發各類反洗錢和審計監管報表等等。

區塊鏈數據可視化:Data-Export會自動生成Grafana的配置文件,無需開發,即可實現區塊鏈數據可視化。區塊鏈數據可視化不僅能夠作為區塊鏈數據大盤、數據查看、運營分析的工具,同時也可以運用在應用開發、調試、測試階段,以可見即可得的方式提升研發體驗和效率。此外,Data-Export還提供了Restful API供外部系統集成。運維人員可以通過Grafana實時監控業務系統的狀態,業務人員可以在集成後的業務後臺系統上獲得該業務的實時進展。

區塊鏈中間件平臺WeBASE的數據導出子系統已經整合了Data-Export,同時,Data-Export也可以獨立與區塊鏈底層集成,以靈活地支持業務需求,迄今已在數十個生產系統中穩定、安全運行。如今,Data-Export作為區塊鏈數據治理的關鍵組件,以開源形式發布,由社區夥伴通力完善,以適應更多的使用場景、打造更多的功能。

場景3:業務數據應用

在業務層,數據對帳是區塊鏈交易系統中最常見的場景之一。基於數個區塊鏈DAPP應用的開發和實踐經驗,我們封裝和開發了數據對帳組件Data-Reconcile,提供基於區塊鏈智能合約帳本的通用化數據對帳解決方案,並提供了一套可動態延展的對帳框架,支持定製化開發,主要面向開發人員,為業務人員提供服務。

企業內部對帳:Data-Reconcile支持企業內部系統之間的對帳,例如區塊鏈鏈上數據與鏈下業務系統之間的對帳。開發人員可以利用Data-Reconcile快速進行二次開發,將業務系統數據和鏈上數據進行核算比對,保證了企業內部業務系統數據的可靠和運行安全。

企業間對帳:Data-Reconcile可以幫助開發者快速構建跨機構間的對帳應用系統。例如,在結算時,A企業定期將自身業務系統交易數據導出為對帳文件,發送至與文件存儲中心。B企業可藉助Data-Reconcile定期拉取A企業對帳文件,配合Data-Export,與企業內部的鏈上數據進行對帳處理。Data-Reconcile在保證對帳結果可信的同時提升了對帳的效率,可實現準實時對帳。

綜上所述,WeBankBlockchain-Data 是一套穩定、高效、安全的立體化區塊鏈數據治理解決方案,旨在通過提供一系列相互獨立、可插拔、可靈活組裝的組件,應對和處理區塊鏈海量數據的問題,為用戶帶來更加便捷、簡單、低成本和輕量化的用戶體驗,從而推動區塊鏈數據治理的發展。

開源地址

github代碼庫地址:

Data-Stash 數據倉庫組件

https://github.com/WeBankBlockchain/Data-Stash

Data-Export 數據導出組件

https://github.com/WeBankBlockchain/Data-Export

Data-Reconcile 數據對帳組件

https://github.com/WeBankBlockchain/Data-Reconcile

gitee代碼庫地址:

Data-Stash 數據倉庫組件

https://gitee.com/WeBankBlockchain/Data-Stash

Data-Export 數據導出組件

https://gitee.com/WeBankBlockchain/Data-Export

Data-Reconcile 數據對帳組件

https://gitee.com/WeBankBlockchain/Data-Reconcile

文檔地址:

Data-Stash 數據倉庫組件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Stash/index.html

Data-Export 數據導出組件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Export/index.html

Data-Reconcile 數據對帳組件

https://data-doc.readthedocs.io/zh_CN/latest/docs/WeBankBlockchain-Data-Reconcile/index.html

歡迎參與WeBankBlockchain的社區建設:

  1. 如項目對您有幫助,歡迎點亮我們的小星星(點擊項目左上方Star按鈕)。
  2. 歡迎提交代碼(Pull requests)。
  3. 提問和提交BUG
  4. 如果發現代碼存在安全漏洞,可通過https://security.webank.com/上報。

最後,還有個小小的彩蛋:微眾銀行區塊鏈計劃開放更多的區塊鏈通用組件,鏈治理組件和通用智能合約庫組件即將火熱來襲,敬請期待:)

相關焦點

  • 區塊鏈隱私不是奢侈品,是必需品——499DeFi Rocket
    up the entire blockchain sphere; we innovatively use a variety of authenticated data structures to make a highly efficient new blockchain.
  • 凍土墾荒,微眾區塊鏈的五年
    2016年6月到8月之間,微眾銀行與華瑞銀行、長沙銀行、洛陽銀行共同開發了一個基於區塊鏈技術的機構間對帳平臺,這是微眾銀行區塊鏈技術的第一個落地應用,也是國內首個在生產環境中運行的銀行業聯盟鏈應用場景,真正讓業界看到了區塊鏈在金融領域落地。凍土破冰了。
  • 微眾銀行登頂2019年全球銀行發明專利排行榜
    據了解,在微眾銀行2019年的全部公開專利申請中,80%以上來自於「ABCD」 (AI人工智慧、Blockchain區塊鏈、Cloud Computing雲計算、Big Data大數據)四大領域,其中又以人工智慧和區塊鏈最具代表性。
  • 泰嶽區塊鏈對話聯盟鏈,國產自主聯盟鏈技術在哪裡?
    ,由可以創建一個小聯盟,只對自己行開放,這樣其他銀行就看不到建設銀行的數據,但是建設銀行需要邀請中國銀行加入,這樣中國銀行就可以看到所有銀行的數據,但是其他行的數據都只有自己可以看到,這個權限管理在實際應用中特別常見。
  • 微眾銀行區塊鏈首席架構師張開翔:區塊鏈上隱私保護的挑戰和應對
    >近日,微眾銀行區塊鏈首席架構師、FISCO BCOS開源區塊鏈平臺首席架構師張開翔做客HKSAIR《AI金融》系列線上講座,以「區塊鏈上隱私保護的挑戰和應對」為主題,探討區塊鏈如何為數據隱私和信息開放構建一座天平。
  • 《區塊鏈常用術語解釋》匯總,中英對照表
    chain apps區塊鏈應用block generation rate出塊速度block hash區塊散列值block header hash區塊頭散列值block headers區塊頭block height區塊高度blockmeta區塊元block templates區塊模板blockchains
  • 如何創建通用的區塊鏈智能合約
    智能合約的挑戰在於,它們通常依賴於將現實世界數據與區塊鏈(或數據從一個區塊鏈轉移到另一個區塊鏈)進行橋接的能力,以便智能合約能夠識別質量、評估可靠數據並觸發商定的結果滿足條件。而在以往這是一個過於複雜和困難的過程,限制了更廣泛的採用。
  • 首屆線上 Blockchain Gamer LIVE! 結識新業務合作夥伴,窺探區塊鏈...
    之前在倫敦和香港舉行的全球區塊鏈遊戲產業大會將於2020年7月純在線舉行。旨在幫助您建立新聯繫並學習新商業技能的講座、小組討論、會議等等... 如今無論您在世界何處都可以參加。的主辦方為全球區塊鏈娛樂產業呈現的純在線活動。世界各地或許仍處於不同程度的封鎖,不過區塊鏈和遊戲業務未曾停歇。隨著新機遇和新挑戰湧現,建立聯繫的需求可以說從未像目前這麼迫切。作為一項全新的為期一周的在線活動——Blockchain Gamer LIVE! Digital,可以滿足這一需求。
  • 微眾銀行發布「數據新基建」白皮書,助力釋放數據要素生產力
    近期,由中國計算機學會(以下簡稱CCF)主辦的2020 CCF中國區塊鏈技術大會在濟南成功舉辦,來自全國區塊鏈領域的行業專家匯聚一堂,一同探討區塊鏈技術未來與應用趨勢。會上,CCF區塊鏈專委會委員、微眾銀行區塊鏈底層平臺研發負責人李輝忠發布《打造數據新基建,釋放數據生產力》白皮書。
  • 京東數科區塊鏈加大核心技術投入 「開源即可信」初見成效
    智慧財產權產業媒體IPRdaily與incoPat創新指數研究中心聯合發布的數據顯示,今年上半年,在全球區塊鏈企業發明專利排行榜前100名的企業中,中國佔比高達67%,排名第一。而在國內網際網路企業中,從2016年即開始組建區塊鏈技術團隊的京東數字科技集團也堅持對區塊鏈持續投入。截至2019年12月,其區塊鏈專利申請量已達近300件。
  • 銀行業首次應用國產晶片 微眾銀行獲央行2019年度銀行科技發展獎...
    其從資源使用場景出發進行深度分析,從核心基礎組件、核心業務應用系統、銀行交易系統等方面全路徑持續推動銀行系統硬體國產化,從而真正實現銀行核心系統的軟硬體全面自主可控,為落實安全可控的國家戰略和掌握核心技術能力奠定堅實的基礎。
  • 首日回顧:新一代區塊鏈開發平臺初步建成 | ArcBlock Devcon 2020
    ArcBlock 通用瀏覽器北京時間 6 月 20 日下午,ArcBlock 高級工程師盧佳孟在中文場具體介紹瀏覽器在區塊鏈行業裡的重要性以及 ArcBlock 通用瀏覽器這一獨特的區塊鏈應用產品。兩本新書:區塊鏈如何實戰
  • Will TRON's Acqusition of BT Rejuvenates the Blockchain Industry
    Although the self-financing property has made the blockchain rich enough, the lack of scenarios has brought credit crisis to the entire blockchain industry.
  • 區塊鏈期刊IET Blockchain於世界人工智慧大會宣布創刊
    該論壇圍繞區塊鏈、大數據等數智融合技術,就共建未來城區更新發展的解決之道進行探討,分享自主可控區塊鏈應用於未來城市數字資產實踐的新機遇。會上,Nigel Fine先生宣布IET攜手同濟大學,上海區塊鏈應用服務工程技術研究中心(SERCBAAS),合作推出開放獲取(Open Access)區塊鏈專業期刊IET Blockchain,該期刊旨在發表與區塊鏈基礎理論、應用技術及產業發展相關的前沿研究成果、科技創新和最新觀點,期刊將於2020年年底正式出版。
  • 比特幣的黑科技區塊鏈(Blockchain)到底是個什麼鬼?
    那麼今天我就用大白話來解釋一下blockchain到底是個什麼鬼。Blockchain:為什麼我們需要這個複雜的東西?「對於每個複雜的問題,都有一個明確,簡單和錯誤的答案。」 - HL Mencken不像網上的其他文章,我不是給Blockchain下一個定義,本文將會解釋Blockchain解決了什麼問題。
  • 金融行業開源技術應用社區研討實錄:開源組件安全問題與升級方式
    在長達2.5小時的激烈討論中,來自浦發銀行、農業銀行、中國銀行、上海銀行、微眾銀行、寧波銀行、海通證券等多家金融機構的技術負責人,以及稜鏡七彩、新思科技、默安科技、奇安信等多家技術廠商的專家們,又一次在「吐槽大會」中碰撞出精彩紛呈的觀點。這一次關於「開源組件安全問題與升級方式」的話題,反映了金融機構哪些普遍性的痛點?
  • STD——蘊含多重激勵機制完全去中心化的創新型區塊鏈架構
    STD是一個蘊含多重激勵機制完全去中心化的創新型區塊鏈架構,其致力於打造新一代的以技術驅動型為基礎,以應用落地為切入點的去中心化全球價值流通網絡生態平臺。STD-Chain是從通用型區塊鏈到專業型區塊鏈技術的升級,目前針對區塊鏈生態系統各環節連結、流通打造一套完整的,行之有效的鏈上價值流通網絡數改系統。
  • STD—針對各行業業務特性,打造基於區塊鏈技術個性化行業解決方案
    鏈改是什麼?是對傳統企業進行區塊鏈經濟化改造。傳統企業為什麼需要鏈改?對傳統股份制企業進行區塊鏈經濟化改造,讓其上鏈經營,成為區塊鏈經濟組織,就是鏈改。鏈改為傳統公司制企業賦能,是一種供給側結構性改革。
  • 英飛凌針對產品需求:推出以區塊鏈加密的 SECORA Blockchain技術
    英飛凌針對嚴謹產品需求推出以區塊鏈加密的 SECORA Blockchain 技術由於在線通路興盛,也造成黑心商人藉由網絡平臺販賣盜版商品,甚至一有黑心商人在在線平臺銷售來路不明的贓物,故一些大品牌希望能通過內嵌產品履歷能讓消費者買得安心,而英飛凌看到產品履歷的需求
  • 「比特派AMA」Helium-當物聯網遇見區塊鏈直播回顧
    7月1日下午2:00,比特派錢包邀請到物聯網區塊鏈明星項目Helium的COO Frank(孟繁榮)進行社區分享。Building a novel protocol blockchain is very hard.