阿里云為什麼要做多模資料庫?

2020-11-28 騰訊網

作者 | Kitty

採訪嘉賓 | 沈春輝

Gartner 曾在 2017 年預測多模數據管理將成為未來的主要趨勢,並在隨後幾年逐漸成為主流資料庫的選擇。當前多模資料庫的發展到底處於一個什麼樣的階段?主要在哪些場景下使用?未來將會有怎樣的突破?近日,InfoQ 有幸邀請到阿里巴巴資深技術專家沈春輝(天梧),請他聊一聊多模資料庫的構建和發展。他還將在QCon 全球軟體開發大會(深圳站)「現代數據架構」專題中進行《阿里雲 Lindorm 面向多模數據管理的技術創新與實踐》的分享,敬請關注。

以下是採訪實錄:

InfoQ:您從 2011 年就開始從事面向大數據場景的分布式資料庫研發工作,這期間您經歷了大數據領域哪些新老技術的更迭和演進?

沈春輝在大數據發展史上,有兩個影響深遠的標誌事件,一個是 2004 年前後,谷歌發表 GFS、MapReduce、Bigtable 三篇論文,證明了大數據從理論概念到生產實踐的業務價值,並給出了架構典範;另一個是 2008 年,Hadoop 正式成為 Apache 頂級項目,把大數據帶入到各大企業尤其是網際網路企業的 IT 基礎設施中。

在過去的十多年,隨著對數據規模、處理速度、易用性、成本、效率等越來越多的需求,我們看到大數據架構和產品不斷地推陳出新。起初,Hadoop 作為大數據的代名詞,支持存儲和計算能力的水平擴展,很好地解決了規模化的挑戰,但隨著大數據應用到各個場景,各種需求開始井噴,Hadoop 也從單一系統走向一個多元化生態。比如:

Hive,讓 SQL 進入到 Hadoop,大大降低了使用門檻;

HBase,通過 LSM 架構,滿足了海量數據的高並發吞吐;

Spark,通過基於內存的分布式計算,大幅提升了數據處理的效率;

Storm、Flink、Spark Streaming 等流計算系統,有效提升了數據處理的實時性;

還有 Presto、Kylin、Impala 等,在不同場景下,加速大數據複雜分析。

所以,現代企業的大數據平臺大多都是基於 Hadoop 生態構建的「一存多算」的多元化架構,即以 HDFS 為統一存儲,通過 HBase、Spark、Flink、Presto 等多種計算引擎滿足不同場景的處理需求,這個架構的優點是適用範圍廣、靈活性強,但缺點是成本高、維護複雜、體驗較差,這也會是未來技術繼續向前演進的方向。

InfoQ:您將在 QCon 深圳 2020 分享的話題是「面向多模數據管理的技術創新與實踐」,在您看來,當前多模資料庫的發展整體處於一個什麼樣的階段?

沈春輝:在網際網路發展之前,資料庫可以說基本就是在關係模型上發展,比如發展了幾十年的 Oracle、DB2,而 NoSQL 的出現打破了這一慣性,KV、寬表、文檔、圖、時序等多種模型都得到了廣泛應用和快速發展,但這個趨勢也會使得應用開發變得越來越複雜,記得在 2012 年的 NoSQL 大會上,有大佬提出了「多模資料庫」的概念,設想一個系統可處理多種類型數據,以簡化應用數據架構,減少開發維護成本。隨著 NoSQL 系統在單模能力上的成熟,以及應用數據需求的多樣化,業界開始進入對多模資料庫的探索和實踐,通過 db-engine 網站,我們可以看到越來越多的流行資料庫已經走向多模資料庫。

多模資料庫,其目標是將多個系統組合使用的解決方案下沉為資料庫內置能力,與傳統分庫分表方案升級為分布式資料庫能力相似,所以,這是一個相對漫長的建設過程,我們為其定義了四個階段,也可以說是系統開發的四個路標,分別是多種類型、垂直引擎、跨模融合、統一訪問,如果按此看,那麼大部分業界多模資料庫現在可能處於第一、二階段,其能力主要是提供多種類型的數據接口,在不同模型的處理效率上有所側重傾斜,在數據聯接上有所缺失,還是很難在生產中真正替換多套系統組合使用的方案。

InfoQ:是什麼原因驅動阿里從 HBase 轉到多模資料庫的?整體架構設計是如何考量的?

沈春輝:阿里 HBase 的發展已經有比較長的時間,過去主要聚焦在成本、性能、可用性等通用能力的深度自研,所以,在這個方向上算比較成熟了。然而,現代應用場景的玩法和功能變得越來越豐富,除了高擴展、低延時、高可用、低成本等核心需求之外,簡單分析、多維檢索等高級數據處理正在成為越來越多應用的基本需求,為此,我們看到當數據量小的時候,一個關係資料庫基本能解所有問題,但數據量大的時候,很多場景需要混用 HBase、ES、TSDB、SQL 等系統,像是監控、IoT、畫像、社交等等,每一個應用都需要開發數據中間層來對接多種資料庫,去處理模型轉換、數據分發、數據同步、查詢合併等一系列問題,最終期望這多個異構系統組合成為一個資料庫系統工作,面向上層的業務邏輯提供統一存儲、統一訪問並保證數據正確。

針對這種普遍存在的共性需求,我們期望使用多模資料庫的思路進行解決,打造一個同時具備寬表、時序、搜索等多種模型處理能力的資料庫,幫助業務重新聚焦於應用邏輯,這就是我們 2020 年 9 月上線的雲原生多模資料庫 Lindorm(中文名:靈動)。

Lindorm 目前主要聚焦於第三階段跨模融合的能力建設,在業務需求滿足上,可以達到及超過多套系統組合使用的效果,並相比有明顯更低的開發維護成本,隨著系統能力的逐漸完善,對業務的價值優勢也會越來越明顯。Lindorm 在系統架構上主要考慮了雲原生、多模原生兩個方面,核心是構建彈性按需伸縮、多模融合處理、高效低成本等能力,具體的架構設計也將在此次的 QCon 會議上分享,歡迎大家的關注。

InfoQ:哪些場景適合用 Lindorm,您認為多模資料庫帶來的最大改善和提升是什麼?下一步的計劃是什麼?可以給想要做或者正在做這些事情的同學一些建議嗎?

沈春輝:多模資料庫 Lindorm 目前支持寬表、時序、搜索、文件四種模型,我們在選擇模型時主要考慮面對海量數據的實際場景需求和自身過去的技術積累。比如,對於監控、IoT、廣告、社交、風控等數據驅動型業務,目前可能混合使用了 MySQL、HBase、ElasticSearch、OpenTSDB、Ceph、Hive 等類似系統,這中間的數據鏈路會是比較複雜的,通過 Lindorm 則可以替換其中的多個組件,大幅簡化架構,實現降本增效。

具體來說,對於一個監控系統,Metrics、Logging、Tracing、參數屬性、報警視頻等這些數據都各自需要一個系統進行存儲,數據的關聯、分析、同步和低成本處理都需要業務側進行方案設計和實施,沒有一個十幾人團隊很難把這樣一個大型監控應用做好,其中大部分精力投入在數據層的設計、開發和維護,這還不包括背後的四五個資料庫系統團隊支撐,一句話總結就是協同成本和冗餘成本巨高,而通過 Lindorm 的多模融合處理能力,將多種數據的操作管理需求下沉到資料庫系統,使得應用在效率、成本、體驗上可以獲得非常明顯的提升。

在技術上,Lindorm 吸取了阿里過去多年在寬表、時序、搜索等垂直領域的能力,如果僅僅將其當成一個單模系統使用,那麼已經比較成熟了,而在多個數據模型之間的融合打通方面,還有不少工作要做,比如模型轉換、統一訪問、統一管理、資源共享等。另外,前面也提到,雲原生是我們另一個關鍵方向,Serverless、雲原生存儲、智能運維等都是重點攻堅的工作。

如果要建設一個多模資料庫系統,個人認為有兩個選擇是比較關鍵的:

系統支持哪些模型?

可能會有一個誤區,多模資料庫的發展會進入到「All In One」,這可以看成是一種理想,但軟體工程的自身能力是有限制的,隨著數據種類支持的添加,其複雜性會大幅增加,並且對上層的統一抽象難度也會加大,其可實現性是未知的,或者說現有能力是不可實現的,所以,系統需選擇有限的模型進行支持,具體的選擇可以結合需求,比如 Lindorm 主要是根據業務場景的實際混合使用情況進行選擇,你也可以根據被使用的規模大小和可結合性;

多模技術中哪些共享,哪些獨立?

共享的厚一點,工程迭代效率會更高,但可能會犧牲一定地運行效率,目前業界選擇主要是兩種,一種是在 KV 層共享,類似基於 HBase 構建 OpenTSDB、JanusGraph,另一種是在文件層共享,比如 Lindorm 的寬表引擎、時序引擎、搜尋引擎都是構建在分布式文件系統之上,這樣數據的組織索引就可以有更大的設計空間,在性能上可以有更大優勢,從而除了多模混合使用場景之外,在獨立的垂直場景,也無需換用專用資料庫。

InfoQ:您認為大數據領域還有哪些值得關注的技術方向?

沈春輝:個人目前比較關注云原生、一體化這兩個技術趨勢,這也是目前很多大型企業正在大力投入資源推進落地的方向,不管是學習,還是實踐到自己的企業,都值得了解:

雲原生:上雲已經成為企業數位化的共識,上雲之後如何用好雲是當前大家的重點討論和思考,如果仍然按照過去線下機房的模式去部署和使用大數據,不僅無法獲得雲計算的紅利,甚至在成本效率上可能面臨諸多不適。所以,以「存儲計算分離 + 彈性 Serverless」為代表的雲原生大數據架構,實現存儲計算的獨立伸縮、資源彈性按需使用,大幅提升資源利用率、系統運維靈活性,成為接下來的主要趨勢。在阿里雲平臺,我們以 Lindorm(兼容 HDFS、HBase 等多模的 Serverless 存儲)+DLA(提供 Spark、Presto 等多模態的 Serverless 計算)向企業提供了雲原生的大數據最佳實踐,大家有興趣可以關注交流。

一體化:開源大數據技術經過十多年的快速發展,在採集、存儲、計算、調度、管理等各個方面的整體版圖已經相當完善,同時面向各個場景的存儲計算引擎也呈現出百花齊放的景象,但這也加大了用戶的使用門檻和維護複雜度,多種系統的一體化也越來越成為下一個大的發展趨勢,比如多種模型資料庫的一體化、大數據與資料庫的一體化、批計算與流計算的一體化、數據湖與數據倉庫的一體化等,這些技術上的整合,可以幫助企業更加經濟高效的用好數據。

想了解更多阿里雲多模資料庫的發展和技術實踐細節,可以來 12 月 6-7 日的 QCon 全球軟體開發大會(深圳站)的現場,與沈春暉老師當面交流。除了沈春輝老師的演講內容外,本專題還有以下技術分享,感興趣的朋友可以關注下:

相關焦點

  • 阿里雲資料庫李飛飛:雲計算推動資料庫向雲原生快速演進
    阿里雲推出的雲原生多模資料庫Lindorm,以及雲原生內存資料庫Tair是NoSQL方向的代表,幫助客戶在IoT等場景下的數據實現高效存儲與處理。  為了簡化用戶使用雲端資料庫,阿里雲構建了豐富的雲原生資料庫生態工具,包括傳輸、備份到管理,數據傳輸可以使用DTS,做端到端數據的同步;用DBS數據備份做多雲多端的邏輯備份、物理備份;用DMS可以做企業級的開發建模流程;用ADAM則可以做針對基於傳統資料庫和數據倉庫開發的應用評估和遷移。
  • 對話阿里雲李飛飛:雲原生資料庫的時代來了
    值此之際,CSDN 與阿里雲資料庫的總負責人、達摩院資料庫首席科學家李飛飛(花名飛刀)相約阿里雲 EFC 總部的崑崙頂,論資料庫之道,解鎖鮮為人知的阿里雲資料庫故事與其背後的團隊文化。阿里雲資料庫團隊在緩存技術深度理解的基礎上做的大量的深度創新,比如熱點打散、智能化冷熱數據分離、將一個集群內存進行集群化的管理和使用和調度等,由此極大提升應用對緩存、內存資料庫的訪問,提升效率和降低成本。
  • 阿里雲的資料庫俠客!
    但我們能做的只是把故障寫成報告匯報到國外廠商。在別人眼裡,我們是中國最好的技術人,但是,這種無法掌握自己命運的感覺,你、我還能承受多久?」於是,阿里雲的第一個開源資料庫敢死隊火速建立了,經過幾次討論後他們發現,雖然此前沒做過開源,但是,開源資料庫也不是想像的那麼可怕。
  • DTCC2020阿里雲李飛飛:雲原生分布式資料庫與數據倉庫系統點亮數據...
    趨勢二:雲計算加速資料庫系統演進關鍵詞:商業起步 - 開源 - 分析 - 異構NoSQL - 雲原生、一體化分布式、多模、HTAP趨勢三:下一代企業級資料庫關鍵技術關鍵詞:HTAP:大數據資料庫一體化、雲原生+分布式、智能化、Multi-Model 多模、軟硬體一體化、安全可信
  • 支付寶自研資料庫OceanBase通過阿里雲向全球開放
    3月25日,由支付寶自研的金融級分布式資料庫OceanBase正式通過阿里雲向全球開放,提供高可用、高性能、低成本的計算服務,企業可在雲上獲得「支付寶同款」的世界頂級資料庫處理能力。支付寶金融級分布式資料庫OceanBase2010年,為滿足高速增長的業務需求,阿里巴巴、支付寶開始自主研發資料庫系統OceanBase。2016年,OceanBase完成了對支付寶核心系統中Oracle資料庫的全面替換,支撐著數億人能夠隨時隨地網購、行動支付。
  • 全社會一臺「雲電腦」,阿里雲要做新時代的Windows
    但為什麼是現在提出「全速重構」呢?以東方希望集團為例。創立於1982年的東方希望集團是我國改革開放後建立的第一批民營企業。在2020阿里雲線上峰會上,阿里雲智能總裁張建鋒首次對外展示了阿里雲再生長的三大方向:「做深基礎」,從飛天雲作業系統向下延伸定義硬體;「做厚中臺」,將釘釘這樣的新型作業系統與阿里雲進行深度融合,實現「雲釘一體」;「做強生態」基於雲和新型作業系統,構建一個繁榮的應用服務生態。
  • DTCC 2020 | 阿里雲葉正盛:資料庫2025
    在DTCC 2020大會上,阿里雲資料庫產品管理與運營部總經理葉正盛為大家分享他對於「資料庫2025」的展望。葉正盛(花名:鬥佛),阿里雲資料庫產品管理與運營部總經理,目前擔任阿里雲資料庫產品總規劃師,主要負責阿里雲資料庫的產品規劃和產品運營相關的工作
  • 中國技術再下一城,阿里雲自研資料庫AnalyticDB打破TPC-DS世界紀錄
    【獵雲網】5月14日報導日前,據權威國際處理性能委員會TPC官方披露,在被譽為「資料庫分析場景珠穆朗瑪峰」的TPC-DS基準測試中,阿里雲自研的雲原生數據倉庫AnalyticDB以1489萬的性能指標刷新了世界紀錄,
  • 阿里雲技術再獲突破 自研資料庫AnalyticDB打破TPC-DS世界紀錄
    來源:證券時報網日前,據權威國際處理性能委員會TPC官方披露,在被譽為「資料庫分析場景珠穆朗瑪峰」的TPC-DS基準測試中,阿里雲自研的雲原生數據倉庫AnalyticDB以1489萬的性能指標刷新了世界紀錄,比第二名提升近30%以上,同時單位計算成本降低到
  • 第二屆資料庫挑戰賽閉幕,選撥內存資料庫明日之星
    由阿里雲和英特爾聯合主辦的第二屆資料庫大賽—Tair性能挑戰賽於12月13日落幕並舉辦頒獎典禮。經過125天的層層評選,最終決出了6支優秀團隊分別獲得了冠亞季軍,其中美國的資料庫領域自由職業者金星獲得本次比賽冠軍。Tair是阿里雲自研的雲原生內存資料庫,專注於多數據結構的緩存與高速存儲場景,接口兼容開源Redis/Memcache。
  • 單模光纖和多模光纖的區別,單多模光纖和單多模光模塊應用在哪裡
    光纖收發器按在光纖中的傳輸模式可分為:單模光纖和多模光纖,單模光纖收發器和多模光纖收發器最根本的區別就是傳輸距離遠近。 一、 工業級光纖收發器:單模光纖和多模光纖的區別 (1)單模光纖採用固體雷射器做光源,多模光纖採用發光二極體做光源; (2)單模光纖傳輸頻帶寬、傳輸距離長,但是需要雷射源,成本較高,多模光纖傳輸速度低、距離短,成本低; (3)單模光纖芯徑和色散小,僅允許一種模式傳輸; (4)多模光纖芯徑和色散大,允許上百種模式傳輸。
  • 激流勇進,資料庫替代比預想要快得多
    阿里雲技術專家楊傳輝介紹說,2014年阿里金融業務螞蟻金服支付寶開啟去IOE徵程,大膽嘗試將10%的交易流量由Oracle切換到阿里自研的資料庫OceanBase,這是全球第一次在金融系統核心業務中使用非Oracle資料庫。
  • 螞蟻金服自研分布式關係資料庫OceanBase上線阿里雲
    OceanBase於2020年3月在阿里雲上完成了商業化,在公有雲上正式對外開放。OceanBase會對數據集做兩層瘦身,第一層是encoding,會使用字典、RLE等算法對數據做瘦身,第二層是通用壓縮,使用lz4等壓縮算法對encoding之後的數據再做一次瘦身。在zstd算法下,相較傳統MySQL Innodb的壓縮,可以做到相同數據集只是用MySQL的1/3的存儲,幫助用戶極大的節省存儲成本。
  • 百度網盤迎來勁敵,「阿里雲網盤」App每秒10MB/s不限速
    阿里雲是中國排名第一的公有雲,無論是市場還是技術層面都是如此,阿里雲甚至在全球也是排名靠前的,能在亞馬遜、微軟和谷歌裡面殺出一條血路,還是不容易的。首先我們看看商業上阿里雲有多牛,從2019年Q3的市場份額統計來看,IaaS市場和PaaS市場,阿里雲都是佔據了第一位,而且幾乎是排名第二的騰訊雲的兩倍,這個市場份額是絕對具有壟斷地位的。
  • 雲原生、存算一體、持久化,阿里雲內存資料庫Tair出世不凡
    「內存資料庫正進入了新的階段,雲原生、持久化、融合計算是三大特徵。」 阿里巴巴集團副總裁、阿里雲智能資料庫產品事業部總經理、高級研究員李飛飛表示。「如果在沒有存儲和計算解耦,沒有存儲池化能力,內存的容量一定要按照業務峰值進行匹配,否則在峰值的時候就會出現內存被擊穿,資料庫被湧來的請求衝垮。而在傳統架構下,內存資料庫必須按照峰值容量部署,因此使用成本一定高。」李飛飛解釋說。第三,計算模型上,Tair提供了非常豐富的功能,能支持圖計算、文本計算、圖片計算等。
  • 資料庫半年回顧:國外波瀾不驚,國內勢如破竹
    本文將通過墨天輪資料庫排行榜的一些數字和一些新聞事件,對國產資料庫半年來的發展做一個簡單回顧。每月1號,我們都會在墨天輪發布當月的資料庫排行,總結資料庫行業最新的一些發展動向以及我們對此變化的一些思考。
  • 十六位頂尖專家齊聚,解密阿里雲最新核心技術競爭力!
    在其架構上:底層的數據中心、物理資源等提供了強有力的基礎設施支撐;中間有著物理層管控之天基、先進的計算平臺架構之神龍、存儲之盤古、虛擬網絡系統之洛神「坐陣」,帶來了計算、存儲、資料庫、網絡等核心服務;除此之外,阿里雲還構建了面向用戶的系統服務以及原生服務
  • 第二屆資料庫大賽落幕,全球開發者共同挑戰持久內存上的性能極限
    由阿里雲和英特爾聯合主辦的第二屆資料庫大賽—Tair性能挑戰賽於12月13日落幕並舉辦頒獎典禮。經過125天的層層評選,最終決出了6支優秀團隊分別獲得了冠亞季軍,其中美國的資料庫領域自由職業者金星獲得本次比賽冠軍。
  • 光模塊單模和多模的區別
    1、什麼是單模光模塊與多模光模塊單模(SM)光模塊使用局限性小,適用於遠距離數據傳輸,多模(MM)光模塊可以傳輸多種模式的光,適用於近距離傳輸。光模塊中的單模與多模,實際上是指與光模塊連接的光纖種類。2、單模光模塊與多模光模塊的區別(1)波長不同多模光模塊的工作波長一般是850nm,單模光模塊的工作波長一般是1310nm、1550nm。(2)傳輸距離不同單模光模塊常用於遠距離傳輸,傳輸距離可達150至200km。多模光模塊則多用於短距離傳輸中,傳輸距離2km以下都可使用多模光模塊。
  • 全球測試刷屏背後:正在崛起的螞蟻資料庫生態
    TPC-C是全球目前最具公信力的聯機交易處理(OLTP)資料庫功能與性能結合的測試標準,尤為金融、電信、政府等客戶矚目。讓人好奇的是,為何短短7個月又測一次? 要知道,去年OB打破了甲骨文塵封9年的世界紀錄。後者與其他同業未以同類測試做出回應。