阿里沈春輝:HBase發展與改進優化分享

2020-12-05 IT168

  【IT168資料庫大會 現場報導】2013年4月18-20日,第四屆中國資料庫技術大會(DTCC 2013)在北京福朋喜來登酒店拉開序幕。在為期三天的會議中,大會將圍繞大數據應用、數據架構、數據管理(數據治理)、傳統資料庫軟體等技術領域展開深入探討,並將邀請一批國內頂尖的技術專家來進行分享。本屆大會將在保留資料庫軟體應用實踐這一傳統主題的基礎上,向大數據、數據結構、數據治理與分析、商業智能等領域進行拓展,以滿足於廣大從業人士和行業用戶的迫切需要。


2013中國資料庫大會專題報導

  自2010年以來,國內領先的IT專業網站IT168聯合旗下ITPUB、ChinaUnix技術社區已經連續舉辦了三屆資料庫技術大會,每屆大會超過千人規模,雲集了國內技術水平最高的數據架構師、DBA、資料庫開發工程師、研發總監、IT經理等,是目前國內最受歡迎的資料庫技術盛會。


▲阿里數據平臺開發工程師,HBase社區Committer:天梧(沈春輝)

  HBase – Hadoop Database,是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統,利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。

  特點:海量數據(TB以上)、很高的隨機寫能力、在海量數據中實現高效的讀取、很好的伸縮能力、強一致性、能夠同時處理結構化和非結構化的數據、動態列、不需要複雜的查詢需求包括:SQL、事物、Join、多維索引等。

  HBase的版本發展:

  2007.4 第一個版本(HVASE-287 Mike Cafarella)

  2010.10 0.89(Facebook的生產版本 based on)

  2011.4 0.90.2(阿里HBASE的第一個版本 based on)

  2012.1 0.92(Adds 安全,協處理器,HFile V2,分布式log-Splitting)

  2012.5 0.94(Performance Release),目前是主流版本。

  2013.4 0.95(0.96的預發版,Adds protobuf,Table Snapshot,PrefixTreeCompression等等)

  Coming 0.96

  HBase在阿里的發展:

  2011.3月開始研究

  2011.5月上線第一個應用

  截止目前:以基於0.94的阿里HBase版本為主、穩定性達到在線應用的城池標準之上、近百個業務,特點多樣化。

  國內外應用發展HBase的公司:

  Cloudera、Hortonworks、Salesforce等

  faceboook、Yahoo、eBay、Twitter、Pinterest、Line等

  Intel、IBM等

  阿里巴巴、華為、小米、360等。

  實踐與改進--Bucket Cache(Allocate Block)

  1、將整個邏輯上的存儲塊切割成一個個的Bucket。2、每一個Bucket都有相同的固定的容量,e.g.2MB as default;3、每一個bucket都擁有一個size tag,cache這個size以內的Block。4、對於完全空閒的Bucket,它的size tag可以被重新指定。5、每一個bucket與物理存儲的位置有固定的映射關係,根據Block在Bucket中的偏移,則就可以計算出其在物理存儲中的偏移。

  實踐與改進--優化Java的GC麻煩

  1、Concurrent mode failure

  原因:old區要分配內存了,但是old區空間不夠,而此時CMS正在運行中

  解決:降低YGC頻率,降低CMS GC觸發時機(降低 CMSInitiatingOccupancyFraction的值)

  2、Promotion Failed(發生很多)

  原因:old區要分配內存了,但是找不到空間分配,卻還沒達到CMS的觸發值。

  heap碎片+YGC晉升對象(Block,Memstore Chunk)過大

  解決:聚合小數據:開啟msalab(注意Region數目)

  HBase自己管理(重用)內存對象:Bucket Cache(HBASE-7404)(使用Byte buffer作為IOEngine的存儲介質)、Chunk Pool(HBASE-8163)。

  YGC停頓過長
  原因1:Young區活對象數目過多,old區髒頁數目過多
  原因2:MemStore中的Keyvalueset,開啟WAL壓縮後的字典map
  解決:1、降低young區大小。2、減小-XX:Maxcache/ChunkPool,減少晉升對象,減少拷貝時間。

  實踐與改進--更高的服務可用性

服務單點


▲更多優化

  HBase是Google Bigtable的開源實現,類似Google Bigtable利用GFS作為其文件存儲系統,HBase利用Hadoop HDFS作為其文件存儲系統;Google運行MapReduce來處理Bigtable中的海量數據,HBase同樣利用Hadoop MapReduce來處理HBase中的海量數據;Google Bigtable利用 Chubby作為協同服務,HBase利用Zookeeper作為對應。

  hbase是bigtable的開源山寨版本。是建立的hdfs之上,提供高可靠性、高性能、列存儲、可伸縮、實時讀寫的資料庫系統。

  它介於nosql和RDBMS之間,僅能通過主鍵(row key)和主鍵的range來檢索數據,僅支持單行事務(可通過hive支持來實現多表join等複雜操作)。主要用來存儲非結構化和半結構化的鬆散數據。

  與hadoop一樣,Hbase目標主要依靠橫向擴展,通過不斷增加廉價的商用伺服器,來增加計算和存儲能力。

  企業面臨以下問題時,可以考慮選擇HBase。如數據量急劇增加,需要TB級甚至PB級的在線服務;數據量增長速度快,對水平擴展能力有需求,前期少量投入,隨著數據量的不斷增加,後期可以不斷追加;只是簡單的kv讀寫,要求響應延時低;要求強一致性;每秒上萬的寫入,並且需要批量讀取,大量的隨機讀取,需要大吞吐量;應用程式不斷變更,導致schema多變;最後一個則是整個平臺是一個Java平臺,需要良好的Java接口等等。而HBase無疑很好地滿足了這些特點。

相關焦點

  • 【硬核乾貨】國際站產品優化方法
    分享阿里巴巴國際站運營日常,獨立站以及其他外貿知識。
  • 近3億利潤背後,阿里健康展示了怎樣的網際網路醫療發展路徑?
    2020年11月25日晚,阿里健康(00241)發布了2021財年中期業績。如行業預期,阿里健康成績喜人。次日開盤,阿里健康拿下了超過8%的漲幅。 直接看數據,2021財年前半段,阿里健康取得71.62億元收入,同比增長74%。毛利同樣大幅度增長,上半財年總計18.6億元,同比增長80.3%。更重要的是實現了2.79億元的利潤,首度扭虧為盈。
  • "南和犬貓糧"聯合阿里數字鄉村打造區域公用品牌
    本次活動邀請到區領導、區直有關部門,阿里巴巴、無界集團等行業嘉賓,重點企業代表、商家代表、媒體記者等80餘人見證分享、共商發展。阿里巴巴數字鄉村與區域經濟發展事業部 項目總監,分享後疫情時代如何打造鄉村振興的數字引擎
  • 阿里文娛大魚號詳解2017發展重點 構建全新大魚體系
    6月29日, 阿里巴巴文化娛樂集團旗下創作服務平臺大魚號,在北京舉辦內容創作者城市沙龍,詳解2017年大魚號的發展重點,並現場教路平臺創作運營規則與技巧。據悉,此次沙龍是大魚號首次與創作者面對面的交流,也是大魚號United Cities系列沙龍的首站。沙龍上,阿里巴巴文化娛樂集團副總裁周曉鵬、大魚號產品負責人吳越、短視頻運營負責人皮力分別作了分享。
  • 阿里、京東、美團、電通等電商行業營銷模型匯總
    在全新的營銷法則中,兩個具備網絡特質的「s」——search(搜索),share(分享)的出現,指出了網際網路時代下搜索(Search)和分享(Share)的重要性,而不是一味地向用戶進行單向的理念灌輸,充分體現了網際網路對於人們生活方式和消費行為的影響與改變。
  • 微軟如何改進 Microsoft Edge 的滾動效果?
    微軟 Microsoft Edge 團隊在博客分享了他們如何改進新版 Edge 的滾動效果,包括改進滾動動畫和優化滾動體驗(交互和外觀)。
  • 阿里推推到底是什麼項目?阿里推推佣金制度是什麼?
    日前,抖音快手均對淘寶連結進行降權,發展各自體系的線上櫥窗。因此阿里推推是在淘寶直播生態基礎上衍生出的綜合推廣服務平臺,致力於淘寶線上推廣,主要是用於推廣淘寶直播間,為淘寶直播間帶來人氣。在直播電商領域,淘寶直播與抖音,快手分庭抗禮,無奈雙拳難敵四手,目前抖音日活用戶4億,快手3億,淘寶直播僅1800萬,淘寶作為電商的鼻祖,無法對抗抖音快手的衝擊,而且現在抖音快手均對淘寶連結進行降權,發展各自體系的線上櫥窗,所以阿里巴巴為了推動淘寶直播,故與曲中求(南京)網絡技術有限公司合作開發的一個綜合電商推廣服務平臺,率先服務於淘寶直播,給淘寶直播帶流量。
  • 改進管理措施,創新發展模式 -雙向發展,雙線結合
    為緊緊圍繞黨支部工作條例要求,踐行支部七大職責,上海應用技術大學材料科學與工程學院第二學生黨支部在章奇書記的領導之下,結合自身情況,改進相應的支部管理措施,創新支部發展模式,形成以「雙向發展,雙線結合」基本路線的工作法,通過橫向隊伍建設,縱向黨建延伸,利用數位化媒體,線上輔助、線下擴展,高效率、高水平的開展支部活動,打造支部特色品牌。
  • 阿里在上海投資成立實業公司 法定代表人為申通快遞董事長
    來源:澎湃新聞原標題:阿里在上海投資成立實業公司,法定代表人為申通快遞董事長11月26日,天眼查App顯示,上海德峨實業發展有限公司於11月24日成立,該公司註冊資本約79.6億人民幣,第一大股東為阿里巴巴
  • 輝瑞中國與阿里健康宣布合作——拓展抗感染和皮膚專科領域,助力...
    輝瑞中國與阿里健康籤約儀式現場合影 輝瑞生物製藥集團中國區業務優化與創新負責人寶華致辭
  • 流程優化的五種基本方法
    2016-05-31 18:17 什麼是流程優化?流程優化就是在流程設計以及實施過程中,通過對流程進行改進,來取得一個好的效果,這就是對現在的工作流程的梳理,完善以及改進的過程,被統稱為流程優化,對於流程的優化,不管是對流程整體的優化還是說對中間部分的改進,例如減少環節,改變時序等等,都是通過提高工作質量,提高工作效率以及降低成本,降低勞動的強度,節約能源消耗,然後保障產品的安全生產以及減少汙染,流程優化的基本方法分為五種。
  • 雲尚直播+燈塔學院+雲智公開課,阿里影業知識分享覆蓋影視全鏈路
    該劇總製片人、阿里影業副總裁敦淇做客「雲尚影視製片直播沙龍」,分享了《重生》以及此前《甄嬛傳》等代表作的幕後製作故事,並推介了製片管理系統雲尚製片。當晚直播沙龍也成為自上線以來熱度最高的一期。 敦淇對於其多年來的製片方法論做了獨到的總結和分享,這也標誌著阿里影業繼「燈塔學院」(宣發)和「鳳凰雲智公開課」(發行)後,將直播課程進一步布局到上遊製作領域,用知識分享賦能影視行業全鏈路,幫助從業者儲備知識、修煉內功。   疫情期間,雲尚製片將原本的線下沙龍轉移到線上,邀請業內專家共同打造公益性知識分享,為眾多影視人提供學習渠道,提升專業技能。
  • 明年發展20000家門店 阿里躺平新戰略能否打破僵局?
    因此,阿里躺平的誕生,旨在在這些痛點上有所突破。在設計上,阿里推出躺平設計家。這個軟體的前身是室內設計軟體Homestyler, 2017年6月居然之家從Autodesk手裡買過來,更名為居然設計家。遺憾的是,設計家並沒有在居然之家真正發展起來,也沒趕上數位化的班車,甚至有點擱置了兩年。
  • 車門密封條 VOC 性能的改進
    熱點資訊▕  知識分享▕ 熱門活動 ☂ 訂閱汽車部件與材料資訊 ☂摘要:為解決汽車車門密封條揮發性有機化合物(VOC)中甲苯和二甲苯的散發量超標問題 , 從車門密封條的合成材料分析了汙染物的來源,採用HPLC與GC-MS對材料散發進行檢測與分析。
  • 高管離職、人員優化,調整後的瓜子終於實現整體盈利|36氪獨家
    根據公開資料顯示,雷雁群2000年加入阿里巴巴,經歷阿里中供鐵軍整個發展過程,先後任職於阿里中供業務前線五個大區省長和後臺多個部門負責人,2018年3月加盟瓜子母公司車好多集團任COO(營運長)。具體來說,雷雁群分管車好多集團營銷戰略制定、運營管理和圍繞交易服務業務的整體規劃等工作,其中包括瓜子的車後市場部門。
  • 網站優化為企業網絡推廣發展創新機會
    在網絡時代不斷地發展中,現今做網站SEO營銷的人也變得越來越多,如今做網絡優化要想能夠在搜尋引擎中獲得獲得更多的流量和關鍵詞排名,對於站長們的SEO知識和優化推廣技術是有一定的要求的。那SEO優化要如何快速提升網站排名?
  • 圖謀二手市場 阿里「閒魚」誰來買單
    而在即將上市的前夕,阿里終於有所收斂,沒有再爆出驚人消息,卻轉而開始「縫縫補補」,力爭將已有的資源進行優化。近日,阿里宣布旗下淘寶二手移動客戶端在經過改版以後,以「閒魚」的名字正式上線。「閒魚」的推出,顯示出阿里對二手市場的野心。重建二手市場的標準,重整二手市場的規範,將是「閒魚」的終極目的。但對於其他二手平臺來說,它們能為「閒魚」的高調進入買單嗎?
  • 考拉海購升級「會員電商」,年輕化與差異化之外,阿里還要什麼?
    據稱,「全新的會員體系設計」已經提上提上日程,未來,產品、技術、商品、供應鏈等要素都將圍繞「黑卡會員」優化。(截圖:考拉海購App)半年整合期後,考拉海購進入阿里時間在釘科技看來,這一系列操作都要置於一個大背景之下,考拉海購併入阿里巴巴體系之後半年整合期的完成。據了解,2019年9月6日下午的管理層會議上,阿里方面表示,考拉海購在六個月期間會按照網易的方式運行。而從,4月1日開始,阿里對考拉開通了內網的所有權限,考拉海購進入了阿里時間。
  • 阿里的「犀牛智造」能讓追趕潮流的都市麗人梅開二度嗎?
    根據中服網消息,都市麗人將和阿里新推出的「犀牛智造」進行合作,生產女款德絨保暖衣、液體萊卡女士打底褲,並計劃在明年推出更多黑科技面料的明星款產品。在今年8月的秋冬新品發布會上,不同於以往主打時尚感和設計感,從會場布置到內容分享都著重於強調科技感。發布會上的「輕暖科技實驗室「帶到了現場。此次與阿里「新製造」的聯手可謂與品牌的轉型方向不謀而合。
  • 玖雲平臺成為阿里云云市場計劃合作夥伴,進駐API服務市場
    眾所周知,阿里云云市場是中國最大的雲計算/企業服務平臺之一,作為阿里雲的戰略發展點,它承接著中國雲生態各個鏈條產品的落地。截至目前,阿里云云市場已經覆蓋了企業應用、基礎軟體、上雲服務、解決方案、IoT等多種場景。阿里云云市場每年服務超50萬家企業,幫助企業一站式獲取到專業的產品與解決方案,引領數位化轉型浪潮。