分布式存儲與離線混部彈性計算平臺實踐

2020-12-25 IT168

【IT168 SACC現場報導】在數位化轉型時代,雲已成為萬物智能的數位化大腦。而隨著大數據應用、人工智慧、移動網際網路等技術的飛速發展,「智慧+」的概念正在深入到各行各業,提升企業效率,釋放商業潛能,創造全新機遇。作為國內頂級技術盛會之一,2017中國系統架構師大會(SACC2017)將於10月19-21日在北京新雲南皇冠假日酒店震撼來襲。

大會第三日,搜狗雲平臺資深高級開發工程師申賢強針對HDFS 當集群擴大一定階段後需要應對的問題,以及具體的 Fedration 的技術,針對 YARN 改進彈性計算框架改進可能遇到的問題做了分享。

申賢強,2012 年 7 月畢業於中科院計算所,2012 年 7 月—2013 年 7 月,百度,網頁搜索部,分布式架構開發,2013 年 7 月—至今,搜狗,大數據平臺部,主要負責 Hadoop,HBase,Docker 等基礎平臺的開發和建設,以及提供一站式數據分析服務。

申賢強認為,基於社區的 HDFS 進行元信息的垂直擴展,且進一步優化針對二級目錄的拆分,讓 HDFS 的元數據更加均勻,降低 GC time,提升 HDFS 穩定性到 99.99%,同時業務發展制約於計算資源的缺乏,因此採用離線混布的計算模型,將資源進行統一管理,提供穩定高效的服務,極大的解決了業務方資源不足的問題。

關於搜狗雲分布式存儲與離線混部彈性計算平臺,是基於Apache Hadoop生態,建設搜狗海量數據存儲和計算平臺,能夠提供穩定高效的數據分析系統,為搜狗各類型大數據應用,提供一站式數據處理服務 。每天數十億的數據增量,數以萬計的數據計算流程,使數據的價值得到充分利用,作為前沿技術落地及推進開源技術的發展起到了重要作用。

對於當初的技術選型階段,申賢強吐露,通過考察國內外主流企業和網際網路企業,為了實現集群的無限擴容,提供高性能、高可用,搜狗雲借鑑和自研的垂直擴展Hadoop元信息的技術,即社區的Fedration方案,將集群的管理能力擴展到理論無上限,且保持高性能,穩定性達到99.99%。

申賢強介紹,搜狗雲在分布式存儲優化方面,主要分為HDFS Fedration、NameService拆分、FastCopy、等切分、拆分和優化部分,優化後Master的性能和吞吐提升3倍 ,計算性能提升12%以上 ,SLA水平到達99.99%。

搜狗雲彈性計算平臺的構建背景主要源於資源需求在增加,但資源的整體利用率卻不高、解決實際業務資源不足問題,CPU等資源利用率低。

C/S業務彈性計算—總體流程包括:Driver精細的資源控制,Docker環境隔離 ,YARN自動化資源控制 ,基於時間/負載的資源調度。在基於負載調度方面,Driver收集CPU/Mem/Net/Disk負載,負載超過閾值Driver Kill Service ,Driver將負載信息上報給LocateServer ,NodeManager將負載上報給RM ,RM根據負載進行資源調度 ,LocateServer根據負載返回Service Client 在不影響集群原有服務,以提高集群的利用率。

在集群統一管理優勢是提高並均衡集群利用率,解決業務方資源不足的問題以及節約成本,提高online業務的SLA水平。

▲更多精彩請點擊:http://sacc.it168.com/topic2017/

相關焦點

  • 什麼是分布式存儲?Filecoin 的深入研究
    02分布式存儲簡介現代計算處於高度集中的階段,在過去的十年時間中,一些大型存儲公司通過將傳統計算機系統劃分雲存儲產品獲得了巨大的財富。這側面反映了現代化網絡中心化集中的現象——如果其中一個供應商發生問題時,便會衍生成重大的網際網路事件。
  • IPFS的分布式Web新協議∣實現分布式雲存儲
    HTTP和IPFS 的關係就好比「中心化存儲」與「分布式存儲」一樣,HTTP依賴中心化伺服器,容易遭受攻擊,訪問量暴增伺服器容易宕機,下載速度慢,存儲成本高;而IPFS是分布式節點,更加安全不易被DDoS攻擊,不依賴主幹網,降低存儲成本且存儲空間大,下載速度快還能查找文件歷史版本記錄,並且理論上能永久儲存。
  • 課程實錄:大規模高並發下的分布式存儲架構設計
    在海量數據時代,傳統存儲系統已難以滿足業務運行需求,分布式存儲大放異彩,發展迅速。但對於許多企業來說,提高存儲系統的並發性能仍然是一大挑戰,此外系統穩定性、靈活擴展能力、整合異構存儲資源的能力、以及對資源進行智能化管理的需求也不斷增長。如何解決這些問題,成為企業IT部門的重要任務。
  • 什麼是分布式存儲?(IPFS, FileCoin, Sia, Storj & Swarm)
    自網際網路開始使用以來,數據洩露就隨之而來,公司已經學會了處理它們,但它也引起了人們的注意,新的底層技術可能有助於為部分情況提供解決方案(即分布式存儲)。分布式存儲是區塊鏈公司正在研究和實施的潛在解決方案。 它是一個能夠存儲文件的系統,無需回復大量集中的數據孤島,這些數據孤島不會破壞隱私和信息自由等重要價值。
  • 公有雲+邊緣+專有雲加速融合,騰訊Techo Park無邊界計算分論壇解析...
    在強大的雲計算集中式算力基礎上,為企業提供低延遲訪問本地系統的算力服務,實現數據本地化處理和存儲,以進一步滿足安全合規要求,已成為眾多雲產商的重要發展策略。在無邊界計算分論壇上,騰訊雲多名高級工程師就與業界大咖及合作夥伴共同分享在邊緣計算的發展趨勢以及在雲中心、邊緣和專有雲場景下,企業如何更好獲得一致的算力和統一的基礎設施能力。為開發者們帶來一場邊緣計算和專有雲的技術盛宴。
  • DTCC2020阿里雲李飛飛:雲原生分布式資料庫與數據倉庫系統點亮數據...
    完美的Partition Sharing是不存在的,這些是分布式業務需要解決的核心挑戰,以及在這個架構需要做到的高一致性保障。雲原生的架構,本質上底下是分布式共享存儲,上面是分布式共享計算池,中間來做計算存儲解耦,這樣可以非常好地提供彈性高可用的能力,做到分布式技術集中式部署,對應用透明。
  • 計算存儲分離之「數據存儲高可用性設計」
    一、背景  面對著業務的發展,不管是在線,近線還是離線系統,其所需要的存儲規模以及存儲成本,成倍上漲。如果還是採取傳統的分散式存儲管理方式,除了高昂的管理分散式存儲的成本,還會增加存儲成本。  因此,我們極需一種既高效又省成本的數據存儲以及存儲管理方式。
  • 方物vStorage與EMC ScaleIO分布式存儲雙劍合璧
    時至2015年春末,國內自主研發的方物虛擬化套件FVI,搭載EMC公司ScaleIO平穩服役超過5個月,經過行業用戶長期測試與成功實踐,意味著方物與EMC在分布式存儲領域合作成功,Fronware虛擬化平臺的存儲方案為用戶提供了更多的選擇。
  • 為什麼雲原生+分布式是資料庫的未來?
    資料庫領域絕對不能僅僅只做 TP 資料庫(事務處理/在線交易),接下來的發展會越來越多看到像 HTAP 這種技術,將在線事務處理和在線分析與計算合二為一,將在線分析和離線計算合二為一,我們會看到越來越多資料庫和大數據系統的結合。從產品體系上,我們要為客戶提供端到端的數據能力,包括生產、處理、存儲、計算分析等。
  • 分布式存儲特徵優勢有哪些呢?
    2020年,分布式存儲元年,ipfs/Filecoin分布式存儲屬於區塊鏈的基礎設施,是區塊鏈「數據生命」的承載者。分布式存儲是一種數據存儲技術,簡而言之,數據分散到多個存儲伺服器,而這些分散的存儲資源,構成了虛擬存儲設備,實際上,數據分散存儲在伺服器的每一個角落。傳統的中心化存儲,所有數據集中存儲在伺服器上,伺服器已經成為系統性能的瓶頸,可靠性和安全性差,不能滿足大規模存儲應用的需要。如果存儲運營商出現問題,就會導致重大的網際網路事件。
  • 機器學習實踐心得:數據平臺設計與搭建
    上半部分是生產環境,運行著數據處理pipeline,同時與數據建模平臺對接著。  在生產環境中,模型對應的特徵數據分兩類:  一類是實時特徵數據,比如數據實時採集,生成一些實時的特徵,根據不同的業務需求存儲在不同的集群裡。  另一類是離線特徵數據,離線數據加工後存到Hive,供模型應用側進行使用。
  • 精英雲集,看國內外12家頂級公司大數據實踐
    簡要介紹Kafka的特性,闡述為何Kafka是實時計算系統中理想的數據存儲方案;詳細介紹Druid的架構設計及原理,闡述Druid作為OLAP解決方案的優點;詳細介紹Samza的架構設計及原理,闡述如何通過Samza解決實時計算中的各種挑戰;介紹Lambda architecture,闡述如何將離線計算和實時計算統一起來,通過離線計算來修正實時計算。
  • 大數據時代資料庫-雲HBase架構&生態&實踐
    Hadoop & Spark可以解決計算複雜性和靈活性,但是解決不了延遲的問題;HBase&分布式索引、分布式資料庫可以解決靈活性與延遲的問題,但由於它沒有很多計算節點,所以解決不了計算複雜性的問題。Kylin(滿足讀延遲)在計算複雜性與延遲之間找了一個平衡點,這個平衡點就是怎樣快速出報表,但對於這個結果的輸入時間我們並不關心,對於大部分的報表類的需求就是這樣的。
  • 河南移動的MPP大數據平臺對象存儲實踐
    這一解決方案導致:在應用端,無法實現多種數據融合分析,多並發能力不足查詢效率不高;在存儲端,計算存儲緊耦合不夠彈性,出現存儲訪問瓶頸,無法支持海量數據的按需擴展;以及更複雜的運維,更高的建設成本,逐漸難以滿足海量日誌分析的需求。
  • Ceph殺手鐧CRUSH和主流分布式存儲一致性哈希算法
    引言在當前雲計算推廣如日中天的時代,企業和個人每天都會產出大量的數據,數據做為企業和組織的最寶貴資產,海量數據對後端存儲的彈性伸縮能力、敏感數據的安全性、可靠性、一致性以及存儲系統的IOPS和吞吐量有了更高的要求。江湖傳聞:「武林至尊,寶刀屠龍,號令天下,莫敢不從」。
  • 為什麼存儲的彈性很重要
    /f320981ms7q.html)  存儲彈性小科普  「彈性」即意味著具有回彈的能力,也就是當設備出現故障,可以快速恢復並繼續運行。當一個存儲系統的設計是為了保護和糾正常規工作流程中發生的異常情況時——就被稱為"彈性"。  為了使存儲系統達到高度的彈性,系統必須既能容錯,又能提供各種數據管理技術,其中還可能包括虛擬化。理想情況下,具備彈性的系統可以讓用戶永遠都不知道發生過中斷。  那麼,有哪些方法可以判斷  存儲系統是否擁有彈性?
  • DDS生態社區:ipfs分布式存儲相關應用有哪些?
    今天,DDS生態社區分享更多關於IPFS的應用程式,這些應用程式涵蓋的應用範圍很廣,並不是特定的某個方面,只是想讓您知道IPFS分布式存儲無處不在。這些上傳的照片存儲在哪裡?當然,在IPFS分布式存儲網絡中,它可以永久存儲,並且不必擔心隱私問題,因為它具有私鑰的加密保護。每個用戶將獲得一個唯一的安全私鑰,該私鑰屬於他自己,永遠不會被共享。用戶使用的每張照片都用其私鑰加密,並獲得一個唯一的指紋,該指紋存儲在用戶的數字錢包中。控制你的數據。從照片開始,Textile就是你的數碼錢包。
  • 信息爆炸時代 數字圖書館分布式對象存儲
    但馮諾依曼體系架構沒有考慮並行計算和數據共享情形,在如今的網絡時代,大量計算設備通過網絡形成一個龐大的,相互獨立而又統一的計算系統,因此我們可以總結出一個數據存儲的通用模型,這個模型包括兩級存儲,其存儲容量差距約1000倍:  SAN和NAS技術已經出現了10多年,目前單臺SAN或NAS最大容量已經做到PB級別,但在應對EB級數據挑戰時,還是顯得有些力不從心。
  • 解讀|以Filecoin為例,談分布式存儲機制的優點
    分布式存儲一躍成為行業內為數不多的熱點概念之一。簡單來講,去中心化存儲通過分布式存儲技術將文件或文件集分片存儲在不同供應方提供的磁碟空間上,成為了分布式技術更好落地的基礎設施之一。在傳統雲存儲服務上,已有了一套邏輯完整的存儲商業模式,這讓一部分傳統領域的投資機構同樣看懂了這一商業邏輯,帶來了增量資金。