揭秘海象分布式存儲系統

2021-03-02 信也科技拍黑米
延續了大數據海洋生物的產品系列,海象在海水中靠著流線型的身體、發達的肌肉以及強有力的鰭狀肢,行動自如,大而不笨。就如同我們的海象系統一樣,在承載了成千上萬的文件之後依然可以穩定,高效的運行。我們的目標是秒接入,秒傳!隨著我們部門系統不斷增加,對文件存儲的需求也越來越大。上傳完視頻和圖片之後我們還有實時預覽的需求,所以用傳統的ftp保存就不能滿足我們了。由於我們這邊需要保存大量的圖片和視頻,使用第三方阿里雲,七牛雲,騰訊雲這些存儲服務,要提前走流程審批,提預算,費用較貴,使用第三方的服務也不利於後期我們其他系統的接入和存儲。我們就有了做個自己的分布式存儲系統的想法,海象由此而生。海象可以快速接入,只需管理員後臺開通帳號,對接接口即可。海象目前提供了restful接口上傳和js直連上傳。根據我們的接口文檔要求對接即可享受秒傳服務。目前主流的分布式存儲服務有: TFS, Ceph, FastDFS, Minio
TFS :是淘寶開發的一個高可擴展、高可用、高性能、面向網際網路服務的分布式文件系統,主要針對海量的非結構化數據Ceph: 是加州大學Santa Cruz分校的Sage Weil(DreamHost的聯合創始人)專為博士論文設計的新一代自由軟體分布式文件系統FastDFS: 是一個輕量級的開源分布式文件系統,主要解決了大容量的文件存儲和高並發訪問問題,文件存取時實現了負載均衡Minio: 是GlusterFS創始人之一Anand Babu Periasamy發布新的開源項目。Minio兼容Amason的S3分布式對象存儲項目經過對比發現MinIO 對象存儲系統是為海量數據存儲、人工智慧、大數據分析而設計,基於Apache License v2.0 開源協議的對象存儲系統,它完全兼容 Amazon S3 接口,單個對象的最大可達 5TB,適合存儲海量圖片、視頻、日誌文件、備份數據和容器/虛擬機鏡像等。Minio採用去中心化設計,摒棄複雜的大規模集群調度管理去除對第三方組件zookepper,kafaka等的依賴,減少風險因素與性能瓶頸,打造高可靠的集群、靈活的擴展能力以及超高的性能。Minio集群安裝簡單,監控完善,易於維護,對linux運維要求很低。Minio採用的是建立眾多的中小集群組成集群聯盟,減少集群之間出錯互相影響。

海象系統總體分為兩大部分web端管理系統,底層Minio存儲系統。目前minio集群由兩臺機器構成的,每臺機器創建兩個data目錄。其他系統調用接口上傳文件時,minio會把這個文件平均分成兩份放到兩天不同的機器中。當一臺的某個文件損壞時,minio會自動檢測並恢復此文件。

對象:類似於hash表中的表項:它的名字相當於關鍵字,它的內容相當於「值」。租戶:用於隔離存儲資源。在租戶之下可以建立桶、存儲對象。用戶:在租戶下面創建的用於訪問不同桶的帳號。可以使用MinIO提供的mc命令設置不用用戶訪問各個桶的權限。

上傳一個文件後minio會生成兩個文件part.1和xl.josn 其中xl.josn中存放的是這部分文件的詳細信息(文件大小,桶位置,糾刪碼信息等),part.1中會存放糾刪碼或者文件信息。下載一個文件時,minio會根據存儲的糾刪碼和文件部分組合合成一個完整的文件。

Minio中引入了糾刪碼技術,糾刪碼的具體作用是:

糾刪碼是一種恢復丟失和損壞數據的數學算法, Minio採用Reed-Solomon code將對象拆分成N/2數據和N/2 奇偶校驗塊。這就意味著如果是12塊盤,一個對象會被分成6個數據塊、6個奇偶校驗塊,你可以丟失任意6塊盤(不管其是存放的數據塊還是奇偶校驗塊),你仍可以從剩下的盤中的數據進行恢復

糾刪碼的工作原理和RAID或者複製不同,像RAID6可以在損失兩塊盤的情況下不丟數據,而Minio糾刪碼可以在丟失一半的盤的情況下,仍可以保證數據安全。而且Minio糾刪碼是作用在對象級別,可以一次恢復一個對象,而RAID是作用在卷級別,數據恢復時間很長。Minio對每個對象單獨編碼,存儲服務一經部署,通常情況下是不需要更換硬碟或者修復。Minio糾刪碼的設計目標是為了性能和儘可能的使用硬體加速。


MinIO對象存儲系統從設計之初就考慮到修復靜默錯誤,從被修復的目標來說,按照大小可以分為以下三種類型的修復:某個對象、某個桶、整個集群。當文件由磁記錄磨損、磁碟幻象寫(phantom writes)、磁碟指向錯誤導致損壞時,在控制臺上執行mc命令即開始進行數據修復。該命令一方面向minio發送數據修復的HTTP請求,另一方面不斷地接收minio服務進程返回的修復進度信息,而後輸出到控制臺,直到修復工作完畢。如前面所述,每個對象都被分成多個分片,然後存儲於多臺主機的磁碟上。數據修復可以分為正常、深度兩種模式,正常模式下只是簡單地檢查分片狀態信息,深度模式下會使用hash算法來校驗分片的內容,找出比特位錯誤,同時也更耗費資源。

Minio集群不支持對單個集群進行擴展,MinIO對象存儲系統的這種設計,使得系統的很多模塊更加簡單(比如從一個對象轉換到它所在的糾刪組,只用簡單的哈希即可。)降低了整個系統出錯的概率,使得MinIO對象存儲系統更加可靠、穩定。當容量不夠需要擴容時,minio支持聯盟集群的形式,再創建一個minio集群和原來的集群形成聯盟。當有文件上傳到聯盟集群時minio會判斷哪個集群容量大,就向大的集群存儲,以達到容量均衡的目的。

每分鐘上傳文件

https://blog.csdn.net/liuben/article/details/101529892

相關焦點

  • 騰訊開源分布式存儲系統 Tendis,可完全兼容 Redis
    近日,騰訊宣布開源一個與 Redis 協議完全兼容的高性能分布式存儲系統 Tendis。
  • HDF星盤文件系統 或將引領新一代大數據分布式雲存儲
    眾所周知,區塊鏈因其去中心化、信息不可篡改等的特徵及分布式存儲、非對稱加密算法、時間戳、共識機制等技術特點給數據賦予了真實、可信等的保障。星盤文件系統Hard disk Distribution File System(簡稱"HDF")則運用了區塊鏈技術,將文件存儲和安全相結合,讓存儲在HDF的文件得到合理有效的保護。
  • 中心化存儲與分布式存儲,未來在哪裡?
    1、中心化交易的結果當我們接觸這個行業的時候,一般都是在中心化交易所註冊,再交易,所有的數字貨幣也是由交易所來託管的,也就是存儲在交易所的數字錢包中,私鑰也是被交易所託管掌握,正因如此,每次大牛市來臨之際,就會出現交易所跑路的現象,比如去年Fcoin跑路,大批用戶損失慘重,那可是多年的血汗錢啊!
  • 八年鍛造,為雲而生,QingStor 分布式存儲全線升級
    作為混合雲先行者和領導者,青雲QingCloud旗下QingStor分布式存儲產品從架構設計到產品開發,完全採用100%自主設計、自主研發,從零開始構建而成。這和當下國內的分布式廠商中,基於開源的分布式存儲作為底層進行二次封裝和二次開發的做法存在本質差異。
  • IPFS分布式存儲的落地應用
    隨著技術的成熟,目前IPFS生態系統中已經衍生出了較多的dapp、工具和項目,其中包括Brave,3box,EthDNS等新來者。    這些信息可以存儲在星際文件系統IPFS上。其所有上傳到平臺的數據都安全保存在IPFS系統中。
  • VEDA榮獲2020南京智博會「分布式存儲十佳品牌」
    12月19日,VEDA受邀參加由國際區塊鏈節組委會、WBA世界區塊鏈聯盟、國際分布式存儲聯合會等行業知名機構聯合主辦的南京站線下大會——「第十三屆國際智慧城市、物聯網、大數據博覽會」,其創新的生態發展機制獲得業內一致認可,榮獲「分布式存儲十佳品牌」。
  • VEDA榮獲2020南京智博會「分布式存儲全國10強」
    12月19日,VEDA受邀參加由國際區塊鏈節組委會、WBA世界區塊鏈聯盟、國際分布式存儲聯合會等行業知名機構聯合主辦的南京站線下大會——「第十三屆國際智慧城市、物聯網、大數據博覽會」,其創新的生態發展機制獲得業內一致認可,榮獲「分布式存儲全國10強」。
  • IPFS分布式存儲到底有什麼神奇之處?
    IPFS分布式存儲到底有什麼神奇之處? IPFS是一個面向全球的、點對點的分布式版本文件系統,也可以看成是一種去中心化的超媒體分發協議。 啥是Filecoin? Filecoin是一個由區塊鏈和原生代幣構成的去中心化存儲網絡,Filecoin是IPFS的唯一代幣,是運行在IPFS上面的激勵層,用以確保IPFS文件系統所存儲的數據安全可靠。
  • 今日推薦|除了 Filecoin,Arweave 與 Crust 等分布式存儲項目也...
    簡單來講,去中心化存儲通過分布式存儲技術將文件或文件集分片存儲在不同供應方提供的磁碟空間上,成為了分布式技術更好落地的基礎設施之一。在傳統雲存儲服務上,已有了一套邏輯完整的存儲商業模式,這讓一部分傳統領域的投資機構同樣看懂了這一商業邏輯,帶來了增量資金。
  • 基於分布式帳本技術的跨境支付系統應用
    分布式帳本技術及其在跨境支付領域的應用分析分布式帳本是一種在網絡成員之間共享、複製和同步的資料庫。與典型的帳本系統不同,分布式帳本系統由該系統的所有參與者而不是由一個中心方(例如銀行或清算中心)進行維護。它以密碼學技術為基礎,通過分布式多節點共識機制,完整、不可篡改地記錄交易過程。
  • 2020第三屆深圳分布式存儲行業大會在深圳會展中心舉行
    央視民生網深圳訊(記者:煜棣  陳功  通訊員:陳銳東)2020年8月14日至16日,第三屆分布式存儲行業大會暨展覽會在深圳會展中心舉行,星際文件(深圳)有限公司聯合創始人巫山老師為特邀嘉賓,現場分享新基建雲存儲的大趨勢,即要堅持做到硬體軟體運維三為一體的黑科技產業之路,同時做核心的黑技術軟體生態開發為重點,為新基建分布式存儲作出應有的貢獻。
  • 分布式系統事務一致性
    業界著名的CAP理論也告訴我們,在設計和實現一個分布式系統時,需要將數據一致性、系統可用性和分區容忍性放在一起考慮。1、CAP理論在分布式系統中,一致性(Consistency)、可用性(Availability)和分區容忍性(Partition Tolerance)3 個要素最多只能同時滿足兩個,不可兼得。
  • IPFS星際特工深度解析:被神化的區塊鏈和被低估的分布式存儲!
    星際特工論道區塊鏈分布式存儲 相比傳統的集中式存儲存在數據安全性和可靠性的問題,區塊鏈分布式存儲就可以很好地解決這一痛點,那為什麼區塊鏈分布式存儲可以解決傳統存儲方式的痛點?什麼是區塊鏈分布式存儲?
  • IPFS不只是分布式存儲?也不是為了取代HTTP?
    1)安全性:HTTP屬於集中化的,所有流量直接搭載在中心化的伺服器上,承載的壓力極大,容易造成系統崩潰,HTTP還容易遭受DDOS攻擊。IPFS的存儲方式是去中心化的、分片的分布式存儲,黑客無法攻擊,文件不易丟失,安全有保障。2)效率:HTTP依賴中心化服務網絡,伺服器容易被關閉,伺服器上文件也容易被刪除,伺服器需要24小時開機。
  • 第三屆深圳分布式存儲行業大會暨展覽會即將召開
    2020年第三屆深圳分布式存儲行業大會暨展覽會將在8月14日- 16日在深圳會展中心6號館召開。第三屆深圳分布式存儲行業大會暨展覽會此次大會作為「第八屆中國電子信息博覽會、深圳國際大數據與存儲峰會」重要組成部分,活動由工信和信息化部、深圳市人民政府指導支持,中國移動通信聯合會區塊鏈專委會、中國民營科技促進會分布式存儲分會、中國發展研究院分布式存儲研究中心,中國通信工業協會無線網格網絡MESH+IPFS專業委員會聯合主辦
  • 華為:實力見證,以軟硬結合引領分布式存儲創新
    過去的十年,企業的數據整合、視頻大聯網、金融的業務雲化等業務帶來了大量的數據並成為推動分布式存儲普及的重要力量。未來,隨著5G+AI等新技術和產業的到來,將進一步加速數據的生產和流動,分布式存儲的重要性將進一步凸顯。
  • 分布式存儲成未來趨勢丨為何Filecoin最為矚目丨星際數據
    這就過於狹隘了,應該說是以Filecoin為代表的分布式數據存儲體系是人類文明數據的基石,Filecoin是分布式存儲裡面走的最遠的那一個。Filecoin存儲網絡之所以成為分布式存儲領域最耀眼的那顆明珠,與其共識的基礎屬性密不可分。
  • 未來就緒,XSKY發布全新下一代分布式文件系統XGFS
    1分布式文件架構,如何和硬體與時俱進?數位化轉型下的軟體定義存儲架構,可以很好的滿足用戶各種需求,如在標準伺服器上的敏捷部署,可靈活擴展,性能和容量隨伺服器節點數增長而線性增長,硬體升級與更換無需跨存儲系統遷移數據,硬體升級換代紅利即時享用,業務層無感知、無影響等。
  • 大數據基礎知識:Hadoop分布式系統介紹
    Hadoop是Apache軟體基金會下一個開源分布式計算平臺,以hdfs(Hadoop Distributed File System)、MapReduce(Hadoop2.0加入了YARN,Yarn是資源調度框架,能夠細粒度的管理和調度任務,還能夠支持其他的計算框架,比如spark)為核心的Hadoop為用戶提供了系統底層細節透明的分布式基礎架構。
  • 2020年第三屆深圳分布式存儲行業大會暨展覽會最新日程
    數據存儲是基礎且關鍵的一項技術,往下可作為信息留存的基礎設施,往上可構建商業模式、形成具體產品的核心資產。IPFS和Filecoin分布式存儲,將海量數據遷入分布式、去中心的倉儲系統,數據哈希上鏈、去中心化操縱以確保不可篡改,分布式部署確保安全可靠、分發最快、體驗最為流暢。伴隨著 Filecoin的主網上線,大家對於分布式存儲的未來充滿無限期待。