IPFS和Filecoin最近越來越火
有人說,IPFS是網際網路世界的未來
還有人說,IPFS分布式存儲或成為未來趨勢
IPFS到底有什麼神奇之處?
今天給大家帶來IPFS愛好者必讀手冊
帶大家一探究竟
開始!
啥是IPFS?
IPFS是一個面向全球的、點對點的分布式版本文件系統,也可以看成是一種去中心化的超媒體分發協議。
啥是Filecoin?
Filecoin是一個由區塊鏈和原生代幣構成的去中心化存儲網絡,Filecoin是IPFS的唯一代幣,是運行在IPFS上面的激勵層,用以確保IPFS文件系統所存儲的數據安全可靠。
IPFS必讀手冊 IPFS的存儲需求和挑戰
IPFS作為分布式存儲的新興場景,與傳統的分布式存儲場景有著較大的區別,主要分為性能、可靠性、容量、供應、價格、易維護性這幾個方面的需求。
性 能
在性能上主要分為三部分挑戰。
1、sealing大文件大帶寬的封裝寫入
2、windowpost針對所有sector的隨機讀抽查
3、winingpost出塊權,針對贏filecoin的sector進行檢驗
在sector sealing階段,因IPFS龐大的數據封裝寫入,有大帶寬的寫入需求,每個文件大小為32G,業內優化做的比較好,且與浪潮合作的廠商,如加密矩陣、星河華訊等,能實現單worker每日封裝2TB-6TB,而每個存儲集群可接入幾十上百個worker,故整體對存儲集群的大文件順序寫入有極高的要求。
在windowpost階段,需要在一天的48個窗口內,對所有的partition進行隨機抽查,並且在規定的時間內提交完成,對存儲讀取的要求,通常需要在3-4分鐘內完成。集群總容量3.5PB以內,每個partition有2349個sector需要進行隨機檢查,而隨著集群規模的繼續增大,每個partition所含有的sector也會進行增長,每增加3.5PB容量,單partition會增加2349個sector,而對要求提交的時間卻仍然為3-4分鐘,故大規模礦池存儲集群下,windowpost的隨機讀壓力對存儲也是有極高的挑戰。
在winningpost階段,針對出塊的sector,需要進行隨機的抽查,要求在3S左右完成對隨機小塊數據的讀取,通常為單線程處理,對存儲小IO隨機讀取的時延有非常高的挑戰要求。
可 靠 性
在可靠性方面,為了防止sector因節點/硬碟/機櫃等硬體故障而丟失,高可靠的存儲是區塊鏈服務供應商保證收益的重中之重,一方面是為了保證現有算力的維持,另一方面避免因丟失sector而帶來的抵押幣損失。
隨著IPFS行業的發展,主流區塊鏈服務供應商已經逐步從原始的組裝機+JBOD的方案轉向專業的企業級分布式存儲,通過糾刪碼、快速重構、高可靠硬體等技術,實現大規模sector封裝的零丟失,零懲罰。故障出現後,為保證算力封裝的效率和POST檢查的通過,不僅要求數據不丟失,同時在集群降級情況下,不影響業務的正常使用,並在短時間內能恢復。
容 量
在容量方面,截止2021年1月6日,單帳戶最大封裝的容量已達到72PB,預計未來在IPFS場景下百PB級集群將會越來越多,這要求存儲在容量上支持百PB級,甚至EB級規模,因此橫向擴展、在線擴容方面,同樣對存儲提出了極高的要求和挑戰。
供 應
在供應方面,主要包含兩大塊。
1、設備的生產供應
2、維保/實施等服務的供應
首先,因資金的時間成本,數據量寫入量大,最終用戶的時間要求等因素,IPFS區塊鏈服務供應商通常要求存儲的供應商能夠在接到訂單的1-2周內完成發貨和實施。因IPFS場景通常每次訂單的規模少則幾十個,多則上百個節點,對應單次訂單所需要的大容量硬碟數量是以千計的,在供應和生產上也是非常考驗存儲廠商的基本功。
其次,因機房的分布情況不同,同一家可能在中國各地有對應的設備,一旦出現故障,需要有全國範圍內的服務支持體系去協助排查和解決問題。
價 格
在價格方面,為保證足夠高的投資回報率,IPFS服務供應商對存儲每TB價格提出了極高的要求,這要求存儲廠商在滿足基本性能的情況下,針對IPFS場景的IO模型進行調優,並儘可能降低硬體配置,實現最優性價比的方案。
易 維 護 性
在易維護性方面,因數據量和設備量巨大,涉及到多套存儲集群的統一管理和運維,要求存儲集群能夠提供智能化的運維管理工具,降低運維壓力和成本。
IPFS必讀手冊 浪潮IPFS解決方案優勢
極 致 性 能
浪潮針對IPFS場景獨特的大文件寫入,小塊隨機讀的IO模型進行了深入的優化,在大帶寬持續寫入,並在降級重構時,實現了3分鐘內完成windowpost讀取,3S內完成winingpost讀取的成果,平均單個IO時延響應在35ms以下。
首先,通過針對Ubuntu 18.04和20.04作業系統進行優化,縮短標準協議的IO路徑,並降低因用戶態和內核態轉換所帶來的上下文切換開銷,相比於通常傳統的掛載延時降低50%,帶寬提升80%,大幅降低時空證明讀取時間,並提高sealing寫入速度。
其次,通過讀寫優先級優化,避免在大帶寬寫入時,對時空證明的時延影響,保證時空證明的順利進行,降低抵押幣損失風險。
再次,基於NVMe SSD直接裸設備管理機制,在縮短IO路徑的同時提高了數據組織管理效率,實現數據與元數據的徹底分離,解決了日誌疊加日誌的設計,降低寫放大。並優化底層的流控機制,降低IOPS、時延抖動。寫性能翻倍,時延降低50%。
最後,通過分布式重構以及數據恢復QOS技術,保證在重構時sealing和時空證明不受影響,並快速恢復集群至正常狀態。
極 致 性 價 比
浪潮針對IPFS IO模型獨特優化和設計後,形成了差異化領先的IPFS存儲解決方案,為客戶提供更具性價比的方案,在保證性能滿足的情況下,綜合成本每TB下降10%-20%。
一方面,藉助極致的性能技術,極限優化配置,降低不必要的CPU、內存、SSD、導軌等開銷,提升單位容量的性價比。
另一方面,通過業內獨有的4U60高密分布式存儲節點,相比於傳統的4U36機型,單盤平均功耗下降13%,空間利用率提升66%,並提供13類部件的熱維護,顯著提高運維效率,降低成本。
極 致 可 靠
浪潮分布式存儲在底層硬體上採用通用的X86伺服器,但在firmware上進行了獨特的加固處理,優化異常情況的處理,降低異常處理風險。同時,在生產上,通過獨特的篩盤機制,從成千上萬塊硬碟中,篩選出最符合要求的硬碟,用於分布式存儲的部件,大幅降低機械硬碟的故障率。
除此之外,在軟體上,通過糾刪碼、RAS架構、慢盤檢測等技術,大幅提升系統可靠性,已累計部署超1000套,經受過市場的檢驗,並在金融、能源、通信等核心領域廣泛應用。在IPFS業內也與如冰河實驗室、星宮數據等廠商有合作,可滿足IPFS場景下的存儲需求,方案成熟穩定。
極 致 服 務
浪潮依託於中國第一,世界前三的服務產量規模,能為客戶提供全球主要國家地區的服務和維保。同時,依託於全球化的供應鏈、智能工廠體系,滿足客戶在短期內大批量的採購需求,實現資金的高效運轉。
同時,浪潮支持遠程的POC測試環境,針對產品的實際表現若存在疑慮,可申請免費的遠程測試資源,快速完成驗證,避免設備借物帶來的運輸、時間上的開銷。
極 易 管 理
免費贈送Inview智能管理平臺,實現多套存儲集群的統一監控管理,支持歷史性能統計、磁碟故障預測、性能趨勢預測、容量趨勢預測等功能,並能提供北向API接口被集成。大幅提升客戶的易用性,並降低運維成本。
浪潮InView智能管理平臺
未來,隨著5G、AI、大數據、區塊鏈等新技術的加速普及和商用,數據的產生量、產生方式、處理方式將不斷發生巨大變化,分布式存儲的發展革新必將成為新數據時代下新存儲解決之道。
正是由於在新存儲產業領域、新行業應用場景的深厚積累和不斷探索,浪潮存儲收穫了第三方機構的高度認可,多次入選Gartner魔力象限和用戶評測報告。浪潮存儲將繼續敞開胸懷,探索新興場景下的分布式存儲技術,以新存儲之道釋放數據要素價值,在數據存儲領域助力各行業領域業務創新,驅動智慧化轉型升級。