什麼是分布式存儲?深入研究Filecoin

2020-12-04 星球日報

2020年分布式存儲以其獨特的姿態湧入我們的視野之中,可是我們好像從來沒有思考過,究竟什麼是分布式存儲?而我們為什麼需要分布式存儲?

實際上採用分布式存儲可以說是「被迫」的,因為面對越發飛速發展的網際網路、整個生態應用不斷創新、用戶數量不斷龐大、數據階梯式增長這些無疑不給現有的本地存儲帶來巨大的壓力。因此,必須通過採用其他分布式存儲系統去緩解相應的壓力,所以分布式存儲和分布式文件系統應運而生。

今天我們這篇文章將對於分布式存儲進行介紹,並對Filecoin進行深入研究。

定義

分布式存儲系統,是將數據分散存儲在多臺獨立的設備上。傳統的網絡存儲系統採用集中的存儲伺服器存放所有數據,存儲伺服器成為系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分布式網絡存儲系統採用可擴展的系統結構,利用多臺存儲伺服器分擔存儲負荷,利用位置伺服器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。

分布式存儲簡介

現代計算處於高度集中的階段,在過去的十年時間中,一些大型存儲公司通過將傳統計算機系統劃分雲存儲產品獲得了巨大的財富。這側面反映了現代化網絡中心化集中的現象——如果其中一個供應商發生問題時,便會衍生成重大的網際網路事件。比如:2017年Amazon網絡突然中斷;2020年6月Github長時間中斷;2020年10月Microsoft多周雲服務出現問題等等。

而我們託管在這些服務上的內容也值得我們擔心,它們被隱藏在經常斷開的脆弱連結之後面,這對我們構建的計算機系統以及越來越依賴它們的社會具有深遠的影響。集中式架構之所以成功,部分原因在於它們易於構建。為了阻止合併,開發人員需要同樣容易組成的基礎新構建塊。分布式存儲就是這樣的基石,是分布式Web的前提。

分布式存儲的基本特徵

1.彈性

現代網際網路非常脆弱。如今,Web內容隱藏在URL後面,每個URL在任何給定時刻都屬於一臺確定的伺服器,一旦供應商出於原因中斷網絡連接,其指向的內容將不可訪問。集中化會增加這種影響,造成單一節點故障並為審查提供方便。結果,在當今的網際網路中,普遍存在著網際網路連結失效的現象,就好像當一個連結斷開或永久不可用,國家級審查和分布式拒絕服務攻擊破壞可以訪問任何文件。

在理想的分散系統中,運營商的損失不應阻止用戶對先前存儲和服務的內容的訪問。通過將責任分散到網絡的許多節點上,分散式系統還可以自然地抵抗審查制度和其他拒絕服務的嘗試,因為沒有集中的目標可以使攻擊者大量獲取資源。

集中存儲系統易於受到審查的影響,一個典型的案例是當西班牙的17個自治社區之一的加泰隆尼亞,舉行獨立公投時,反對獨立計劃的西班牙政府封鎖了擁有ISP級別投票信息的網站,通過切斷這些關鍵的連結,政府有效地阻止了許多個人訪問這些信息。

然而,許多網站也使用對等存儲網絡星際文件系統(IPFS)進行了鏡像。任何運行IPFS節點的人都可以從網絡上的其他節點下載經過審查的信息,並開始自己分享。IPFS的分散化本質與西班牙政府阻止訪問這些文件的企圖背道而馳——只要一個節點被封鎖,另一個節點就可以輕易地取代它。通常,分布式存儲系統使網絡級阻塞變得更加困難。

2.效率

所有計算系統體系結構都有其優點和缺點,並且沒有單一的解決方案適合所有可能的用例。不幸的是,現代網絡對集中化的重視沒有什麼不同。如今,全球少數城市中的一些集中式數據中心存儲的內容最多。例如,如果同一網絡上的兩個用戶希望彼此發送消息,這些消息通常將發送到其中一個數據中心;如果100個用戶在一個房間裡用他們的設備觀看同一段視頻,他們每個人都會訪問一個中央伺服器並下載100份副本,而不是下載一份副本並在本地網絡上共享它。

最簡單的說法是:分布式存儲使得共享文件變得更容易,而不需要在網際網路上向特定的幾個數據中心發送請求。取而代之的是,節點之間通過儘可能少的中間人建立連接。例如,連接到其他國家的節點仍然需要幾次跳轉,但是同一網絡上的節點可以直接共享文件。分布式存儲的最終目標是建立眾多的節點,從而使每個人都可以通過本地對等的節點來獲取信息。

分布式存儲解決方案可以將基本的新效率引入此類活動。通過繞過數據中心,分布式系統可以使節點放置在比現代內容分發網絡更接近終端用戶的地方,甚至比現代內容交付網絡都更靠近最終用戶,從而大大加快了文件檢索速度。通過本地網絡進行點對點文件共享還可以節省帶寬,特別是在對更廣泛的網際網路訪問有限的地區。

分布式存儲的理想特性

儘管彈性和效率是分布式存儲的標誌,但理想的存儲系統可能還具有許多其他特徵:

1.可訪問

理想的分布式系統應該是可訪問的。參與網絡應該很容易,允許儘可能多的節點代表網絡存儲和分發文件。

如果您正在閱讀本文並想知道:我可以是一個節點嗎?答案是:視情況而定。藉助Filecoin,任何相對精通技術的人都應該能夠運行客戶端節點以與網絡進行交互。至於運行存儲礦工節點,並不是所有人都能做的,因為您需要具有滿足特定規格的硬體。

對於IPFS,節點的硬體要求較低,這意味著有可能有更多的用戶通過運行節點,或許通過運行內置的Web瀏覽器,對網絡做出貢獻。雲服務提供商使廉價,可靠的存儲比以往任何時候都更容易使用。它們成功的一個主要方面是能夠通過API通過代碼配置和管理存儲的能力。任何競爭性系統都應該能夠提供相同級別的便利。

2.內容尋址

如前所述,URL體現了一些內在的設計折衷。它們描述的是數據的位置,而不是數據的內容。為了解釋集中式系統是如何使查找數據變得困難的——假設您想下載一隻毛茸茸的小貓的照片。考慮以下兩個URL:

https://example1.com/cat.jpeg

https://example2.com/cat.jpeg

這些URL都引用了一個名為cat.jpeg的文件,但不能保證這兩個文件相同。如果example1.com離線,則無法確定example2.com是否滿足您的需求-cat.jpeg可能完全不同。事實上,它甚至可能是一張狗的照片!URL和它引用的內容之間沒有固有的關係。

因此,你沒有辦法問今天的網際網路,「有人有這個文件嗎?」因為除了它的位置之外,你對文件一無所知。

當您使用URL共享文件時,可能會出現問題。伺服器可能會從該URL開始提供不同的文件,或者有人會執行中間人攻擊並修改文件(奇怪的是,這種攻擊並不少見)。很難確認訪問URL的每個人都收到了他們想要的文件。

相比之下,內容尋址基於內容標識符(CIDs)查找文件,CIDs作為文件的數字指紋。用這種方式尋址文件解決了位置尋址的問題。當客戶端需要一個文件時,他們向網絡中的節點詢問具有特定CID的文件,而不是向一個伺服器詢問URL。客戶端下載文件後,便會自己對其進行指紋識別。

回顧我們前面的例子,就好像所有網站都對輸入cat.jpeg時要交付的文件有共同的理解。因此,雖然不能保證任何節點都具有特定的cat.jpeg,但這些節點將檢查該文件的指紋以嘗試找到匹配項。

儘管像指紋識別這樣的步驟需要比普通人要多的技術知識,但Filecoin和IPFS客戶可以輕鬆地使此過程自動化。這樣一來,客戶就可以保證他們已收到所需的文件-在此系統中,查找數據的備用提供者很簡單。

主要要點:CIDs意味著您可以找到集中式系統中可能丟失的內容,CIDs還可以防止中間人攻擊或伺服器在特定URL處突然更改文件。

3.獨立性

無信任系統允許雙方進行合作,而不需要了解對方或尋求第三方。她認為,系統的激勵促使參與者朝著網絡運行所必需的行為前進。

4.可驗證

理想的存儲系統應該能夠輕鬆地持續證明節點正在存儲它們所承諾的精確數據。這種類型的可審核性是實現不信任的關鍵。如果您總是能夠確定數據被正確地存儲,那麼您就不太需要信任提供存儲的一方。

5.開放性

最後,理想的分布式存儲系統是開放的:它的代碼是開放原始碼的,並且是可審計的。此外,存儲系統不應該是單塊的。相反,它應該公開一個任何人都可以實現和構建的開放協議,而不是鼓勵鎖定。

案例研究:Filecoin如何體現這些特徵

Filecoin項目是一個分布式存儲系統,旨在滿足這些特性。在2014年的描述中,Filecoin協議最初是作為一個激勵層開發的星際文件系統(IPFS),一個對等存儲網絡。與IPFS一樣,Filecoin是一種開放協議,它基於其較早版本的屬性,利用相同的底層對等和內容尋址功能。

Filecoin節點網絡為文件的檢索和存儲提供了一個分散的存儲市場。這個網絡是由一個新的區塊鏈支持的,它記錄了網絡參與者所做的承諾。用戶使用區塊鏈的加密貨幣FIL在網絡上進行交易。

1.檢索市場

在檢索市場上,被稱為檢索礦工的節點競爭將文件儘快提供給客戶端。檢索礦工通過少量的FIL費用獲得獎勵。這使得位於關鍵位置的節點有了加入網絡的動機,並促進了文件的快速分發。它還鼓勵建立一個穩健的網絡來複製和保存急需的文件。

2.存儲市場

在Filecoin的存儲市場中,被稱為存儲礦工的節點被授權在各種特性上競爭,比如價格和位置,為客戶提供指定時間內的文件託管合同。存儲礦工在接受合同前,必須先進行抵押FIL;如果存儲礦工未能履行其對客戶的義務,則此功能可用於自動向客戶償還費用。

當存儲礦工和他們的客戶達成協議時,客戶將他們的數據傳輸給存儲礦工。存儲礦工將其數據添加到一個扇區,扇區是Filecoin中存儲的基本單位。然後礦工執行計算密集型操作(稱為封裝),以創建該扇區數據的唯一副本。

如果客戶希望存儲其數據的多個唯一副本,那麼封裝過程將確保每個副本都具有惟一的指紋,而獲取該指紋所需的計算量將防止節點從基礎數據重新生成指紋,從而避免作弊。數據最終用於向Filecoin區塊鏈發布複製證明。

在存儲交易期間,需要定期要求存儲礦工向區塊鏈提交時空證明。礦工使用隨機性(由區塊鏈本身提供),密封扇區和發布到區塊鏈的複製證明來獲得這些證明。這些證據為客戶端提供了一個強有力的概率論證,即存儲礦工擁有完整,唯一的數據副本。這是一個非常有力的保證-甚至是現代雲存儲提供商也無法提供其客戶。

客戶通過支付FIL作為交易費來獎勵Filecoin存儲礦工。還為存儲礦工提供了為區塊鏈挖掘區塊的機會,這既需要FIL獎勵,也可以向希望在開採塊中包含消息的其他人收取交易費用。Filecoin的證明系統意味著礦工需要一些額外的硬體,但對於技術熟練的個人來說,要求仍然很低。作為客戶端參與網絡的硬體要求是適當的,Filecoin節點還公開了一個用於與網絡進行編程交互的API,允許第三方服務在核心網絡功能之上構建。

結論

分布式存儲提供了一種與傳統的集中式存儲相對應的強有力的選擇。它為開發人員提供了探索設計計算空間的機會,從而強調了內容存儲和交付的穩定性和效率。Filecoin表明,通過分布式存儲可以不僅可以讓數據更加安全;也可以讓Web3.0網絡為更多人使用。

相關焦點

  • Filecoin官方信息|分布式資本生態系統基金助力Filecoin
    原標題:Filecoin官方信息|分布式資本生態系統基金助力Filecoin 原文https://filecoin.io/blog/fenbushi-ecosystem-fund/ 分布式資本與協議實驗室合作,宣布在IPFS和Filecoin生態系統中投資一千五百萬美元。該基金的任務是推動IPFS和Filecoin生態系統的發展。
  • Filecoin是什麼意思 應該如何選擇Filecoin現貨和期貨
    Filecoin是什麼意思 應該如何選擇Filecoin現貨和期貨Filecoin消息 ,一直 備受關注的Filecoin終於 兌現 了承諾 ,在2020年 10月15日前 正式啟動 項目 主網 。到底 什麼是 Filecoin,我們 又該如何選擇現貨 和期貨 呢,有興趣 的小夥伴們 一起 往下看。Filecoin是什麼意思Filecoin是運行在 IPFS上的一個激勵層,是一個基於區塊鏈的分布式存儲網絡,區塊鏈技術既完善又創新,創新了"算力"概念,巧妙地重用了算力形成過程的數據來進行共識,規避了 PoW 帶來的大量能源與計算資源的消耗。
  • FIL是什麼幣?讀懂Filecoin挖礦模型
    質疑、罷工,2020年最具爭議的項目恐怕是 filecoin 了。filecoin曾因2.57億美元的巨大融資引發關注,如今,filecoin又因上線後經濟模型等問題引發爭議,那麼filecoin究竟如何,我們研究一下。一、背景filecoin 出生不凡,僅投資機構便有紅杉資本、DCG集團、A16資本、史丹福大學等國際知名投資機構,而創始人胡安更是獲得了史丹福大學計算機碩士學位,並且是一個連續創業者。
  • IPFS和Filecoin什麼關係?IPFS礦商集體停擺的背後原因
    事實上,目前IPFS已經成為了分布式HTTP協議的工業標準。IPFS與區塊鏈是什麼關係?目前大部分公鏈的最大問題是無法存儲大量的數據在自己的鏈上,運用IPFS技術解決存儲瓶頸是可行方案之一。 什麼是Filecoin?
  • Filecoin是什麼讓Filecoin變得特別?
    「是什麼讓Filecoin變得特別」? Juan在ETH Global和Filecon主辦了存儲市場峰會(SMS)上說出了自己的觀點。 當我們談論Filecoin時,我們需要非常深入地思考我們消耗的能源。
  • Filecoin需要多久能夠達到100美元 合理分析
    另一方面,IPFS的長期生態價值決定了filecoin價格的長期走勢。與HTTP協議相比,IPFS分布式存儲具有低成本、安全性和持久性等優點,有望為web3.0創建一個新的Internet技術框架。目前,已向IPFS提交了超過50億個文檔,超過100個區塊鏈項目選擇了IPFS來存儲數據信息和文檔。IPFS網絡的價值將逐步向參與建設的貢獻者釋放。
  • 什麼是區塊鏈分布式存儲、IPFS挖礦分布式存儲的商機與Filecoin...
    什麼是恆訊雲分布式存儲?對於計算機系統,計算和存儲是非常重要的連結。可以這樣理解,分布式計算解決了數據計算成本的問題,每個人都可以幫助進行計算。雖然分布式存儲解決了數據安全性問題,但每個人都可以幫助保持帳戶在一起。
  • Filecoin到底是不是騙局?為什麼會引起全球的注意?
    作為技術派系的IPFS是一個明星項目,其激勵層Filecoin主網上線,在2020年熱度飆升,捕獲了巨大的流量與關注度。記住那個不斷地和你分享IPFS /filecoin的人,你以後會感謝TA的。如果你錯過IPFS/filecoin ,將錯過一個時代,他不是一個什麼普通項目,因為他是網際網路時代的未來,也是區塊鏈時代的王者,是真正對人類社會非常有價值的。
  • Filecoin主網上線只是開始 未來3-5年將開啟無限可能
    付諸了大量的資金、設備、人力和期待的Filecoin主網在區塊高度148888(北京時間10月15日22時45分)終於面世。148888,寓意一生一世發發發發。 1、Filecoin的價值是什麼? Filecoin的官網對自己的介紹是,旨在存儲人類社會中最重要的信息分布式網絡。其實我們去分析的話,它的價值是打破圈層。現在很多defi,其實更多是圈內的人玩。基於Filecoin去開發應用,其實可以引入到很多一些圈外的流量。而且我覺得區塊鏈最重要是去信任,Filecoin是零信任的存儲,可以把所有人類有價值的數據存在上面。
  • Filecoin什麼意思?毋庸置疑區塊鏈最大的投資機會
    Filecoin什麼意思?毋庸置疑區塊鏈最大的投資機會一天朋友和我聊天問我:如果時間可以倒流,你最想做什麼?我回答:如果能回到10年前,我就會買100,000個比特幣,這樣我就變成億萬富翁了。朋友說:如果能預知未來該有多好,只是你不能回頭,只能做個白日夢。
  • 讀懂IPFS-Filecoin|IPFS和Filecoin的區別與聯繫
    讀懂IPFS&Filecoin | IPFS和Filecoin的區別與聯繫Filecoin項目已經上線,但還有很多人傻傻分不清楚IPFS和Filecoin,今天我們就理一理它倆的區別和聯繫。什麼是IPFS?
  • Filecoin釋放採用的網絡基準線是一種保護機制
    Filecoin經濟模型釋放機制 在官方發布的經濟模型中,有一個部門是很多礦工關注的,就是Filecoin代幣的釋放和質押,Filecoin的釋放沒有單純使用指數衰減性釋放代幣,為了鼓勵存儲落地的一致性和長期存儲投資而不僅僅是快速封裝,Filecoin引入了網絡基準的概念。
  • Filecoin主網於今日3:00pm(世界標準時間)正式啟動
    從早期設計用於存儲和複製的證明(這些證明將刺激存儲的增長),到將這樣一個複雜的去中心化市場變為現實所需的高級系統工程,再到使Filecoin網絡更加強大且更易於訪問的集成工具和項目生態——我們作為一個社區整體取得了如此多的成就。大家的共同努力下,我們通過一個開放的,分布式的,可驗證的存儲層來升級了網絡。
  • 分布式與集群分久必合,淺析Filecoin集群架構優化方向
    分布式與集群什麼是集群? 集群一般是指物理集中、統一管理的,從形態上來說,集群只是一個物理形態,但並不是一個工作方式,從工作方式來說,集群也分為單機結構集群、集群結構集群以及分布式結構集群。但總得來說,分布式集群相對於單機集群而言,有著降本增效的作用,相對於集群架構組成的集群而言,能夠減少資源浪費,提高服務的復用性。事實上,時代日新月異,集群的架構也是在不斷地發展進步的,分布式與集群分久必合合久必分,一個真正優秀的集群管理者和構建者,必然能夠選取最符合公司現狀的集群模式,然後在根據業務情況進行個性化部署。
  • 力場對話IPFS原力區:Filecoin的生態位與現狀
    那麼IPFS和Filecoin的現狀如何?生態發展到什麼規模了呢?IPFS現狀IPFS於2014年上線,作為新興網絡技術,一直被廣大技術愛好者研究,並嘗試運用到生活場景中。2019年下半年數據,全球IPFS節點已超過百萬,存儲於IPFS網絡的數據達100億份。
  • Filecoin意味著分布式存儲時代的到來,FIL幣將不可想像?未來會超越...
    隨著萬眾矚目的Filecoin主網上線,分布式存儲行業被推上高地。相比傳統Web2.0作為Web3.0以及數字經濟時代的基礎設施,分布式存儲時代的到來將會給存儲市場帶來了全新的商業模式和經濟生態的新發展。
  • IPFS 分布式存儲前景是什麼
    Q1:分布式存儲對比中心化存儲具有什麼優勢,它的應用場景和價值在哪呢?現在中心化存儲技術已經發展很成熟。但與此同時,帶來的新問題是中心化網絡易擁堵、數據易被盜被濫用。傳統的數據傳輸方式是從客戶端上傳到中心化的雲伺服器,再從伺服器下載到客戶端。IPFS是從客戶端上傳到N個節點,再從這些節點裡就近下載到客戶端裡面,所以傳輸速度非常快。
  • Fil中文社區分析:什麼是IPFS?什麼是Filecoin?
    鑑於太多的小夥伴對什麼是IPFS,什麼是Filecoin,該怎麼參與,都是一知半解。主網已經上線,分布式存儲的風口將正式到來,但網上充斥著大量的科普信息對大眾又存在著理解門檻,為了便於大家清楚了解此次風口,今天用最簡單的大白話來講清楚這兩個項目和參與方式。V   dan503231493
  • IPFS分布式存儲到底有什麼神奇之處?
    IPFS分布式存儲到底有什麼神奇之處? 浪潮存儲 發表於 2021-01-13 14:36:28 IPFS和Filecoin最近越來越火,有人說,IPFS是網際網路世界的未來,還有人說,IPFS分布式存儲或成為未來趨勢,IPFS到底有什麼神奇之處?
  • Filecoin你必須知道的
    作為一個全新的數據存儲和分發網絡,filecoin網絡的使命是為人類信息打造分布式的、高效且強大的基礎。那麼這個,ipfs的分布式存儲呢,就相當於京東的分布式存儲呢,就相當於京東的分布式倉庫一樣,在你家附近有這麼一個存儲,你提東西是不是一樣很快。比如說你家有一臺電腦,你有50t的這個閒置空間,你可以把這50t的空間拿出來,給你的鄰居給你的小區的所有人來用,他們把東西存在你這裡,而提取的時候是不是要比從深圳提取更方便呢?把數據存在全國各地,也避免了壟斷的產生。所以ipfs是以後網際網路發展的必然趨勢。