區塊鏈(blockchain)是眼下的大熱門,要了解IPFS/Filecoin,首先了解清楚什麼是區塊鏈。
其核心概念非常簡單,幾句話就能說清楚。希望讀完本文,你不僅可以理解區塊鏈,還會明白什麼是挖礦、為什麼挖礦越來越難等問題。
一、區塊鏈的本質
區塊鏈是什麼?
一句話,它是一種特殊的分布式資料庫。
首先,區塊鏈的主要作用是存儲信息。任何需要保存的信息,都可以寫入區塊鏈,也可以從裡面讀取,所以它是資料庫。
其次,任何人都可以架設伺服器,加入區塊鏈網絡,成為一個節點。區塊鏈的世界裡面,沒有中心節點,每個節點都是平等的,都保存著整個資料庫。你可以向任何一個節點,寫入/讀取數據,因為所有節點最後都會同步,保證區塊鏈一致。
二、區塊鏈的最大特點
分布式資料庫並非新發明,市場上早有此類產品。但是,區塊鏈有一個革命性特點:
區塊鏈沒有管理員,它是徹底無中心的。
其他的資料庫都有管理員,但是區塊鏈沒有。如果有人想對區塊鏈添加審核,也實現不了,因為它的設計目標就是防止出現居於中心地位的管理當局。
正是因為無法管理,區塊鏈才能做到無法被控制。否則一旦大公司大集團控制了管理權,他們就會控制整個平臺,其他使用者就都必須聽命於他們了。
但是,沒有了管理員,人人都可以往裡面寫入數據,怎麼才能保證數據是可信的呢?被壞人改了怎麼辦?請接著往下讀,這就是區塊鏈奇妙的地方。
三、區塊
區塊鏈由一個個區塊(block)組成。區塊很像資料庫的記錄,每次寫入數據,就是創建一個區塊。
每個區塊包含兩個部分:
區塊頭(Head):記錄當前區塊的元信息區塊體(Body):實際數據區塊頭包含了當前區塊的多項元信息:
生成時間實際數據(即區塊體)的 Hash上一個區塊的 Hash…這裡,你需要理解什麼叫 Hash(哈希),這是理解區塊鏈必需的。
所謂 Hash 就是計算機可以對任意內容,計算出一個長度相同的特徵值(特徵值:線性代數中的重要概念)。區塊鏈的 Hash 長度是256位,這就是說,不管原始內容是什麼,最後都會計算出一個256位的二進位數字。而且可以保證,只要原始內容不同,對應的 Hash 一定是不同的。
舉例來說,
字符串「123」的 Hash 是:a8fdc205a9f19cc1c7507a60c4f01b13d11d7fd0(十六進位),轉成二進位就是256位,而且只有「123」能得到這個 Hash。
因此,就有兩個重要的推論。
推論1:每個區塊的 Hash 都是不一樣的,可以通過 Hash 標識區塊。推論2:如果區塊的內容變了,它的 Hash 一定會改變。四、Hash 的不可修改性
區塊與 Hash 是一一對應的,每個區塊的 Hash 都是針對」區塊頭」(Head)計算的。
Hash = SHA256(區塊頭)
上面就是區塊 Hash 的計算公式,Hash 由區塊頭唯一決定,SHA256是區塊鏈的 Hash 算法。
前面說過,區塊頭包含很多內容,其中有當前區塊體的 Hash(注意是」區塊體」的 Hash,而不是整個區塊),還有上一個區塊的 Hash。這意味著,如果當前區塊的內容變了,或者上一個區塊的 Hash 變了,一定會引起當前區塊的 Hash 改變。
這一點對區塊鏈有重大意義。如果有人修改了一個區塊,該區塊的 Hash 就變了。為了讓後面的區塊還能連到它,該人必須同時修改後面所有的區塊,否則被改掉的區塊就脫離區塊鏈了。由於後面要提到的原因,Hash 的計算很耗時,同時修改多個區塊幾乎不可能發生,除非有人掌握了全網51%以上的計算能力。
正是通過這種聯動機制,區塊鏈保證了自身的可靠性,數據一旦寫入,就無法被篡改。這就像歷史一樣,發生了就是發生了,從此再無法改變。
每個區塊都連著上一個區塊,這也是」區塊鏈」這個名字的由來。
五、挖礦
由於必須保證節點之間的同步,所以新區塊的添加速度不能太快。試想一下,你剛剛同步了一個區塊,準備基於它生成下一個區塊,但這時別的節點又有新區塊生成,你不得不放棄做了一半的計算,再次去同步。因為每個區塊的後面,只能跟著一個區塊,你永遠只能在最新區塊的後面,生成下一個區塊。所以,你別無選擇,一聽到信號,就必須立刻同步。
所以,區塊鏈的發明者中本聰(這是假名,真實身份至今未知)故意讓添加新區塊,變得很困難。他的設計是,平均每10分鐘,全網才能生成一個新區塊,一小時也就六個。
這種產出速度不是通過命令達成的,而是故意設置了海量的計算。也就是說,只有通過極其大量的計算,才能得到當前區塊的有效 Hash,從而把新區塊添加到區塊鏈。由於計算量太大,所以快不起來。
這個過程就叫做挖礦(mining),因為計算有效 Hash 的難度,好比在全世界的沙子裡面,找到一粒符合條件的沙子。計算 Hash 的機器就叫做礦機,操作礦機的人就叫做礦工。
六、難度係數
讀到這裡,你可能會有一個疑問,人們都說採礦很難,可是採礦不就是用計算機算出一個 Hash 嗎,這正是計算機的強項啊,怎麼會變得很難,遲遲算不出來呢?
原來不是任意一個 Hash 都可以,只有滿足條件的 Hash 才會被區塊連結受。這個條件特別苛刻,使得絕大部分 Hash 都不滿足要求,必須重算。
原來,區塊頭包含一個難度係數(Difficulty),這個值決定了計算 Hash 的難度。
舉例來說,第100000個區塊的難度係數是 14484.16236122。
區塊鏈協議規定,使用一個常量除以難度係數,可以得到目標值(target)。顯然,難度係數越大,目標值就越小。
Hash 的有效性跟目標值密切相關,只有小於目標值的 Hash 才是有效的,否則 Hash 無效,必須重算。由於目標值非常小,Hash 小於該值的機會極其渺茫,可能計算10億次,才算中一次。這就是採礦如此之慢的根本原因。
區塊頭裡面還有一個 Nonce 值,記錄了 Hash 重算的次數。第 100000 個區塊的 Nonce 值是274148111,即計算了 2.74 億次,才得到了一個有效的 Hash,該區塊才能加入區塊鏈。
七、難度係數的動態調節
就算採礦很難,但也沒法保證,正好十分鐘產出一個區塊,有時一分鐘就算出來了,有時幾個小時可能也沒結果。總體來看,隨著硬體設備的提升,以及礦機的數量增長,計算速度一定會越來越快。
為了將產出速率恆定在十分鐘,中本聰還設計了難度係數的動態調節機制。他規定,難度係數每兩周(2016個區塊)調整一次。如果這兩周裡面,區塊的平均生成速度是9分鐘,就意味著比法定速度快了10%,因此難度係數就要調高10%;如果平均生成速度是11分鐘,就意味著比法定速度慢了10%,因此難度係數就要調低10%。
難度係數越調越高(目標值越來越小),導致了採礦越來越難。
八、區塊鏈的分叉
即使區塊鏈是可靠的,現在還有一個問題沒有解決:如果兩個人同時向區塊鏈寫入數據,也就是說,同時有兩個區塊加入,因為它們都連著前一個區塊,就形成了分叉。這時應該採納哪一個區塊呢?
現在的規則是,新節點總是採用最長的那條區塊鏈。如果區塊鏈有分叉,將看哪個分支在分叉點後面,先達到6個新區塊(稱為」六次確認」)。按照10分鐘一個區塊計算,一小時就可以確認。
由於新區塊的生成速度由計算能力決定,所以這條規則就是說,擁有大多數計算能力的那條分支,就是正宗的比特鏈。
九、總結
區塊鏈作為無人管理的分布式資料庫,從2009年開始已經運行了十幾年,沒有出現大的問題。這證明它是可行的。
但是,為了保證數據的可靠性,區塊鏈也有自己的代價。
一是效率,數據寫入區塊鏈,最少要等待十分鐘,所有節點都同步數據,則需要更多的時間;
二是能耗,區塊的生成需要礦工進行無數無意義的計算,這是非常耗費能源的。
因此,區塊鏈的適用場景,其實非常有限。
不存在所有成員都信任的管理當局寫入的數據不要求實時使用挖礦的收益能夠彌補本身的成本如果無法滿足上述的條件,那麼傳統的資料庫是更好的解決方案。
目前,以BTC比特幣為代表的加密貨幣,是目前區塊鏈最大的應用場景。
可是BTC沒有從根本上提升我們的效率,從BTC的創始宣言(中本聰BTC白皮書)裡面可以看到BTC誕生的原因:源於公平,卻無關乎效率。
比特幣和以太坊,以及大部分公有鏈或虛擬貨幣,都是基於PoW算法來實現其共識機制的。這種機制是根據挖礦貢獻的有效工作,來決定貨幣的分配。此原理下的所謂挖礦,就是計算機通過窮舉的辦法,不斷去找Nonce值、算哈希值的過程。誰先找到,誰就挖成功了。
PoW,優勢是可靠、使用廣泛,是經歷了充分的實踐檢驗的公有鏈共識算法。但其缺點也較為明顯,消耗了太多額外算力,即大量能源,很不環保,比特幣網絡的全球活動每年佔用2.55億千瓦的電能,幾乎與愛爾蘭全年用電量相當。而且資本大量投資礦機,導致算力中心化,有51%攻擊的安全隱患。
挖礦的本質是全球礦工一起用算法和算力,來維持一個安全,去中心化的貨幣系統,越多算力加入系統才會越安全。
那是否有一種挖礦機制能夠在不耗費算力和電力的條件下進行呢?
答案是肯定的。
PoSt,全稱Proof-of-Spacetime,即時空證明。在權益共識PoS(Proof-of-Stake)的基礎上,IPFS的激勵層Filecoin改進共識機製成了PoSt,來替代工作量證明PoW。
IPFS(InterPlanetary File System),星際文件系統, 是一個點到點的分布式文件系統,它連接的計算設備都擁有相同的文件管理模式,可以讓我們的網際網路速度更快,更加安全,並且更加開放。
在IPFS的區塊鏈激勵層Filecoin系統中,礦工完成存儲,用戶確認礦工完成存儲,確認的動作也就是「PoSt」。PoSt會一直存在於Filecoin網絡中,用戶可以隨時查看。Filecoin把礦工在網絡中的當前存儲數據相對於整個網絡的存儲比例轉化為礦工投票權(voting power of the miner),其中網絡選擇一個礦工創建一個新塊的可能性與他們正在使用的存儲和網絡其餘部分的成本成正比。
在PoSt機制下,礦工提供存儲並重新使用計算來證明數據被存儲以參與共識。利用時空證明(PoSt)來產生共識,不用像比特幣那樣浪費計算資源和能源,並且能激勵礦工投入更多的存儲空間(硬碟)資源而不是計算和能源資源為網絡做貢獻,非常環保高效的方式。
從這種意義上講,IPFS系統從根本上提升人類的效率,是真正的共享經濟,把我們對存儲資源利用方式往前邁了一大步。
本文來源: 金色財經 / 作者:算力雲數據