人類基因組計劃是一項規模宏大,多學科交叉結合的科學工程,與曼哈頓原子彈計劃和阿波羅登月計劃齊名,其又被譽為生命科學的「登月計劃」。早在2003年4月14日,人類基因組計劃的測序工作就已經完成。如今的任務就是要將所有的基因信息破譯,了解其作用機理,用於預防遺傳疾病、科學研究等。
現如今,基因測序技術已經相對成熟,做一次個體全基因測序只需要花費幾千美元。這個價格對普通家庭來說可能還稍顯昂貴,但是隨著醫學工業的發展,相信不久就能將成本降低到幾百美元甚至更低。可以想像,未來每個新生兒「破殼」後都會進行全基因測序,並寫入出生證明。
人類基因組只有4種鹼基,ATCG,大約有30億個鹼基對。每個鹼基在計算機中可以對應一個byte,那麼總共大約需要3GB來存儲一個人的所有基因信息。當前世界總人口已達70億,那麼,就大約需要20 ZB,要知道,當前全人類數據總量也就100 ZB。這個數據量級也無法通過壓縮來大幅縮小,再算上每時每刻都有新生命誕生,這麼龐大的數據存在哪呢?中心化的公司肯定無法負擔。
我們都知道,人類的基因信息不需要高頻訪問,除非極少部分基因發生突變,不然數據是恆久不變的,所以它需要一個有完善的信息加密機制並且長久穩定的存儲媒介。Filecoin分布式存儲的優良特性恰好能滿足這些需求。
儘管Filecoin網絡現在還處於測試階段,但對於它的未來,我們還是很樂觀的。在當前測試網中,網絡存儲容量每天以10PB增長。官方依據測試網的數據,將基準線作出了調整,第一年全網總存儲容量2.5EB,並且以100%年增長率翻番。基準線可以近似的反映出Filecoin網絡的發展情況。可以粗略估算,只需要5-6年,Filecoin網絡中存儲數據的總量就會達到100EB,超過當前網際網路中心化資料庫的存儲量。並且當前Filecoin網絡尚處早期,當各行業巨頭進軍Filecoin網絡時,網絡的存儲量還會呈幾何級數的增長。這麼龐大的存儲容量用來存儲全人類的基因數據是綽綽有餘的。
我們都知道基因屬於個人隱私,此類數據如果存儲在中心化資料庫中,當資料庫被攻破並造成數據洩漏時,那麼將是災難級的影響。Filecoin網絡又是如何保證數據隱私呢?這與Filecoin的存儲機制有關。文件上傳至礦工的存儲扇區,當扇區seal密封后,文件被分片拆分成很多份,打散存儲在各個伺服器節點中,每個文件存儲一個對一無二的CID用於尋址。這樣就徹底解決了隱私安全問題,因為即使有伺服器節點被攻破,駭客也只能獲得基因數據中很微小的一個片段,幾乎毫無作用。
Filecoin網絡又是怎麼確解決基因數據存儲安全、穩定的問題呢?畢竟如此重要的數據如果丟失,那麼會對基因主人造成莫大的困擾。低廉的備份機制,在Filecoin網絡中數據備份應屬常態,在這樣的機制下,數據想丟失都難。
接下來,我們再談談建立這樣一個基因庫有什麼意義,將來又會有什麼應用呢?
邁入21世紀,生命科學進入蓬勃發展階段,但是仍有諸多和基因相關的醫學難題亟待解決。建立這樣一個基因庫不僅可以為每個人類個體謀福利,還能夠未雨綢繆,為我們的子孫後代積累數據寶藏。雖然以我們現在的認知還不能夠完全理解,但是科技在發展,未來一定會派上用場。
01個人基因定製化健康方案
未來人類從一出生就有了基因全譜,可以依據基因狀況並結合了人工智慧和大數據分析,為新生兒制定長期的健康方案,避免先天性疾病,預防後期隱性疾病。而且當基因主人狀況出問題時,如果是基因突變問題引起,那就可以依據原譜,迅速找到變異基因片段,找到病因對症治病。我們都知道,作為人類健康第一「殺手」的疾病—癌症,就是因為部分基因變異,導致細胞轉變為癌細胞無限複製,進而危害人體。如果未來能夠監控人類個體基因的變化情況,及時糾錯,那麼人類的平均壽命可能會達到100多歲。如果再進一步,由於癌細胞的複製不會導致端粒縮短,癌細胞中或許藏著永生的秘密。如果結合癌細胞的特性解決細胞端粒複製縮短的問題,那麼人類的永生或許真可以實現(就像核裂變,失控的核裂變發展成核武器,受控的核裂變可以發展成核電站)。如果真能實現,那麼人類可能已經邁入星際時代,畢竟地球現有的資源無法養活這麼多人口。話說回來,這一切的前提還是要有完整的基因數據,這正是Filecoin所肩負的使命。
02基因數據服務
有了數據,自然就要分析,這麼龐大的基因數據可以用來訓練人工智慧,為基因方面疾病提供智能化的快速診斷手段。這對於醫療來說簡直就是一次革命。還可以用來大數據分析,對數據進行統計學分析,研究人種、起源等本源性問題,甚至可以預測人類的進化走向。研究基因和人類的關係(讀者可以了解《自私的基因》)。
03瀕危物種拯救
上面主題都是講的人類,當然也可以拓展到動植物,尤其是瀕危動物。或許我們已經無法通過自然或人工幹預的方法拯救某個物種,或許可以換一個角度,將該物種現存生命體的基因存儲在Filecoin網絡中。待到人類生命科學發展更進一步時,由我們的子孫通過基因數據將其復活。當然有讀者可能會有更可怕的想法,為什麼不用來復活人呢?因為動物沒有與人類相當的自我意識,而意識和個人的記憶、經歷有關,如果用來復活人,他可能和你是同卵雙胞胎的關係,他並不是你!
Filecoin的網絡的未來著實讓人著迷,也希望大家的基因數據未來都在庫中吧。