1公斤DNA就能存儲全球數據!未來人體就是行走的超級「硬碟」

2020-12-02 中國科學技術館

未來一定是一個數據爆炸的時代!

5G、物聯網和人工智慧等信息技術的快速發展,使得信息量呈指數級增長。根據國際機構IDC預測,全球數據產生量將從2018年的33ZB快速增長至2025年的175ZB,1ZB約相當於10億TB(太字節)的數據量存儲。

這有多恐怖呢?舉個很簡單的例子:數據單位從小到大分別為KB、MB、GB、TB、PB、EB再到ZB,如果將1ZB文件加載到1TB硬碟中,則需要轉換大約10億個1TB硬碟。如果它是連接的,那麼繞地球旋轉兩次都足夠了!

然而目前的存儲技術卻完全滿足不了未來的需求。

正是在新一輪數字洪流噴薄而出的背景下,DNA存儲數據這一思路被提出來。DNA存儲技術作為未來潛在的無限存儲方式,或將打開數據存儲的新紀元。

DNA是如何實現數據存儲的?

DNA存儲是一種相對於傳統存儲設備的生物存儲技術。它是一種用人工合成的脫氧核糖核酸(DNA)存儲文本文檔、圖片和聲音文件等數據,隨後完整讀取的技術。

其原理本身並不複雜!

我們知道,電腦上存儲的數據是依據電壓的高和低代表0和1來表示的,每一個數字、字符和標點符號都由唯一的一串01組合來構成。比如小寫字母「e」的代碼是:01100101,因此,任何數位化的內容(視頻,圖片,文字)本質上都只是一串串的0和1而已。

那麼,DNA的存儲原理實際上就是把原本這些用0和1來表示的內容,換成用鹼基:A,C,G,T來表示,這是一個從數位訊號到化學信號的過程。而且由於鹼基有四個,相比起原本的0和1,我們可以用來多表示兩個狀態,比如,我們可以假設用A代表00,C代表01,G代表10,T代表11。一個本來要用8bit代表的字符用DNA編碼的話,只需要用4個化學鹼基,比如上面的小寫字符「e」編碼成為DNA序列就是:CGCC。

DNA可以以遠超過電子設備的密度精確存儲大量數據。根據《新科學家》雜誌報導,1克DNA理論上攜帶有455EB的數據。在這樣的密度下,1kg DNA就能儲存全球數據。

在應用場景上,DNA存儲大概可以分為以下幾類:

1. 歸檔場景,其中美國國家圖書館、維基百科、Google有意願將資料備份在DNA存儲上;

2. 在軍事用途應用中,可以通過人體攜帶DNA數據,有了DNA存儲技術,我們人體就是「雲硬碟」;

3. 在個人應用中,未來個人可以隨身攜帶超大容量的DNA USB數據盤。

而且相較於傳統的硬碟、存儲器等存儲介質,DNA存儲還具有以下優勢:

(圖為目前常見存儲產品形式)

DNA存儲優勢初現,引領企業爭相角逐

DNA存儲雖然作為一個比較新的概念,但卻早已不是「PPT產品」。

早在2012年,哈佛大學研究人員就用DNA儲存了一本五萬字的圖書。2016年,哈佛大學醫學院也第一次利用這樣的技術把這一張「奔跑的駿馬」的Gif放進了活大腸桿菌的DNA裡,而且還能重新測序並解碼出來。

同樣是2016年,華盛頓大學和微軟研究院的團隊,他們更進了一步,把莎士比亞的十四行詩、馬丁路德金的演講原聲、醫學論文等資料共計739KB的數據編碼成了DNA序列,並存儲起來,這個技術以此為標記取得了巨大的進步。

2019年年初,微軟宣布在概念驗證測試中,微軟已經演示了第一個全自動DNA數據存儲系統。這將是 DNA 存儲技術從實驗室走向商業數據中心的關鍵步驟。

正如微軟所說,「假如合成 DNA作為存儲手段能夠實現的話,那麼合成DNA的成本和提取信息的測序過程成本都需要降下來。」這些過程自動化,對降低合成 DNA 存儲信息的成本極為重要。

在研究的同時,一些企業也圍繞DNA存儲技術加緊推出商業服務。

其中美國初創企業Catalog在2019年宣布,他們已經把維基百科英文版的所有文本,一共16GB,塞進了和我們人類身體相同的DNA分子裡。據悉,Catalog擁有自己的設備,可以每秒4MB的速度將數據寫入DNA中。技術優化應該將這個速度提高兩倍,讓人們在一天內記錄125GB內存的數據,這大約相當於一部高端手機的存儲容量。

此外,全球還有這些企業在DNA存儲領域「逐鹿中原」:

雖然中國在DNA存儲技術領域剛剛起步,企業或高校的研究水平目前都不突出,但也有某些企業開始將目光轉向DNA存儲技術。 蘇州泓迅生物科技有限公司是一家專注於合成生物學的DNA技術公司,該公司在DNA存儲技術領域申請了2件相關專利,有自主智慧財產權的編碼轉制軟體,精確、快速的大規模和高通量的合成DNA序列,應用於下一代的信息存儲。

另外,上海吐露港生物科技有限公司與上海生命科學院於2018年在《ACS合成生物學》上共同發表了一篇關於輔助的DNA隱寫術對DNA編碼信息的儲存和轉移的安全處理的文章。 該研究結果可以巧妙地利用Cas12a的trans切割特性,對DNA數據進行加密。

大數據藍海將催生DNA存儲新紀元

DNA存儲是在解決海量數據存儲的背景下應運而生的。而大數據的蓬勃發展必將為DNA存儲帶來廣闊空間。

根據IDC發布的白皮書顯示:每年被創建、採集或是複製的數據集合就是全球數據圈,2018 至 2025 年全球數據圈將增長5倍以上。IDC預測,全球數據圈將從2018年的33ZB增至 2025年的175ZB。屆時不僅將會對全球數據中心的建設產生影響,同時也會對數據的存儲發起挑戰。

此外,從數據量和存儲空間來看,在2018年,全球已安裝的存儲容量為 5.0ZB,到2025年預計屆時全球容量大約為16.5ZB。這與全球2025年將產生175ZB的數據量相比,遠遠不夠。

而中國存儲市場將率先享受到海量數據帶來的紅利。

IDC發布的白皮書顯示:中國數據圈增速最為迅速,平均每年的增長速度比全球快 3%。2018 年,中國數據圈佔全球數據圈的23.4%,即7.6ZB。預計到2025年將增至 48.6ZB,佔全球數據圈的 27.8%,中國將成為全球最大的數據圈。

從不同存儲類型的存儲容量增長情況來看,即使電影和音樂從DVD 和CD 遷移到流媒體,在中國市場,磁碟和光碟仍將繼續發揮重要作用。但隨著數據的爆炸式增長,可以預見的是這部分市場將被率先被取代。

從研發到商業落地,DNA存儲的技術瓶頸亟待打破

DNA存儲要想完成從研發到商業化的華麗轉身,就必須打破現有的技術瓶頸。

其中數據的輸入和讀取效率一直是阻礙DNA 儲存技術商業化的最大瓶頸之一,今年年初微軟首次實現了全自動 DNA 信息存儲,僅僅是編碼「hello」五個字母,從轉換到讀取就要花費 21 小時。但在現有技術下,這已經算是非常快的速度了。

其次,與現在幾百塊的硬碟相比,成本高企也是目前DNA存儲的「阿克琉斯之踵」。據早前《Wired》雜誌報導,存儲一分鐘立體聲音所需150 萬對鹼基對,成本約為10萬美元。如果成本不能大幅降低,那麼將無法進入實用環節。

現階段下,如果DNA存儲能夠解決這些瓶頸,那麼距它迎來高光時刻也就不遠了。

從結繩記事到竹簡紙張,從計算機存儲到光碟刻錄,人類從未停止追求更加高效便捷的信息存儲方式,信息存儲方式的變革很大程度上也塑造著我們獲取信息和認知世界的方式。

本文來自: 前瞻網

相關焦點

  • 我,就是數據:高中生把數據編入體內,1公斤DNA 未來可儲存全球數據
    新智元原創 來源:cnet、sciencemag等編輯:金磊、張佳【新智元導讀】全球每年產生的數據需要4180億個1TB硬碟才能放下,若是把如此龐大的數據放到DNA上,只需 1kg DNA就夠了!最近一家公司將16G的維基百科存儲在了一個DNA分子上讓人驚嘆,DNA存儲已成為最受關注的新興技術之一,「我,就是數據」時代即將來臨。
  • 全球首款「蠶絲硬碟」問世!可植入人體,可存儲DNA
    5G等通信技術的快速發展,帶來了高可靠低延遲的網絡連接,我們將更快進入「萬物互聯」時代,連接到網絡的設備激增,就會帶來數據存儲量的激增。如何突破現有存儲設備限制,實現更高效、更大容量的存儲是當下技術人員研究的重點。
  • 世界上存儲量最大的硬碟,就是你的DNA
    簡單看步驟的話,現在的科技就能做到前兩步了,之前看到新聞, DNA 存儲技術已經能大規模寫入數據了。根據紐約基因組中心的數據, 一克DNA 可存儲2.15 億GB 數據。把這些數據存到1T 容量, 7mm 規格的硬碟裡,硬碟堆在一起, 有1505 米高。世界最高建築,杜拜塔也只有828 米。。。
  • 全球首款蠶絲硬碟誕生:可植入人體,可存儲DNA
    近日消息,中科院上海微系統所陶虎課題組,聯合美國紐約州立大學石溪分校和德州大學奧斯汀分校相關課題組,在國際上首次實現基於天然生物蛋白的高容量生物存儲技術——一個蠶絲製成的硬碟。以普通人的想像力,實在難以理解蠶絲硬碟該如何進行存儲。好在,紐約州立大學石溪分校劉夢昆教授在媒體中解答了我的疑惑,他介紹說:「我們通過納米針尖將紅外光聚焦在極小的尺度下,對蠶絲蛋白進行改性從而達到信息存儲和讀取的目的。
  • 上海科學家研發全球首款「蠶絲硬碟」:可植入人體,可控銷毀
    未來,我們的電腦使用的硬碟可能不是一款半導體,也不是一群大腸桿菌,而是來自一個蠶繭。蠶繭 受訪者供圖中國科學家研發出全球首款天然生物蛋白硬碟存儲器——蠶絲硬碟,一個由蠶絲製成的硬碟:除了能存信息,還能裝東西,比如血液樣本、DNA、疫苗,甚至可以植入生物體。
  • 全球首款「蠶絲硬碟」問世:可植入人體,可控銷毀
    在微波爐中高火30分鐘後,蠶絲硬碟中的信息仍「安然無恙」。目前蠶絲硬碟的存儲容量已可達64GB每平方英寸,相當於0.5TB。通過納米針尖,將紅外光聚焦在極小的尺度下,對蠶絲蛋白進行改性,從而達到信息存儲和讀取的目的。後期可以進一步結合多探針平行加工技術和快速移動平臺,未來有潛力實現可比擬商業化硬碟存儲器的存儲密度和讀寫速度。
  • 未來可以植入人體?全球首款非半導體蠶絲硬碟問世
    最近,中國科學家研發出一種以天然生物蛋白製造的硬碟存儲器「蠶絲硬碟」,亦就是由蠶絲製成的硬碟。根據我們以往的了解,蠶絲一般都被用作紡織材料,如今科技的力量令蠶絲蛋白可以用來做成數據存儲器,並載入生物信息,比如血液樣本、DNA等等,未來甚至還可以植入人體。
  • DNA硬碟:16GB的英文版維基百科,正以4Mb/s的速度存入DNA
    上個世紀60年代,生物存儲信息的想法被科學家提了出來。而今,美國是DNA存儲技術的最大玩家,其次是歐洲。對於大多數人而言,DNA用來存儲數據,是一項非常神奇的技術。但是,我們的大自然,億萬年來的各種生物,都是利用DNA來傳遞信息,也就是遺傳,從而實現了繁衍生息。DNA數據存儲技術的的原理是什麼?
  • DNA存儲,拯救人類數據危機的良方?
    我們知道這些信息最高效的形式就是數據,而這些數據主要存儲在硬碟和光碟當中的。想想這些硬碟儲存器的重量和數據密度,我們不得不再一次氣餒。更何況,可能飛船還沒逃出太陽系,這些數據就會因為硬碟或光碟的壽終正寢而丟失。那麼DNA能不能當做硬碟來存儲數據信息呢?答案是,可以的。
  • 中國科學家發明「蠶絲硬碟」,或將開啟晶片存儲新紀元
    近日,上海科學家推出全球首款「蠶絲硬碟」,將半導體材料與生物介質融合,發明出一種可以同時記錄數字信息和生物信息的新科技存儲硬碟。5000年的古老生物見證了中華文明的歷史,如今成為數據的存儲介質,在未來科技裡重獲新生。
  • 「未來硬碟」誕生 存儲體積縮小1000倍
    在筆者之前的文章中曾經換算過單位存儲空間的價格降低速度驚人。比如,在8寸軟盤剛剛出現時候,一個8寸軟盤驅動器的價格,比一臺微型計算機整機還貴。再比如世界上第一款容量超過1GB的硬碟(約2.52GB),在今天看來價格更可謂是天價:8-14萬美元,平均每GB價格為4萬美元,相當於我們今天購買硬碟價格(2TB硬碟600元)的930000餘倍。
  • 猜想木乃伊之謎,DNA記憶存儲,複製人是否有本體記憶?
    >而1克的dna就可以保存700tb的容量,隨著技術的發展還遠遠不止這些其實dna存儲原理並不複雜,是由是A、T、C、G四種鹼基,通過四種鹼基的排列組合形成多樣化的生物個體。我們知道計算機是二進位0和1.我們在電腦中看到的所有圖像和視頻說白了都是0和1的編碼那DNA數據存儲技術就是把現有的二進位0、1轉化成A、T、C、G,然後通過合成含有這些鹼基序列的DNA,就實現了數據信息的存儲。
  • 世界首塊「蠶絲硬碟」問世!寫得數據,存得DNA,可植入人體
    蠶絲硬碟真的是蠶絲做的嗎?除了我們熟知的數據儲存,它竟然還能存儲DNA、疫苗等繁雜的生物信息,甚至可以植入生物體使用?「0」和「1」的數位訊號,通過解碼即可獲取存儲的信息。製作過程就是把將蠶絲變成蠶絲蛋白溶液後,將帶有血紅蛋白、白蛋白、葡萄糖等生命體特徵的標記物融入其中,這就完成了生命體信息存儲的全過程,使得蠶絲硬碟能植入生物體不產生排斥反應。而且它是一種厭水性材料,能保護包覆在其中的蛋白質、葡萄糖、DNA等易於損壞的有機分子不受破壞。蠶絲硬碟置於相對溼度90%或7特斯拉磁場或25千戈瑞強輻射環境下,存儲信息不回丟失。
  • 全球首款「蠶絲硬碟」!耐高溫可重寫,能存DNA,還能植入人體
    也就是說,未來,你的數據可能不需要再存儲在半導體上,而是一個蠶繭中。陶虎在澎湃新聞記者的採訪中提到,「蠶絲硬碟能同時存儲數字信息和生命信息;其生物兼容性良好,可以植入活的生物體,比如人體,長期保存甚至永久保存,像電影中士兵佩戴的銘牌一樣,製成永不丟失的生命銘牌;又能根據設定,製成壽命可控的時間膠囊
  • 薛其坤:量子革命解決大數據難題,指甲蓋存儲全世界
    只花200秒就完成了目前世界上最頂級的超級計算機一萬年才能完成的任務、未來指甲蓋大小的存儲器就能夠存下全世界所有的數據……第二次量子革命真的來了。在9月22日中關村軟體園舉行的創新之源大會上,清華大學副校長、北京量子信息科學研究院院長薛其坤院士剖析了未來的量子技術。
  • IBM成功在一顆原子中存儲數據:信用卡大小存儲iTunes所有3500萬首...
    ——獨立的原子,並演示在未來可能利用該磁體來存儲數據。而今天介紹的科研項目就是這項新發現的附加成果之一。通過超級尖的探針掃描物體表面,當探針上的鐵原子產生反應 STM 就能測量兩者之間的隧道電流,從而能夠更直觀的測量單個原子的磁場,且靈敏精準度要比其他方式更高。目前科學家通過最新研發的鐵原子傳感器,已經成功檢測到鈥原子的磁場。這主要是因為作為地球吸引元素之一,鈥原子具備極高的磁性。
  • 記憶等於多大硬碟?探人腦存儲的奧秘
    一件事,一幅圖,一個場景……幾乎所有的事情大腦都能夠將這些信息轉化為信號存儲在這個兩個拳頭大小的空間裡。    硬碟,是電腦最簡單的存儲單元之一。看形狀,其與人類大腦的大小可能沒有多大區別。但是存儲的數據量來看。單一的存儲硬碟已經很難與人類大腦存儲的數據相比較。可以說二者遠遠不是一個數量級的存儲,那麼人類大腦的存儲的信息量相當於多少塊這樣的硬碟呢?
  • 超級DNA硬碟來了!科學家成功「編程」大腸桿菌 將電脈衝轉化為DNA...
    原標題:超級DNA硬碟來了!科學家成功「編程」大腸桿菌 將電脈衝轉化為DNA片段   硬碟和光碟只要按下一個按鈕就能存儲千兆字節的數字數據。
  • Nature:用2斤DNA就能存儲世界上所有的數據
    那時,哈佛大學的生物學家喬治•丘奇(George Church)和他的團隊也發表了一種DNA編碼的實例。當時739KB數據量的EBI文件構成了有史以來的最大DNA存儲;但是在2016年7月,微軟和華盛頓大學的研究人員宣布,利用DNA存儲技術完成了約200MB數據的保存,是信息存儲的一個飛躍。
  • 當聽到蠶絲竟然能用來存儲數據時,你的第一反應是什麼?
    說起蠶絲製品想必大家不陌生,關於蠶絲最初的印象就是武俠電影裡刀槍不入的天蠶寶甲(真假無考究);隨後就是讓我們感到自豪的絲綢,幾千年以來,絲綢幾乎就成為了東方文明的傳播者和象徵。現在,蠶絲又有了新的應用,那就是作為硬碟來存儲數據。聽到這你肯定以為我在胡說八道,但事實就是如此。