DNA存儲——存儲材料的變革者

2020-12-27 BMJ分布式存儲0001

根據Domo的數據,2020年每分鐘,谷歌進行400萬次搜索,用戶在YouTube上觀看了433萬段視頻,發送了204,000,000封電子郵件,發了27萬次推特,在Instagram上發布了21萬張照片。到 2021年,全球人均每秒將創造約 1.7 兆字節的數據,假設世界人口為 78 億,一年可創建約 418 ZB(4180 億 個1TB 硬碟的信息價值)。目前的磁性或光學數據存儲系統通常不能持續超過一個世紀,此外,運行數據中心需要大量能源。簡而言之,我們即將遇到嚴重的數據存儲問題,隨著時間的推移,這個問題只會變得更加嚴重。

1.DNA存儲時間長

基於 DNA 的數據存儲,DNA由核苷酸A、T、C、G的長鏈組成,是生命中的信息存儲材料。數據可以按這些字母的順序存儲,將DNA轉化為一種新的信息技術形式。它已經可以常規地排序(讀取),合成(寫入),並輕鬆地準確地複製。DNA也非常穩定,遠古的化石樣本完全基因組測序就證明了這一點,儲存它不需要太多的能量。

2.DNA存儲容量大

DNA可以用遠遠超過電子設備的密度來儲存大量數據。例如,根據哈佛大學喬治·丘奇(George Church)及其同事在《自然材料》上發表的計算,簡單的大腸桿菌的儲存密度約為每立方釐米1019位。在這種密度下,目前世界上一年的儲存需求可以通過一個大約一米的DNA立方體很好地滿足。

3.DNA技術可行性高

DNA數據存儲不僅僅存在於理論中,實際的可行性高。例如,2017年,哈佛大學的教會小組採用了CRISPR DNA編輯技術,將人類手掌的圖像記錄到大腸桿菌的基因組中,這些圖像的讀取精度超過90%。華盛頓大學和微軟研究公司的研究人員已經開發出一種全自動系統,用於編寫、存儲和讀取DNA編碼的數據,包括微軟和Twist生物科學在內的許多公司都在努力推進DNA存儲技術。

與此同時,DNA已經被用來以不同的方式管理數據,研究人員正在努力理解大量的數據。下一代測序技術的最新進展使數十億個DNA序列能夠同時輕鬆讀取。有了這種能力,研究人員可以使用DNA序列作為分子識別"標籤"來跟蹤實驗結果。

目前存在的挑戰是DNA數據存儲成本較高,讀取和寫入的速度並不能支持大規模商用。幾乎可以肯定的是DNA會用於以全新的尺度生成信息,並長期保存某些類型的數據,促進整個存儲工業的發展。

近日,北卡羅納州立大學(North Carolina State University,以下簡稱NC)的研究人員開發了一種全新的DNA數據存儲系統方法,使用戶能夠讀取或修改數據文件,而不會破壞它們,並使系統更易於擴展實際使用。

"大多數現有的DNA數據存儲系統依靠聚合酶鏈式反應(PCR)來訪問存儲的文件,這在複製信息方面非常有效,但也帶來了一些重大挑戰,",論文的共同作者Albert Keung說。"我們開發了一種稱為動態操作和可重用信息存儲技術DORIS(筆者註:DORIS是Dynamic Operations and Reusable Information Storage的縮寫),該系統不依賴於 PCR。這有助於我們解決實際實施 DNA 數據存儲技術所面臨的一些關鍵障礙,Keung 是北卡羅來納州立大學化學和生物分子工程助理教授。

目前的系統依賴於稱為引物結合序列(primer-binding sequences)的DNA序列,這些序列被添加到存儲信息的DNA鏈的末端。簡而言之,DNA的引物結合序列用作文件名。當您需要文件時,您可以檢索帶有該序列的 DNA 鏈。

DNA 數據存儲技術的許多實際障礙都圍繞著使用 PCR 來檢索存儲的數據。依賴PCR的系統必須大幅度提高和降低存儲的遺傳物質的溫度,以便將DNA雙鏈撕開並顯示引物結合序列。這導致所有的引物結合序列和數據存儲序列自由地混在「基因湯」中。現有技術可以對基因混合物進行排序,以便使用 PCR 查找、檢索和複製相關的 DNA。溫度波動對於開發實用技術來說是個問題,PCR 技術本身逐漸消耗正在檢索的文件的原始版本。

DORIS採取了不同的方法。DORIS不使用雙鏈DNA作為引物結合序列,而是使用由單鏈DNA組成的"懸空"——就像一條尾巴,它系在實際存儲數據的雙鏈DNA後面。雖然傳統技術要求溫度波動撕開DNA以找到相關的引物結合序列,但使用單鏈游離意味著DORIS可以在不幹擾雙鏈DNA的情況下找到適當的引物結合序列。

論文的共同作者、NC電氣和計算機工程教授詹姆斯·塔克(James Tuck)表示:"換句話說,DORIS可以在室溫下工作,這使得開發在真實場景中的DNA數據管理技術更加可行。

不必撕開DNA鏈的另一個好處是,懸垂中的DNA序列可以與在數據文件的雙鏈區域找到相同的序列。在不犧牲信息密度的情況下,基於 PCR 的系統很難實現這一點,因為系統無法區分引物結合序列和數據存儲序列。

文的第一作者、NC博士生Kevin Lin說:"DORIS使我們能夠顯著提高系統的信息密度,也使得處理大型資料庫變得更加容易。一旦DORIS確定了正確的DNA序列,它就不會依靠PCR來複製。相反,DORIS將DNA轉錄為RNA,然後通過反向轉錄來讀取的數據存儲系統DNA。單鏈懸垂也可以修改,允許用戶重命名文件、刪除文件或"鎖定"文件,從而有效地使其他用戶看不到這些文件。

存儲材料科學一直處於變革之中,隨著時間的推移,數據存儲的需求增長,一批批新的存儲材料將會應運而生,一家家基於數據存儲的企業也會如雨後春筍破土而出。

BMJ一直致力於前沿科技的研究,2020年投資3000萬成立了分布式存儲產業基金,投資50個數據研究中心,用於分布式存儲相關的技術研究。2021年在全球成立30家分布式存儲實驗室,主要做存儲材料相關領域的技術研究。BMJ分布式存儲,為存儲而來,為服務而生。

筆者註:

PCR:(Polymerase Chain Reaction),聚合酶鏈式反應是一種用於放大擴增特定的DNA片段的分子生物學技術,根據DNA 雙螺旋結構雙鏈互補的特性,通過ATCG鹼基對在短時間內大量複製生成,形成DNA長鏈。

參考文獻:https://news.ncsu.edu/2020/06/dynamic-scalable-dna-data/

相關焦點

  • UCloud發力歸檔存儲,市場的攪局者or變革者?
    面對歸檔存儲這個歷史悠久的市場,UCloud大舉發力,是要做一個市場的攪局者還是變革者?讓我們從冷數據的發展趨勢以及UCloud最新的歸檔存儲產品中一窺究竟。正如UCloud所認為,絕大部分數據經過6個月之後都會變成冷數據,隨著數據量的不斷增加,存儲自動分層將是大勢所趨。歸檔存儲未來除了合規性之外,很重要的一點就是面臨前所未有的數據量時,如何有效地大幅降低存儲成本。
  • 人民日報:數字存儲打開想像空間 「DNA存儲」將成可能
    來源:人民日報原標題:數字存儲打開想像空間(新知)【現象】數位化時代產生的海量數據,讓數據存儲與數據安全成為熱點話題。研發高容量、高密度並且能夠承受極端環境條件的數據存儲介質,正成為研究前沿。不久前,《自然·生物技術》發布一項研究成果,研究團隊運用「萬物DNA」特殊材料3D列印出來一隻「兔子」,實現了數據的DNA存儲和傳遞。這項前瞻性研究,使得基於DNA的數字存儲技術再次受到各國研究者的關注。【點評】網際網路和人工智慧等信息技術的快速發展,使得信息量呈指數增長。
  • 未來信息存儲的領航者——多鐵性材料
    在現今高速發展的社會,信息存儲對人類的重要性不言而喻。信息存儲記錄了這個社會的發展,幫助人們更好地了解這個世界並推動它的發展。在我們的印象中,紙張似乎是信息存儲的開始。然而在信息載體出現之前,大腦才是最強大的信息存儲器。而後出現了用於信息存儲的工具——龜甲、竹片和紙張等。
  • 微軟可能很快將雲數據存儲在DNA存儲中
    存儲和內存以兆字節和千兆字節為單位。數據可以以文件格式存儲,就像使用ISAM和VSAM的大型機系統一樣。用於數據存儲,轉換和處理的其他文件格式包括逗號分隔的值。這些格式繼續在各種機器類型中找到用途,即使更面向結構化數據的方法已在企業計算中立足。數據增長如此之快,以至於當今的技術可能無法跟上。
  • 改變你的存儲方式 聯想個人云存儲X1終將成為行業變革者
    全稱Network Attached Storage,即具備資料存儲功能,並可以隨時連接到網絡使用的一種專用數據存儲器。售價為2399元的聯想個人云存儲X1,是2020年10月底在聯想秋季新品發布會上首次亮相的,這也是繼聯想推出雙盤位個人云T1和單盤位A1之後,第三款對大量數據有著更高存儲需求的個人云存儲產品。同時兼容3.5英寸HHD硬碟與2.5英寸HHD、SSD硬碟,單盤容量最高支持16TB,最高容量可達80TB。
  • 寶德:存儲產品新動能,邁向數據存儲新時代
    超過20年的發展時間,有著這樣長期積累的中國企業級存儲廠商,屈指可數。寶德堅守在數據存儲領域,繼往開來,正面向新數據新存儲的未來邁進。寶德在存儲領域持續投入,擁有完整的存儲產品線,主流產品包括混快閃記憶體儲、全快閃記憶體儲、分布式存儲系列等,覆蓋了不同應用、不同等級的存儲產品,可為不同規模體量的用戶提供靈活的選擇,滿足企業多樣化的存儲需求。GS5324M是寶德推出的一款面向中小型企業的數據集中存儲,數據歸檔備份存儲產品,具有高穩定性,高性能和極具價格競爭力的中低端存儲產品。
  • DNA存儲,拯救人類數據危機的良方?
    DNA絕對是這個星球上最古老的生命信息存儲工具,同樣也可以作為數據信息的存儲介質,且存儲密度和使用壽命要遠遠超出現有的磁碟式的存儲方案。因此,DNA存儲,正在被人類視為數據存儲的未來,成為拯救人類數據存儲危機的最好的替代方案。DNA存儲具體是怎麼做到的呢?現在發展到那一階段?商用的話還有哪些阻礙?這需要我們一一解答。
  • 關於Xilinx FPGA如何獲取FPGA的Device DNA
    一般來說,用戶在邏輯上可以通過特定的接口把這個Device DNA讀取出來,經過一系列加密算法之後和預先在外部Flash存儲的一串加密後的字節串做比較,這個flash存儲的加密後的字節串也是由該DNA經過加密後得到,fpga加載程序後可以先從flash讀出該段字節做比較,如果相同,則讓FPGA啟動相應的邏輯,如不同,則代表該FPGA沒有經過用戶授權,用戶邏輯上可以關閉FPGA的邏輯功能甚至可以通過一些手段讓硬體損壞
  • DNA硬碟:16GB的英文版維基百科,正以4Mb/s的速度存入DNA
    Catalog認為,生物分子的壽命將遠遠超過最新的計算機存儲技術。——DNA寫入機的哲學基礎據CNET報導,StartCatalog已經將所有16 GB的英語維基百科存儲在這個小瓶中的dna上。上個世紀60年代,生物存儲信息的想法被科學家提了出來。而今,美國是DNA存儲技術的最大玩家,其次是歐洲。對於大多數人而言,DNA用來存儲數據,是一項非常神奇的技術。但是,我們的大自然,億萬年來的各種生物,都是利用DNA來傳遞信息,也就是遺傳,從而實現了繁衍生息。DNA數據存儲技術的的原理是什麼?
  • 反鐵磁性材料中能否存儲信息?能!
    與鐵磁材料相比,反鐵磁材料中的微觀磁矩產生了取向變化。 在資訊時代,我們需要存儲的信息越來越多,與此同時終端設備越來越小。然而,矽基傳統電子存儲技術正在達到極限。 自旋電子學,特別是反鐵磁材料,為信息存儲提供了另一種選擇:電子不僅可以存儲信息,電子自旋也可以包含磁性信息。這樣的話,同樣的空間可以存儲加倍的信息。 然而,反鐵磁材料是否可以存儲電子信息,一直存在爭議。
  • 紫晶存儲,國內光存儲領軍者
    設計、開發,提供基於藍光數據存儲系統核心技術的光存儲介質、光存儲設備和解決方案的生產、銷售和服務。藍光數據存儲系統是一套融合底層光存儲介質、硬體設備和軟體,實現數據自動寫入、存儲和自動讀取的安全可靠、長壽命、綠色節能、低成本存儲系統。
  • 一隻塑料兔竟有DNA,身體每處都能「克隆」本兔
    在這種架構中,DNA分子被融合到一種功能性材料中,從而創建具有不可變內存的對象。研究人員選擇了一個叫斯坦福兔子(Stanford Bunny)的對象。這是一個常用的計算機圖形三維測試模型。首先,將兔子的二進位立體光刻(STL)文件從100kB壓縮到45kB。
  • 企業雲存儲是一個實現文件協作共享的解決方案
    打開APP 企業雲存儲是一個實現文件協作共享的解決方案 發表於 2019-07-08 10:51:19 說起企業雲存儲,可能大家還不清楚它是一什麼東西
  • 1克DNA=5億TB硬碟 DNA存儲數據試驗成功!
    事實上,使用DNA(脫氧核糖核酸)作為數據存儲容器的想法很早已被提出,現在瑞士蘇黎世理工學院的研究人員又取得了新的進展。   外媒消息,蘇黎世理工學院化學和應用生物科學系講師羅伯特·格拉斯表示:「我們已經發現了使DNA非常穩定的簡單方法,現在的問題是,如何將DNA的高存儲密度和穩定性這兩個屬性結合起來,應用於數據存儲方面。」
  • 新興跨季儲能材料登場,可有效存儲太陽熱能四個月
    最近英國科學團隊研發一種新型儲熱晶體材料,不僅可以在室溫環境下存儲四個月以上的太陽熱能,還能依照需求釋放熱能,有鑑於這款材料能長時間儲熱,團隊認為它會是將來冬季禦寒大作戰的潛在幫手
  • 存儲系列二:塊存儲、文件存儲、對象存儲、分布式文件存儲
    首先,我們介紹這兩種傳統的存儲類型。通常來講,所有磁碟陣列都是基於Block塊的模式,而所有的NAS產品都是文件級存儲。塊存儲和文件存儲是我們比較熟悉的兩種主流的存儲類型,而對象存儲(Object-based Storage)是一種新的網絡存儲架構,基於對象存儲技術的設備就是對象存儲設備(Object-based Storage Device)簡稱OSD。
  • ...微電子學院副院長周鵬:布局新材料存儲計算 實現新領域跨越發展
    基於傳統矽基半導體材料的存儲計算晶片遭遇的「存儲牆」和「功耗牆」問題日趨嚴峻,而順勢湧現的一些新興半導體材料,例如石墨烯、硫化鉬此類二維層狀半導體材料憑藉獨特的電學、光學特性,在新型存儲及計算電子器件和晶片系統應用中展現出無限潛能,並且目前國際社會對它們在存儲及計算領域中的實際應用仍處於探索階段。
  • 全面布局集中式存與分布式存儲,浪潮譜寫新篇章
    Gartner主存儲魔力象限合併了以往的通用存儲陣列魔力象限和固態存儲陣列魔力象限,產品覆蓋了混閃和全閃兩種存儲形態,合併後的主存儲市場在全球存儲市場中的佔比將高達70%以上,成為全球存儲業界最重量級的魔力象限之一。這已經是浪潮存儲第三年入選Gartner魔力象限了。
  • 存儲系列三:塊存儲、文件存儲、對象存儲的比較
    3、對象存儲典型設備:內置大容量硬碟的分布式伺服器對象存儲最常用的方案,就是多臺伺服器內置大容量硬碟,再裝上對象存儲軟體,然後再額外搞幾臺服務作為管理節點,安裝上對象存儲管理軟體。管理節點可以管理其他伺服器對外提供讀寫訪問功能。之所以出現了對象存儲這種東西,是為了克服塊存儲與文件存儲各自的缺點,發揚它倆各自的優點。
  • 揭秘長江存儲產業鏈,一圖盡收A股設備材料...
    揭秘長江存儲產業鏈,一圖盡收A股設備材料供應商名單 記者從長江存儲方面確認,目前給長江存儲供貨的產業鏈夥伴主要集中在設備和材料領域,但具體供應商信息不便作進一步透露。產業鏈上遊的設備和材料,同時還是國家大基金二期的投資重點;疊加其本身具備的新基建屬性,或將迎來更多採購機遇。據《科創板日報》不完全統計,目前至少有16家國產設備及材料廠商已在長江存儲的供應商之列。