數據存儲的趣事

2021-02-26 喔家ArchiSelf

引:本來想系統學習整理一下文件系統的體系,一不小心發現了一個關於存儲的趣文,Jessie Frazelle 的 「The Life of a Data Byte」(https://queue.acm.org/detail.cfm?id=3419941,2020-8)。為什麼像物理和化學這樣基礎學科如此重要呢?這篇文章或許可以給出一些答案。

隨著更新、更好、更快的存儲介質的到來,一個字節的數據能夠以多種不同的方式進行存儲。字節是數字信息的單位,通常指八位,比特位是一個信息單位,可以表示為0或1,表示邏輯狀態。讓我們跟隨時光的腳步簡單地走一走,先了解一下比特和字節的起源。

關於比特和字節

回到Babbage的分析機,可以看到一個比特位被存儲為一個機械齒輪或槓桿的位置。在紙質卡片的時代,卡片中某個特定位置是否有孔代表一個比特位。對於磁帶和磁碟等磁性存儲設備,比特位表示為磁片某一區域的極性。在DRAM中,一個比特通常被表示為儲存在電容器中的兩級電荷,電容器是一種在電場中儲存電能的裝置。

1956年6月,Werner Buchholz創造了 byte 這個詞來指用於編碼單個文本字符的一組比特,後來演變為我們熟知的ASCII編碼。ASCII 是基於英文字母的,因此,每個字母、數字和符號(A-Z、 A-Z、0-9、 + 、-、/!等)表示為一個介於32和127之間的7位整數。為了支持其他語言,Unicode 擴展了 ASCII,以便將每個字符表示為一個編碼值。例如,小寫的 j 表示為 u + 006 a,其中 u 表示 Unicode,後跟十六進位數字。

UTF-8是將字符表示為8位的標準,允許0到127之間的每個代碼點存儲在一個字節中。這對於英文字符來說沒有問題,但是其他語言中的字符通常表示為兩個或更多字節。UTF-16是將字符表示為16位的標準,UTF-32是32位的標準。在 ASCII 中,每個字符都是一個字節,但在 Unicode 中,一個字符可以是一個、兩個、三個或更多字節。

數據存儲介質的時光漫步

一個字節中的比特數隨過去存儲介質的設計而變化,通過各種存儲介質進行時間旅行,可以了解數據在歷史中是如何存儲的。假設我們有一個字節的數據要存儲: 字母 j,或者編碼的字節6a,或者二進位01101010。穿越時光,讓這個數據字節貫穿於各種存儲技術之中。

1951年

70年前,大約1951年在Univac 1 計算機上誕生了 Uniservo 磁帶驅動器,這是第一臺商用計算機的磁帶驅動器。這種磁帶有三磅重,半英寸寬,由被稱為 vicalloy 的鍍鎳磷青銅製成,長1200英尺。字節數據可以以每秒7,200個字符的速度存儲在以每秒100英寸的速度移動的磁帶上。這時候,我們可以通過磁帶走過的距離來測量存儲算法的速度。

1952年

到了1952年5月21日,當時 IBM 發布了它的第一臺磁帶機——IBM 726。數據字節現在可以從 Uniservo 的金屬磁帶轉移到 IBM 的磁帶上了。這個新家非常舒適,磁帶是可以存儲高達200萬位的空間。這種七磁軌磁帶每秒移動75英寸,傳輸速率為12500位數字每秒或7500個字符每秒,當時稱為拷貝組。

七磁軌磁帶有六個磁軌用於數據存儲,一個磁軌做奇偶校驗。數據以每英寸100比特位的速度完成記錄。該系統採用真空通道的方法,使一圈膠帶在兩點之間循環。這允許磁帶驅動器在瞬間啟動和停止磁帶,是通過在磁帶卷盤和讀/寫磁頭之間放置長的真空柱來實現的,以吸收磁帶中突然增加的張力,否則磁帶通常會斷裂。磁帶卷背面的可拆卸塑料環提供了防寫,一卷磁帶大約可以儲存1.1 MB 數據。程序不能繞過磁帶,也不能隨機訪問數據ーー它們必須按順序讀寫。

1956年

磁碟存儲時代始於1956年,當時 IBM 將 305 RAMAC 計算機交付給舊金山的 Zellerbach Paper 公司。這是第一臺使用移動磁頭硬碟驅動器(硬碟驅動器)的計算機。RAMAC 磁碟驅動器由50個直徑為24英寸的磁性金屬盤組成,能夠以每個字符7位的速度存儲大約500萬字符的數據,並以轉速1200轉的速度旋轉,存儲容量約為3.75 MB。

與磁帶或穿孔卡不同,RAMAC 允許實時隨機訪問存儲器中的大量數據。IBM 宣傳 RAMAC 能夠存儲相當於64,000張穿孔卡的數據。在此之前,事務需要數據累積到一定容量後通過批處理執行。RAMAC 引入了連續處理事務的概念,以便數據能夠及時檢索。我們的那個數據字節j,現在可以在 RAMAC 中以每秒100,000位的速度訪問。在此之前,人們使用磁帶時,必須順序寫入和讀取數據,而不能隨機跳轉到磁帶的各個部分,實時隨機訪問數據在當時是真正的革命。

1963年

DEC tape 於1963年推出,價格低廉,性能可靠,因此在很多代 DEC 計算機中都有使用。這卷3英寸的膠帶是夾層的,夾在兩層聚酯薄膜之間,放在一個4英寸的捲軸上。可以用手攜帶,而不像之前的那些重量級產品,這使得 DEC tape 對於個人電腦來說非常重要。與七軌磁帶相比,DECtape 有六個數據軌道、兩個標記軌道和兩個時鐘軌道,數據以每英寸350位的速度記錄。數據字節是8位的,但可以擴展到12位,以每秒8,325個12位字的速度傳輸到 DEC tape,磁帶速度為每秒93 +/-12英寸,這比1952年的 Uniservo 金屬磁帶提升了8%。

1967年

四年後的1967年,IBM 的一個小團隊開始研究軟盤驅動器,代號為 Minnow 。當時,該團隊的任務是開發一種可靠且成本低廉的方法,將微代碼加載到 IBM System/370主機中。然後,該項目被重新分配並用於將微代碼加載到代號為 Merlin 的 IBM 3330 Direct Access Storage Facility 的控制器中。

數據字節現在可以存儲在塗有磁性材料的八英寸柔性聚酯薄膜磁碟上,稱為軟盤。在發布時,該項目的結果被命名為 IBM 23FD 軟盤驅動器系統。這些磁碟可以容納80 KB 的數據。與硬碟驅動器不同,用戶可以很容易地將帶有保護外殼的軟盤從一個驅動器轉移到另一個驅動器。後來,在1973年,IBM 發布了一個讀/寫軟盤驅動器,隨後成為了行業標準。

1969年

1969年,AGC(阿波羅導航計算機)只讀繩索存儲器是在阿波羅11號上發射升空的,阿波羅11號將美國太空人送上月球並返回。這種繩索存儲器是手工製作的,可以存儲72kb 的數據。製造繩索存儲器是緩慢而費力的,類似於紡織工作,它可能需要幾個月編織一個程序到繩索存儲器,如下圖所示。

但在當時,它是抵禦嚴酷太空環境的最佳工具。當一根導線穿過其中一個圓形核心時,它代表1。圍繞一個核心的電線代表0。我們的那個數據字節j,現在需要一個人花幾分鐘才能編織進繩子裡。

1977年

1977年發布的Commodore PET是第一臺面向大眾市場成功的個人電腦。內置的 PET 是一個 Commodore 1530 數據套裝(數據及盒式磁帶)。PET 將數據轉換成模擬聲音信號,然後存儲在盒式磁帶上。這使得存儲解決方案具有成本效益和可靠性,儘管速度非常慢。小數據字節可以以每秒60-70位元組的速度傳輸,盒式磁帶每30分鐘一面可容納100 KB,每卷磁帶有兩面。例如,可以在盒式磁帶的一側放入大約2張55kb 的圖像。這種數據套裝也出現在 Commodore VIC-20和 Commodore 64中。

1978年

來到1978年, MCA 和飛利浦公司推出了「碟形光碟」。《大白鯊》是北美雷射唱片公司賣出的第一部電影。LaserDisc 的音頻和視頻質量遠遠好於競爭對手,但對大多數消費者來說太貴了。與 VHS 磁帶相反,用戶可以用它來錄製電視節目,而 LaserDisc 則不能寫入。LaserDiscs 使用帶有模擬調頻立體聲和 PCM 數字音頻的模擬視頻。這些圓盤直徑為12英寸,由兩個塑料層的單面鋁製圓盤組成。如今,雷射唱片被視為 DVD 製作的基石。

1979年

一年後的1979年,Alan Shugart 和 Finis Conner 創立了希捷科技,他們的想法是縮小硬碟驅動器的規模,使其與5.25英寸軟盤的大小一樣,這在當時是標準配置。1980年,他們的第一款產品是希捷 ST506,是第一款微型計算機硬碟。

5.25英寸的磁碟容納了5MB的數據,這在當時是標準軟盤的5倍。它是一個堅硬的金屬盤子,兩面都塗上了一層薄薄的磁性材料來存儲數據。我們的數據字節可以以625 KB/s 的速度傳輸到磁碟上。

1981年

隨後,索尼推出了第一個3.5英寸軟盤驅動器。1982年,惠普推出 HP-150,成為第一家採用這項技術的公司。這使得3.5英寸軟盤在業界得到了廣泛的支持。磁碟是單面的,格式化容量為161.2 KB,非格式化容量為218.8 KB。1982年,一個由23家存儲公司組成的聯盟,根據索尼最初的設計,製作了一個3.5英寸的有了雙面軟盤。我們數據字節j現在可以存儲在早期廣泛應用的存儲介質中——3.5英寸的軟盤。

1984年

1984年,索尼和飛利浦公司宣布推出了可存儲550MB預先錄製數據的CD-ROM。這種格式源於兩家公司在1982年開發的 CD-DA (光碟數字音頻),用於分發音樂的 CD-DA 的容量為74分鐘。當索尼和飛利浦就 CD-DA 標準進行談判時,傳說參與談判的四個人中有一個人堅持認為 CD-DA 能夠容納貝多芬《第九交響曲》的全部內容。第一個產品發布的 CD-ROM 是 Grolier 的電子百科全書,出版於1985年。這部百科全書包含900萬個單詞,僅佔553兆字節可用空間的12%。百科全書和我們的數據字節將有足夠的空間。

此後不久,在1985年,經過許多計算機和電子公司的共同努力,為CD-ROM制定了標準,以便任何計算機都能訪問這些信息。

也是在1984年,Fujio Masuoka 發表了他的關於一種新型浮柵存儲器的研究成果,這種存儲器被稱為快閃記憶體,它可以被多次擦除和重新編程。

首先回顧一下浮柵存儲器是如何工作的。它使用了電晶體,這是一種可以單獨開關的門電路。由於每個電晶體可以處於兩種不同的狀態(開或關) ,它可以存儲兩個不同的數字: 0和1。浮柵指的是添加到電晶體的第二柵極,這個第二個柵極由一層薄的氧化層絕緣。這些電晶體使用施加在電晶體柵極上的一個小電壓來表示它是開啟還是關閉,轉換成0或1。

對於浮柵,當在氧化層上施加適當的電壓時,電子穿過氧化層,卡在浮柵上。因此,即使斷開電源,電子仍然存在於浮柵上。當浮柵上沒有電子時,它表示1; 當電子被捕獲在浮柵上時,它表示0。反過來,在氧化層上施加相反方向的適當電壓,使電子從浮柵中穿出,使電晶體恢復到原來的狀態。因此,這些單元可以編程,具有不易失性。我們的那個數據字節j,可以被編程為01001010個電晶體,浮柵中電子被捕獲則代表0。

Fujio Masuoka 的設計比 EEPROM稍微便宜一些,但是靈活性不如 EEPROM,因為它需要多組單元一起擦除,但這也解釋了它的速度。當時,Masuoka 在東芝工作,但不久後辭職,成為大學的一名教授。他對東芝公司沒有對自己的工作給予獎勵感到不滿,於是起訴東芝公司,要求對他的工作給予補償。該案於2006年和解,一次性支付了8700萬美元,相當於80年代的75.8萬美元。考慮到快閃記憶體在行業中的影響力,這個數字仍然很低。

關於快閃記憶體,需要來看看 NOR 和 NAND 快閃記憶體之間的區別。快閃記憶體在由浮柵電晶體構成的存儲單元中存儲信息,這些技術的名稱與存儲單元的組織方式直接相關。

在 NOR 快閃記憶體中,單個存儲單元並行連接,允許隨機訪問。這種體系結構使隨機訪問的微處理器指令所需的短時間讀取成為可能。NOR 快閃記憶體是典型的低密度應用程式,大多數應用於只讀的場景。這就是為什麼大多數CPU通常從 NOR快閃記憶體中加載固件。Masuoka 和他的同事在1984年發明了 NOR 快閃記憶體,在1987年發明了 NAND 快閃記憶體。

相比之下,NAND快閃記憶體設計者放棄了隨機訪問的能力,以換取更小的存儲單元,這也帶來了更小的晶片尺寸和每個比特位成本更低的好處。NAND 快閃記憶體的結構是由八個存儲器電晶體組成的陣列串聯而成。這導致了高存儲密度,更小的內存單元大小,更快的寫和擦除。當數據不是按順序寫入且塊中已存數據時,必須覆蓋數據。

1991年

跑到1991年, IBM 評估了SanDisk 製作的一個SSD (固態硬碟)原型模塊,當時被稱為 SunDisk。該設計將快閃記憶體陣列和非易失性存儲晶片與智能控制器相結合,實現了缺陷單元的自動檢測和修正。這張磁碟容量20MB,2.5英寸大小,售價約為1000美元。最終在 ThinkPad 筆記本電腦上使用了這個產品。

1994年

在1994年, Lomega 發布的Zip磁碟,是一個100 MB的盒式磁帶,外形尺寸為3.5英寸,比標準的3.5英寸磁碟厚一點。後續版本的 Zip 磁碟最多可以存儲2 GB。這些磁碟的便利性在於它們只有軟盤那麼小,但卻能夠容納大量的數據,使得引人注目。我們的數據字節可以寫在一個1.4 MB/s 的Zip磁碟上。在那個時候,1.44 MB 的3.5英寸軟盤寫速度為16 kB/s。在Zip驅動器中,磁頭是非接觸式的讀/寫,並且在表面上飛行,這與硬碟相似,但不同於其他軟盤。由於可靠性問題和CD的經濟性,Zip 磁碟最終被淘汰了。

也是在1994年,SanDisk 推出了 CompactFlash,它被廣泛應用於消費電子設備,例如數字攝像機和視頻攝像機。

像CD-ROM一樣,CompactFlash 的速度是基於倍速的(8倍,20倍,133倍等等)。最大傳輸速率是根據原始音頻 CD 傳輸速率150 kB/s 計算出來的。這個結果看起來像 r = k × 150kb/s,其中 r 是傳輸速率,k 是速度等級。對於133x CompactFlash,我們的數據字節寫為133 × 150kb/s,或者大約19,950kb/s 或者19.95 MB/s。CompactFlash聯盟成立於1995年,目的是制定基於快閃記憶體存儲卡的行業標準。

1997年

幾年後, CD-RW (可擦寫光碟)在1997年推出。這種光碟用於數據存儲,備份以及在各種設備傳遞文件。CD-RW 只能被重寫大約1000次,這在當時並不是一個限制因素,因為用戶很少在一個磁碟上反覆重寫數據。

CD-RW 是基於相變技術的。在給定介質的相變過程中,介質的某些性質發生變化。在 CD-RW 的情況下,由銀、碲、銦組成的特殊化合物的相移會導致反射區和非反射區,每個區域代表0或1。當這種化合物處於晶體狀態時,它是半透明的,這表明它是1。當化合物熔化成非晶態時,它變得不透明和不反射,這代表是0。我們可以用這種方式將數據字節01001010寫成非反射區和反射區。後來,CD-RW 的市場份額最終還是被DVD佔據了。

1999年

1999年,IBM 推出了當時世界上最小的硬碟驅動器: 170MB和340 MB 容量的 IBM 微驅動器。這些是小型硬碟,一英寸大小,設計用於可以插入 CompactFlash II 型插槽。其目的是創建一個類似 CompactFlash 但具有更大存儲容量的設備。然而,這些產品很快就被USB快閃記憶體驅動器和更大的CompactFlash卡所取代了。像其他硬碟驅動器一樣,微驅動器是機械式的,包含小型的旋轉磁碟碟片。

2000年

USB 快閃記憶體驅動器於2000年推出,這樣的設備包括了一個外形小巧的帶有 USB 接口的快閃記憶體。根據所使用的 USB 接口的版本不同,速度也不同: USB 1.1的速度限制在1.5 Mbps,而 USB 2.0可以處理35Mbps,USB 3.0可以處理625Mbps。

第一個 USB 3.1 Type C 驅動器於2015年3月發布,讀寫速度達到530mbps。與軟盤以及光碟不同,USB 設備更不容易損壞,但仍然提供相同場景的數據存儲、傳輸和備份文件。正因如此,軟盤和光碟驅動器的流行度已經下降,取而代之的是 USB 埠。

2005年

硬碟驅動器製造商在2005年開始使用 PMR (垂直磁記錄)出貨產品。有趣的是,這發生在蘋果公司發布 iPod Nano 的同時,iPod Mini 使用的是快閃記憶體,而不是一英寸的硬碟,引起了業界的一片譁然。

一個典型的硬碟驅動器包含一個或多個硬碟,硬碟上塗有一層由微小的磁性顆粒組成的磁敏薄膜。當磁頭在旋轉的磁碟上方飛行時,數據就會被記錄下來,就像電唱機和唱片一樣,只不過那些場景下的磁頭與唱片有物理接觸。當碟片旋轉時,與碟片接觸的空氣會產生流動。就像機翼上的空氣產生升力一樣,空氣也會在磁頭上產生升力。磁頭快速翻轉一個晶粒磁化區域,使其磁極指向上或下,表示1或0。

PMR 的前身是 LMR (縱向磁記錄),PMR 可以提供超過 LMR 三倍的存儲密度,兩者的關鍵區別在於 PMR 介質存儲數據的晶粒結構和磁場方向是柱狀而非縱向。由於更好的粒子分離和均勻性,PMR 具有更好的熱穩定性和信噪比的改善。它還受益於,因為更強的磁頭磁場和更好的磁介質可以對齊,進而提供了更好的寫入性能。像 LMR 一樣,PMR 的基本限制是基於磁寫入數據位的熱穩定性,以及需要有足夠的信噪比來讀取信息。

2007年

日立公司在2007年發布了第一臺1 TB 硬碟, Deskstar 7K1000使用了5個3.5英寸200 GB 的碟片,每分鐘轉速為7200轉。這與世界上第一個硬碟驅動器 IBM RAMAC 350形成了鮮明的對比,後者的存儲容量大約為3.75 MB,這是51年來的變化。

2009年

2009年,NVMe (nonvolatile memory express,非易失性存儲器)登上了科技的舞臺。NVM 是一種具有持久性的存儲器,而易失性存儲器需要恆定的能量來保存數據。NVMe 滿足了基於 PCIe (PCI Express)的 SSD對可伸縮性主機控制接口的需求。

超過90家公司參與了開發設計的工作組,這些都是基於先前定義的 NVMHCIS (非易失性存儲器/主機控制接口規範)。在一個現代伺服器中可能會找到一些 NVMe 驅動器,目前最好的 NVMe 硬碟可以達到3,500 MB/s 的讀和3,300 MB/s 的寫。對於我們使用的數據字節,字符 j,相對於「阿波羅」計算機手工編織繩索存儲器幾分鐘的時間來說,這是天壤之別。

數據存儲介質的現在和未來

我們希望存儲是持久化的,根據存儲介質的用途可以粗略地分為存儲級內存和硬碟。

關於存儲級內存

如今,SCM (存儲級內存)的最新技術狀態是怎樣的呢?

像 NVM 一樣,SCM 是持久化的,但是它提供的性能比主內存更好,或者可與主內存相媲美提供字節可尋址性。SCM 旨在解決當今緩存所面臨的一些問題,如 SRAM (靜態隨機存取存儲器)的低密度問題。DRAM提供了更好的密度,但這是以較慢的訪問時間為代價的。DRAM 還需要持續不斷的電源支持。分析一下,由於電容器上的電荷一點一點地洩漏,所以需要電力; 這意味著如果沒有幹預,晶片上的數據很快就會丟失。為了防止這種洩漏,DRAM 需要一個外部存儲器刷新電路,定期重寫電容器中的數據,恢復它們的原始電荷。

為了解決密度和功率洩漏的問題,一些正在發展中的技術有 PCM (相變化內存) ,STT-RAM (自旋轉移力矩隨機存取存儲器)和 ReRAM (電阻式隨機存取存儲器)。所有這些技術的一個優勢是它們作為 MLC (多級單元)的功能。這意味著它們可以存儲多於一位的信息,而 SLC (單級單元)只能在每個內存單元存儲一位的信息。通常,一個存儲單元是由一個 MOSFET (金屬氧化物-半導體場效應管)組成的。MLC 減少了存儲與 SLC相同數量數據所需的 MOSFET數量,使其密度更高或更小,以提供與使用 SLC技術相同數量的存儲。下面看一下這些 SCM 技術是如何工作的。

相變化內存

PCM 類似於先前描述的CD-RW的相變。它的相變材料通常是 GST,或 GeSbTe (鍺銻碲) ,它可以存在於兩種不同的狀態: 非晶態和晶態。非晶態的電阻比晶態的電阻高,用於表示0和1。通過將數據值分配給中間電阻,PCM 可以用來存儲多個狀態作為一個 MLC。

自旋轉移力矩隨機存取存儲器

STT-RAM 由兩層鐵磁性的永磁體組成,中間隔著一層絕緣體,這種絕緣體可以在不傳導的情況下傳遞電力。它根據磁場方向的不同存儲數據位。一個磁層,稱為參考層,具有固定的磁方向,而另一個磁層,稱為自由層,具有通過電流控制的磁方向。對於1,兩層的磁化方向是一致的。對於0,這兩個層有相反的磁方向。

電阻式隨機存取存儲器

ReRAM 由兩個金屬電極組成,兩個金屬電極被金屬氧化物層隔開。這與 Masuoka 最初的快閃記憶體設計類似,電子會穿過氧化層,卡在浮柵上,反之亦然。然而,對於 ReRAM,單元的狀態是由金屬氧化物層中氧空位的濃度決定的。

存儲級內存的缺點和優點

雖然這些SCM技術很有前途,但它們也有缺點。PCM 和 STT-RAM 具有較高的寫延遲。PCM 的延遲是 DRAM 的10倍,而 STT-RAM 的延遲是 SRAM 的10倍。PCM 和 ReRAM 在出現嚴重錯誤之前對寫的持續時間有限制,這意味著內存元素被卡在一個特定的值上。

2015年8月,英特爾發布了基於3DXPoint 的產品 Optane,發音為3D cross-point 。Optane 聲稱性能比 NAND 固態硬碟快1000倍,性能是快閃記憶體的1000倍,而價格是快閃記憶體的4到5倍。Optane 證明了SCM不僅僅是實驗性的,觀察這些技術是如何發展的將是一件有趣的事情。

關於硬碟存儲

不論是海量存儲還是可攜式存儲, 我們的IT系統都是以硬碟存儲為基石的。

氦磁碟驅動器(HHDD)

HHDD(氦硬碟驅動器)是一種高容量的硬碟驅動器,在製造過程中充滿氦並密封。像其他硬碟類似,它很像一個旋轉磁塗層的磁碟唱機。典型的硬碟驅動器內部只有空氣,但空氣會對碟片的旋轉產生一定的阻力。

氦比空氣輕,是漂浮著的,事實上氦的密度是空氣的七分之一,因此減少了碟片旋轉時的阻力,導致碟片旋轉所需的能量減少,但這這實際上是一個次要特性。氦氣的主要優勢在於,它可以以通常只能容納五個碟片的外觀規格包裝七個碟片,而用充滿空氣的驅動器進行這種嘗試會引起湍流。如果還記得之前關於飛機機翼的比喻,那麼這個比喻就非常貼切了。氦可以減少阻力,從而消除湍流。

然而,眾所周知的是,氦氣球在幾天後就會開始下沉,因為氦氣會從氣球中逸出。這些驅動器也無法避免氦氣的逃逸。製造商們花了好幾年時間才發明出一種容器,在驅動器的使用壽命內防止氦氣逸出。Backblaze 發現 HHDD的年錯誤率較低,為1.03% ,而標準硬碟驅動器的年錯誤率為1.06% 。當然,這個差別很小,很難從中得出什麼結論。

一個充滿氦氣的驅動器規格可以使用一個 PMR 的硬碟封裝,或它可以包含一個 MAMR (微波輔助磁記錄)或者 HAMR (熱輔助磁性錄寫)驅動器。任何磁存儲技術都可以用氦來替代空氣。2014年,日立將兩種尖端技術結合到其10TB HHDD 中,使用了主機管理的 SMR (疊瓦式磁記錄)。

疊瓦式磁記錄

PMR 是 SMR 的前身。與 PMR 不同的是,SMR 記錄了新的軌道,這些軌道重疊了以前記錄磁軌的一部分,這反過來又使之前的軌道變窄,允許更高的軌道密度。這項技術的名字來源於這樣一個情景,即重疊的軌道類似於屋頂上的瓦。

由於寫入一個軌道會覆蓋相鄰的軌道,所以 SMR 會導致一個更加複雜的寫入過程。當磁碟碟片是空的而數據是順序的時候,這就不起作用了。然而,一旦您寫入一系列已經包含數據的軌道,這個過程就會破壞現有的相鄰數據。如果相鄰磁軌包含有效數據,則必須重寫該磁軌,這非常類似於 NAND flash。

擁有設備管理的 SMR 設備通過設備固件管理來隱藏這種複雜性,從而產生與任何其他硬碟一樣的接口。另一方面,主機管理的 SMR 設備依賴於作業系統來處理驅動器的複雜性。希捷公司於2013年開始發布 SMR 驅動器,聲稱其密度比 PMR 高出25% 。

微波輔助磁記錄

MAMR 是一種能量輔助磁存儲技術,與 HAMR 類似,它使用20到40GHz 的頻率以圓形微波場覆蓋磁碟碟片。這降低了磁碟的矯頑力,這意味著磁碟的磁性材料對磁化強度變化的阻力較低。磁碟區域的磁化強度變化用來表示0或1,因此磁碟對磁化強度變化的阻力較低,所以可以更密集地寫入數據。這項新技術的核心是自旋轉矩振蕩器,用於產生微波場而不犧牲可靠性。

西部數碼在2017年發布了這項技術,東芝在2018年緊隨其後推出了類似的產品。當 西部數碼和東芝正忙於追求 MAMR 的時候,希捷正押注於 HAMR。

熱輔助磁記錄

HAMR 也是一種能量輔助磁存儲技術,利用雷射發熱幫助磁碟表面寫入數據,從而大大增加了硬碟等磁性設備上存儲的數據量。熱量使得磁碟上的數據位之間的距離更近,從而提高了數據密度和容量。

這項技術很難實現。在寫入數據之前,一個200毫瓦的雷射器把該區域的一小部分快速加熱到750華氏度(400攝氏度) ,同時不幹擾或損壞磁碟上的其餘數據。加熱、寫入數據和冷卻的過程必須在一納秒內完成。這些挑戰需要開發納米級表面等離子體雷射單元,也稱為表面導向雷射,而不是直接基於雷射的加熱,還需要開發新型的玻璃碟片和熱控塗層,以容忍快速點加熱而不損壞記錄頭或任何附近的數據,還需要克服各種其他技術挑戰。

希捷在2013年第一次展示了這項技術,儘管有很多人對此持懷疑態度,但是,希捷仍然在2018年開始發布第一批基於這項技術的設備。

結束語

本文從1951年存儲介質的發展狀況入手,展望了存儲技術的未來。隨著時間的推移,存儲方式發生了很大變化,從紙帶到金屬帶、磁帶、繩索存儲器、旋轉磁碟、光碟、快閃記憶體等等,每一個進步都為了帶來更快、更小、更高效的數據存儲設備。對比NVMe 和1951年 Uniservo 金屬磁帶, NVMe 可以比Uniservo 每秒多讀取486,111% 的數據。對比NVMe 和1994年的 Zip 磁碟,可以看到 NVMe 每秒可以多讀213,623%的數據。

存儲0和1的方法仍然是正確的,但做到這一點的方法千差萬別。

【關聯閱讀】

相關焦點

  • 基於新型存儲的大數據存儲管理
    其次,藉助基於新型存儲的分布式內存文件系統等技術[12],可以大規模提升外存和內存的寫吞吐速率。  本文綜述了基於新型存儲的大數據存儲管理技術,分析了現有大數據存儲技術的局限性,介紹了新型存儲的特點和發展概況,總結了基於新型存儲的大數據存儲架構、基於新型存儲的大數據存儲管理等方向的研究現狀,在此基礎上給出了基於新型存儲的大數據存儲與管理的若干未來研究方向。
  • 存儲市場數據結構
    存儲市場的兩類數據結構,分別是訂單和訂單簿。(1)訂單訂單種類包含成交訂單、出價單(bid)和報價訂單(ask)3種。存儲礦工提交報價單出售服務,用戶提交出價單購買服務。如果兩個訂單對某一價格達成共識,雙方共同創立一個成交訂單。
  • 計算存儲分離之「數據存儲高可用性設計」
    一、背景  面對著業務的發展,不管是在線,近線還是離線系統,其所需要的存儲規模以及存儲成本,成倍上漲。如果還是採取傳統的分散式存儲管理方式,除了高昂的管理分散式存儲的成本,還會增加存儲成本。  因此,我們極需一種既高效又省成本的數據存儲以及存儲管理方式。
  • 大數據存儲平臺之異構存儲實踐深度解讀
    經常做數據處理的夥伴們肯定會有這樣一種體會:最近一周內的數據會被經常使用到,而比如最近幾周的數據使用率會有下降,每周僅僅被訪問幾次;在比如3月以前的數據使用率會大幅下滑,存儲的數據可能一個月才被訪問幾次。
  • 紫晶存儲發布光存儲數據報告:一圖看懂光存儲介質的技術光環
    在資訊時代,數據呈現出爆炸增長的態勢,但海量數據的丟失也對存儲介質提出了更大的挑戰。近日,紫晶存儲發布了題為《解決大數據存儲,光存儲駕到》的光存儲數據報告,認為光存儲是大數據存儲的最優解,可以有效解決目前存儲行業中面臨的多種難題。但光存儲作為四大存儲介質之一,真的有如此巨大的優勢而成為未來存儲的趨勢嗎?
  • 天賦異稟,高存儲密度成為海量數據存儲首選
    多數存儲環境之下,相當一部分數據被訪問或者更改的機率非常之小,而囿於眾多政策、法律法規的要求,這些數據必須得到妥善的長期保存。存儲成本和數據保護成為企業存儲最大的兩個挑戰。IBM 在軟體和硬體層面「雙管齊下」,圍繞磁帶技術打造不斷升級的數據存儲解決方案,可以幫助企業完美應對新時代的存儲需求。
  • 什麼是數據的存儲、邏輯結構和數據的運算?
    先來了解一下數據的構成,1,數據元素,數據元素是組成數據的基本單位,比如表中的一欄信息,包括學生的編號、名字、性別等等這些都屬於這個數據表中的諸多學生中的一個,也就是其中的一個數據元素。2,據項是組成數據元素的基本單位,就如表中的一個名字或者一個編號。為什麼要先了解數據元素和數據項呢?因為數據結構的三個基本概念可以說就是這些基本單位之間的某種關係。一般書面裡的定義是這樣說的:數據結構就是相互之間存在一種或多種特定關係的數據元素的集合。
  • IDC數據中心與分布式存儲
    1.市場演化隨著網際網路和通信技術的不斷發展,企業的數據處理和存儲趨於規模化、靈活化和節能化,IDC也從基礎的主機託管、帶寬出租等業務不斷與新技術結合(雲計算、邊緣計算等)拓展到網絡安全服務、代維服務、虛擬數據存儲和計算等綜合化業務。隨著5G時代的來臨,IDC向著產業4.0時代邁進。
  • GBS+區塊鏈 數據存儲的未來
    存儲市場有多大?我們看看日常的需求就清楚了,我們使用手機需要存儲、電腦需要存儲、各類網站系統需要存儲、各個機構數據需要存儲……可以說在數位化的今天,存儲已經深入我們日常生活的方方面面。而傳統中心化的網際網路將數據存儲在本地驅動器中,伺服器的運營和維護成本不菲,與此同時有關洩密、侵犯隱私、隨意刪改等問題顯然可見。
  • 構建數位化基石 紫晶存儲參展2018中國存儲與數據峰會
    2018中國存儲與數據峰會(簡稱DSS大會)將於2018年12月11至12日在北京國際飯店會議中心舉辦。紫晶存儲是國內唯一擁有專業藍光存儲介質技術和生產能力的高新技術企業,是國家光碟行業標準的起草單位,也是國家出版產品質量監督檢測中心「藍光檢測實驗室」的承辦和運營管理單位。紫晶存儲多年來專注於綠色、安全的藍光存儲技術和產品的研發及其在大數據領域的規模運用,成效顯著,是國內光存儲行業的領軍者。
  • IBM v7000存儲數據恢復過程
    經客戶描述故障設備品牌為:IBM型號為V7000,做的RAID5;主機作業系統為:windows;分區類型為:NTFS;存儲介質共三臺IBM V7000存儲設備,共64塊900G容量的SAS硬碟;客戶存儲中,有多塊硬碟故障離線,導致陣列失效,LUN無法訪問;需要恢復卷中所有數據(主要為
  • 杉巖數據:對象存儲智能化的探路者
    然而,伴隨「股神」巴菲特押注科技股的美國雲數據倉庫公司在紐交所上市,存儲圈一陣叫好因為,業內專業人員注意到,這家雲數據倉庫中,使用的是對象存儲,對象存儲不僅可以存儲大規模的數據,還可通過機器學習算法等應用進行數據處理。對象存儲的廣泛被應用,充分驗證了對象存儲不僅能解決非結構化數據,還能解決OLAP結構化數據的存儲問題。對此,專注於對象存儲的杉巖數據頗受鼓舞。
  • 浮點型數據存儲方式分析
    筆試面試的過程中難免會遇到很多自己不清楚或者是當時不清楚的問題,關於浮點型數據的問題我認為是比較難的問題啦,如果不清楚浮點型存儲問題,回答問題只有猜結果了。
  • 如何解決大規模非結構化數據的存儲挑戰
    【IT168 評論】存儲非結構化數據是存儲系統的主要挑戰之一,大數據、人工智慧、5G等技術的進步正在產生大量的必須進行管理、存儲和分析的數據,這為存儲系統帶來了許多挑戰。  當然,處理非結構化數據並非是一個「世紀難題」,越來越多的提供商正在興起,幫助企業滿足處理大量數據的需求。
  • 點進來你就懂的iOS數據存儲
    上面是百度百科對沙盒簡介,iOS這邊每個APP都對應有一個自己的沙盒,用於App自己的數據存儲。安全角度上每個App只能訪問自己沙盒裡的數據而不能跨域訪問別的App的數據。此次討論的數據持久化存儲除keychain外都是存在沙盒裡的。
  • 大數據時代的存儲介質:鋇鐵氧體數據流磁帶
    另外,除了單盤存儲容量大,磁帶介質還具有諸多不同於主流在線存儲介質的特性:┃存儲密度:Q: 磁帶如何做到這樣高的單位存儲密度?A:首先,現在最新的數據流磁帶產品上塗布的是納米級磁性顆粒。其次,在前幾代的磁帶,如錄音帶、錄像帶中,磁帶本身包含兩根軸體,導致產品體積偏大;而現在的磁帶,只包含一根軸體,另外一根則被移至磁帶驅動器當中,因此產品尺寸顯著縮小,充分滿足了大數據存儲客戶對存儲介質和相應設備在節省使用空間成本方面的需求。
  • DNA存儲,拯救人類數據危機的良方?
    我們知道這些信息最高效的形式就是數據,而這些數據主要存儲在硬碟和光碟當中。想想這些硬碟儲存器的重量和數據密度,我們不得不再一次氣餒。更何況,可能飛船還沒逃出太陽系,這些數據就會因為硬碟或光碟的壽終正寢而丟失。那麼DNA能不能當做硬碟來存儲數據信息呢?答案是,可以的。
  • 微軟擬用DNA存儲數據:相當於一個數據中心
    微軟研究院的計算機架構師表示,該公司已經正式制定了一個目標,即在2020年之前,在數據中心內建立一個以DNA為基礎的操作存儲系統。微軟研究院架構師道格。卡米(Doug Carmean)說:「我們希望3年內實現這樣的願景,即在原始商業系統中的DNA上存儲相當於1個數據中心的數據量。」卡米還描述了最終設備的大小,它與20世紀70年代的施樂複印機差不多。
  • 大數據入門:Spark持久化存儲策略
    持久化存儲是Spark非常重要的一個特性,通過持久化存儲,提升Spark應用性能,以更好地滿足實際需求。而Spark的持久化存儲,根據不同的需求現狀,可以選擇不同的策略方案。今天的大數據入門分享,我們就來具體講講Spark持久化存儲策略。
  • 360海量數據存儲 zeppelin設計與實現
    我們公司的github 地址  https://github.com/Qihoo360  我們團隊開發的 pika, pink, zeppelin, floyd 等等代碼都在上面  我們先來談談在線存儲和離線存儲的區別  離線存儲的需求很統一, 就是離線數據分析, 產生報表等等.