性能并非唯一優勢,為何說全閃存成為AI時代數據存儲的必選項
原創從自然語言處理領域的智能對話系統,到計算機視覺中的圖像識別與生成,AI 應用的廣泛落地,對數據中心存儲系統提出了更高的要求。以DeepSeek為例,實時生成文本、圖像、視頻的AI模型,其訓練和推理過程需要百GB/s級帶寬、毫秒級延遲響應、EB級存儲容量,這就需要更高性能、更大容量和更加穩定可靠的存儲產品。
提到AI時代的數據存儲,就不得不說全閃存存儲。憑借數GB每秒的順序讀速度和1GB每秒的順序寫速度,全閃存存儲能夠很好地滿足AI應用需求。可以說,性能已經成為企業選擇全閃存存儲的重要參考依據。
在筆者看來,除了性能之外,相比傳統的HDD存儲解決方案,全閃存存儲在整體擁有成本、可靠性等方面擁有更具優勢。本篇文章,我們不再介紹全閃存存儲的性能,重點來談一談全閃存存儲在其他方面有哪些優勢。
一是在整體擁有成本方面,全閃存存儲優勢更加明顯。當前階段,每TB的HDD售價的確要比SSD便宜3—4倍左右。不過,在一套存儲系統中,不僅要看每塊硬盤的成本,還要考慮能耗、單位存儲密度、機房占地面積等綜合成本。
隨著數據中心規模的不斷擴大,能耗問題已經成為用戶關注的焦點話題。作為數據中心的一部分,存儲系統的節能問題變得越來越重要。相比傳統機械硬盤,閃存在能耗方面具有顯著優勢。
我們知道,傳統機械硬盤在工作時,需要電機帶動盤片高速旋轉,磁頭在盤片上尋道讀寫數據,這一過程消耗了大量的電能。而閃存的工作原理決定了其能耗主要集中在芯片的電信號驅動上,無需機械部件的運轉,因此能耗大幅降低。
數據顯示,每一塊全閃存相較于HDD,能耗可節約33%。以OceanStor Pacific 9920/9928全閃存非結構化數據存儲為例,由于采用高效數據縮減算法,每TB功耗低至0.25W。
在大規模數據中心中,存儲設備的能耗是整個數據中心能耗的重要組成部分。采用閃存存儲能夠有效降低數據中心的整體能耗。例如,某大型互聯網公司的數據中心,在將部分傳統機械硬盤存儲替換為全閃存存儲后,存儲系統的能耗降低了30%以上,每年節省的電費高達數百萬元。同時,由于閃存存儲產生的熱量較少,數據中心的散熱系統負載也相應減輕,進一步降低了能源消耗。
除此之外,由于閃存功耗低、體積小的特性,在相同的單位面積內,能夠部署更多的存儲容量,有效降低了機房的占地面積,更好地節省了企業的開支。
最后,在全閃存備份一體機存儲產品采用重刪壓縮技術,也能夠進一步降低全閃存儲的存儲成本。例如,OceanProtect X3000/X6000最高實現了72:1的重刪除壓縮率,大大節省了數據備份的存儲容量。
二是在可靠性方面,全閃存存儲也有著更加明顯的優勢。我們知道,對于AI應用來說,數據的可靠性至關重要。一旦數據在存儲過程中出現丟失或損壞,將對AI模型的訓練和應用產生嚴重影響,甚至導致模型失效。
眾所周知,閃存芯片的寫入壽命有限,長時間在同一存儲單元上頻繁寫入數據會導致該單元過早損壞,而磨損均衡算法則很好地解決了這一問題。磨損均衡算法的作用就是將數據寫入操作均勻地分布到閃存芯片的各個存儲單元上,避免某些單元過度使用,從而延長閃存設備的整體使用壽命。例如,三星的閃存產品在其內部控制器中集成了先進的磨損均衡算法,能夠動態監測各個存儲單元的使用情況,并智能地調整數據寫入策略,確保每個存儲單元的磨損程度保持在相對均衡的水平。
除此之外,強大的糾錯編碼(ECC)技術也消除了閃存存儲數據位錯誤的問題。我們知道,在數據讀寫過程中,由于外界干擾(如電磁干擾)或閃存芯片自身的微小瑕疵,可能會導致數據位出現錯誤。ECC技術能夠實時檢測并糾正這些錯誤,保證數據的準確性。在AI訓練數據的存儲過程中,即使數據在傳輸或存儲過程中受到一定程度的干擾,ECC 技術也能確保數據的完整性,使得AI模型能夠基于準確的數據進行訓練,避免因數據錯誤導致的模型偏差。
此外,閃存的物理結構使其相比傳統機械硬盤具有更強的抗沖擊和抗振動能力。傳統機械硬盤內部的盤片和磁頭在受到物理沖擊或振動時,容易出現磁頭劃傷盤片、數據丟失等問題。閃存由于沒有機械活動部件,在面對日常的搬運、設備振動等情況時,能夠更好地保護數據的安全。這一特性在邊緣計算場景中尤為重要,因為邊緣設備通常部署在各種復雜的環境中,可能會面臨頻繁的物理移動和振動,閃存的高可靠性能夠確保在這些惡劣環境下數據的穩定存儲和傳輸。
最后,3D NAND技術的進步,也讓閃存存儲容量得到了大幅提升,每TB的價格也越來越低。3D NAND技術通過將存儲單元在垂直方向上進行堆疊,極大地提高了存儲密度。例如,韓國SK海力士開發的由238層存儲單元組成的NAND閃存芯片,相比前代產品,在相同的芯片面積下,存儲容量得到了顯著提升。三星電子也宣布計劃生產第9代V - NAND閃存,采用雙層堆棧架構且層數超過 300 層。這種多層堆疊的 3D NAND 芯片,使得單個閃存芯片的容量能夠達到數TB甚至更高。
除此之外,通過使用多顆高容量的3D NAND芯片,整個存儲系統的容量得到了飛躍式的提升。以華為OceanStor Pacific 9920全閃存存儲產品為例,其單盤支持 30.72TB,2U空間可提供768TB容量,進一步降低了存儲的成本,為AI應用提供了強大的存儲容量支持。
實際上,3D NAND技術不僅提高了閃存的容量,還在一定程度上改善了閃存的性能和可靠性。在性能方面,多層堆疊的結構使得數據的并行讀寫能力增強,提高了整體的讀寫速度。在可靠性方面,通過合理的設計和冗余機制,3D NAND閃存能夠更好地應對存儲單元的磨損和故障,確保數據的安全存儲。
隨著技術的不斷進步,未來3D NAND技術將會突破1000層,例如日本存儲芯片巨頭鎧俠(Kioxia)宣布公司計劃到2031年批量生產超過1000層的3D NAND Flash芯片,這將進一步降低全閃存存儲的成本。
寫在最后:
根據IDC預測顯示,全球數據總量將在2027年達到291ZB,其中AI相關數據占比將從2023年的不足1%躍升至10%。
可以預見,隨著AI技術的發展與落地應用,閃存憑借其卓越的性能、高可靠性、出色的節能特性以及不斷提升的存儲容量,將成為AI時代數據存儲領域的核心產品。