QLC為何越來越受到數據中心用戶的關注
原創生成式AI不僅帶火了GPU,而且也帶動了存儲產品的快速增長,尤其是大容量的QLC NAND,目前,雖然市場中仍有很多聲音質疑其性能和穩定性表現,但根據TrendForce預測,到2024年,QLC企業級SSD出貨量將達到30EB,相比2023年增長四倍。
那么,2023年嚴重下滑的QLC NAND出現一路上漲的市場態勢,究竟有何原因?在生成式AI和各種大模型應用中QLC NAND又具備哪些優勢?本文將一一解讀。
何為QLC?有何優勢和不足?
QLC全稱Quad-Level Cell,即四層式存儲單元,是固態存儲顆粒的一種,在一個存儲單元中可以存儲4個比特的數據。
在QLC之前,還有SLC、MLC和TLC三種不同的固態存儲顆粒:
SLC(Single-Level Cell):即單層式存儲單元,在一個存儲單元中可以存儲1個比特的數據;
MLC(Multi-Level Cell):即多階式存儲單元,在一個存儲單元中可以存儲2個比特的數據;
TLC(Triple-Level Cell):即三階式存儲單元,在一個存儲單元中可以存儲3個比特的數據。
在QLC之后,還有PLC(Penta-Level Cell五階式存儲單元),在一個存儲單元中可以存儲5個比特的數據。不過,由于技術等原因,PLC目前仍舊處于初期階段。
由于在一個存儲單元中可以存儲更多比特的數據,因此QLC與SLC、MLC和TLC相比,擁有更高的存儲密度和更低的成本,能夠將單塊SSD的容量做得更大,并且成本上更低。
當然,由于QLC在每個存儲單元中需要存儲更多的電荷,在相同條件下可能更容易磨損,因此其P/E壽命與前三者相比會進一步降低。另外,更高的存儲密度意味著每個單元的電荷狀態更難進行區分,需要更復雜的讀取機制來區分更多的電荷狀態,這就會影響數據的讀寫速度,因此在性能方面QLC也存在著一定的劣勢。
總結來看,QLC的優勢是擁有更高的存儲密度,目前采用QLC NAND的閃存盤單盤最高容量已經達到61TB,擁有更低的每TB成本。但性能和壽命相比TLC略顯不足。
為何QLC是生成式AI的最佳存儲設備
雖然QLC在性能和壽命方面存在一定的不足,但這并不影響其成為AI時代的最佳存儲設備。
我們知道,AI在訓練階段和推理階段對存儲系統有著不同的要求。在訓練階段,需要對龐大的數據集進行復雜的計算,數據量越大,訓練的精度越高,這就要求存儲系統必須具備高速的讀寫能力,且存儲容量一定要大。在推理階段,數據主要以頻繁的讀取為主,因此對于存儲的訪問性能提出了更高的要求。
不難發現,無論是AI訓練還是推理,都對存儲性能和容量有著極高的要求。TLC雖然在性能上有著一定的優勢,但容量明顯不夠用,且成本更高,顯然不是最佳的選擇。機械硬盤雖然容量夠大,成本也較低,但性能卻達不到AI的要求。因此,從整體性價比來看,QLC無疑是最佳的選擇。
實際上,為了提高QLC NAND的使用壽命,各大廠商也正在采用諸如改進寫入策略、數據刷新技術、高級錯誤校正碼(ECC)、智能磨損均衡算法、熱輔助磁記錄(HAMR)、存儲單元隔離技術、自適應讀寫技術等等一系列的創新技術。例如西部數據可能采用了動態數據刷新技術來減少對特定存儲單元的重復寫入,從而延長其使用壽命。長江存儲等廠商可能采用3D NAND技術,通過垂直堆疊存儲單元來提高存儲密度,同時可能通過更精細的工藝控制來提高每個單元的可靠性。
此外,主控廠商也在通過技術創新,來提高QLC NAND的壽命。例如,聯蕓科技Agile ECC3技術引入4K LDPC,LDPC軟解碼能力的提升保障了最惡化情況下的閃存數據可靠性,極大地延長了SSD的使用壽命。
除了通過技術創新不斷提高QLC NAND的使用壽命之外,閃存顆粒廠商也在不斷提高3D NAND的層數來提升SSD的存儲容量。
目前,Solidigm采用四層單元最大容量為61.44TB的SSD已經上市銷售,美光基于232層技術的6500系列30TB SSD也已經應用于數據中心當中。 SK hynix除了計劃推出60TB eSSD之外,還預計未來SSD會從36TB發展到128TB。存儲容量的增加,將會進一步拉低SSD成品的價格,進一步加速了機械硬盤的淘汰速度(目前最大的機械硬盤容量為24TB)。
寫在最后:
技術的進步,不僅提高了QLC NAND的使用壽命,而且讓它擁有了更高的存儲容量,以及更低的價格。
在筆者看來,由于SSD擁有更高的性能、更大的容量和更低的能耗,因此在同等密度的數據中心中能夠部署更多的產品,不但能夠大幅提高數據中心的存儲密度,而且能夠大幅降低數據中心的能耗,因此擁有更低的TCO。所以,隨著QLC NAND技術的不斷成熟和價格的不斷降低,其勢必將快速淘汰HDD,成為數據中心的主流存儲產品。