數據中心未來:智算中心能否應對AI時代的挑戰?
原創隨著云計算、大數據、物聯網等技術的廣泛應用,各行各業對算力的需求呈現指數級增長。尤其是生成式AI技術的廣泛應用,使得算力需求翻了數倍。根據《算力基礎設施高質量發展行動計劃》的預測,到2025年,中國算力規模將有望超過300 EFLOPS,智能算力的占比將達到35%以上。
算力需求的爆炸式增長,這不僅催生了對計算能力的巨大需求,也對數據中心的傳統架構提出了挑戰。為此,數據中心正在向更加智能化、高效化的智算中心轉型,以更好地支持人工智能的應用和發展。
人工智能正在重構整個價值鏈,包括從芯片,到服務器,再到數據中心。此前,在2024年施耐德電氣創新峰會之算力未來數據中心論壇上,施耐德電氣高級副總裁,關鍵電源業務中國區負責人朱文沁指出,“智能算力的迅猛增長對基礎設施提出了更為嚴峻的挑戰,未來的數據中心不僅需要具備更加遠大的愿景,也需要更為全面的價值考量。可持續、高效、韌性和適應性成為未來發展關鍵。”
數據中心的盡頭是智算
傳統數據中心,主要由服務器、存儲設備和網絡設備組成,設計初衷是為了滿足一般的計算和存儲需求。然而,面對人工智能應用的高計算量和大數據處理需求,它們暴露出計算能力不足、能耗高、擴展性差等局限性。
智算中心,是在數據中心的基礎上,集成了人工智能(AI)、機器學習(ML)、深度學習等先進技術的計算平臺。它不僅提供數據存儲和處理能力,還具備智能分析和決策支持功能。
相比之下,智算中心配備了大量高性能計算硬件,如GPU、TPU和FPGA,這些硬件能夠高效處理深度學習和大數據分析任務。智算中心采用大規模分布式計算架構,可以同時處理來自不同來源的大量數據,提升數據處理效率和計算速度,利用人工智能技術實現資源的自動調度和優化管理,根據實際需求動態調整計算資源,提升資源利用率和系統響應速度。
智算中心與數據中心的主要差別還體現在架構、性能、可擴展性、成本和安全性等方面。智算中心使用虛擬化技術和云服務來提供計算和存儲資源,這種架構上的變化使得智算中心能夠更靈活地響應業務需求,快速部署新應用或服務。在性能方面,智算中心利用高速網絡和分布式存儲技術,有效提升了處理高性能計算和大數據處理的能力。在可擴展性方面,智算中心幾乎無差的全采用虛擬化技術,以及云計算搭載應用,所以在擴展性方面,以及對短時內高并發業務的響應速度方面,完勝傳統數據中心。
據報道,英偉達全球智算中心建設計劃投資額高達3萬億美元,微軟和OpenAI擬投資1000億美元打造“星際門”智算中心項目;亞馬遜云科技規劃在未來15年內,投入約1500億美元用于全球數據中心的建設與運營……視線調轉國內,國家信息中心與相關部門聯合發布的《智能計算中心創新發展指南》顯示,目前全國有超過30個城市正在建設或提出建設智算中心。
可見,全球均在加大對智算中心建設的投入力度。這不僅是技術發展的必然趨勢,也是市場對高效、智能、安全計算資源的迫切需求。
智算中心的四大愿景:可持續、高效、韌性、適應性
兩年前,在行業看來40KW的功率密度已經非常高。然而,去年這一數字已經上升到60至70KW。到了今年,機柜的功率密度更是達到了120KW。數據中心的功率密度正在以驚人的速度增長。以英偉達展示的32000塊GPU組成的人工智能工廠為例,據推算,這樣的規模大約需要500多個微模塊和400多個機柜來支持,機房的IT流量可能在50MW到60MW之間,這遠遠超出了過去對數據中心IT容量的傳統認知。
算力需求急劇增加直接導致了機柜功率需求的顯著提升。
為了應對這一挑戰,數據中心必須加強電力保障能力,以確保在電網不穩定或停電情況下的穩定運行。此外,隨著機柜功率的增加,傳統的熱保護關機時間已不再適用。智算中心需要實現連續制冷,以避免因過熱導致的設備宕機,這要求數據中心在制冷側進行持續的技術創新和管理優化。
同時,為了適應更高的功率密度,數據中心的空間布局也必須進行優化。增加的制冷和通風系統配置意味著每個機柜所需的空間將顯著增加,這直接影響了數據中心的規模和設計,也對數據中心的選址和建設帶來了更多的限制。
也就是說,數據中心向智算中心的轉變不僅涉及到硬件設施的升級,更涉及到數據中心規劃、建設和運維的全方位變革。朱文沁指出,“‘可持續、高效、韌性、適應性’將成為數據中心未來發展的關鍵。”
適應性強調數據中心需要具備靈活的設計和維護能力,以及對下一代IT技術的兼容性,包括軟件定義技術的發展和主動能源管理。可持續性不僅要求最大化利用可再生資源,助力企業實現其可持續發展戰略。高效方面,數據中心應更有效地利用能源和資源,同時確保資本投入得到充分利用,具體體現在部署速度和空間占用的優化。韌性則超越了傳統的高可用性概念,不僅需要優秀的設計以增強能源和冷卻系統的冗余,還需關注網絡安全和預測性分析,以全面保障數據中心的穩定運行。
愿景落地,需創新推動
數據中心的轉型升級,僅有愿景是遠遠不夠的。“可持續、高效、韌性、適應性”這四個關鍵詞的背后涉及到供配電、制冷、機柜和軟件管理等一系列的挑戰,愿景的落地需要創新的技術產品進行驅動。
在2024年施耐德電氣創新峰會的算力未來數據中心論壇上,施耐德電氣重磅發布與英偉達的合作成果,推出首個面向智算中心的參考設計。這一設計專為部署英偉達的高性能加速計算平臺而量身打造,旨在為智算中心提供標準化的數據中心生態系統內的AI部署和運營基準,并且也可以作為解決高密度機柜的通用智算中心解決方案。
從存量數據中心改造到新建智算中心的機電系統設計,覆蓋設施供電、制冷、IT機房、全生命周期軟件四個技術領域,該參考設計憑借一套框架體系,為賦能構建高效、可持續與可擴展的基礎設施提供有力支撐。
在推出參考設計之前,施耐德電氣早已為賦能智算中心做了充分的準備。截至目前,施耐德電氣已經發布了超過230本白皮書,其中《中國數據中心可持續發展之旅》白皮書進一步幫助數據中心行業定義了可持續發展的關鍵要素,并提供了衡量指標與有效路徑,為數據中心的轉型升級提供了理論支持和實踐指導;第110本白皮書深入探討了AI對數據中心帶來的顛覆性挑戰,并為每個物理基礎設施類別提供了應對指南。
同時,施耐德電氣針對數據中心的轉型升級,推出了一系列創新產品,以支持適應性、韌性、高效和可持續性四大核心愿景。在適應性方面,公司推出了適配AI智算中心的冷板式液冷CDU系統,以及I-LINE Track中電流母線,能契合用戶實際也無需求,有效實現節能增效。
高效性方面,施耐德電氣SmartCool末端空調節能解決方案,使空調末端基于IT負載實時需求進行動態制冷輸出,實現秒級同頻優化,在進一步提升數據中心制冷能效的同時,兼顧客戶可持續發展與業務的持續增長。
在韌性建設上,施耐德電氣不僅提供強大的中低壓配電設備,還推出了ETAP全新電氣系統數字孿生平臺,基于強大的數字孿生和模擬仿真能力,優化數據中心和電力系統設計,提升效率,并能預測并預防設備問題。
可持續性方面,施耐德電氣提供了全面的節能降碳解決方案,涵蓋設備級、系統級到管理級,并融入人工智能與數字孿生技術,以最大化能源效率。
伴隨全球AI加速爆發,智能算力的布局已是箭在弦上,不得不發。作為數據中心變革的影響者和賦能者,施耐德電氣已經準備就緒。尚處于觀望,抑或是處于迷茫狀態的“局中人”,施耐德電氣提供的解決方案和專業指導或許是可參考的解題之道。