提高數(shù)據(jù)中心效率的三個步驟
日前,調(diào)研機構(gòu)IHS Markit公司的云計算和數(shù)據(jù)中心分析師Maggie Shillington表示,2018年,平均每個數(shù)據(jù)中心的電力容量為2,751千瓦。到2019年底,這個數(shù)字可能達到3,670千瓦,這主要是由需要更多處理能力的應(yīng)用程序和分析推動的。而數(shù)據(jù)中心為了確保高效運行,需要適當(dāng)保持其溫度和電源利用率。
然而,建立數(shù)據(jù)中心以適應(yīng)這種不斷增加的功耗并不是一個***選擇。Shillington在最近一次關(guān)于改善數(shù)據(jù)中心電力和冷卻效率的網(wǎng)絡(luò)研討會上表示,企業(yè)正在通過部署智能機架配電單元(PDU)和數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)來應(yīng)對,這可以更好地監(jiān)控數(shù)據(jù)中心環(huán)境。
由于運行應(yīng)用程序需要更多的計算能力,企業(yè)需要確保***限度地利用其數(shù)據(jù)中心。IT團隊可以遵循三個步驟來提高數(shù)據(jù)中心效率:
- 監(jiān)控環(huán)境
- 避免熱點
- 查找閑置的電力容量
1. 監(jiān)控環(huán)境
加利福尼亞州的IT基礎(chǔ)設(shè)施供應(yīng)商Chatsworth Products公司電力、電子和軟件高級產(chǎn)品經(jīng)理Ashish Moondra表示,提高數(shù)據(jù)中心效率的***步是監(jiān)控設(shè)備以及設(shè)備所在的機架和機柜。IT團隊?wèi)?yīng)該嘗試收集和觀測有關(guān)機柜、機架和設(shè)備級用電的信息。他們還應(yīng)控制每個插座的電源,以便更好地控制配置、容量和重啟。
為了實現(xiàn)更深層次的監(jiān)控,IT團隊可以采用智能機架PDU和DCIM軟件。這些工具提供有關(guān)降低能耗的信息以及基于功率、濕度或溫度等因素安裝新服務(wù)器的***位置。IT團隊可以監(jiān)控IT設(shè)備的整體數(shù)據(jù)中心布局、電源利用率和工作負載分配。他們還應(yīng)該為非關(guān)鍵或重要事件設(shè)置通知、警報和警告。
Moondra表示,雖然智能機架PDU提供了一些好處,但它們也存在一些挑戰(zhàn),例如PDU網(wǎng)絡(luò)。許多IT團隊都避免將PDU放在網(wǎng)絡(luò)上,這是由于為每個PDU指定一個網(wǎng)絡(luò)IP地址的成本很高,有時達到每端口500美元,他說。為了***限度地降低成本,IT團隊可以整合IP地址。
“智能PDU允許IP地址整合,因此用戶可以同時管理多臺PDU,例如32臺PDU可以采用一個IP地址。”他說。這種合并顯著減少了所需的IP地址數(shù)量。但IT團隊需要確保在網(wǎng)絡(luò)連接斷開的情況下為故障轉(zhuǎn)移冗余分配主要PDU和備用PDU。
2. 避免熱點
Moondra說,提高數(shù)據(jù)中心效率的第二步是關(guān)注數(shù)據(jù)中心的溫度和濕度。為了管理數(shù)據(jù)中心的溫度,IT團隊?wèi)?yīng)該優(yōu)先考慮適當(dāng)?shù)臍饬鞴芾?,而不是簡單地增加冷卻能力。非管理的氣流將在數(shù)據(jù)中心內(nèi)創(chuàng)建熱點,并限制機架密度和容量。
為了解決這個問題,IT團隊?wèi)?yīng)該使用擋板和通道遏制策略來引導(dǎo)冷空氣進入IT設(shè)備。這有助于保持對入口溫度的控制,并減少冷空氣供應(yīng)量。此外,IT團隊?wèi)?yīng)確保廢熱空氣不會與冷空氣混合。
他補充說,IT部門可以使用傳感器監(jiān)測機柜頂部的溫度,并將結(jié)果與數(shù)據(jù)中心相關(guān)標準或美國采暖、制冷和空調(diào)工程師協(xié)會的標準進行比較。此外,IT團隊?wèi)?yīng)尋求綜合環(huán)境監(jiān)測措施,以便更好地跟蹤設(shè)備性能和濕度水平。考慮使用智能機架PDU的企業(yè)應(yīng)該尋找能夠***承受140華氏度的產(chǎn)品。
3. 查找閑置的電力容量
企業(yè)提高數(shù)據(jù)中心效率的另一種方法是找到并利用未開發(fā)所有容量的閑置服務(wù)器,因為這會浪費寶貴的計算資源。Moondra表示,這些“幽靈”服務(wù)器消耗功率但不執(zhí)行任何工作負載。
為了查明任何潛在的幽靈服務(wù)器,IT團隊?wèi)?yīng)該查看其服務(wù)器的CPU使用情況,并確定它們是否具有剩余容量。
Moondra說:“用戶確保不會超過自己設(shè)定的閾值,或者僅僅使用現(xiàn)有的容量預(yù)算。”
他補充說,這是監(jiān)控工具和智能機架PDU可以提供幫助的地方,因為它們提供了有關(guān)可用容量的信息以及部署其他服務(wù)器的可能影響。一旦IT團隊找到未使用的服務(wù)器電源,他們就可以整合服務(wù)器和應(yīng)用程序,并更好地平衡工作負載。