【OpenManage大解密】分鐘級部署千臺服務器?
記得10年前,我和當時的同事在做服務器選型測試工作時,就不止一次談到這樣問題——當我們使用來自多家(主板/準系統)供應商的產品時,就會面臨管理方案不同的問題。
舉個例子,比如SuperMicro、Intel(EPSD)和Tyan這3家服務器ODM,在主板的管理上就有著不同的設計,包括BMC硬件以及與之配合的軟件。那么做為一家OEM廠商,如果只是簡單地組裝銷售,用戶將無法獲得統一的管理體驗,很難從產品技術上形成品牌黏性。
至于較大一些的服務器品牌,為了解決這個問題會投入相應的研發,但只要您使用對比過,就會發現不同廠商在管理功能方面的差距不小。也就是說,除了硬件的品質之外,這也是一個能夠體現出Dell堅持國際領先技術和讓用戶“最簡單”宗旨的品牌優勢的地方。
那么服務器管理都能做些什么呢?相信不少讀者朋友對此都已經熟悉了。本文我們想以戴爾iDRAC生命周期控制器為例,帶大家簡單回顧BMC/IPMI的基本功能,并介紹一下怎么實現分鐘級部署千臺服務器,以及“無狀態服務器池“對云計算IaaS的意義。
戴爾iDRAC with Lifecycle Controller被稱為智能嵌入式生命周期管理,它的功能可以分為4個方面:
部署:(服務器)發現/編目,設置和操作系統部署;
維護:重新分配,修復,更換配件;
監控:電源,性能,告警/健康狀況;
更新:BIOS,Firmware和驅動程序。
根據我們的理解,基礎的部署、維護和監控功能由硬件來實現;而高級部署功能和更新則通過管理軟件來協助提供。服務器按管理方式又可分為帶外(out-of-band)和帶內(in-band)兩種,帶內管理可以通過安裝在OS中的代理執行;而帶外管理則基于下面要介紹的BMC硬件。
上面的照片是在數年前拍攝于戴爾PowerEdge R910服務器主板,可以看到一顆NUVOTON(前身為Winbond)BMC底板管理控制器和旁邊的DRAM顯存芯片。現在主流的服務器BMC一般集成基本的顯卡功能。
上圖中用紅圈標出的部分,是R910服務器的管理網口,它是以一個子卡的形式安裝在戴爾專用的NDC網卡上,四路服務器在設計上與雙路有一些不同。BMC/IPMI硬件管理的網口可以共用板載以太網卡,也可采用獨立設計。
現在比較流行的是主板提供單獨的管理網口,受控于BMC芯片所在的嵌入式系統。這部分電路與主板上其它單元相獨立,只要+5Vsb/+3.3Vsb電源供應正常、管理網絡/串口連通,哪怕CPU、內存等損壞都可以進行iDRAC帶外管理操作。
這兩個截圖也是來自當年Dell R910上的iDRAC6
如上圖,除了遠程開關機、重新啟動等之外,iDRAC的一大基本功能就是遠程控制,或者說KVM(鍵盤、鼠標、顯示輸出)重定向。由于在操作系統完成安裝之前,通常無法使用遠程桌面這樣的工具,因此KVM更多是用在系統配置、OS安裝的階段。
就像當年我的一位朋友指著PowerEdge R710的管理網口說:“插根網線,不用接顯示器就能裝系統了。”這時可能還需要本地光驅,如果支持vMedia(虛擬介質)則會更方便。
有些用戶在網絡環境中有PXE引導服務器,并通過FTP/NFS將操作系統安裝介質映射給待安裝的服務器。不過在簡單環境中,使用USB重定向技術的虛擬介質用起來更加方便。如上圖,除了物理光驅/軟驅之外,我們還可以將客戶端的ISO鏡像映射為服務器上的“光盤”。
注:虛擬介質功能需要iDRAC Enterprise版本的License,相對基礎的iDRAC Express不提供支持。
以上功能主要涉及操作系統部署,以及在此之前的單機設置。當年我還測過有的IPMI遠程管理卡,提供類似的功能動輒要上千元,而現在服務器嵌入的高級管理特性已經不只于此。下面我們重點介紹一個——批量配置服務器來進一步提高部署效率。
讓我們來看看iDRAC8的自動化服務器配置是怎么工作的。如上圖中的5個步驟:配置、采集、克隆、重新分配和維護基準。在服務器配置文件中,包括BIOS、PERC(PowerEdge RAID卡)、網卡/HBA和iDRAC/生命周期控制器的設置。
此外它還有多種使用模式,可以整合到已有的進程中,使用U盤對現場對服務器“應用配置”,或者在網絡設置中應用。使用OpenManage Essentials軟件來采集、設置和檢測配置的一到多漂移。
帶有生命周期控制器的iDRAC嵌入式服務器自動化特性,宣稱分鐘級部署數千臺服務器(應該是理想情況下)。對于一臺尚未配置管理IP和權限的戴爾13G服務器而言,只需要標準的網絡資源——DHCP服務器和標準網絡共享,然后上架、連線即可。
我們再看一下自動設置的工作流:
1. iDRAC發送DHCP請求到DHCP服務器;
2. DHCP服務器響應(給出)IP地址以及選擇字段;
3. iDRAC檢查選擇字段并恢復來自遠程共享的服務器配置文件;
4. iDRAC應用配置文件到服務器,根據變化的需要服務器可能會重啟。