NEC 4D冗余服務器很有意思
一. 蒙古騎兵和中國高鐵
蒙古騎兵的“三騎一”。
成吉思汗麾下的鐵騎,每個騎兵要備三匹馬,征戰時騎一帶二,輪流騎乘。所以當年的蒙古騎兵才可以一日千里縱橫四海。
軌道交通中的“三取二”。
高鐵機車計算機控制系統里有三臺一模一樣的電腦,上傳下達的控制信號首先要由這三臺電腦同時計算,只有至少兩臺電腦的計算結果一致時,控制信號才能被認可和執行,所以數百公里時速的高速列車才能安全無虞。
那么兩匹馬夠不夠用呢?如果是小媳婦回娘家,只要騎頭驢都夠了。
兩匹馬不是不可以,可是成吉思汗征服世界就需要三匹馬,關鍵是有沒有?
三臺電腦夠不夠?
如果玩網游,一個上網本就夠了。
兩臺電腦容錯當然可以,所謂HA雙機容錯系統不就是這樣的雙冗余服務器嗎?可是高鐵為保障高速運輸安全就是需要三臺電腦冗余,問題是能不能設計得出來這樣的“三取二”系統?
問題繼續。
四匹馬有沒有?四臺電腦冗余行不行?
四匹馬的事只有成吉思汗能回答。至于四臺電腦能不能做冗余?NEC回答了這個問題。
NEC 最新推出的4D容錯服務器,在一個2U機箱里集成了四個電腦,這四個計算單元不僅能進行多種形式的冗余配置,而且可以做VMware環境中的集群管理,而且,能在40度高溫中工作,而且,性能價格比讓人心動。
二. 先說一說NEC
中國民間有句古話:要知道一個姑娘怎么樣, 看看她媽就知道了。
在討論NEC 的4D服務器之前,我們也先看看NEC。
NEC 這個公司有點奇怪,在中國雖不至于陌生,但對國人來說,也說不上有多大了解。
但是NEC在日本可是大名鼎鼎。NEC是日本最大的IT企業之一,規模大過中國聯想,電腦銷售穩居日本第一,日本商店的POS機、街邊的加油站計費器都隨處可見NEC的商標。
NEC的IT產品線很全面,包括平板電腦、臺式機、PC服務器、容錯服務器、刀片服務器、HPC超算服務器、磁盤陣列、磁帶庫等,不僅如此,日本國家地震中心的近百臺大型計算機也是NEC的招牌產品,而且上到衛星導航,下到汽車控制都有NEC的身影。NEC每年在東京舉辦的年度展覽會是日本IT年度盛會,規模甚至可以和京交會媲美。
但NEC的IT研發思路更是不同尋常。
現在計算機的制冷方式大都是風冷,而NEC就反其道而行之,成功研發推廣了水冷靜音服務器。
風冷,很方便;水冷靜音,很人文。
大家都在追求磁盤陣列內的硬盤數目時,NEC卻又另辟奇徑,推出了大壓縮比磁盤陣列,讓你的物理容量以一當十。
這就是NEC的另一個特點:你大,我強。
十年前HA雙機容錯系統很是流行,而NEC卻投入巨資研發成功了IT業界第一臺硬容錯服務器,實現了CPU指令同步和內存數據保存,終于實現了零秒百分之百的切換,終結了雙機軟容錯時代。
做到極致,這是NEC的又一個特點
當大家都以為NEC徹底摒棄了軟件容錯模式時,NEC又推出了這款4D冗余服務器,在在強調集成度、性價比和能耗的同時,將雙機軟容錯的概念一口氣推廣到四機一體軟容錯。
IT產品連成線,同種產品高低配。因為顧客從來不喜歡只有一樣主菜的菜單。
NEC積極活躍的、精明的、人文的技術思路也是NEC推陳出新長盛不衰的保證,對國內一些IT制造企業來說,NEC的研發特點或許有很好的借鑒作用。
三. 回到 NEC 4D冗余服務器
1. 高集成度
2U高度 19英寸寬度的機箱是個什么概念?不到10厘米高,50厘米寬,大致相當于辦公桌的一個抽屜。
在這樣的機箱里集成四臺電腦,每個電腦作為一個計算單元,包括CPU、內存、硬盤、擴展插槽等,這樣的集成度是非常密集的。這種集成方式不同于刀片服務器,刀片服務器中每個刀片是不帶硬盤和PCI擴展槽的,否則刀片服務器將會變得很臃腫。
密集集成首要的問題是散熱。NEC的4D冗余服務器在散熱問題的解決上境界不低:不僅解決了散熱問題,而且保證系統可以在40度高溫中正常運行。
同樣的性能,你是喜歡抽屜大小還是冰箱大小?更高的性能伴隨更小的物理尺寸,這是IT業界的潮流,一臺機器裝滿半間機房的時代已經一去不復返了。
2. 靈活的管控模式
四個計算單元這么搭組?NEC從手段上提供了所有的可能,但是其中是有伯仲之分的。
1)4+0: 絕對追求處理能力
四個計算單元全部投入計算,不考慮容錯問題。
此時4D服務器就有兩種變形可能:
第一種:四個計算單元各自承擔不同的工作;
第二種:可以通過VMware的虛擬化,將這四個計算單元整合成一臺更強的計算機,這就是集群概念的具體應用,NEC也提供相應的集群管理軟件。
2)3+1: 處理能力和容錯性能兼顧
根據以上模式,將四臺處理單元中的一臺單獨拿出來,作為其他三個單元的備用機。容錯機制依然是軟件容錯,備用單元與三個處理單元分別分成HA雙機容錯 系統,三個處理單元依然可以按上述的兩種工作方式分別工作或組成集群一起工作。
3)2+2: 處理能力和容錯性能均分
可以結成兩組一一對應的HA雙機軟容錯系統。也可以再復雜一點,兩個處理單元和兩個備用單元形成不指定的全局容錯對應關系。
以上三種工作模式中,單從性能價格比來說,最為理想的是第二種,即所謂的“3+1”模式。
四.魚和熊掌的平衡
一臺計算機,從使者的角度來看,即希望處理速度快,又希望安全穩定。
魚和熊掌可以兼得嗎?
答案是可以兼得,但必須有輕重之分。
硬容錯服務器重點在于安全保障,在最壞情況下(如主單元掉電、CPU故障、內存芯片失靈、硬盤崩潰等),保證作業零秒無間隙切換。這是容錯的最高境界。在一些特別關鍵的場合,如關卡計費、實時監控、金融交易、生產線、試驗場等應用中特別適合。
容錯服務器的計算性能相對于其安全性,則只能處在次要位置。雖然也可以選擇更多路的CPU、更大的內存,但因為容錯服務器中是需要專門的容錯硬件芯片和容錯電路進行控制的,其成本也是水漲船高,而且漲幅會很快。
4D冗余服務器有更靈活的組合方式,可以組合出更強大的計算能力,也可以組合出有高可靠性的工作方式。但是我們必須知道,4D冗余服務器在容錯性能上,就像以前的HA雙機容錯系統一樣,是基于軟件進行容錯的。雖然4D冗余服務器在結構和性能上相對HA雙機軟容錯系統有了長足的長進,但是在容錯的徹底性上到底還是比不過硬容錯服務器。
最后需要提及容錯技術中一個常見的泡沫。
在雙機軟容錯系統中,經常見到這樣的介紹:兩臺機器平時可以各自工作,一臺故障時,故障機上的作業可以由容錯軟件切換到正常機上自動運行。
這是一個看上去挺美的技術泡沫,自打二十年前HA雙機容錯誕生時一直講到今天。
兩個壯碩的蒙古騎兵,當其中一個的戰馬倒下后,兩個人再合乘一匹馬繼續戰斗。
繼續戰斗?逃跑可能都來不及了。 戳破泡沫的道理其實就這么簡單。