世界最強計算機,極少人見過,讓程序員高薪工作一輩子!
我剛進IBM的時候,聽說過一個故事:一個人畢業時被迫進入了一個偏冷的部門:大機部門。
大家認為他很不走運,因為大型機軟件硬件自成一體,太封閉,同行極少,沒有多少人會,網上沒人交流,學會東西出來一點兒用都沒有,萬一大機市場不行了,他絕對會失業,真慘!
可結局出乎意料,人家在大機的領域耕耘了幾十年,度過了大機在中國從興起到衰敗(其實現在也沒有衰?。┑耐暾^程,然后舒舒服服地退休了!
拿著IT界的收入,享受著如同編制般的穩定,實在太爽了!
不過,這樣的機會,現在再也沒有了。
那么,大機究竟是什么呢?
IBM z 系列通常被我們稱為大型機,Mainframe,簡稱“大機”。
大機以高性能,高可用性,高可靠性著稱,它有一套自成體系的硬件和軟件,在服務器市場中鶴立雞群,價格也非常感人,只有超大型公司才能用得起。
我們拿2017年發布的z14來看看它的性能指標吧(最新的是z16,性能更加強悍。)
CPU主頻5.2G Hz,10個核心
可以配置170個CPU
內存32TB (不是GB!)
最多支持8000個虛擬機
可以橫向擴展到200萬個docker容器
為什么要設計出這樣的“怪物般”的機器呢?
因為這個世界上存在著一些關鍵業務,對平臺要求極高。
幾年前,調研機構Qualix Group曾有一組數字,服務器宕機1分鐘,平均使運輸業損失15萬美元,銀行業損失27萬美元,通信業損失35萬美元,制造業損失42萬美元,證券業損失45萬美元……
尤其對于銀行業,如果銀行系統中斷1小時,將直接影響該行的基本支付業務;中斷1天,將對其聲譽造成極大傷害;中斷2-3天以上不能恢復,將直接危及其他銀行乃至整個金融系統的穩定。
必須有一種機器,在處理能力、穩定性和安全性上,滿足這些需求,大型機就應運而生。
01硬件
大型機一般都在系統內集成了高程度的冗余和錯誤檢查技術,防止系統發生災難性問題。
大型機的每個處理器核心都有2個完全的執行通道來同時執行每一條指令。如果兩條通道的計算結果不一致,CPU的狀態就會復原,重新執行該條指令,結果還是不一致的話,一個空閑狀態的CPU將會被激活替代當前的CPU。
獨立磁盤冗余陣列(RAID)大家都聽說過,可以用冗余的磁盤和條帶化算法,防止數據的損壞和丟失。
圖片
2010年,IBM率先把類似的理念也引入到內存當中,用部分物理內存實現磁盤RAID的功能,叫做RAIM(獨立冗余內存陣列), 從而實現內存的高可用性。
除了CPU和內存外,其它的元件如內存總線、I/O通道、電源等等,都有相應的冗余設計。確保系統的高可靠性、高可用性。
即使出錯,許多組件的熱拔插特性也能確保系統的高服務性,在系統運行的同時被更換。
在大機中把很多軟件模塊都被硬件化了,比如硬件壓縮卡、排序指令、向量運算指令,隨機數生成器、加密硬件(AES、DES、TDES、SHA等),非常的霸氣。
大機的處理器用的是自己獨特z/Architecture主機架構。
IBM z14 有170個處理單元(PU),每個PU中除了我們常說的中央處理器(CPU)之外,還有集成固件處理器,集成信息處理器,內部耦合處理器等專用處理器。
這些專用處理器完成特定工作,卸下CPU的工作負載,讓它專注于操作系統和應用程序。
圖片
02軟件
大機的操作系統也是獨特的,叫z/OS。
在上面可以運行DB2, IMS(數據庫),CICS(交易中間件),JVM等應用程序,當然它們也都是為大機定制的。
圖片
大機也提供了強大的虛擬化能力,可以創建多個虛擬機實例,每個虛擬機運行不同的操作系統和應用程序:
圖片
有意思的是無論操作系統,還是上面的應用程序,它們的收費方式很獨特:用戶定期上傳一個報告,根據使用情況來計算軟件費用。
比如MSU(Million Service Units),這是IBM z Systems上一個用于測量處理能力的度量單位,一個MSU相當于系統每秒能夠執行一百萬條指令。
在IBM z/OS操作系統中,許多IBM和第三方軟件都使用MSU來確定許可成本。客戶通常需要購買足夠的MSU來覆蓋其應用程序和工作負載的處理需求。
我原來所在的IBM部門,就是專門負責大機上軟件的銷售和費用計算的,業務邏輯很有意思。
03向后兼容性
單獨把向后兼容性拎出來說,是因為對于關鍵業務應用來說,它實在太重要了。
它可以讓大型公司平穩地升級硬件和軟件,而無需重寫或修改現有的應用程序。
IBM大型機的歷史可以追溯到上世紀60年代,那個時候IBM通過System/360統治了計算機市場,后來雖然不斷進化,但是一直保持了向后兼容性。
許多為早期系統編寫的應用程序,在 50 年后仍然可以在最新的 IBM z系統上運行,無需修改。
所以我們看到很多用COBOL寫的恐龍級古老應用:稅收、社保、醫療保險、保單、理賠等,在大機上穩定運行了幾十年,并且極有可能會繼續運行下去。
圖片
04結語
IBM z 系列中的z有兩種說法,一種是零停機時間,一種表示終極的意思。
不管哪種說法,IBM的z系列確實做到了,這是一臺終極的、不停機的計算機。
它對外的SLA承諾是7個9(99.99999%),也就是說,每年停機時間僅有3.16秒。
用這種服務器的公司都是全球的頂尖企業:
100強中三分之二的企業
10大保險公司中的8家
10大零售商中的7家
10大電信公司中的8家
這些大公司都把它作為運行最關鍵任務、高度安全的平臺。
如果按價值計算,大型機上運行著70%的全球交易。
互聯網技術蓬勃發展,很多公司用廉價的x86機器也實現了可靠性很高的分布式系統,大型機顯得有些“過氣”了,但是它超高的性能、可靠性、安全性、擴展性,讓它依然固守著最后的領地。
如需轉載,請通過作者微信公眾號coderising獲取授權