醫療行業用戶談關鍵業務基礎設施
在信息技術日新月異的今天,醫療機構越來越依賴信息系統來開展業務,對于門診、臨床等關鍵業務應用而言,提供7×24×365連續運營至關重要。目前大多數醫院所采用雙機熱備、集群服務器在可靠性方面存在著不小的安全隱患,加之不少醫院專業人員有限,在這種情況下,具有更高安全級別的容錯服務器解決方案更加備受關注。
容錯是指服務器對于錯誤的容納能力,是應用過程中對于服務器穩定性追求的一個目標。為了這樣一個目標,服務器集群技術、雙機冗余服務器方案和單機容錯技術這三種實現方法都在被使用。但集群技術、雙機冗余服務器方案由于依賴于軟件的特性,其設計更為復雜,并且維護成本較高,而容錯服務器的思路就是把所有運算器(CA)、控制器(CC)、存儲器M和輸入/輸出裝置這些部件全部采用冗余硬件設計。兩個部件共運行同一個任務,以此來提高系統的運行可靠性。這種冗余硬件的設計并不難,但是最為困難的是如何保證計算和數據在硬件中的同步(Lockstep),這是美國容錯技術有限公司(Stratus)的核心專利技術,也是其馳騁容錯技術領域30年不敗的關鍵。
7×24小時不間斷,stratus可以保證
美國stratus容錯公司生產的容錯服務器在一些關鍵性領域里應用非常廣泛,例如:電信、機場、銀行、冶金行業、安全、醫院HIS系統、公安、電力行業、大的零售業等一切要求高可用性的行業。
而現實是,雙機應用仍然是現在的主流,凡涉及關鍵業務應用的領域,雙機冗余都是一個重要的解決方案。但是雙機冗余服務器方案不能夠解決軟件的故障。在實際運行過程中,有些時候數據庫莫名其妙打不開了,在這種情況下,只有重新安裝數據庫,沒有其他好的辦法,而這不僅可能造成數據的丟失,也會在時間上無法滿足醫院的要求,這對醫院是致命而不可接受的。
在醫院,7×24小時的不間斷運行是對硬件與系統的考驗,尤其是在關鍵業務上。上海中醫藥大學附屬曙光醫院曾使用stratus容錯服務器很多年,信息中心劉珉主任說:對醫院而言,信息主管最關心的是系統的安全穩定以及數據的準確性,在容錯服務器中,由于采用冗余部件同時運行同一應用任務,這樣當兩個系統產生不一樣計算結果時,系統就會察覺,并通過技術手段對于計算錯誤進行校驗,從而提高應用的準確性。stratus容錯服務器在我院使用的8年中,從未出現過停頓15分鐘以上的故障,確實能夠滿足我們在關鍵業務上的需求。
哥倫比亞大學基金會•上海德濟醫院信息主管張志翔主任介紹說:由于私立醫院在人力等方面的投入較之大型三甲醫院不足,因此在硬件上更希望能夠盡量降低人力和維護成本,并能夠穩定安全的運行。stratus容錯服務器正好能夠滿足我們在硬件安全高效的要求。
對于容錯服務器而言,雖然在理論上存在著兩個相同部件同時損壞的情況,但是隨著硬件水平的提高,這種概率是比較低的。容錯硬件的設計一方面可以防止硬件的單點故障,同時也可以防止硬件所造成的計算錯誤,并對此做出校正。
上海市衛生局信息中心高級工程師沈惠德很形象地將雙機與容錯進行了比喻。他說:如果將服務器比作人的器官,那么雙機冗余像是器官移植,會出現“排異”的可能性,而容錯服務器更像是自身的一套器官,不會出現排異,因此其安全可靠性更高。在他看來,醫院信息化的不斷推進對安全的要求更高,隨著對醫院等級評測要求的提高,也將推動容錯服務器的發展。
1+1>2,stratus可以做到
買一臺stratus容錯服務器,得到的不僅僅是一個硬件設備,還有伴隨的高可靠性、更精確運算以及更優性價比。
美國stratus容錯服務器代理商之一上海復高計算機科技有限公司副總經理馬俊華表示:stratus容錯服務器部署更簡單,可以大大減少軟件成本;安全更有保障,能有效地保護動態數據不丟失。上海復高計算機科技有限公司系統集成部總經理汪國亮說:如果采用雙機冗余方案,需要購買兩套操作系統、兩套數據庫產品,那么其總體的投資與容錯服務器方案相當,而系統的可用性方面,容錯服務器顯然更具有優勢。
同為美國stratus容錯服務器代理商的上海顯亮數碼科技發展有限公司總經理周彬彬說,應用容錯服務器后,相比其他方式的“救火”行為,容錯服務器將醫院信息化底層無法預測的硬件故障預防,管理人員可以將更多的精力用于其他軟件的運作與維護,可大大減少運維成本。
根據國際著名咨詢機構IDC所公發布的數據:容錯服務器可用性是99.9998%,消除單點故障的集群,可靠性僅為99.99%,而IBM的大型機為99.995%。就技術而言, 雙機只能保證寫入硬盤的數據,不能夠對緩存數據進行有效保護,雙機系統當硬件出現故障進行切換時,是要產生停頓的,與此同時,雙機切換有可能不成功,如此以來,對于醫院的窗口單位而言,就會對正常的醫療秩序產生影響,甚至引發群體性事件,影響醫院整體形象。有與之相比,容錯產品支持任意硬件熱插拔,包括主板、CPU等關鍵性硬件,外界并感覺不到切換,系統可靠性大大提高,同時因為系統具備糾錯能力,系統更加穩定。如果說集群技術可以減少停機,那么容錯系統的目標是避免停機,在相同的條件下,容錯系統顯然更加穩定和安全。需要稍加說明的是,小型機雖然也是一種選擇,但這會增加成本,同時也對企業的技術人員提出了比較高的要求。
目前,容錯服務器推廣應用還需要政府推動以及人們認知水平的提高。一個好消息是,越來越多的醫院在選購stratus容錯服務器,說明在醫院的關鍵業務中,容錯服務器更加適用。