雙活還有真和假?
Live Volume with Auto-Failover (LVAFO)是Dell SC系列存儲內置的解決方案功能,通俗的講就是兩套SC系列存儲建立同步復制的卷能夠同時被前端主機進行讀寫訪問,而且還能夠實現存儲級別的自動故障轉移,從而實現存儲的“雙活”。 兩臺存儲上的Live volume卷將使用相同的設備ID,當主機掃描到備存儲上的卷時,不會將這個卷當做一個新的設備,而是主機上的卷設備連接多了幾條路徑。 以一個500GB卷為例,在沒有將備存儲上的LV卷映射給主機前,主機上看到2條到主存儲LV卷的路徑。 [root@ljjr910-a ~]# multipath -ll mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running `- 3:0:17:2 sde 8:64 active ready running 映射備存儲上的卷后,主機上看到一共看到4條路徑,其中2條是到主存儲的路徑,2條是到備存儲的路徑。 [root@ljjr910-a ~]# multipath -ll mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running <-到主存儲的路徑 |- 3:0:17:2 sde 8:64 active ready running <-到主存儲的路徑 |- 3:0:13:2 sdg 8:96 active ready running <-到備存儲的路徑 `- 3:0:19:2 sdi 8:128 active ready running <-到備存儲的路徑 關閉主存儲后,主機上就只能看到到備存儲的2條路徑。 [root@ljjr910-a ~]# multipath -ll mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:13:2 sdg 8:96 active ready running `- 3:0:19:2 sdi 8:128 active ready running LV with AFO如何實現 Live Volume with Auto-Failover的實現主要有兩個關鍵點,一是兩套SC存儲內部LV卷都使用與主卷創建時相同的設備ID,二是通過主機上的多路徑在完成對設備的封裝后,變成一個卷,這個卷同時有到主存儲和備存儲的路徑。一旦主存儲出現意外(如斷電導致整個存儲不可用),主機上的IO只是發生路徑的切換,整個切換過程應用不會中斷,保障業務的連續運行。 LV with AFO 可靠么 檢驗方案是否可靠,我們以事實說話,Dell部署服務團多次以實戰來檢驗過,真正的“雙活”是不怕測的。 如下是一個比較完整的具有Windows、VMware、Linux平臺應用都有的存儲雙活典型案例。 VMware vSphere環境實戰 在VMware主機層面,2臺Dell PowerEdge 服務器部署 vSphere 6.0 U2 虛擬化平臺,配置了集群并啟用了HA功能,可以在一定程度上避免因為主機的硬件或軟件故障引起的非計劃停機和業務中斷。在存儲層面,Dell SC Storage Live Volume Auto-Failover (LVAFO) 提供的存儲雙活解決方案能避免因單套存儲因素引起的服務中斷,將2套存儲的live volume卷同時映射給虛擬化集群內所有的vSphere 服務器,DataStore所在卷具有如下多路徑配置。 在DSM存儲管理界面,關閉主存儲,模擬主存儲故障。 在DSM中查看live volume存儲狀態,可以看到LV卷的存儲角色自動故障轉移成功完成。 登錄到虛擬化服務器,確認存儲卷是否能正常訪問,業務系統虛擬機是否正常運行。 文件可以正常上傳,虛擬機可以正常運行,不會因為主存儲的關機而導致IO停止。 2 Windows平臺的Oracle RAC環境實戰 2臺Dell PowerEdge服務器安裝windows 2012 R2 服務器操作系統,通過將SC4020主備存儲劃分過來的磁盤通過ASM整合后部署Oracle Rac數據庫,在一定程度上避免因為主機的硬件或軟件故障引起的非計劃停機和業務中斷。在存儲層面,Dell SC Storage Live Volume Auto-Failover (LVAF) 提供的存儲雙活解決方案能避免因單套存儲因素引起的服務中斷,將2套存儲的live volume卷同時映射給2臺Windows 2012服務器節點,存儲卷多路徑設置如下。 在每個RAC節點下,調整ASM磁盤超時的參數asm_hbeatiowait,該參數在Oracle11.2.0.4中默認是15秒,建議修改為120秒。 登錄到DSM管理界面,關閉主存儲,模擬主存儲故障。 在DSM管理頁面可以看到存儲狀態切換成功。 登錄到Windows服務器節點,可以看到存儲卷還有兩條路徑在線。 主機層面卷可以正常識別,在Oracle應用層面再確認存儲卷是否能正常訪問,最后發現RAC數據庫依舊能正常運行。 3 Linux平臺的Oracle RAC環境實戰 Oracle RAC運行于Linux平臺是目前比較常見的部署方式,而且最大限度的保障業務的連續運行是Dell客戶比較關系的話題。 通過將Linux平臺的Oracle RAC 與LVAFO結合,能實現一個雙機雙柜的架構模型。在主機層面通過Oracle RAC實現高可用性,當一個主機出現故障后,RAC中的其它節點能繼續提供數據庫服務。在存儲層面,當一臺存儲出現故障后,IO切換到另一臺存儲上。 在存儲SC4020-A上創建一個數據卷Data Disk和一個Voting Disk,將卷同時映射給服務器R910-A、R910-B。 在服務器上使用ASMLIB封裝數據卷Data Disk和 Voting Disk。 服務器A、B之間運行Oracle RAC。 [root@ljjr910-a ~]# crs_stat -t Name Type Target State Host ------------------------------------------------- ora.DATA.dg ora....up.type ONLINE ONLINE ljjr910-a ora.GRID.dg ora....up.type ONLINE ONLINE ljjr910-a ora....ER.lsnr ora....er.type ONLINE ONLINE ljjr910-a ora....N1.lsnr ora....er.type ONLINE ONLINE ljjr910-b ora.asm ora.asm.type ONLINE ONLINE ljjr910-a ora.cvu ora.cvu.type ONLINE ONLINE ljjr910-b ora.dsc.db ora....se.type ONLINE ONLINE ljjr910-a ora.gsd ora.gsd.type OFFLINE OFFLINE ora....SM1.asm application ONLINE ONLINE ljjr910-a ora....-A.lsnr application ONLINE ONLINE ljjr910-a ora....0-a.gsd application OFFLINE OFFLINE ora....0-a.ons application ONLINE ONLINE ljjr910-a ora....0-a.vip ora....t1.type ONLINE ONLINE ljjr910-a ora....SM2.asm application ONLINE ONLINE ljjr910-b ora....-B.lsnr application ONLINE ONLINE ljjr910-b ora....0-b.gsd application OFFLINE OFFLINE ora....0-b.ons application ONLINE ONLINE ljjr910-b ora....0-b.vip ora....t1.type ONLINE ONLINE ljjr910-b ora....network ora....rk.type ONLINE ONLINE ljjr910-a ora.oc4j ora.oc4j.type ONLINE ONLINE ljjr910-b ora.ons ora.ons.type ONLINE ONLINE ljjr910-a ora.scan1.vip ora....ip.type ONLINE ONLINE ljjr910-b 將數據卷Data Disk和Voting Disk卷配置成Live Volume Auto Failover,將數據從SC4020-A 同步復制到SC4020-B,確保相關卷的live volume配對關系正常。 在SC4020-B上將數據卷Data Disk和 Voting Disk卷對應的Live Volume卷也映射給服務器R910-A、R910-B;在服務器上查看,每個設備各有4條路徑。 [root@ljjr910-a ~]# multipath -ll mpathe (36000d31000f190000000000000000267) dm-2 COMPELNT,Compellent Vol size=1.0G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:7:1 sda 8:0 active ready running |- 3:0:11:1 sdc 8:32 active ready running |- 3:0:15:1 sdh 8:112 active ready running `- 3:0:21:1 sdj 8:144 active ready running mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol size=500G features='1 queue_if_no_path' hwhandler='0' wp=rw `-+- policy='round-robin 0' prio=1 status=active |- 3:0:9:2 sdb 8:16 active ready running |- 3:0:17:2 sde 8:64 active ready running |- 3:0:13:2 sdg 8:96 active ready running `- 3:0:19:2 sdi 8:128 active ready running 如果使用了多個Voting Disk,還需要調整ASM磁盤超時的參數asm_hbeatiowait,該參數在Oracle11.2.0.4中默認是15秒,建議修改為120秒。 使用HammerDB對RAC數據庫進行壓力測試。 在DSM管理界面,關掉主存儲,存儲角色自動切換到備存儲。 而在測試過程中,在HammerDB的管理界面上可以看到,應用出現短暫停頓后繼續運行。
【責任編輯:張燕妮 TEL:(010)68476606】