實(shí)用技巧: 光纖通道交換環(huán)境的最佳策略
如果公司決定部署光纖通道存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN),接下來(lái)就應(yīng)該確定交換機(jī)的供應(yīng)商,因?yàn)榛旌鲜褂酶鞣N品牌并不明智。
光纖通道交換機(jī)需要彼此通信、合作,以管理整個(gè)網(wǎng)絡(luò)。要保證交換機(jī)彼此通信良好,最佳方法是從三家最頂尖的交換機(jī)供應(yīng)商中挑選一家,然后選擇其產(chǎn)品:博科、思科以及QLogic公司。
“(交換機(jī)之間的)通信需遵循標(biāo)準(zhǔn),但對(duì)于構(gòu)建SAN所需的功能而言,這種標(biāo)準(zhǔn)相對(duì)疲軟,而且并不常見(jiàn)。” Gartner分析師Robert Passmore說(shuō),“所有的交換機(jī)供應(yīng)商都擁有一組專屬的強(qiáng)健的管理功能。”
下文分類列舉了光纖通道交換環(huán)境普遍適用的最佳策略。
規(guī)劃的注意事項(xiàng)
根據(jù)你未來(lái)三年的需要規(guī)劃SAN。
根據(jù)過(guò)去兩年使用的應(yīng)用程序、物理服務(wù)器以及存儲(chǔ)數(shù)量,規(guī)劃你未來(lái)的需求。考慮可能部署哪些新技術(shù),如虛擬服務(wù)器。認(rèn)真思考不同的組件會(huì)對(duì)總體環(huán)境產(chǎn)生什么影響。
“無(wú)論你在未來(lái)三年有什么需要,都將這種需要擴(kuò)大一倍,并按這個(gè)目標(biāo)構(gòu)建。” Dragon Slayer Consulting總裁Marc Staimer說(shuō):“這么做花費(fèi)增加了,但是會(huì)讓你今后的生活簡(jiǎn)單得多。”
沒(méi)有事先規(guī)劃SAN就好比“一個(gè)巨大的噩夢(mèng)”,Staimer指出“規(guī)劃越充分,返工就越少”。
判斷應(yīng)用程序的吞吐量和I/O,從而設(shè)計(jì)SAN環(huán)境的規(guī)模,這么做能取得最佳效果。
惠普公司多供應(yīng)商系統(tǒng)工程團(tuán)隊(duì)的高級(jí)SAN系統(tǒng)工程師Dan Iacono認(rèn)為,大多數(shù)用戶并不了解應(yīng)用程序的吞吐量和I/O。Unix和Windows內(nèi)置的性能工具,或者由網(wǎng)絡(luò)、SAN、存儲(chǔ)供應(yīng)商提供的性能工具都能幫助計(jì)算吞吐量和I/O。
了解應(yīng)用程序及其吞吐量,有助于判斷哪種端口(超額認(rèn)購(gòu)或完全吞吐量)最為合適,以及如何設(shè)計(jì)SAN能最有效地利用網(wǎng)絡(luò)帶寬。許多用戶選擇核心/邊緣設(shè)計(jì),邊緣采用16口或32口交換機(jī),通過(guò)交換機(jī)內(nèi)鏈路(ISL)接入更大的導(dǎo)向器級(jí)交換機(jī)。
Iacono說(shuō):“你需要了解邊緣交換機(jī)的吞吐量,從而通過(guò)適量的ISL連入導(dǎo)向器中。”減少ISL的數(shù)量,可以釋放交換機(jī)的端口,從而將更多的資金投入SAN。
擁有成熟SAN的公司可能會(huì)發(fā)現(xiàn),他們需要將邊緣交換機(jī)中高吞吐量的應(yīng)用程序直接連入導(dǎo)向器,從而減少中轉(zhuǎn),讓程序和存儲(chǔ)近距離接觸。
不要害怕超額認(rèn)購(gòu)。
大多數(shù)服務(wù)器并不需要光纖通道交換機(jī)的全部網(wǎng)絡(luò)帶寬,因此,超額認(rèn)購(gòu)或者分配的存儲(chǔ)超過(guò)交換機(jī)的處理能力都是十分常見(jiàn)的策略,因?yàn)閺慕y(tǒng)計(jì)學(xué)上來(lái)講,不可能同時(shí)需要所有存儲(chǔ)。
Howard Goldstein Associates的總裁Howard Goldstein依然認(rèn)為管理員“容易變得非常保守,其實(shí)大可不必”。他還指出,在大多數(shù)SAN環(huán)境中,“你僅使用了交換機(jī)端口的十分之一容量”。
事先評(píng)價(jià)電力消耗和降溫需求。
技術(shù)供應(yīng)商經(jīng)常將產(chǎn)品整合為盡可能小的軟件包,但是客戶站點(diǎn)可能無(wú)法處理。博科公司數(shù)據(jù)中心基礎(chǔ)設(shè)施分類部的產(chǎn)品銷售主管Mario Blandini認(rèn)為,大多數(shù)提議都會(huì)面臨電力消耗的問(wèn)題。
“究竟多少IT環(huán)境不再需要額外的電力容量,你可能會(huì)很好奇。” Blandini說(shuō),“大多數(shù)(醫(yī)院或大學(xué))的建筑物都是在75年甚至100-200年之前建立的。這些建筑物在設(shè)計(jì)電耗時(shí),可能從來(lái)沒(méi)有想到19平方英寸的空間需要消耗10,000 W的電力。”#p#
建立兩個(gè)獨(dú)立的光纖通道網(wǎng)絡(luò),實(shí)現(xiàn)冗余
SAN需要一周七天、一天二十四小時(shí)都在運(yùn)行。SAN支持的服務(wù)器數(shù)量越多,故障引起的后果越嚴(yán)重。為了保證SAN不發(fā)生故障,服務(wù)器和存儲(chǔ)的連接需要兩條路徑。
如果一條路徑——采用HBA、交換機(jī)、電纜、端口等——發(fā)生故障,另一條路徑就能讓程序繼續(xù)與其存儲(chǔ)通信。這么做還有一個(gè)好處,SAN在運(yùn)行時(shí)就能實(shí)現(xiàn)升級(jí)。
“光纖通道這項(xiàng)技術(shù)可能引起破壞。” Staimer說(shuō),“無(wú)論你改變或者添加了任何東西,或者對(duì)系統(tǒng)完成了任何工作,都可能破壞當(dāng)時(shí)正在使用系統(tǒng)的應(yīng)用程序。因此,最好是在一個(gè)網(wǎng)絡(luò)中實(shí)現(xiàn)變更,在另一個(gè)網(wǎng)絡(luò)運(yùn)行程序。具有兩個(gè)網(wǎng)絡(luò)時(shí),損失最小。”
管理:技術(shù)方面
安裝路徑管理軟件,當(dāng)一條路徑失效時(shí),自動(dòng)將I/O請(qǐng)求切換到另一條路徑。
一些操作系統(tǒng)環(huán)境能提供基本性能。Passmore說(shuō),一些存儲(chǔ)供應(yīng)商擁有自己的路徑管理軟件,費(fèi)用相對(duì)較高,但由于還能實(shí)現(xiàn)其它功能,因此還是物有所值。
設(shè)置、調(diào)整并監(jiān)測(cè)硬件和性能警告。
惠普公司的Iacono記得有一家大型的咨詢公司,每天接到6000條警告,卻置之不理。而一家交換機(jī)供應(yīng)商在SAN遭遇0 MBps時(shí),采用缺省警告加以終止。這樣可能會(huì)導(dǎo)致每天收到上千封郵件。
他說(shuō):“你需要關(guān)閉缺省警告。”
但是,即使是少量的硬件位級(jí)錯(cuò)誤也應(yīng)該引起重視,因?yàn)檫@可能是錯(cuò)誤發(fā)生的前兆。“大約95%的SAN錯(cuò)誤,我們都能事先得到警告,但是沒(méi)有解決警告。” Iacono說(shuō),“如果你得到的警告太多,可能就需要調(diào)整警告環(huán)境,去除錯(cuò)誤的設(shè)置,或者可能真的存在急需解決的問(wèn)題。”
將SAN的設(shè)置信息備份到硬盤中,而不是SAN中。
SAN一般不會(huì)發(fā)生錯(cuò)誤,但是一旦發(fā)生錯(cuò)誤,問(wèn)題就嚴(yán)重了。如果將SAN文檔備份到與網(wǎng)絡(luò)驅(qū)動(dòng)相連的服務(wù)器中,而驅(qū)動(dòng)又在SAN中,那么存儲(chǔ)團(tuán)隊(duì)就會(huì)丟失恢復(fù)系統(tǒng)所需的信息。
Iacono說(shuō):“我可以告訴你,《財(cái)富》50強(qiáng)公司也這么做,真是令人吃驚。”
許多公司甚至沒(méi)有更新SAN文檔。他們通常從Excel線程開(kāi)始工作,出發(fā)點(diǎn)很好,但是幾乎從不更新,因?yàn)槊媾R著更加緊迫的任務(wù)。
“如果讓他們檢查故障,他們甚至不知道哪些信息與哪些端口相連。” Iacono說(shuō),“每個(gè)人都會(huì)涉及此類文檔,但是50%到70%的文檔都沒(méi)有及時(shí)更新。”#p#
管理:人事方面
雇傭?qū)I(yè)的存儲(chǔ)團(tuán)隊(duì)和完善的變更管理程序。
SAN出現(xiàn)問(wèn)題,通常是由于人為錯(cuò)誤。嚴(yán)格的變更管理策略能夠降低錯(cuò)誤發(fā)生率。同理,專業(yè)的存儲(chǔ)團(tuán)隊(duì)能積極管理系統(tǒng),減少錯(cuò)誤率。
服務(wù)器管理員需要與存儲(chǔ)團(tuán)隊(duì)交流、協(xié)調(diào)需求,因?yàn)榇鎯?chǔ)是由存儲(chǔ)團(tuán)隊(duì)設(shè)計(jì)完成的。一位存儲(chǔ)專家記下流程步驟和設(shè)置說(shuō)明,包括存儲(chǔ)陣列和交換機(jī)的任務(wù)。理想情況下,另一位存儲(chǔ)專家會(huì)審核變更設(shè)計(jì),從而保證質(zhì)量。
Gartner的Passmore認(rèn)為:“實(shí)際上,遵循這些規(guī)則的公司多年來(lái)一直在SAN領(lǐng)域取得成功。”
為訪問(wèn)SAN的每位管理員和第三方咨詢師設(shè)置獨(dú)立的用戶帳戶和密碼。
Iacono說(shuō),很多情況下,管理員在調(diào)整新交換機(jī)的參數(shù)后沒(méi)有轉(zhuǎn)告同事。他發(fā)現(xiàn)同一臺(tái)交換機(jī)擁有不同的配置,詢問(wèn)發(fā)生了什么情況,通常會(huì)聽(tīng)到這種回答“Joe是這么做的,而Steve是那么做的”。
Iacono認(rèn)為:“一旦明確了職能,這些問(wèn)題就不復(fù)存在。我們希望能夠?qū)徲?jì)所有的過(guò)程。”
IT團(tuán)隊(duì)不僅能夠明確問(wèn)題來(lái)源,而且當(dāng)SAN管理人員離開(kāi)公司時(shí),不必重置通用密碼。
安全
完成LUN掩碼和綁定的同時(shí)創(chuàng)建區(qū)域。
為新服務(wù)器創(chuàng)建存儲(chǔ)時(shí),可以利用工具建立存儲(chǔ)卷,分配地址或SCSI LUN。如果某些實(shí)體不具有LUN,LUN掩碼就會(huì)將LUN隱藏;LUN綁定只是將LUN附屬到服務(wù)器中HBA的全局ID中。
完成LUN掩碼和綁定的同時(shí),存儲(chǔ)專家應(yīng)該深入交換機(jī),創(chuàng)建區(qū)域,而且只允許專門的適配器與特定的存儲(chǔ)端口實(shí)現(xiàn)通信。
“實(shí)際上,交換機(jī)通過(guò)分區(qū)可以強(qiáng)化LUN的掩碼和綁定。” Passmore說(shuō),“進(jìn)一步而言,可以設(shè)計(jì)與服務(wù)器通信的端口交換機(jī),從而檢查全局ID,在存儲(chǔ)陣列中強(qiáng)化LUN的掩碼和綁定。”
使用安全外殼(SSH)協(xié)議訪問(wèn)SAN。
如果管理員使用Telnet協(xié)議登錄SAN交換機(jī),密碼其實(shí)沒(méi)有受到保護(hù),可能會(huì)面臨攔截的文獻(xiàn)。SSH能提供安全通道。
“采用SSH,一切都受到保護(hù)。” Iacono說(shuō),“如果你管理的是Windows或Unix環(huán)境,這就是一項(xiàng)基本標(biāo)準(zhǔn),但是處于某些原因,沒(méi)有人對(duì)SAN環(huán)境使用SSH。”
虛擬服務(wù)器
保證服務(wù)器內(nèi)外流入交換機(jī)和指定目標(biāo)的網(wǎng)絡(luò)帶寬足以適應(yīng)環(huán)境。
如果服務(wù)器沒(méi)有得到充分利用,但又運(yùn)行了虛擬機(jī)中多個(gè)應(yīng)用程序的工作負(fù)荷,那么網(wǎng)絡(luò)帶寬的需求就會(huì)逐步擴(kuò)大。用戶在設(shè)計(jì)SAN時(shí)需謹(jǐn)記這一點(diǎn)。
“去年,典型的x86服務(wù)器經(jīng)常需要處理每秒一千多兆的吞吐量。”Staimer指出,“當(dāng)前的x86服務(wù)器一般都屬于四核,如果應(yīng)用程序允許的話,很容易就能達(dá)到10 GB。如果你同時(shí)運(yùn)行20個(gè)程序,就會(huì)達(dá)到10 GB。而以前的服務(wù)器之所以沒(méi)有達(dá)到10 GB,是因?yàn)橐粋€(gè)程序無(wú)法完成。”
保證擁有虛擬機(jī)的物理服務(wù)器位于同一區(qū)域。
管理員可以利用虛擬服務(wù)器技術(shù)在無(wú)需停機(jī)的情況下,將應(yīng)用程序從一臺(tái)物理服務(wù)器轉(zhuǎn)移到另一臺(tái)物理服務(wù)器,但是這些物理服務(wù)器需要位于同一光纖通道區(qū)域,才能訪問(wèn)存儲(chǔ)。
Staimer說(shuō):“應(yīng)用程序無(wú)法找到存儲(chǔ),為什么呢?因?yàn)槌绦虮罎⒘?”
利用支持N_Port ID虛擬化(NPIV)的交換機(jī)和HBA。
如果一臺(tái)物理服務(wù)器中運(yùn)行了五臺(tái)虛擬機(jī),NPIV就會(huì)允許每臺(tái)虛擬機(jī)各自獲得一個(gè)獨(dú)特的HBA標(biāo)識(shí)符,具有NPIV功能的交換機(jī)能夠識(shí)別這些獨(dú)特的ID。這就意味著每臺(tái)虛擬機(jī)都能訪問(wèn)各自的LUN。
如果設(shè)備不具備NPIV功能,物理服務(wù)器就只能得到一個(gè)端口ID。
新型交換機(jī)和HBA都支持NPIV,但是使用遺留硬件的人員可能需要檢查供應(yīng)商如何更新固件。NPIV處理刀片服務(wù)器的方式與其處理虛擬服務(wù)器的方式非常相似。