系統(tǒng)升級(jí)前應(yīng)做的準(zhǔn)備工作
盡管示例來自于 AIX 遷移,但可以針對(duì)其他平臺(tái)和系統(tǒng)變化來調(diào)整大部分想法。分三個(gè)階段來考慮升級(jí):
- 準(zhǔn)備
- 升級(jí)本身
- 升級(jí)后的工作
平穩(wěn)升級(jí)有賴于良好的準(zhǔn)備工作。但這個(gè)過程并沒有在您將系統(tǒng)交回用戶時(shí)就結(jié)束了。升級(jí)之后,花費(fèi)一些時(shí)間修訂文檔、看看用戶是否滿意并進(jìn)行升級(jí)后的檢查,是非常重要的。這樣您便有機(jī)會(huì)弄清工作得如何以及如何做更好。
準(zhǔn)備
管理用戶期望。升級(jí)的最大困難通常并不在技術(shù)方面,更多的時(shí)候跟管理用戶期望有關(guān),以便用戶不會(huì)期望系統(tǒng)完成不可能的事情。管理期望意味著讓涉眾參與更改審批過程,還意味著用戶對(duì)升級(jí)帶來的影響有一個(gè)合理的估計(jì)。何時(shí)會(huì)再次備份他們的系統(tǒng)?他們會(huì)注意哪些功能和特性?一個(gè)關(guān)鍵的組成部分是允許有足夠的停機(jī)時(shí)間來進(jìn)行升級(jí)。
不要在生產(chǎn)環(huán)境中進(jìn)行測試,而是使用一個(gè)盡可能與生產(chǎn)環(huán)境接近的測試環(huán)境來測試升級(jí)的運(yùn)行。在生產(chǎn)環(huán)境中進(jìn)行測試可能會(huì)造成災(zāi)難。
閱讀文檔。即使您以前進(jìn)行過類似的升級(jí),也要閱讀文檔,因?yàn)榭赡軙?huì)有新的先決條件和不同的過程。我發(fā)現(xiàn),尤其是到 Virtual I/O Server (VIOS) 的升級(jí),您需要了解所涉及的內(nèi)容,尤其是所有先決條件。
最大程度減小對(duì)用戶的影響。很難確定中斷時(shí)間范圍,原因之一在于中斷過程太長。情況并不總是這樣的。某些升級(jí)方法可能會(huì)節(jié)省大量時(shí)間。例如,使用 Network Installation Manager (NIM) 通過 nimadm 進(jìn)行遷移,將允許您創(chuàng)建一個(gè)備用磁盤并在中斷時(shí)間范圍之前升級(jí)該磁盤。在停機(jī)期間,所有需要做的只是重新啟動(dòng),用戶就可以再次登錄了。采用這種備用磁盤安裝的方式還會(huì)提供一個(gè)非常快速的回滾計(jì)劃(如果需要的話)。
事先下載更新。有了一個(gè)緊湊的中斷時(shí)間范圍,您就不再需要在下載您認(rèn)為不需要的軟件或固件方面浪費(fèi)時(shí)間。您可以提前下載所有更新。對(duì)于 AIX,這可能是指 Power Systems 固件、適配器和設(shè)備微碼,可能還包括 Hardware Management Console。
驗(yàn)證更新。如果您使用的是物理媒體,那么執(zhí)行您可以執(zhí)行的所有操作來檢查它的可讀性。如果程序包采用壓縮格式或者位于存檔中,那么有必要進(jìn)行解壓縮或者至少檢查您是否可以讀取該存檔。
創(chuàng)建并驗(yàn)證備份。這聽起來非常簡單,不是嗎?但備份實(shí)際上只是用于還原的功能。備份過程中的某些元素可能需要修訂。我最近聽說一個(gè)小學(xué)校,有人每天更改備份磁帶,但實(shí)際上從未計(jì)劃運(yùn)行任何備份。檢查您的備份是否包含您可能需要還原的一切內(nèi)容也是非常重要的。例如,如果您使用 mksysb 命令進(jìn)行 AIX 操作系統(tǒng)備份,則通過一些其他方法檢查排除列表 (/etc/exclude.rootvg) 中的所有文件或目錄是否可還原或是否不重要。
準(zhǔn)備備用升級(jí)策略。單點(diǎn)故障可能會(huì)是毀滅性的。您可能有一個(gè)首選的方法來進(jìn)行升級(jí),但您仍然可以擁有回滾計(jì)劃,以防萬一。例如,如果您使用 NIM 進(jìn)行 AIX 遷移,那么您可能希望在您的 VIOS 虛擬媒體存儲(chǔ)庫上擁有 AIX V7.1 安裝映像的副本。
在升級(jí)期間
首先重新啟動(dòng)。如果 uptime 命令報(bào)告操作系統(tǒng)已經(jīng)運(yùn)行了幾個(gè)月,那么可能需要進(jìn)行一次初始的重新啟動(dòng)。這樣將會(huì)確認(rèn)操作系統(tǒng)本身原封未動(dòng)并且能夠承受住重新啟動(dòng)。如果由于某些原因,系統(tǒng)未啟動(dòng)、必需的過程未啟動(dòng)或者文件系統(tǒng)未裝載,那么您可以直接解決這些問題,無需考慮此問題是否跟升級(jí)有關(guān)。
保留日記。簡單記錄每個(gè)任務(wù)的開始和結(jié)束時(shí)間將有助于您計(jì)劃在將來進(jìn)行更高效的升級(jí)。記下任何意外結(jié)果或問題,以及您可能使用的任何解決方案或解決辦法。
建立多個(gè)回滾點(diǎn)。如果您的升級(jí)涉及 10 個(gè)步驟,但第 3 步失敗了,那么您愿意將系統(tǒng)停留在第 2 步階段,還是回滾到原始的升級(jí)前配置?
記錄升級(jí)。您應(yīng)該已經(jīng)擁有了一些升級(jí)文檔,其中包含您計(jì)劃要執(zhí)行的操作。那么對(duì)該文檔進(jìn)行一些改進(jìn)以便顯示您實(shí)際執(zhí)行的操作是非常值得的。如果您對(duì)原始計(jì)劃進(jìn)行了某些改動(dòng),請(qǐng)記下都有哪些改動(dòng)以及為什么進(jìn)行改動(dòng)。
通知涉眾。如果在升級(jí)期間遇到問題或者您預(yù)計(jì)有一些延遲,則應(yīng)該提前通知涉眾。通常,他們寧愿被告知系統(tǒng)未按計(jì)劃運(yùn)行,而不愿自己最后才搞清真相。
升級(jí)之后
驗(yàn)證功能。如何驗(yàn)證升級(jí)是否成功將取決于應(yīng)用程序。進(jìn)行一些基本的測試是非常必要的。但重要的是在數(shù)百個(gè)或數(shù)千個(gè)用戶打電話說他們無法登錄之前,弄清楚數(shù)據(jù)庫已關(guān)閉。
創(chuàng)建新備份。如果出現(xiàn)不幸的情況,在升級(jí)完成之后的一段時(shí)間內(nèi)還必須依賴備份,那么您必須還原到升級(jí)前的備份,然后再次升級(jí)。
清理。成功完成升級(jí)之后,需要清理您可能使用過的所有臨時(shí)文件和文件系統(tǒng)。刪除備用磁盤并恢復(fù)卷組鏡像(如果適用)。
減少代價(jià)
成功和平穩(wěn)的升級(jí)不應(yīng)該依賴幸運(yùn)。良好的準(zhǔn)備、基本的故障排除技巧以及改進(jìn)過程的愿望都有助于您以最小的代價(jià)升級(jí)系統(tǒng)。