UCS版本固件升級經驗分享
本文寫的是手工升級firmware的步驟,由于當前版本2.1(3a)存在一個bug CSCui99339,會導致從2.1(2a)升級到3a版本的自動升級會失敗。而且這個bug目前還沒解決方法和繞開的辦法,因此建議采用手動升級的方法。(目前指2013年10月12日)
思科UCS設備、服務器的固件在設備內存在3種不同的形態:Backup Version、Startup Version 和Running Version。Backup Version就是備用的固件版本,它保證了固件升級即使失敗也不會徹底弄壞設備,而可以回滾到原來的版本。Startup Version是系統啟動的時候讀取的固件,而Running Version就是當前內存中正在運行的那個版本。
在將固件整合包(那3個從思科官網下載的bin文件)download到設備以后,就可以開始升級了。升級的過程分3步,***步叫Update Firmware(更新固件),將固件包里面的相關firmware釋放出來并替換掉原來的Backup Version;第二步叫作Activate Firmware (激活固件),就是將Backup Version和Startup Version對換;第三步就是重啟。重啟之后新的固件就被load到內存中成為當前的Running Version了。
理解了以上升級過程之后,后面的具體操作中為啥每次都需要先Update,然后再Activate,***總要重啟就一目了然了。
升級本身沒太多技巧,按照文檔一步一步來即可,只是升級的順序非常重要,必須按照以下順序進行:
UCSM Adapter IOM Fabric Interconnect CIMC BIOS
這其中服務器CIMC和BIOS的升級可以放在升級完UCSM之后的任何階段,但是其他必須按照順序進行。
還有一個非常關鍵的地方需要特別說明一下。IOM必須先升級,再升級Fabric Interconnects,升級完IOM一定不要重啟(不管是自動立刻重啟還是手工重啟),而是等待Fabric Interconnect升級完畢重啟的時候,會自動帶起IOM的重啟。這一條,官方文檔中沒有強調,只是寫了不要去掉Set Startup Version Only前面的勾。但是,如果升級完IOM立刻重啟的話,IOM會因為和Fabric Interconnect的固件版本不一致,不兼容而引起無法正常連通,系統會報告各種錯誤,直到***回滾到原來的版本。整個報錯及回滾過程也很漫長,大概會耗費20分鐘左右。
在正式的生產環境中,升級應該額外小心,一臺一臺升級。VMware的虛擬化環境可以vMotion來避免宕機時間。升級2臺Fabric Interconnect的正確的順序是先升級從屬的(Subordinate)那臺,一般來說是Fabric B。然后將Primary切換到Fabric B,再升級Fabric A。***把Primary切換回去到Fabric A的FI。