網管必備 常見服務器硬件故障排查判斷
服務器常見故障的診斷與解決,服務器故障排除***部分,服務器故障排除的基本原則性問題服務器故障排除(51CTO推薦閱讀:遠程服務器管理技巧大全)。
一、服務器開機黑屏故障排查
1.檢查供電環境,零-火;零-地電壓?
2.檢查電源指示燈,如果亮,正常嗎?
3.按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?
4.是否更換過顯示器,更換另一臺顯示器。
5.去掉增加內存
6.去掉增加的CPU
7.去掉增加的第三方I/O卡
8.檢查內存和CPU插的是否牢靠
9. Clear CMOS
10.更換主要備件,如系統板,內存和CPU服務器故障排除
#p#
二、服務器故障排除基本原則
1.盡量恢復系統缺省配置
a:硬件配置:去除第三方廠商備件和非標配備件;
b:資源配置:清除CMOS,恢復資源初始配置;
c: BIOS,F/W,驅動程序:升級***的BIOS,F/W和相關驅動程序;
d: TPL:擴展的第三方的I/O卡屬于該機型的硬件兼容列表(TPL)嗎?
2.從基本到復雜
a:系統上從個體到網絡:首先將存在故障的服務器獨立運行,待測試正常后再接入網絡運行,觀察故障現象變化并處理。
b:硬件上從最小系統到現實系統:指從可以運行的硬件開始逐步到現實系統為止。
c:軟件上從基本系統到現實系統:指從基本操作系統開始逐步到現實系統為止。
3.交換對比
a:在***可能相同的條件下,交換操作簡單效果明顯的部件;
b:交換NOS載體,既交換軟件環境;c:交換硬件,既交換硬件環境;d:交換整機,既交換整體環境;服務器故障排除三、服務器故障排除需要收集哪些信息?服務器信息:1.機器型號2.機器序列號(S/N:如:NC00075534)3.Bios版本4.是否增加其它設備,如網卡,SCSI卡,內存,CPU5.硬盤如何配置,是否做陣列,陣列級別6.安裝什么操作系統及版本(Windows Server, Netware, Sco, others)
#p#
故障信息
1.在POST時,屏幕顯示的異常信息
2.服務器本身指示燈的狀態?
3.報警聲和BEEP CODES
4. NOS的事件記錄文件?
5. Events Log文件
確定故障類型和故障現象
1.開機無顯示;
2.上電自檢階段故障;
3.安裝階段故障和現象;
4.操作系統加載失敗;
5.系統運行階段故障
【編輯推薦】