當(dāng)系統(tǒng)受到損壞時(shí),專業(yè)程序員都用它診斷是不是硬件的問(wèn)題!
譯文【51CTO.com快譯】由于擁有許多優(yōu)點(diǎn),Linux是一種靈活而通用的操作系統(tǒng)。然而,它有諸多不太知名的應(yīng)用程序,其中之一可用作硬件診斷工具。
為了進(jìn)行功能測(cè)試和性能測(cè)試,許多人仍往往依賴在其他操作系統(tǒng)上運(yùn)行的價(jià)格不菲的特殊解決方案,但是小小的StressLinux Live發(fā)行版讓你可以測(cè)試系統(tǒng)的功能,無(wú)需復(fù)雜處理,也無(wú)需其他工具的高昂成本。
StressLinux作為一款Live“迷你發(fā)行版”,StressLinux可幫助你迅速可靠地找到錯(cuò)誤和瓶頸的潛在根源,不需要耗費(fèi)時(shí)間地安裝到硬盤(pán)上。尤其是,如果你想排查處理器或散熱系統(tǒng)存在的問(wèn)題,StressLinux就是一款出色的工具。當(dāng)然,你需要密切關(guān)注系統(tǒng)在負(fù)載狀態(tài)下的散熱性能,防止因萬(wàn)一散熱能力不足而過(guò)熱、導(dǎo)致系統(tǒng)受到損壞。
1.黑盒子
啟動(dòng)后,StressLinux最初彈出很老土的文本屏幕和黑色背景的簡(jiǎn)陋線圖形。一旦操作系統(tǒng)準(zhǔn)備就緒,你需要登錄:用戶名和密碼都是stress。接下來(lái)是文本模式下的YaST2配置工具,需要的話它會(huì)在熟悉的藍(lán)色窗口中定制鍵盤(pán)。軟件提示你輸入主板型號(hào)。如果你不確信自己安裝了哪種主板,或者你使用的筆記本電腦搭載專門為移動(dòng)使用設(shè)計(jì)的主板,只要摁OK按鈕,就可以啟用***個(gè)表項(xiàng)Run_sensors-detect。然后,你的硬件通過(guò)幾個(gè)步驟來(lái)加以檢查,檢查有無(wú)各種傳感器。一旦完成,系統(tǒng)會(huì)在表格中顯示可能的測(cè)試和基準(zhǔn)測(cè)試命令,顯示提示符,等你輸入(見(jiàn)圖1)。
圖1:StressLinux提供了眾多壓力測(cè)試。
表格的頂部顯示了數(shù)量驚人的測(cè)試?yán)谐绦?,它們是針?duì)特定硬件而定制的。這些例行程序按廠商英特爾和AMD來(lái)排序。下面是涵蓋一系列更廣泛的測(cè)試的程序,以及檢查網(wǎng)絡(luò)速度和大容量存儲(chǔ)器的測(cè)試。如果你不知道安裝在系統(tǒng)中的硬件的詳細(xì)情況,只要運(yùn)行l(wèi)shw命令,就可以列出最重要的部件。來(lái)自lshw的輸出很全面,但是你可以用這個(gè)命令來(lái)逐頁(yè)顯示屏幕上的輸出:
- lshw | more
那樣你可以在方便時(shí)查看細(xì)節(jié)。為了確定處理器的具體類型,在提示符處輸入x86info;這會(huì)給出處理器的最重要的技術(shù)數(shù)據(jù)(見(jiàn)圖2)。
圖2:簡(jiǎn)明扼要的處理器規(guī)格
2.處理器和芯片組測(cè)試
列表中的頭六個(gè)程序出現(xiàn)在一些軟件庫(kù)中,作為cpuburn套件的一部分。這些程序在***負(fù)載狀態(tài)下,測(cè)試來(lái)自英特爾和AMD的處理器和芯片組,包括老式的K6和K7系列以及現(xiàn)代的兼容系統(tǒng),讓你得以確定處理器適合超頻的程度,并幫助你查明硬件問(wèn)題。比如說(shuō),如果系統(tǒng)在滿負(fù)載狀態(tài)下運(yùn)行,幾分鐘后突然停止運(yùn)行,這可能表明處理器的散熱件有瑕疵或不合要求。
你可以在每一種情況下啟動(dòng)測(cè)試程序,只要運(yùn)行列表中指定的控制臺(tái)命令;這不需要管理員權(quán)限。由于程序通常在屏幕上并不輸出任何內(nèi)容,你應(yīng)該在后臺(tái)運(yùn)行硬件測(cè)試,那樣在應(yīng)用程序運(yùn)行的時(shí)候可以一心關(guān)注控制臺(tái)。想對(duì)你***進(jìn)的英特爾處理器進(jìn)行全面測(cè)試,在控制臺(tái)輸入命令序列:burnP6 || echo $? &。處理器處于滿負(fù)載狀態(tài),所以如果現(xiàn)在你在控制臺(tái)上運(yùn)行top命令,顯示各個(gè)進(jìn)程使用系統(tǒng)資源的百分比,burnP6始終會(huì)出現(xiàn)在列表頂部,***性的處理器負(fù)載遠(yuǎn)高于95%。
StressLinux在負(fù)載狀態(tài)下,幾乎實(shí)時(shí)監(jiān)測(cè)你系統(tǒng)的散熱性能,顯示相關(guān)信息,只需使用從F10到F12的組合鍵。
鍵盤(pán)快捷鍵Ctrl+Alt+F12可為你顯示系統(tǒng)上所有傳感器的當(dāng)前溫度,并顯示風(fēng)扇轉(zhuǎn)速。附近是處理器溫度顯示畫(huà)面,該畫(huà)面還表明了允許的***工作溫度。如果畫(huà)面顯示傳感器溫度在很短時(shí)間后突然上升,較高的風(fēng)扇轉(zhuǎn)速對(duì)傳感器記錄的熱量增聚沒(méi)有任何影響,***檢查一下散熱系統(tǒng)。對(duì)處理器的散熱部件來(lái)說(shuō)尤其如此,原因在于處理器正上方、一段時(shí)間后發(fā)干的散熱膏會(huì)充當(dāng)絕熱體,最終給系統(tǒng)造成破壞。
鍵盤(pán)快捷鍵Ctrl+Alt+F11顯示存儲(chǔ)設(shè)備的當(dāng)前溫度。在滿負(fù)載狀態(tài)下,即便長(zhǎng)時(shí)間接受壓力測(cè)試后,硬盤(pán)的工作溫度也應(yīng)該不會(huì)升到50攝氏度以上,要不然,你可能會(huì)遇到數(shù)據(jù)丟失或損壞。
按Ctrl+Alt+F10組合鍵會(huì)以圖形化方式顯示網(wǎng)絡(luò)吞吐量;只有eth0接口受到監(jiān)測(cè)。該畫(huà)面對(duì)處理器和芯片組測(cè)試來(lái)說(shuō)仍處于不活躍狀態(tài)。
3.系統(tǒng)測(cè)試
輸入stress命令可開(kāi)始更全面的系統(tǒng)測(cè)試;除了處理器外,它還檢查內(nèi)存接口、內(nèi)存,必要的話,還可檢查存儲(chǔ)設(shè)備。由于該測(cè)試套件有數(shù)量眾多的參數(shù)(每個(gè)例行程序都可以調(diào)整),應(yīng)該先運(yùn)行stress --help,大致了解可能適用的選項(xiàng)。為了使測(cè)試自動(dòng)化,又不讓系統(tǒng)長(zhǎng)時(shí)間處于過(guò)載狀態(tài),你可以為壓力測(cè)試運(yùn)行設(shè)定時(shí)間限制。
4.存儲(chǔ)
硬盤(pán)變舊后,它們常常成為系統(tǒng)的薄弱部件;技術(shù)瑕疵引起數(shù)據(jù)丟失會(huì)帶來(lái)致命影響。StressLinux用兩個(gè)工具:bonnie++和smartctl檢查硬盤(pán)的健康狀態(tài)。Bonnie++這款工具用來(lái)對(duì)存儲(chǔ)介質(zhì)進(jìn)行基準(zhǔn)測(cè)試,而Smartctl支持測(cè)試運(yùn)行,并顯示硬盤(pán)的當(dāng)前技術(shù)狀況。想開(kāi)始使用這款實(shí)用工具,你必須是StressLinux根用戶或同等權(quán)限的用戶。在輸入根密碼stresslinux后,su – 命令為你提供了根權(quán)限。
如果你運(yùn)行這個(gè)命令:smartctl -a <drivename> | more
看到錯(cuò)誤日志中的一些數(shù)據(jù),應(yīng)該至少備份最重要的文件。如果你想執(zhí)行另外一些測(cè)試,輸入smartctl --help會(huì)列出一系列全面的參數(shù)以及幾個(gè)例子(見(jiàn)圖3)。
圖3:Smartctl可以顯示關(guān)于你存儲(chǔ)設(shè)備的所有細(xì)節(jié)。
5.網(wǎng)絡(luò)
為了測(cè)試網(wǎng)絡(luò)接口的吞吐量,StressLinux提供了netio程序,該程序可測(cè)量?jī)膳_(tái)計(jì)算機(jī)之間(一臺(tái)計(jì)算機(jī)充當(dāng)服務(wù)器)的數(shù)據(jù)傳輸速度。
Live模式下在兩臺(tái)計(jì)算機(jī)上都啟動(dòng)StressLinux后,你可以在服務(wù)器上使用命令netio -s,啟動(dòng)該程序,然后在客戶機(jī)上,輸入:netio <server IP address>,StressLinux會(huì)以列表形式顯示數(shù)據(jù)吞吐量,數(shù)據(jù)包大小不一。另外,你可以使用Ctrl+Alt+F10,顯示傳輸速度的條形圖。
結(jié)束語(yǔ)
StressLinux是一款實(shí)用的工具,可以對(duì)你的硬件進(jìn)行全面的測(cè)試。這款軟件沒(méi)有花哨的圖形元素,但是確實(shí)要求用戶對(duì)命令行有一番了解。
StressLinux(http://www.stresslinux.org/sl/downloads)基于openSUSE 11.4和BusyBox,這是一個(gè)200MB或225MB大小的ISO映像文件,適用于64位或32位架構(gòu)。另外的版本可結(jié)合USB存儲(chǔ)介質(zhì)使用,或在虛擬機(jī)中使用。你在項(xiàng)目官方網(wǎng)站(http://www.stresslinux.org/sl/wiki/Documentation)很容易找到通俗易懂的說(shuō)明文檔,以便制作可引導(dǎo)介質(zhì)。
對(duì)于專業(yè)的PC用戶和IT工程師來(lái)說(shuō),StressLinux是一款必不可少的工具,可用于診斷硬件問(wèn)題,因而是每只工具箱的必備利器。
原文標(biāo)題:Hardware Stress Testing with Linux
作者:Erik Bärwaldt
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】