系統管理員核對表:每年要執行的10項任務
譯文【51CTO.com快譯】系統管理員的任務是對員工/用戶的計算設備進行日常的管理和維護,無論它們是直接連接到局域網的獨立計算機、遠程辦公人員的移動設備還是通過公共無線網絡或特別可疑的熱點連接到廣域網的大批平板電腦和智能手機。
新年伊始是確保所有系統井然有序的好時機。下面是確保你的系統為2020年做好準備需要做的10項任務。
1.驗證災難恢復計劃有效
災難恢復計劃有效,是不是?這個觀念常被人提及,但真正的考驗是災難響應。如果災難恢復計劃不管用,重大事件發生之前仍有時間加以糾正。如果沒有實施有效的災難恢復計劃,一切無從談起。
2.進行操作系統升級
鑒于有大量應用軟件可供使用,這是要執行的最簡單的任務之一。移動設備或通過不太理想的連接進行通信的設備需要多花一點精力才能成功完成升級。新的一年為你的用戶提供新系統會使他們的勁頭大一點。
3.為設備安排維修,訂購更換部件
安排維修時間或者為出故障的部件或很可能出故障的部件訂購替換部件將為你節省時間。
一些服務合同規定了供應商上門評估設備并確定是否存在任何問題——這有點像認證機修工對發動機進行檢查。如果發現問題,供應商常可以在IT人員很少參與的情況下幫助迅速有效地維修這些設備,使IT人員騰出時間專注于其他任務。
4.檢查服務器的健康狀況和性能
類似上面第三點但更重要的是,對提供企業使用的服務的服務器執行健康狀況檢查。要檢查的主要是與潛在硬件故障、服務丟失和資源利用率有關的警報。后者尤其容易出現在根據物理服務器來配置資源的虛擬化環境,從而導致閑置資源常常配置過度。
與這種情況相反的是,服務器缺少資源,因而無法穩定運行。資源太多或太少只有一個結果:一些服務器未正確配置,因而未處于最佳狀態下運行。
5.進行預防性維護
有些任務你可能太忙顧不上,或者覺得不需要你親自操心,預防性維護就是這樣的任務。比如,用一罐壓縮空氣清潔計算機以防止灰塵堆積,使用專門的清潔劑對鍵盤鼠標進行除塵,以提高功能和使用壽命。不管怎樣,各個級別的許多人可以執行許多預防性維護任務,這種維護可以延長設備的使用壽命。
6.更新許可協議
這似乎是另一項乏味的任務,卻是是與IT相關的重要任務。如果不加控制,許可證管理會嚴重影響公司的底線。開發人員喜歡使用其軟件帶來經濟利益,任何違規行為都可能導致巨額罰款。
進行盡職調查以評估所有設備上的當前和預計使用情況,包括基于CPU數量為虛擬化實例制定有時棘手的許可結構,這只是表面上的工作。別忘了操作系統升級和設備的支持協議,包括固件更新等方面。更新后的許可記錄清單還可以更好地管理未來的IT資金,如果通過虛擬化整合服務器和客戶端桌面可以降低許可費、節省資金(省下來的錢可重新用于其他支出),更是如此。
7.確保監控工具已更新
占用空間越大,企業組織使用某種監控工具的可能性越大。無論是基于許可證還是開源,用于監控和管理用戶的服務器和工作站都應定期更新,以求最大程度的保護和穩定性。沒有哪個時段比現在更適合執行這些任務了,以驗證所有管理系統已經過優化、有效運行。
8.清點硬件、報告系統健康狀況
一份簡潔的硬件清單可幫助IT人員了解系統所在的位置,而系統健康狀況檢查有助于確定這些節點的狀態,它們是缺少任何更新還是需要調優或更換硬件。
9.分析日志輸出結果以找出隱藏問題
所有設備都會生成日志,IT人員不可能逐條閱讀每臺設備上生成的每條日志,否則什么工作都干不了。幸好我們有syslog服務器,其任務就是將所有這些日志關聯到一個集中的位置,對逐條日志進行整理組織,確定哪些日志很重要,因此應立即采取行動,哪些日志可以晚點響應。
從日志文件收集的信息還可以讓IT人員知道在新的一年如何著手工作。如果結合其他類型的報告,就能更全面地了解網絡,進而了解未來要側重的管理任務和要開展的項目。
10.執行補丁和變更管理
這是不二的選擇。補丁管理、更新、熱修復都必須定期執行,并在受控制的范圍內進行。這在大公司可能很棘手,因為先要在一段確定的時間內測試補丁,然后才能部署到整個生產環境中。這會給最終用戶造成服務停運。
始終進行徹底的測試,確認已在所有設備上打上補丁。還應該附上詳細的變更管理文檔,以識別和跟蹤回歸測試時出現的變更,或者以便在后續修補程序管理期間注明未來的問題。
原文標題:Systems admins checklist: 10 tasks to perform every year,作者:Jesus Vigo
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】