使用自動化時的五個常見錯誤
隨著自動化擴展到涵蓋 IT 的更多方面,越來越多的管理員正在學習自動化技能并應用它們來減輕他們的工作量。自動化可以減輕重復性任務的負擔,并為基礎設施增加一定程度的一致性。但是,當 IT 工作人員部署自動化時,會出現可能對大大小小的基礎設施造成嚴重破壞的常見錯誤。在自動化部署中通常會出現五個常見錯誤。
缺乏測試
初學者常犯的錯誤是自動化腳本沒有經過全面測試。由于拼寫錯誤或邏輯錯誤,簡單的 shell 腳本可能會對服務器產生不利影響。將該錯誤乘以基礎架構中的服務器數量,你可能會遇到一大堆問題需要清理。在大規模部署之前始終測試你的自動化腳本。
意外負載
經常發生的第二個錯誤是沒有預測腳本可能對其他資源施加的系統負載。當目標是十幾個服務器時,運行從倉庫下載文件或安裝包的腳本可能沒問題。腳本通常在成百上千臺服務器上運行。這種負載可以使支持服務停止或完全崩潰。不要忘記考慮端點影響或設置合理的并發率。
離開腳本
自動化工具的一種用途是確保符合標準設置。自動化可以輕松確保組中的每臺服務器都具有完全相同的設置。如果該組中的服務器需要根據該基線進行更改,同時管理員不了解合規標準,那么可能會出現問題。安裝和啟用不需要和不想要的服務,從而導致可能的安全問題。
缺乏文檔
管理員的一項固定職責應該是記錄他們的工作。由于合同到期、升職或定期員工流動,公司可能會在 IT 部門頻繁招聘新員工。公司內的工作組相互隔離也很常見。由于這些原因,重要的是記錄哪些自動化已經到位。與用戶運行腳本不同,自動化可能會在創建它的人離開組之后繼續很長時間。管理員可能會發現自己在其基礎設施中面臨著來自未經檢查的自動化的奇怪行為。
缺乏經驗
列表中的最后一個錯誤是管理員對他們正在自動化的系統不夠了解。管理員經常被雇用到他們沒有接受過足夠培訓且沒有人可以求教的職位上工作。自 COVID 以來,當公司努力填補空缺時,這一點尤其重要。然后管理員被迫處理他們沒有設置并且可能不完全理解的基礎設施。這可能會導致非常低效的腳本浪費資源或配置錯誤的服務器。
結論
越來越多的管理員正在學習自動化來幫助他們完成日常任務。因此,自動化正被應用于更多的技術領域。希望此列表將有助于防止新用戶犯這些錯誤,并敦促經驗豐富的管理員重新評估他們的 IT 策略。自動化旨在減輕重復性任務的負擔,而不是為最終用戶帶來更多工作。