做好運維管理你準備好了嗎?
本文轉載自微信公眾號「新鈦云服」,作者秦鳴 。轉載本文請聯系新鈦云服公眾號。
運維管理思考
首先,我們要思考下:
- 運維管理要做些什么?
- 如何管好運維人員?
- 如何和不同部門的負責人打交道?
- 如何對運維工作進行規劃?
- 做了運維管理還要不要學習技術?
......
如果你已經在做運維管理工作或是正想往運維管理方向發展,那么請搬上板凳,帶好瓜子聽我娓娓道來。我能給出一些個人的建議,讓你在運維管理的道路上少走彎路。如有問題也可以在留言區進行留言,大家一起討論共同進步。
運維管理要做些什么
如果一名從基層做到管理崗位的運維人員,通常不知道自己該怎么做。往往還是會去處理各種運維操作,把分配任務當成了運維的管理。其實不然,運維管理工作并非如此簡單。需要做的事情也不少,以下我列出運維管理工作中常用部分:
- 對底下運維人員進行管理,合理分配工作
- 制定運維和開發人員的規范
- 和各個部門的負責人搞好關系
- 和供應商打交道合理利用供應商為自己解決問題
- 對運維工作進行按月、季度、年的規劃
- 制定下屬培訓計劃,讓下屬更快成長,能獨立承擔更多的任務,這樣我們才能解放雙手把更多的精力投入到管理工作中去
- 自我學習,避免被淘汰
每一項都可以展開細分,下面我就對這些工作進行一個細分解說。
運維人員的管理
根據不同運維人員要有不同的管理方法和手段,當然也有一些通用的管理。我先說下通用的管理。
- 按季度制定合理的OKR,必要的考核是需要的
- 選擇合適的工具進行員工日報記錄,否則底下的人每天在干些什么你都不知道。但只要記錄一些耗時較長或運維項目相關的工作,瑣碎的事不要記錄會給運維人員帶來極大的反感
- 制定賞罰分明的考核制度,讓運維人員工作更有動力。比如周末突發事件處理超過1小時的給予處理人獎勵,但前提這個事故并非運維操作失誤導致。
針對不同的人員管理就需要不同的管理方式。
聽話的
這種類型的運維人員比較好管理,唯一需要注意的是不要讓他覺得不公平。做的比別人多拿的錢都一樣甚至更少。所以在分配工作任務時要盡可能的公平合理。
技術牛逼的
這類人往往對自己的發展有目標和方向,不喜歡得過且過,盡可能將有難度的工作分配給他,重復的勞動盡可能的少。
技術牛逼但不服管教的
這類人如果在試用期就發現就盡快勸他離職,因為他可能只會關注自己喜歡的技術領域工作,不愿意接受你分配的覺得對自己沒啥成長的工作。雖然技術可能很牛逼,但對你和團隊可能幫助并不大。無法幫助團隊的人要當機立斷及早勸退。否則之后苦的只能是自己。筆者在這方面有過慘痛經歷說多了都是淚。
做事情不行的
這里面又分為兩種,一種是不愿意加班的一種是經常做錯事讓你擦屁股的。這兩種毫無疑問都要及早勸退,否則你就等著每天幫人家擦屁股吧。
制定運維和開發人員的規范
上面說的工作日報、考核制度其實也是運維規范里的。做好運維規范可以讓團隊內部和對外都更加和諧。對管理者和運維人員自身都是有幫助的。除了上面說的工作日報和考核制度運維規范外,還需要制定如下一些規范:
- 事故處理的流程
- 發布的流程
- 應急響應的流程規范
- 考勤的規范
......
對于開發人員的規范也是很重要的,做好開發人員規范可以極大的避免出現生產事故。
- 日志規范
- 配置規范
- 數據庫使用規范
- Redis緩存使用規范
......
開發人員的規范需要開會討論得到各部門負責人的認可后才推行下去,找大領導強推也是一種方式,但這個是沒辦法中的辦法。
如何和不同部門的負責人打交道
運維管理不僅要管好自己下面的人還要和不同部門的負責人搞好關系。這對自己和整個部門都是有好處的。在規范的推動和減少事故甩鍋方面都會有所幫助。那怎么和各個部門的負責人打交道呢?這個每個人都有不同的辦法,但人與人相處無非是下面幾種:
- 一有空就找個部門負責人吹水增進彼此的感情
- 偶爾一起吃個飯
- 遇到事故發生后別急著互相推諉,而是把問題分析清楚,是運維占的比重高就攬下來,不是的話就把原因和部門負責人說清楚由質量部門或大領導裁決。
其實這塊是門學問,但最終的目的都是一致的,那就是保障生產業務的穩定運行。所以在和各部門負責人打交道的時候盡量圍繞這個主題做文章,盡可能的把一些事故扼殺在搖籃里。
如何利用供應商這個資源為公司解決問題
有些運維人員不喜歡和供應商打交道,要么是為了省錢,要么就是怕供應商的服務和產品出問題被領導說。其實大可不必如此擔憂,搞好供應商關系可能會幫助你解決很多業務方面的痛點,而且費用比招個人來的更便宜。比如你招一個Kubernetes相關的專業運維人員來做業務容器化,可能費用上會花費3-5萬不等,還不一定能做好,畢竟一個人的能力是有限的,就算做好了整個容器化平臺后續沒有新的項目可能會造成人力資源的閑置。而供應商背后是一個技術團隊能夠快速的幫助我們構建成熟的容器化平臺,按項目制付費,這不香嗎?
以下插播一條廣告:
新鈦云服是優秀的Cloud MSP,可以為客戶提供云服務、監控服務、安全服務、混合云管理平臺TiOps、私有云平臺TiStack、以及公有云、IDC機房、SD-WAN這些資源。
廣告插播完畢,有需要詳細了解的請留言。
對運維工作進行按月、季度、年的規劃
運維工作其實有很多方面是需要做規劃的,否則很多運維工作中的不足無法得到改善或變得推進異常緩慢。一般要做如下一些方面的規劃:
- CI/CD流程規劃
- 監控體系搭建規劃
- 日志查詢和告警平臺搭建規劃
- 業務容器化規劃
- 災備規劃
......
因為運維涉及的面很廣所以要做的事情非常多,及早做好各方面的規劃是非常有必要的。
制定下屬培訓計劃
下屬成長的越快,在你身上的擔子就會越輕,就算有一天下屬離開了這個公司也會感激你對他的培養。制定培訓計劃要結合工作中需求來,最好是工作中能用到的,且大部分人都不會的,如果其中有人會就讓這個人來培訓并留下相關技術文檔入庫。如果沒有人會大家都很有興趣,作為管理者應該利用閑暇時間自己學會了再教下屬。因為一個管理能力強技術也強能在關鍵時刻站出來解決問題的管理人員才能另下屬心服口服。
除了定期培訓外還應該和公司申請買一些書和教學視頻供大家學習成長。
自我學習,避免被淘汰
不要小看這一點,這個也非常重要,現在運維大部分在互聯網企業,互聯網企業成長快,但倒起來也非常快。如果你不進行自我學習,可能工作都找不到。這絕不是危言聳聽。運維的壽命很短很足球職業運動員差不多,一般到了35歲就沒人要了,不管你能力強不強,運維管理崗位可以做的更久,但運維管理崗位相對較少且對技術也有極高的要求,做運維管理是沒辦法把技術扔掉的。特別是現在疫情期間失業的人較多,跟你競爭的人多,公司HR就要挑挑揀揀了。如果這個時候你無法在技術上打動對方的可能就會失去好的工作機會。所以做了運維管理并不能放棄技術學習,要緊跟技術潮流不斷學習,在管理上也要不斷學習。做到哪怕有一天失業了你也不怕找不到工作。
總結
運維管理是一門學問,需要大家自己不斷總結積累。好的管理不但能另自己成長也能讓公司受益。文中描述如有不同意見歡迎大家留言與我討論。