三招為AIOps落地開個好頭
面對激烈的市場競爭,企業意識到必須在業務與IT之間建立一條通暢的“紐帶”。作為制定企業發展規劃與戰略路線的兩大支柱,IT部門應當成為業務部門的重要合作伙伴與助力。
IT部門的誕生與早期的大型機同步,當時其基本作用僅限于“速度與饋送”。但在之后的發展過程中,開明的CIO們開始與業務負責人主動合作,著力思考運營指標對下游業務的實際影響。這種將生態系統可觀察性及運營指標、同業務成果關聯起來的能力,不僅代表著明確的競爭優勢,同時也是企業實現轉型與快速創新的必要條件。
但說起來簡單,我們該如何一步步邁向這個終極目標?
目前衡量IT績效的方法主要分兩種:效率與效能。效率衡量的是IT性能,通常以速度、可用性與吞吐量為指標。另一方面,效能表達的則是IT部門對于業務產出的影響能力。很明顯,業務部門更熟悉效能這類指標,具體涵蓋可用性、客戶滿意度、客戶轉化率與財務指標等等。誰能達成這些目標,誰就能維持高于市場平均水平的增長率、為股東提供價值并為客戶提供助力。
傳奇大師Peter Drucker在暢銷書《卓有成效的管理者》當中,解釋了效率與效能之間的區別。雖然他的結論誕生于1966年,但仍然經受住了時間的考驗。Drucker認為,二者可以分別理解為“把事做對”和“做對的事”。以CIO職能為例,把事做對最重要,而做對的事代表設定正確的目標以推動業務發展,屬于達成目標的一種前提性思考。
事實證明,IT價值往往在預算與人員配備方面有所體現。在解釋價值的過程中,CIO其實是在證明自己如何理解系統、服務/應用乃至客戶群體對業務成果所產生的直接影響——例如客戶轉化、凈推薦值(NPS)所量化的客戶忠誠度,以及最終收入與盈利能力。他們可以在服務與客戶的背景之下,證明IT支出的合理性。以此為前提,我們快速梳理一下哪些指標無法證明IT價值,而哪些能夠準確體現IT的回報。
IT管理中經常會用到正常運行時間與服務水平協議(SLA)等指標,但這些顯然與高管層無關。相反,更具意義的IT指標應該指向創新與擴展能力,例如新服務發布時間(TTNS)等指標。另一個重要指標,則是證明IT方案應對變更的能力。如今,敏捷企業已經將數字化服務納入日常運營當中。過度頻繁的變更與創新往往導致服務故障,并嚴重影響客戶體驗。一旦受到影響,客戶很可能削減采購數額甚至考慮轉向新的服務商。面對這類問題,IT需要在故障響應速度與創新發布速度之間取得平衡點。理想情況下,IT部門應該在客戶受到實際影響之前檢測并響應故障。雖然IT無法徹底消滅故障,但往往能夠率先識別到問題的存在、并運用知識預防潛在的嚴重后果。
為了提升這種效能,現代CIO開始采用AIOps。AIOps是指將人工智能與IT運營整合起來,具體涵蓋大數據分析、機器學習(ML)以及其他各類人工智能(AI)技術,借此自動識別并解決常見的IT問題。舉例來說,IT人員可以使用AIOps衡量變更操作引發意外事件的頻率,并將事件與特定客戶群體關聯起來。IT團隊還可以進行假設性分析,甚至在客戶遭遇實際故障前自動完成響應。通過這種前瞻性的識別與應對能力,AIOps即可防范后續發生類似故障、改善IT指標。這種主動管理能力不僅可以改善客戶體驗,同時也可通過NPS進行效果量化。最終,運營成本將由此降低、客戶更樂于接受新服務,同時也保證技術措施更易被高層管理人員所理解及接納。
效率與效能,可以說是CIO職能定位的核心。要想與業務部門開展良好合作,CIO必須立足特定時間段判斷哪些內容對業務更為重要,而后據此注入資源以確保IT體系擁有必要的技術與人才。只有將IT與業務部門的優先級事務統一起來,雙方才能真正建立合作關系、保證CIO“做對的事”。結合實踐,我們發現以下三個步驟可以作為企業探索AIOps的理想起點:
• 打好第一仗:清點您的系統與流程,找到其中重復、笨拙且效率低下的系統流程。消除及簡化這類流程,可幫助您提高業務效率。
• 關注正確數據:很多數據與業務并沒有什么關聯。因此,請保證只記錄最具價值的用例以及最值得解決的問題,而后判斷解決過程需要哪些數據。這項實踐的意義,在于引導我們將精力集中在正確的數據身上。
• 繪制生態系統圖:明確整個企業生態系統中的各跨職能團隊。通過這份系統圖,我們可以明確誰需要參與協作,而后據此匯總數據以訓練模型。
希望這三項提示,能幫助大家成功邁出AIOps探索之旅的第一步。