云智慧CTO張博:從實驗室到用戶桌面,AI 落地實踐之路
2022年8月6日-7日,AISummit 全球人工智能技術大會如期舉辦。在7日下午舉辦的《AI賦能產業實踐》分論壇上,帶來了《從實驗室到用戶桌面,AI 落地實踐之路》的主題分享。
近些年來,AI在各行各業得到廣泛應用,推動了各行業的智能化,大幅提升了管理水平和決策能力,其中也包括IT行業。將AI應用于IT運維,也就是AIOps,就是AI在IT行業里面的應用熱點。因此,如何高效運維也成為IT部門乃至CIO必須面對的問題。
在主題為《從實驗室到用戶桌面,AI 落地實踐之路》分享中, 云智慧CTO張博指出,在指標、日志和調用鏈這些數據中加入Algorithm算法,就是AIOps的場景。在本次分享中,張博帶來了AI 2B行業智能運維相關分享,將AI算法如何與行業進行適配并落地以及AI工程化如何進行行業適配與落地進行了講解,同時分享了企業開發技術在行業的實踐案例。
AI ToB是最好的時代也是最壞的時代
所謂AI ToB,就是面向企業服務的AI應用與服務。與AI ToC 三大件:搜索、廣告和推薦的根本區別在于,AI ToB 是面向智慧醫療、智能城市、智能運維......往往沒有well-defined問題,定義問題就是一大挑戰。張博表示,AI投資已經進入去泡沫化的階段,AI已經進入應用期。
Gartner報告指出,中國企業對 AI 具備強烈需求,并且熱衷用 AI 來提高生產率、改善客戶體驗和促進業務增長。這一市場需求決定了中國具有產業 AI 的肥沃土壤。
張博認為,B端市場對AI的理解更加務實。以數據為基礎、以場景為導向、以算法為支撐,切實落地智能運維,這就是云智慧的基本理念。
在智能運維領域,無論是ServiceNow、DataGog、Splunk,還是Dynatrace等等,在美國出現了千億美金的公司、500億美金的公司以及將近200億美金的公司。因此,B端市場才是AI領域真正的星辰大海。
AI ToB 算法挑戰
一個模型 y = f(x),在ToC場景下,尤其是近幾年算法問題基本確定的情況下,大部分時間在討論的是f(函數)如何優化,一部分時間是在收集x(數據);但y(目標)往往是明確的。在ToB場景下,x、f、y往往都是不確定的,僅僅一句“智能XX”作為輸入。因此,定義問題是AI ToB的第一步,同時也是最具挑戰的一步。
與人工智能、大數據、區塊鏈等等技術體系不同,智能運維并不是一項“全新”的技術,而是一個以智能運維場景為基礎的智能技術應用和融合,剝離開場景單談“智能運維”不具有實際意義,智能運維的核心在于探索智能技術如何轉化、服務、適配運維行業的發展、如何給運維行業帶來解決問題的新思路。
在運維場景下,Peter Bourgon在2017 Distributed Tracing Summit對運維面對的Logging、Metrics、Tracing進行了系統性的闡述,根據其描述,我們將運維的場景分為“一元場景”、“二元場景”、“轉化場景”三個大類。張博表示,運維的一元場景其實特別簡單,就是指標、日志、告警和調用鏈的四大數據源。
一元場景包括指標、日志和追蹤三個部分:指標是可聚合的邏輯計量單元,日志是對離散的不連續的事件的一種記錄,追蹤是單次請求范圍內的所有信息,即調用鏈信息。
所謂二元場景,就是指標+調用鏈。當業務崩掉之后,一旦有了指標和調用關系,就能進行一些基于指標的根因分析等等。在上圖中三個圓之間產生了兩兩之間的交集,我們把它稱之為改革二元場景。
張博表示,在解決AI to B問題時,只要把場景理解好,就能夠把要賦能的行業做到很好的理解。因此,智能運維就是圍繞著指標/日志/追蹤/告警四要素及其轉化的AI使能。所以,運維場景+智能技術,稱之為智能運維:AIOps。
在接下來的時間里,張博詳細分享了GAIA-Dataset Tasks的相關技術內容,同時解讀了AI ToB工程化挑戰,感興趣的可以觀看視頻回看,了解更加詳細的技術分享內容。
行業實踐與總結
在分享的最后環節,張博還結合云智慧研究院的工作,介紹了一些實踐案例。
在智能運維算法平臺助力某銀行客戶海量指標實時異常發現的案例中,利用云智慧的智能運維,實現了變更自學習、趨勢自適應、趨勢+變更自學習、跑批自適應、周期自學習、周期+趨勢自適應、忙閑時自學習、擴展至物理世界指標等能力,很好的幫助客戶實時發現海量的指標異常數據,簡化了客戶的運維難度。
除此之外,張博還詳細介紹了智能運維算法平臺助力某運營商日志異常發現和智能運維算法平臺助力某銀行客戶交易業務根因分析兩大案例。
張博表示,AI to B是一個既要Algorithm能力,又要落地,又以效果看成敗的特別有趣的行業,擁有整個Algorithm、整個算法的星辰大海,需要大家一起去挖掘深度學習、機器學習等等一些技術,真正賦能產業變革。?