談AT&T關于數據科學與自動化的集體探索
相信大家都有體會,如果一個組織想要通過數據和技術推動自身轉型,那么單靠技術專家并不足以達成目標。其他“業余選手”或者說非專業人員,也必須參與到應用程序開發、數據解析和自動化工作流程當中。不少企業都在這種探索中做出了自己的嘗試,而AT&T顯然更擅長發掘全員能力,借集體之力應對數據科學與自動化議題。
這樣的思路來自一個殘酷的事實——任何組織都不具備充足的專業數據科學家和自動化專家,也就無法完成成功轉型所需要的一切分析與AI工作。AT&T公司首席數據官Andy Markus表示,這家電信巨頭正努力將AI與自動化嵌入其業務核心。在2022年初剝離了WarnerMedia之后,AT&T不再擁有娛樂業務屬性、成為純電信企業,并掌握著豐富的數據和有能力提取信息洞察的人才。也許集體探索并不適合每一家公司,但無疑非常適合AT&T。除了幾百名專業數據科學家和自動化專家之外,AT&T麾下還擁有更多普通開發人員。
數據科學的大眾化普及
AT&T向來有著以數據為中心的企業文化,公司一直努力促進員工使用機器學習模型開展數據分析。AT&T的數據科學、AI與自動化主管Mark Austin在采訪中表示,公司目標是支持機器學習管線中的各個方面,包括尋找合適數據、獲取數據、對數據開展工程設計以建立所需功能、創建模型、將模型部署至生產環境、隨時間推移監控模型性能,并有效實施模型管理。與大多數企業一樣,前三項內容基
本就要占去開發人員80%的工作時間,而AT&T正努力降低這一百分比。
為此,AT&T與AI云平臺服務商H2O.ai合作,為常用源數據與派生數據建立起特征“商店”,借此減少極為耗時的數據整理需求。數據科學專家和業余選手們都對它的效果贊不絕口。特征商店上線不到一年,已經向專業和業余數據用戶們開放了超26000種特征。此外,數據科學模型往往還匹配Pinnacle項目,即一種類似于Kaggle的內部競賽眾包方案。Austin解釋稱,這種競賽機制往往能讓模型性能平均提升近30%。該流程不僅涉及一系列眾包autoML解決方案,同時也結合了AT&T數百名數據科學家與工程師的創新算法與集成。
自動化的大眾化普及
AT&T早在2015年起,就開始通過機器人流程自動化技術推動業務自動化。從那時起,公司已經將3000多個機器人投入生產環境。經過首年實驗,AT&T建立起首個自動化卓越中心(ACoE),目前在該中心內部署了20名全職員工和多位承包商。但如果沒有普通員工的積極參與,該公司的自動化探索絕不可能迅速擴大規模。Austin悉心跟進每個項目,并驚喜地發現高達92%的機器人流程自動化實施出現在卓越中心以外。
隨著時間推移,流程自動化為AT&T創造了巨大價值。Austin表示,機器人實施方案間的靈活組合每年省下約1700萬分鐘的手動操作,產生了數億美元的年均收益,實現了高達20倍的投入回報比。
分析與AI也是Austin的分管項目,他也熱切期待將機器學習與AI功能整合到機器人流程自動化中的機會。他的團隊已經建立起多個機器人流程自動化實現,涵蓋自然語言處理、光學字符識別(OCR)和基于機器學習的決策制定等。喜歡把“智能自動化”掛在嘴邊的企業不少,但AT&T是少數能真正實現這個目標的公司之一。
培養員工技術能力
AT&T已經意識到,數據科學與自動化開發的集體探索離不開必要的技術能力與資源支持。在數據科學方面,該公司開發出廣泛的技術基礎設施,幫助專業和業余參與者們加入自動化機器學習的研究隊伍。其中包含以下功能:
? 同時使用多達七種不同autoML工具,并在各工具間開展競賽以觀察哪個選項能創建出質量最高的模型;
? 部分autoML工具能夠直接參與入選模型的生產部署;
? 可通過機器學習對各類可復用數據集進行分析;
? 提供一款直觀的語義搜索工具,例如返回所有“與流失相關的特征”;
? 提供機器學習與運營工具“Watchtower for MLOps+”,其不僅能監控數據和AI(傳統上被稱為MLOps),同時也能跟蹤整個業務管線中的全部活動集合(應用程序、API調用等)。
在技術自動化方面,AT&T采用的是微軟Power Automate作為工具基準,大大降低了全民參與的門檻。這款工具可以同Microsoft Office工具、PowerBI甚至是Azure機器學習模型相集成。AT&T還維護有“Bot Marketplace”機器人市場,普通員工可以從中選擇已開發完成的自動化解決方案,必要時還能從自動化卓越中心處獲取配置指導。每個月,市場上都會新增約75種可復用的自動化組件。
培養人的能力
AT&T也在積極推動社區建設,關注數據科學與自動化集體探索的人力基礎。在數據科學方面,公司建立起“AI大眾化論壇”,每周組織一次線上演示,并就特定問題分享解決思路、向與會者公布已經開發的功能。這項活動每周吸引到約200名員工,其中大部分并非專業數據科學家,很多人甚至根本不懂編碼。AT&T還整理出一套涵蓋數據科學各個方面的線上培訓材料,共有575門課程可供選擇,同時面向各種供應商工具提供官方認證。
自動化社區的建設工作,主要是為想要參與的員工們提供40小時的培訓課程。此外,自動化卓越中心每年舉辦一次“自動化峰會”,供公司內部團隊展示和分享自己的自動化項目。
目前,部分企業和專業AI開發者仍對普通參與者在模型構建和自動化解決方案中的作用持懷疑態度。但AT&T用實際行動證明,只要為普通員工提供正確的工具和資源,就一定能建立起可行性、創造經濟價值。面對供不應求的數據科學與自動化勞動力市場,AT&T證明精心規劃的引導策略完全可以培養替代人才來彌補這一缺口。