華為云地協(xié)同加速網(wǎng)絡(luò)AI規(guī)模商用,使能實現(xiàn)自動駕駛網(wǎng)絡(luò)
原創(chuàng)【51CTO.com原創(chuàng)稿件】2020年9月23日,以“共創(chuàng)行業(yè)新價值”為主題的華為全聯(lián)接2020在上海隆重舉辦。25日在大會媒體圓桌現(xiàn)場,華為正式發(fā)布了《華為網(wǎng)絡(luò)人工智能引擎 iMaster NAIE 白皮書》,使能自動駕駛網(wǎng)絡(luò)。自2019年4月上線華為云以來,iMaster NAIE 網(wǎng)絡(luò)人工智能引擎(簡稱NAIE)在電信行業(yè)得到了豐富的實踐機會,此次白皮書的發(fā)布,是華為在網(wǎng)絡(luò)全云化基礎(chǔ)上將AI 技術(shù)引入到電信網(wǎng)絡(luò)中的一次實力展示,也是華為幫助電信領(lǐng)域提升網(wǎng)絡(luò)效率,降低運營成本,向自動駕駛網(wǎng)絡(luò)演進過程中邁下的扎實一步。
華為網(wǎng)絡(luò)人工智能(NAIE)產(chǎn)品部總經(jīng)理韓雨發(fā)現(xiàn)場介紹《華為網(wǎng)絡(luò)人工智能引擎 iMaster NAIE 白皮書》
運營商AI特性規(guī)模應(yīng)用挑戰(zhàn)重重
在本次發(fā)布的白皮書中,有一部分內(nèi)容引起了電信運營商的特別關(guān)注,那就是華為云地協(xié)同解決方案,它解決了AI應(yīng)用在規(guī)模復制過程中碰到的關(guān)鍵問題。
眾所周知,電信行業(yè)一直是AI應(yīng)用的前沿陣地。實踐也證明了,AI技術(shù)在運維效率、能耗效率、網(wǎng)絡(luò)資源利用率以及用戶業(yè)務(wù)體驗提升等方面確實能夠帶來明顯價值。但在電信行業(yè)智能化升級過程中,網(wǎng)絡(luò) AI 的規(guī)?;こ虘?yīng)用仍然存在很多挑戰(zhàn),例如模型泛化能力差、模型重訓練占用資源多、模型版本升級管理難度大、本地樣本少并且模型精度不夠等問題。
以AI模型版本升級管理為例,很多場景的AI模型都是一站一模型,例如無線流量預(yù)測、無線基站智能節(jié)能等場景,各站點的模型都根據(jù)本地化數(shù)據(jù)進行定制化訓練。但由于各局點模型版本不同,升級頻度也不同,成千上萬的站點模型導致管理難度很大。電信運營商迫切需要有一個統(tǒng)一的平臺,高效實現(xiàn)模型狀態(tài)的監(jiān)控和版本升級策略等管理任務(wù)。
在站點模型數(shù)量眾多的同時,部分場景又面臨著樣本量太少不足以支撐模型訓練的問題。例如核心網(wǎng)KPI異常檢測,單局點發(fā)生異常頻率很少,訓練需要的樣本量根本不夠。這時電信運營商又需要能夠匯聚所有局點的全量樣本信息,同時輔以聯(lián)邦學習等技術(shù),才能訓練得到滿足業(yè)務(wù)精度要求的AI 模型。除此之外,還面臨AI模型訓練占用資源多有可能會影響設(shè)備性能的隱患。
面對這樣的挑戰(zhàn),華為創(chuàng)新地推出了云地協(xié)同解決方案,可以實現(xiàn)AI特性規(guī)模應(yīng)用,這也是助力運營商邁向自動駕駛網(wǎng)絡(luò)的關(guān)鍵。其中云端是指部署在公有云、合營云或 HCS 上的 NAIE 云端智能,地端則是指集成在網(wǎng)絡(luò)管控單元的網(wǎng)絡(luò) AI、以及網(wǎng)元設(shè)備中的網(wǎng)元 AI。
云地協(xié)同加速 AI 特性規(guī)模應(yīng)用
華為的云地協(xié)同是指在運行態(tài)下,云端、地端協(xié)同完成數(shù)據(jù)樣本上云、模型狀態(tài)管理、模型重訓練、模型/知識下發(fā)、擇優(yōu)更新等系列AI模型任務(wù)。不僅如此,在云端還可以將匯聚全局的網(wǎng)絡(luò)知識經(jīng)驗,以及通過全量數(shù)據(jù)訓練得到的高精度模型,再以協(xié)同形式持續(xù)注入地端,支撐電信網(wǎng)絡(luò)智能迭代,讓網(wǎng)絡(luò)越來越“聰明”。
云地協(xié)同實現(xiàn)架構(gòu)
不妨以電信領(lǐng)域中實際發(fā)生的流程為例來見證一下云地協(xié)同的魅力。當某電信局點 DC PUE 模型三個月不更新后,模型精度開始劣化,下降到 70%。此時地端會在本地進行重訓練,但由于樣本少,資源有限,優(yōu)化效果可能并不明顯。而云端由于匯聚多個局點的樣本數(shù)據(jù),經(jīng)過專家經(jīng)驗處理,會形成高質(zhì)量的模型,于是云端的模型倉庫就會把訓練或優(yōu)化的新模型包推送到地端。地端接收以后,就可以進行實際對比和評估,擇優(yōu)升級。
值得一提的是,目前 NAIE 還可以構(gòu)建 DC 節(jié)能和無線網(wǎng)絡(luò)優(yōu)化等仿真場景。傳統(tǒng)電信網(wǎng)絡(luò)優(yōu)化工作必須要先經(jīng)過仿真系統(tǒng)驗證,但是往往需要一周才能拿到優(yōu)化參數(shù),效率并不高。而如今通過華為云端的仿真系統(tǒng)來驗證,既不會影響現(xiàn)實中網(wǎng)絡(luò)性能,又可以迅速反饋,僅需一天就能反饋優(yōu)化的最佳參數(shù),大大提升了網(wǎng)絡(luò)優(yōu)化的工作效率。
概括而言,云地協(xié)同實現(xiàn)了“一點生效,多點復制”——當AI的特性在一個局點成功實施后,可以快速地形成知識和經(jīng)驗,并在其他局點進行復制,從而實現(xiàn)在全網(wǎng)規(guī)模應(yīng)用。
云地協(xié)同三個發(fā)展階段匹配不同AI場景
據(jù)了解,云地協(xié)同在實際應(yīng)用部署時有三個階段,電信運營商可以針對不同場景選擇自己適合的階段,從而大幅提高網(wǎng)絡(luò)的資源效率。模型相對簡單、算法結(jié)構(gòu)穩(wěn)定,僅需要根據(jù)本地數(shù)據(jù)進行模型參數(shù)優(yōu)化調(diào)整的場景,例如想實現(xiàn)核心網(wǎng)變更在線機器值守,就更適合“云端訓練初始模型+地端重訓練”這一階段;而模型相對復雜,需要華為持續(xù)進行模型算法結(jié)構(gòu)優(yōu)化的場景,例如無線KPI異常檢測選擇“云端模型分發(fā)+地端重訓練”這個階段效果更好;而如果模型復雜,還需要華為在云端高質(zhì)量標注數(shù)據(jù),并利用知識圖譜以及仿真等知識能力進行模型優(yōu)化的場景,就建議選擇“云地實時協(xié)同、模型自動化演進”這個階段了,例如 IP RAN/PTN 智能告警, DC PUE 優(yōu)化等。
那么擁有強大的云地協(xié)同能力的iMaster NAIE究竟能給電信運營商帶來哪些價值呢?在國內(nèi)某運營商省級公司,多網(wǎng)元故障的占比接近 20%,對現(xiàn)網(wǎng)業(yè)務(wù)的影響是單網(wǎng)元故障的 9 倍以上,但是跨界的故障定位難造成運維成本居高不下。華為云地協(xié)同解決方案先通過地端上傳現(xiàn)網(wǎng)告警、拓撲、配置等相關(guān)數(shù)據(jù)到云端,在云端再訓練出故障聚合模型下發(fā)給地端,地端執(zhí)行后,再通過網(wǎng)絡(luò)知識庫建立的故障傳播圖,對故障進行定界,快速找出故障根因,最終完成修復。部署之后,該運營商的故障工單壓縮率提升比例 10%以上,不僅運維人員的派單效率顯著提升,并且還提高問題定位效率。
作為華為自動駕駛網(wǎng)絡(luò)解決方案中的重要智能化部件,iMaster NAIE一直在幫助運營商盡快實現(xiàn)數(shù)字化轉(zhuǎn)型。而云地協(xié)同只是NAIE眾多創(chuàng)新“黑科技”之一,NAIE還提供一站式網(wǎng)絡(luò)AI云服務(wù),讓網(wǎng)絡(luò)AI開發(fā)簡單高效,并通過豐富的NAIE培訓服務(wù),助力運營商人才轉(zhuǎn)型。目前,NAIE已經(jīng)在多個運營商落地,我們相信,不遠的未來,自動駕駛網(wǎng)絡(luò)必將給電信運營商帶來更大的驚喜。
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】