騰訊云副總裁黃俊洪:馭“云原生”之力,驅(qū)動(dòng)產(chǎn)業(yè)互聯(lián)網(wǎng)持續(xù)發(fā)展
原創(chuàng)51CTO讀者成長(zhǎng)計(jì)劃社群招募,咨詢小助手(微信號(hào):TTalkxiaozhuli)
在云計(jì)算發(fā)展的十余年間,企業(yè)對(duì)云計(jì)算的訴求發(fā)生了巨大變化。曾經(jīng),企業(yè)上云更多集中在一些可見的云資源層面,然而隨著上云的不斷深入,很多企業(yè)發(fā)現(xiàn)業(yè)務(wù)數(shù)字化僅靠資源層很難實(shí)現(xiàn),尤其是在以大數(shù)據(jù)甚至大規(guī)模技術(shù)為主導(dǎo)的智能化領(lǐng)域。
如今,無論是傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng)企業(yè),都已從過去的“搬遷上云”轉(zhuǎn)變到了“深度用云”的全新階段。企業(yè)已不再滿足于簡(jiǎn)單地將物理機(jī)轉(zhuǎn)移至虛擬機(jī),而是更希望借助云原生的能力實(shí)現(xiàn)降本增效,云原生已成為了企業(yè)用云標(biāo)準(zhǔn)的新范式。
近日,在 51CTO 與騰訊云 TVP 聯(lián)合主辦的 LeaTech 全球 CTO 領(lǐng)導(dǎo)力峰會(huì)中,51CTO 對(duì)騰訊云副總裁黃俊洪進(jìn)行了專訪。面對(duì)一系列有關(guān)云計(jì)算行業(yè)發(fā)展及云原生實(shí)踐的焦點(diǎn)問題,黃俊洪毫無保留地向 51CTO 分享了諸多自己深刻而獨(dú)到的見解。
1、企業(yè)云原生化改造之道
訪談伊始,黃俊洪便向51CTO介紹了騰訊發(fā)布的云原生改造白皮書,并對(duì)騰訊在企業(yè)云原生改造方面所積累的寶貴經(jīng)驗(yàn)進(jìn)行了分享。據(jù)黃俊洪介紹:騰訊內(nèi)部將企業(yè)云原生改造劃分為4個(gè)主要階段,分別為:開發(fā)云原生、計(jì)算云原生、架構(gòu)云原生以及數(shù)據(jù)云原生。
開發(fā)云原生階段主要解決“企業(yè)研發(fā)運(yùn)維流程效率”問題。企業(yè)組織架構(gòu)、研發(fā)運(yùn)維流程是否符合 DevOps 理念,是否能夠支持對(duì)應(yīng)用進(jìn)行快速迭代、測(cè)試、發(fā)布、試錯(cuò)和優(yōu)化;是否能建設(shè)和使用軟件流程中的工具平臺(tái),提升團(tuán)隊(duì)協(xié)作效率,同時(shí)根據(jù)流程規(guī)范搭建自動(dòng)化平臺(tái),減少人為因素導(dǎo)致的低效或失誤是衡量該階段完成效果的兩個(gè)關(guān)鍵因素。
計(jì)算云原生階段則重點(diǎn)關(guān)注“容器化”、“Serverless 化”兩大關(guān)鍵詞。改造目標(biāo)是降低 IaaS 層的異構(gòu)和差異、資源的部署和調(diào)度的關(guān)注。
架構(gòu)云原生階段需要深入復(fù)雜的軟件架構(gòu)層面,雖然難度較大,但收益非常可觀。在改造過程中,一些成熟的框架服務(wù)的使用,能讓改造事半功倍。例如微服務(wù)平臺(tái)、服務(wù)網(wǎng)格等,它們集成了很多運(yùn)維能力,包括日志、監(jiān)控、服務(wù)注冊(cè)和發(fā)現(xiàn)、故障容災(zāi)等。除了提高研發(fā)效率外,也能提升改造后系統(tǒng)的整體運(yùn)維能力。
而在數(shù)據(jù)云原生階段,企業(yè)的云原生改造已經(jīng)進(jìn)入到深水區(qū),目標(biāo)是將 Kubernetes、Serverless 的技術(shù)和理念應(yīng)用到“數(shù)據(jù)服務(wù)”中,讓“數(shù)據(jù)服務(wù)”也具備極致的彈性伸縮能力,在資源成本上能夠做到最優(yōu)。
黃俊洪表示:任何企業(yè)的轉(zhuǎn)型或改造都不是一蹴而就的,伴隨著企業(yè)數(shù)字化與智能化的不斷深入,未來企業(yè)對(duì)上云的核心訴求也將發(fā)生變化——不再只滿足于簡(jiǎn)單地使用云上的 IaaS 能力,實(shí)體經(jīng)濟(jì)的轉(zhuǎn)型將更需要貼近業(yè)務(wù)的 PaaS 和 SaaS 能力。
例如在政務(wù)領(lǐng)域,結(jié)合更多 AI、大數(shù)據(jù)等能力才能為企業(yè)創(chuàng)造更大價(jià)值;而金融領(lǐng)域則需要構(gòu)建自身的 PaaS 平臺(tái),來快速響應(yīng)客戶的業(yè)務(wù)需求和提升平臺(tái)的開發(fā)效率;工業(yè)領(lǐng)域 PaaS 則能為企業(yè)提供云服務(wù)所必需的各種中間件、分層的動(dòng)態(tài)擴(kuò)展機(jī)制、開發(fā)和運(yùn)維等支撐能力,幫助企業(yè)快速構(gòu)建面向工業(yè)領(lǐng)域的云服務(wù)。
而在騰訊方面,為了能更好地實(shí)現(xiàn)自主可控以及對(duì)用戶的持續(xù)賦能,在過去幾年中,騰訊 ToB 業(yè)務(wù)主動(dòng)調(diào)整了收入結(jié)構(gòu)。在加大音視頻、大數(shù)據(jù)、數(shù)據(jù)庫(kù)等 PaaS 領(lǐng)域投入的同時(shí),將“健康可持續(xù)”作為業(yè)務(wù)的增長(zhǎng)目標(biāo),并采取了包括提高自研產(chǎn)品競(jìng)爭(zhēng)力、鼓勵(lì)產(chǎn)品被集成、豐富伙伴生態(tài)在內(nèi)的一系列舉措。希望能夠以“長(zhǎng)期主義”心態(tài)來推動(dòng)整個(gè)產(chǎn)業(yè)互聯(lián)網(wǎng)的長(zhǎng)期可持續(xù)發(fā)展。
2、云原生時(shí)代的研發(fā)效能提升
在談及有關(guān)企業(yè)研發(fā)效能提升的問題時(shí),黃俊洪提到:云原生能夠?yàn)檠邪l(fā)效能提升帶來新的變化。作為綜合性的解決方案,云原生領(lǐng)域中包含許多不同的技術(shù)和工具,其目的就是為了提高應(yīng)用程序的可移植性、彈性和可靠性。而基于云原生的效能提升推進(jìn)則可以分為規(guī)劃、架構(gòu)、開發(fā)、集成部署和運(yùn)維多個(gè)階段進(jìn)行。
在規(guī)劃階段,可以通過分析現(xiàn)有的技術(shù)性指標(biāo)來確定需要改進(jìn)的方向,重點(diǎn)是建立與業(yè)務(wù)目標(biāo)一致的清晰且定義明確的計(jì)劃,可以通過項(xiàng)目協(xié)同、OKR 工具等進(jìn)行實(shí)施。
應(yīng)用程序架構(gòu)設(shè)計(jì)階段,需要優(yōu)先考慮應(yīng)用程序的可伸縮性和容錯(cuò)性,以實(shí)現(xiàn)應(yīng)用程序的快速迭代和部署。此時(shí),重點(diǎn)關(guān)注應(yīng)用程序的整體架構(gòu)設(shè)計(jì),包括微服務(wù)的設(shè)計(jì)、容器化設(shè)計(jì)和服務(wù)網(wǎng)格的構(gòu)建等。
應(yīng)用程序開發(fā)階段,則要著重優(yōu)化開發(fā)過程和開發(fā)環(huán)境。側(cè)重點(diǎn)是使用云原生技術(shù)構(gòu)建高質(zhì)量的微服務(wù)和容器化應(yīng)用,例如可以使用 CI 工具自動(dòng)化構(gòu)建流程,通過縮短構(gòu)建時(shí)間和提高構(gòu)建質(zhì)量來提高開發(fā)效率。同時(shí)也需要關(guān)注開發(fā)過程的自動(dòng)化和測(cè)試的質(zhì)量控制。
集成和部署階段,需要將應(yīng)用程序和基礎(chǔ)設(shè)施進(jìn)行集成,自動(dòng)化部署和管理應(yīng)用程序的生命周期。在這個(gè)階段主要關(guān)注基礎(chǔ)設(shè)施自動(dòng)化和容器編排,前者可使用自動(dòng)化工具來管理和維護(hù)基礎(chǔ)設(shè)施;后者使用容器編排工具(如 Kubernetes)來管理和協(xié)調(diào)應(yīng)用程序的部署、擴(kuò)展、故障恢復(fù)等任務(wù)。通過全生命周期管理,將云原生應(yīng)用序快速、可靠地發(fā)布到開發(fā)測(cè)試與生產(chǎn)環(huán)境中。
在運(yùn)維階段,要重點(diǎn)關(guān)注應(yīng)用程序的穩(wěn)定性、可靠性和可維護(hù)性。重點(diǎn)是建設(shè)與使用云原生的可觀測(cè)性,包括日志分析、監(jiān)控和鏈路追蹤等。可以使用監(jiān)控工具對(duì)應(yīng)用程序進(jìn)行實(shí)時(shí)監(jiān)控,包括應(yīng)用程序性能、資源使用情況;使用日志分析工具對(duì)應(yīng)用程序的日志進(jìn)行分析,及時(shí)發(fā)現(xiàn)并解決問題。
黃俊洪強(qiáng)調(diào)稱:雖然上述不同階段通過云原生技術(shù)可以協(xié)助實(shí)現(xiàn)研發(fā)效能的量化與推進(jìn),但在具體推進(jìn)階段企業(yè)還是需要根據(jù)不同團(tuán)隊(duì)的實(shí)際情況進(jìn)行調(diào)整,并不斷總結(jié)經(jīng)驗(yàn),不斷優(yōu)化和升級(jí)云原生基礎(chǔ)設(shè)施和應(yīng)用程序,這樣才能從最適合企業(yè)、團(tuán)隊(duì)的路徑完成研發(fā)效能提升的目標(biāo)。
對(duì)于研發(fā)效能工具和研發(fā)管理模式的變化趨勢(shì),黃俊洪則表示,隨著未來企業(yè)軟件以及研發(fā)團(tuán)隊(duì)規(guī)模的不斷增加,研發(fā)效能工具和管理模式的持續(xù)演進(jìn)將成為必然。
自動(dòng)化工具的廣泛應(yīng)用將是未來最明顯的一大趨勢(shì),隨著自動(dòng)化工具的不斷發(fā)展,研發(fā)過程中許多重復(fù)性工作和手動(dòng)操作將會(huì)自動(dòng)化。例如自動(dòng)化測(cè)試、自動(dòng)化構(gòu)建和自動(dòng)化部署、DevSecOps 能力以及可復(fù)用的模版等將會(huì)變得越來越普及。
另一方面是平臺(tái)工程的普及與實(shí)踐,也就是云原生背景下應(yīng)具備面向服務(wù)的 DevOps 服務(wù),除了需要通過平臺(tái)級(jí)能力為開發(fā)團(tuán)隊(duì)提供自動(dòng)化的工程平臺(tái),還需要 IaC、聲明式、GitOps 等技術(shù)手段幫助開發(fā)團(tuán)隊(duì)屏蔽復(fù)雜的底層基礎(chǔ)設(shè)施,從而降低研發(fā)團(tuán)隊(duì)對(duì)云原生底層技術(shù)的學(xué)習(xí)門檻。
而數(shù)據(jù)驅(qū)動(dòng)的研發(fā)效能管理也將是未來企業(yè)將更加關(guān)注的管理模式,通過價(jià)值流工具捕獲關(guān)鍵節(jié)點(diǎn)指標(biāo),通過數(shù)據(jù)來衡量研發(fā)效能,從而提高生產(chǎn)力。這將需要企業(yè)在數(shù)據(jù)收集、分析和利用方面進(jìn)行投資。
最后一點(diǎn),則是開源工具的逐步普及。今天我們可以看到,開源工具在研發(fā)領(lǐng)域中的應(yīng)用已經(jīng)越來越廣泛了,未來企業(yè)中的研發(fā)團(tuán)隊(duì)也會(huì)更多地采用開源工具來提高效率和降低成本。
3、FinOps的現(xiàn)在與未來
在訪談末尾,黃俊洪分享了自己對(duì)于如今云原生領(lǐng)域大火的 FinOps 理念的一些認(rèn)知與理解。黃俊洪認(rèn)為:FinOps 的本質(zhì)是財(cái)務(wù)管理、企業(yè)經(jīng)營(yíng)和成本優(yōu)化的組合。之所以 FinOps 會(huì)受到如此關(guān)注,主要是由于云原生技術(shù)棧確實(shí)提供了一系列提高資源利用率的基礎(chǔ)能力,如對(duì)資源更細(xì)粒度的管控和分配、自動(dòng)伸縮能力等。
對(duì)企業(yè)而言,理論上將業(yè)務(wù)遷移到云原生平臺(tái)以后,利用率應(yīng)該大大提升才對(duì)。但企業(yè)對(duì)云原生的技術(shù)認(rèn)知往往還停留在以前的階段,在虛擬機(jī)上怎么用資源,到了云原生平臺(tái)照舊,并沒有意識(shí)到可以在保證業(yè)務(wù)穩(wěn)定的前提下,采用成本更優(yōu)化的手段。
尤其在疫情這幾年,各企業(yè)對(duì)于成本優(yōu)化的訴求更加強(qiáng)烈,但根據(jù)騰訊云的觀察,不少國(guó)內(nèi)企業(yè)還處在業(yè)務(wù)遷上云原生的時(shí)期,當(dāng)企業(yè)面對(duì)業(yè)務(wù)壓力時(shí),成本管控的優(yōu)先級(jí)自然會(huì)先“放一放”;只有當(dāng)業(yè)務(wù)趨于穩(wěn)定,應(yīng)用的容器化、架構(gòu)的現(xiàn)代化接近完成時(shí),企業(yè)才會(huì)將關(guān)注點(diǎn)轉(zhuǎn)到成本優(yōu)化上,但這并不是一個(gè)理想的狀態(tài)。
根據(jù) FinOps 的理念,實(shí)際上,云成本優(yōu)化應(yīng)該從上云的第一天就開始規(guī)劃,并且不斷優(yōu)化。如果企業(yè)能夠很好地借助云廠商提供的智能推薦、智能調(diào)度等能力,節(jié)省 20% 云成本對(duì)每一家企業(yè)用戶而言都會(huì)是一個(gè)很容易達(dá)成的目標(biāo)。
對(duì)于 FinOps 技術(shù)未來的發(fā)展方向,黃俊洪則做出了如下幾點(diǎn)預(yù)測(cè)。
成本清晰化:越來越多云平臺(tái)已經(jīng)在提供基礎(chǔ)賬單的基礎(chǔ)上增加了多維賬單查詢、標(biāo)簽管理、成本分配等能力;第三方 FinOps 工具也在努力將費(fèi)用與不同部門、不同業(yè)務(wù)的真實(shí)用量關(guān)聯(lián),讓不同業(yè)務(wù)的云成本開銷清晰化。
流程標(biāo)準(zhǔn)化:FinOps 的實(shí)踐是一個(gè)不斷完善標(biāo)準(zhǔn)化流程的過程, FinOps 的全生命周期包括預(yù)算、資源申領(lǐng)、配額下發(fā)、成本優(yōu)化、核算等全流程,中間配合貨幣化結(jié)算、成熟度模型等標(biāo)準(zhǔn)化手段推動(dòng),未來的 FinOps 實(shí)踐會(huì)越來越標(biāo)準(zhǔn)。
成本管控智能化:成本浪費(fèi)的核心原因是云用戶對(duì)業(yè)務(wù)資源需求不能精確把握,對(duì)資源使用方法不科學(xué)導(dǎo)致的后果。用戶學(xué)習(xí)不同云的多種計(jì)費(fèi)模型,學(xué)習(xí)不同特征業(yè)務(wù)的資源需求的成本非常高,靠人力的精準(zhǔn)優(yōu)化難度大。智能化的云平臺(tái)和優(yōu)化工具基于資源畫像和成本模型,基于不同預(yù)測(cè)算法可以給出合理優(yōu)化建議,降低成本優(yōu)化的落地門檻。
歸根結(jié)底,伴隨著各領(lǐng)域企業(yè)的持續(xù)發(fā)展,騰訊云也在根據(jù)企業(yè)的需求變化不斷優(yōu)化自身的云計(jì)算基礎(chǔ)設(shè)施與云原生技術(shù)能力。從始至終,騰訊云在技術(shù)層面的深耕都未曾停歇,這也是如今騰訊云能夠在云上提供如此豐富產(chǎn)品能力的核心原因。對(duì)企業(yè)而言,無論是此前提到的 FinOps 技術(shù),還是如今非常火爆的 LLM 大模型,利用云上的算力集群都能夠更加充分地發(fā)揮它們的技術(shù)價(jià)值。更好地幫助企業(yè)實(shí)現(xiàn)它們的訴求,無論在過去、現(xiàn)在還是將來,都會(huì)是騰訊云最核心的目標(biāo)與責(zé)任。