九層之臺(tái)起于壘土 ——講述承載5G和邊緣計(jì)算的服務(wù)器平臺(tái)
導(dǎo)語:5G的腳步越來越近,伴隨而來的NFV和邊緣計(jì)算也發(fā)展的如火如荼,部分移動(dòng)省公司和互聯(lián)網(wǎng)公司的合作試點(diǎn)已經(jīng)紛紛落地。大家都在關(guān)注5G和邊緣計(jì)算在高帶寬、大連接、低延時(shí)等諸多優(yōu)勢(shì)為上層應(yīng)用帶來的革命,但是這一“優(yōu)勢(shì)”給底層硬件基礎(chǔ)設(shè)施帶來了巨大的挑戰(zhàn),特別是將在傳統(tǒng)數(shù)據(jù)中心的開放能力搬到邊緣側(cè),必將帶來機(jī)房及服務(wù)器設(shè)備的適配和優(yōu)化改造需求。
01運(yùn)營商邊緣機(jī)房現(xiàn)狀
運(yùn)營商有大量的匯聚、綜合接入、基站等邊緣機(jī)房,與核心機(jī)房或傳統(tǒng)數(shù)據(jù)中心相比條件十分特殊,選址靈活度、機(jī)房條件和基礎(chǔ)設(shè)置保障能力等方面受到限制。
首先,由于主要用來放置傳輸設(shè)備,機(jī)架深度通常只有600mm(少量800mm),這種條件下,與之對(duì)比,通用X86服務(wù)器的深度一般為700~800mm;
其次,絕大部分邊緣機(jī)房無固定油機(jī),空調(diào)的制冷穩(wěn)定性無法得到保證,在制冷系統(tǒng)故障或長時(shí)間停電時(shí),機(jī)房溫度可能會(huì)達(dá)到40℃甚至45℃以上。未來隨著業(yè)務(wù)下沉,機(jī)房內(nèi)部署設(shè)備逐漸增多,溫升問題將會(huì)更加嚴(yán)重;
再次,大量邊緣機(jī)房為居民樓、商鋪、寫字樓等普通民用建筑,同時(shí)空調(diào)過濾效果有限,所以承重和空氣潔凈度都無法跟數(shù)據(jù)中心相比。
此外,邊緣機(jī)房的選址很難避開地震烈度高的區(qū)域,也無法保證周圍沒有施工、重型運(yùn)輸設(shè)備等導(dǎo)致的振動(dòng),設(shè)備將面臨抗震方面的要求。傳統(tǒng)數(shù)據(jù)中心,可以綜合考慮自然條件和電力資源等諸多因素,邊緣業(yè)務(wù)的特點(diǎn)決定了邊緣計(jì)算能力就在附近,這導(dǎo)致邊緣機(jī)房分布廣泛,選址相對(duì)不自由。總之,邊緣機(jī)房條件各異,與核心數(shù)據(jù)中心相比差異巨大。
02 定制針對(duì)邊緣的服務(wù)器方案
傳統(tǒng)CT設(shè)備可以理解為針對(duì)邊緣機(jī)房條件進(jìn)行了定制,兩者可以相互適配,但如果直接在邊緣機(jī)房部署通用服務(wù)器,會(huì)存在很多問題。另外,邊緣機(jī)房數(shù)量巨大,統(tǒng)一按滿足通用服務(wù)器要求進(jìn)行改造和擴(kuò)建也是不可能的。
最有效的邊緣計(jì)算部署方案就是利用現(xiàn)有的邊緣機(jī)房資源,并對(duì)服務(wù)器進(jìn)行定制設(shè)計(jì)。2011年11月,我公司聯(lián)合中國電信、中國聯(lián)通、信通院和Intel公司在ODCC中發(fā)起了OTII(Open Telecom IT Infrastructure)項(xiàng)目。計(jì)劃定制一款面向5G及邊緣計(jì)算的深度定制、開放標(biāo)準(zhǔn)、統(tǒng)一規(guī)范的服務(wù)器方案。
03 OTII服務(wù)器規(guī)格設(shè)計(jì)
為適應(yīng)邊緣機(jī)房的環(huán)境并滿足邊緣計(jì)算業(yè)務(wù)的需求,OTII服務(wù)器做了如下方面的定制,當(dāng)然很多方面的規(guī)格和設(shè)計(jì)還將根據(jù)試點(diǎn)的推進(jìn)不斷更新。
首先需要改造的是尺寸。目前市面上的通用服務(wù)器的深度一般為700~800mm。為滿足600mm的機(jī)架深度,我們將服務(wù)器的深度定義在450mm左右,最大不超過470mm。而其寬度與標(biāo)準(zhǔn)的服務(wù)器機(jī)架無異,為19英寸。在高度方面,經(jīng)過對(duì)通用服務(wù)器市場、應(yīng)用需求的調(diào)研,決定將服務(wù)器的高度定義為2U,基本能夠同時(shí)滿足存儲(chǔ)(配置2.5寸硬盤)、計(jì)算和少量GPU的需求。對(duì)于未來一些大存儲(chǔ)和異構(gòu)計(jì)算的應(yīng)用會(huì)考慮采用JBOD、JBOF等一系列擴(kuò)展性方案
由于邊緣機(jī)房的制冷設(shè)備遠(yuǎn)未達(dá)到數(shù)據(jù)中心的水平,如果出現(xiàn)故障會(huì)導(dǎo)致機(jī)房溫度過高,因此需要服務(wù)器能夠在45攝氏度溫度下長期運(yùn)行(通用服務(wù)器多要求35度)。并且這一設(shè)計(jì)要求不會(huì)帶來過多的成本投入。
由于邊緣的空氣質(zhì)量無法有效保證,服務(wù)器的風(fēng)扇需要能夠及時(shí)清理,所以我們將風(fēng)扇從服務(wù)器機(jī)箱內(nèi)放到了后面板,并支持熱插拔。
傳統(tǒng)的電信設(shè)備需要有抗震的要求,邊緣機(jī)房可能在任何地點(diǎn),包括地震頻發(fā)的地方,根據(jù)國標(biāo)要求,需滿足7烈度以上,這對(duì)服務(wù)器來說是極高的,需要制定機(jī)架與服務(wù)器的協(xié)同設(shè)計(jì)方案。
核心機(jī)房設(shè)備通常要求7*24小時(shí)運(yùn)維,但是很多邊緣機(jī)房地處偏遠(yuǎn)分布廣泛,很難達(dá)到這樣的級(jí)別。這就對(duì)服務(wù)器本身提高了要求,我們將為OTII定制統(tǒng)一的IPMI和Redfish接口,統(tǒng)一上層管理平臺(tái)的開發(fā),提升集成的速度,并且能夠有全面的硬件故障檢測和診斷功能,保證能提前預(yù)警、及時(shí)上報(bào)、快速定位等。
從上層業(yè)務(wù)的角度,最重要的是能夠滿足配置和性能方面的要求。目前OTII服務(wù)器能夠滿足Xeon SP雙路和Xeon-D兩種CPU平臺(tái),支持16條內(nèi)存,6~8塊硬盤以及6個(gè)PCIe插槽的擴(kuò)展性,并且能夠支持至少2塊GPU。另外對(duì)于Xeon SP雙路服務(wù)器,還將采用NUMA balance的設(shè)計(jì),有助于提高網(wǎng)絡(luò)及邊緣應(yīng)用的性能穩(wěn)定性。
04 項(xiàng)目影響力不斷提升
自2011年11月立項(xiàng)以來,OTII項(xiàng)目受到業(yè)界的廣泛關(guān)注。目前已經(jīng)有29家成員公司,包括運(yùn)營商、互聯(lián)網(wǎng)公司、服務(wù)器和配件供應(yīng)商,甚至部分非ODCC成員的供應(yīng)商,因?yàn)檫@個(gè)項(xiàng)目而申請(qǐng)加入ODCC。OTII項(xiàng)目已經(jīng)成為具有影響力的5G和邊緣計(jì)算硬件開源項(xiàng)目。
在今年2月25日的巴展上基于Intel新一代Cascade Lake平臺(tái)的OTII邊緣服務(wù)器正式發(fā)布,早于Intel新平臺(tái)4月3日的正式發(fā)布時(shí)間,這種特殊安排也表明了Intel對(duì)OTII項(xiàng)目的重視。該產(chǎn)品專為5G設(shè)計(jì),可承擔(dān)物聯(lián)網(wǎng)、MEC和NFV等5G應(yīng)用場景,適合于邊緣機(jī)房的物理環(huán)境。在展會(huì)期間,北美和歐洲運(yùn)營商表現(xiàn)了對(duì)OTII服務(wù)器的極大興趣。
目前有3家供應(yīng)商已經(jīng)有基于Cascade Lake平臺(tái)的產(chǎn)品,另外還有若干家供應(yīng)商正在開發(fā),預(yù)計(jì)在Q2或Q3會(huì)有產(chǎn)品。JBOD等產(chǎn)品也在規(guī)劃中,會(huì)根據(jù)試點(diǎn)的推動(dòng)情況決定具體的樣機(jī)生產(chǎn)時(shí)間。另外,OTII服務(wù)器已經(jīng)到達(dá)浙江公司某機(jī)房開始支撐邊緣計(jì)算試點(diǎn)。2019年將會(huì)進(jìn)一步推動(dòng)OTII服務(wù)器的生態(tài)發(fā)展以及試點(diǎn)工作,為2020年全面商用奠定基礎(chǔ)。
5G時(shí)代的多元化應(yīng)用催生了邊緣計(jì)算的快速發(fā)展,傳統(tǒng)的數(shù)據(jù)中心將向邊緣側(cè)延伸,電信的核心業(yè)務(wù)在實(shí)時(shí)性、穩(wěn)定性、管理便利性等方面都對(duì)服務(wù)器提出了更高的要求,OTII服務(wù)器未來還將會(huì)面臨諸多挑戰(zhàn)。
作者簡介:
高從文:中國移動(dòng)研究院網(wǎng)絡(luò)與IT技術(shù)研究所 技術(shù)與方案研究員
2011年入職中國移動(dòng)研究院,一直參與服務(wù)器方面的工作,負(fù)責(zé)集采服務(wù)器配置模型制定和服務(wù)器深度定制等方面的工作,對(duì)服務(wù)器技術(shù)和市場趨勢(shì)有比較深入的理解。
徐忠宇:中國移動(dòng)研究院網(wǎng)絡(luò)與IT技術(shù)研究所 技術(shù)與方案研究員
主要從事數(shù)據(jù)中心基礎(chǔ)設(shè)施架構(gòu)方面的研究。
【本文為51CTO專欄作者“移動(dòng)Labs”原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)聯(lián)系原作者】