時(shí)間準(zhǔn)度對(duì)數(shù)據(jù)中心的重要性
俗話(huà)說(shuō)“失之毫厘,謬以千里”,時(shí)間的精準(zhǔn)度對(duì)于我們的工作、生活都非常重要。2000年的千年蟲(chóng)事件以及2017年元旦全球多一秒事件,都引起了人們的高度關(guān)注,尤其是數(shù)據(jù)中心行業(yè)。數(shù)據(jù)中心里很多系統(tǒng)都依賴(lài)時(shí)間來(lái)正常運(yùn)行,人們要認(rèn)真評(píng)估這一時(shí)間變化對(duì)內(nèi)部運(yùn)行設(shè)備的影響,如果設(shè)備不能夠自行調(diào)整時(shí)間,則就會(huì)與實(shí)際時(shí)間產(chǎn)生偏差,因此而帶來(lái)一系列誤判,導(dǎo)致問(wèn)題。所以,時(shí)間精準(zhǔn)度對(duì)于數(shù)據(jù)中心來(lái)講是非常重要的參量。
數(shù)據(jù)中心的時(shí)間有兩個(gè)維度含義,一個(gè)是相對(duì)時(shí)間。比如很多的網(wǎng)絡(luò)設(shè)備要啟用OSPF、ARP、MAC等各種協(xié)議,每種協(xié)議都有各種各樣的定時(shí)器,以便實(shí)時(shí)判斷協(xié)議狀態(tài)是否有變化。OSPF鄰居要通過(guò)一定間隔時(shí)間收發(fā)Hello報(bào)文保持鄰居狀態(tài)為Full,一旦超過(guò)三個(gè)Hello報(bào)文的發(fā)送時(shí)間間隔,一個(gè)Hello報(bào)文也沒(méi)有收到,就認(rèn)為這個(gè)鄰居狀態(tài)發(fā)生了變化,鄰居狀態(tài)由Full切換到Init或Down,記錄Hello報(bào)文超時(shí)的時(shí)間定時(shí)器要準(zhǔn)確,周期性地記錄每個(gè)Hello報(bào)文的收時(shí)間,以便統(tǒng)計(jì)準(zhǔn)確;另一個(gè)是絕對(duì)時(shí)間,就是北京標(biāo)準(zhǔn)時(shí)間,每天我們?cè)谛侣劼?lián)播時(shí)看到的時(shí)間,2000年的千年蟲(chóng)事件以及2017年元旦全球多一秒事件都說(shuō)的是這個(gè)時(shí)間。數(shù)據(jù)中心有很多設(shè)備,這些設(shè)備運(yùn)行中會(huì)產(chǎn)生很多的日志和告警信息,所有的信息都有時(shí)間紀(jì)錄,只有這個(gè)時(shí)間準(zhǔn)確,才能通過(guò)這些時(shí)間來(lái)進(jìn)行分析問(wèn)題。比如數(shù)據(jù)中心發(fā)生了業(yè)務(wù)中斷,我們首先要知道是什么時(shí)候中斷的,持續(xù)多長(zhǎng)時(shí)間,與哪些設(shè)備有關(guān),然后再去查找這個(gè)時(shí)間點(diǎn),設(shè)備上留下的相關(guān)紀(jì)錄,時(shí)間的準(zhǔn)確性對(duì)于分析業(yè)務(wù)中斷原因非常關(guān)鍵,如果沒(méi)有各個(gè)設(shè)備的準(zhǔn)確運(yùn)行時(shí)間,就無(wú)法判斷哪些信息是中斷時(shí)報(bào)出的,哪些信息與故障有關(guān),故障將很難分析出結(jié)果,所以絕對(duì)時(shí)間也非常重要。
無(wú)論是相對(duì)時(shí)間,還是絕對(duì)時(shí)間,對(duì)于數(shù)據(jù)中心運(yùn)行都非常重要,同時(shí)也要保證兩個(gè)時(shí)間的準(zhǔn)度,如果精度太差,也會(huì)產(chǎn)生不少問(wèn)題。上面也有介紹,會(huì)導(dǎo)致網(wǎng)絡(luò)協(xié)議的各種定時(shí)器判斷不準(zhǔn)確,發(fā)生故障時(shí)無(wú)法明確哪些是故障時(shí)間報(bào)出的,這只是舉個(gè)示例,其實(shí)還有更多的方面。如果相對(duì)時(shí)間不準(zhǔn),誤差大,服務(wù)器上的應(yīng)用系統(tǒng)也會(huì)出問(wèn)題,如果要是銀行的存取款業(yè)務(wù)系統(tǒng),每存一筆錢(qián)時(shí)間都慢慢將誤差拉大,可能到***,連儲(chǔ)戶(hù)上的錢(qián)數(shù)數(shù)據(jù)記錄都出現(xiàn)錯(cuò)誤,甚至出現(xiàn)丟失的情況。如果相對(duì)時(shí)間不準(zhǔn),二三層轉(zhuǎn)發(fā)網(wǎng)絡(luò),表項(xiàng)老化的時(shí)間都不一致,有長(zhǎng)有短,導(dǎo)致表項(xiàng)學(xué)習(xí)不穩(wěn)定,流量轉(zhuǎn)發(fā)出現(xiàn)丟包,嚴(yán)重的會(huì)導(dǎo)致表項(xiàng)無(wú)法學(xué)習(xí),造成網(wǎng)絡(luò)中斷;如果是絕對(duì)時(shí)間不準(zhǔn),數(shù)據(jù)中心所有設(shè)備記錄的信息都是不準(zhǔn)確的,各個(gè)設(shè)備之間的信息也沒(méi)有可對(duì)比性,相互之間的影響和作用就無(wú)法從時(shí)間軸上分得清楚。在一些重要變更和操作時(shí),由于絕對(duì)時(shí)間的不準(zhǔn)確,會(huì)導(dǎo)致操作的時(shí)機(jī)不是***的,在變更和設(shè)備準(zhǔn)確上不同步,從而會(huì)產(chǎn)生這樣那樣的問(wèn)題。
既然時(shí)間準(zhǔn)度對(duì)數(shù)據(jù)中心這么重要,那就要提升時(shí)間準(zhǔn)度了。不過(guò),提升時(shí)間準(zhǔn)度可不是一件輕松的事兒。首先,對(duì)于相對(duì)時(shí)間,這個(gè)和北京時(shí)間無(wú)關(guān),與個(gè)體設(shè)備有關(guān),這個(gè)只能靠設(shè)備內(nèi)部的實(shí)現(xiàn)來(lái)保證。很多網(wǎng)絡(luò)設(shè)備在內(nèi)部會(huì)設(shè)定很多定時(shí)器,這些定時(shí)器專(zhuān)門(mén)記錄各種協(xié)議的運(yùn)行時(shí)間,以便判斷協(xié)議的狀態(tài)是否正常,這個(gè)時(shí)間一般通過(guò)CPU的晶振頻率計(jì)算獲得。這樣相對(duì)時(shí)間的準(zhǔn)確度和設(shè)備的CPU性能有很大關(guān)系,往往是越高端的設(shè)備采用的CPU晶振頻率越準(zhǔn),當(dāng)然這類(lèi)設(shè)備的價(jià)格也要高很多。
其次,對(duì)于絕對(duì)時(shí)間,為保證數(shù)據(jù)中心內(nèi)部所有設(shè)備的時(shí)間一致,可以通過(guò)將所有設(shè)備的時(shí)間對(duì)一遍,盡量做到時(shí)間同步,不過(guò)每個(gè)設(shè)備的時(shí)間準(zhǔn)度不同,有的設(shè)備運(yùn)行個(gè)一年半載,偏差可能達(dá)到數(shù)十秒,而有的設(shè)備偏差卻很小,這樣雖然當(dāng)初時(shí)間都對(duì)過(guò),不同設(shè)備的運(yùn)行時(shí)間是一致的,隨著運(yùn)行時(shí)間越來(lái)越長(zhǎng),誤差變得越來(lái)越大,所以這種方式不可行。更多的數(shù)據(jù)中心是通過(guò)設(shè)定一個(gè)NTP服務(wù)器,這個(gè)服務(wù)器可以是網(wǎng)絡(luò)設(shè)備也可以服務(wù)器,甚至是專(zhuān)用的授時(shí)設(shè)備,然后數(shù)據(jù)中心里所有設(shè)備都通過(guò)這臺(tái)設(shè)備來(lái)獲取時(shí)間,從而整個(gè)數(shù)據(jù)中心里的設(shè)備運(yùn)行時(shí)間是完全一致的。
如果采用一般的網(wǎng)絡(luò)設(shè)備做NTP服務(wù)器,運(yùn)行個(gè)幾個(gè)月,這些服務(wù)器運(yùn)行時(shí)間與實(shí)際時(shí)間偏差可能達(dá)到數(shù)十秒,雖然這些時(shí)間偏差比較大,但仍能保證這些設(shè)備之間的相對(duì)時(shí)間是一致的,并不妨礙各種工作的開(kāi)展,包括問(wèn)題定位。不過(guò),有的時(shí)候數(shù)據(jù)中心業(yè)務(wù)對(duì)時(shí)間要求比較高,這時(shí)就需要使用專(zhuān)用的授時(shí)設(shè)備做NTP服務(wù)器。授時(shí)設(shè)備運(yùn)行時(shí)間誤差小,精度可以達(dá)到毫秒甚至微秒級(jí),與北京時(shí)間保持完全一致,即使運(yùn)行時(shí)間久了,偏差也在微秒級(jí),這就保證了數(shù)據(jù)中心里所有設(shè)備與實(shí)際北京時(shí)間完全一致,避免因?yàn)闀r(shí)間不準(zhǔn)確,導(dǎo)致這樣那樣的問(wèn)題。除了授時(shí)系統(tǒng),還有時(shí)間頻率基準(zhǔn),守時(shí)用原子鐘,星載原子鐘等技術(shù),采用這些技術(shù)都可以大幅提升數(shù)據(jù)中心的時(shí)間準(zhǔn)度。
時(shí)間準(zhǔn)度已經(jīng)成為數(shù)據(jù)中心運(yùn)行中至關(guān)重要的參量,一切的數(shù)據(jù)中心活動(dòng)都和時(shí)間準(zhǔn)度有密切關(guān)系。數(shù)據(jù)中心對(duì)高精度時(shí)間頻率的需求越來(lái)越強(qiáng)烈,需要一系列精度越來(lái)越高的計(jì)時(shí)器具,同時(shí)要在各個(gè)設(shè)備之間做好時(shí)間同步工作,保持設(shè)備之間時(shí)間的一致性,以便于開(kāi)展各種數(shù)據(jù)中心運(yùn)維工作。