揭秘南京百度云數據中心 首個規模應用ARM架構服務器
百度,在普通民眾的眼中一直都是一家互聯網搜索引擎、中國最大IT互聯網企業,干凈的百度首頁界面給人印象也是如此簡單。但是在這簡單的界面背后確有著極其復雜的技術力量作為支撐。百度自從成為國內最大搜索引擎之后,一直致力于國內IT行業的進步與發展,百度在云計算領域正在進行一場“打怪升級”。百度不斷開放laaS、Paas和SaaS等多層面的云平臺服務,尤其百度IaaS云快速發展,越來越多的技術人開始關注百度的云計算數據中心。
除了陽泉云計算中心之外,百度在南京的云計算數據中心,也匯集了眾多新興硬件技術,其自主設計的機柜、服務器和交換機等硬件技術有望成為未來IDC的技術標準。下面就讓筆者帶您走進百度云南京云計算數據中心吧。
全球首個ARM架構服務器端規模應用
2013年1月11日,百度位于南京的云計算數據中心首度對外曝光。而在整個南京云計算數據中心中最為矚目無疑是全球首個ARM架構服務器端規模應用。
雖然Intel的ATOM系列芯片已經在功耗和性能等方面有了極大地提高,但是隨著諸如iPad,iPhone、Android平板以及Windows 8的ARM架構PC產品和Surface的推出,使得在云客戶端方面,ARM結構已經獨領風騷很久了,盡管Intel想利用凌動系列芯片插手ARM的地盤,不過目前還不是很成功,反而ARM已經開始涉足后臺的云計算數據中心業務。
2011年NVIDIA公司以Tegra ARM處理器作為GeForce GPU加速器的流量控制,成功設計出一款可與超算相媲美的服務器。2012年百度云南京數據中心則首次在服務器端規模應用ARM架構,使ARM架構的服務器正式走進IDC。
在服務器領域,眾多人眼中X86架構與新興的ARM架構必將有一場激烈的競爭。因為即便是與最為節省能耗的X86芯片相比,ARM處理器所使用的功率還要小得多。即使與Intel大大降低了功耗和價格的凌動芯片相比,ARM依舊占據市場高地。因為ARM本身并不生產芯片,而是以授權的商業方式與全世界所有的半導體芯片廠商共享ARM芯片,這種硬件的開源為ARM服務器注入強大的生命力。或許ARM服務器時代真的快要到來了。
百度南京云計算數據中心在ARM服務器架設方面已經積累了非常豐富的經驗,利用代碼指令集變遷的方法,將X86平臺與ARM平臺進行整合,利用ARM軟件工具鏈使調試工具完善,發揮ARM服務器32位優勢,只保留特殊變量,利用特殊指令變量對齊的方法,成功架設了全球首款規模應用的ARM服務器。
據南京數據中心的工作人員介紹:“ARM服務器大大降低了功耗和成本,云平臺將軟件與CPU指令集解耦得以實現,進而實現了輕計算負載和和高存儲密度。ARM服務器不但是全球首款規模應用的ARM服務器,同時百度在研發這款服務器時還積累10項發明專利、TCO降低了25%以及存儲密度提升了70%。隨著ARM 64位處理器在2014年的推出,百度ARM服務器的技術標準將加成熟。”
國內互聯網行業首個定制化整機柜
“綠色機房”已成為當今IDC的時代主題,它包括減少一開始使用的能源和材料、提高樓宇的使用效率、延長樓宇的使用壽命、減少配件的更換和浪費等一系列行動。IDC在全球的增長已令企業開始關注數據存儲、傳輸和處理過程中所用資源的效率和生產率。
在南京云計算數據中心中,成排成排的整機柜格外引人注目。集中部署了大規模上線的定制化整機柜,百度作為互聯網企業顯然沒有將國內IDC提供商的一些陋習帶進這家新興的云計算數據中心。
做過IDC的IT技術人都了解,物理空間、電源、布線和空調散熱是每一家數據中心無法躲過的老大難問題。幾乎每一個系統管理員都為新增服務器沒有位置、UPS不夠用、布線以及散熱問題頭痛過。舉個例子,數據中心所消耗的電力已占到美國全部電力使用量的2%,在所消耗的電力中,有 很大一部分是為了滿足網絡電子設備與樓宇運行的需要。這些電子技術會產生大量的熱,這是數據中心所面臨的主要問題之一。隨著溫度的升高,IT硬件的可靠性 大幅降低。據估計,溫度每升高10°C(18°F),電子設備的長期可靠性將降低50%。具有諷刺意味的是,數據中心運行所依賴的一些核心網絡電子設備產 生的熱量正是導致其效率和壽命降低的因素。這個時候IDC的工作人員能做的往往只能是“堵住破罐子別漏水,實在沒辦法了,拿個新罐子接破罐子的水!”筆者最近接觸的一位工作于北京市東城區的IDC工作人員(具體是哪家很好猜吧)就在為擴建數據中心而頭痛,畢竟數據中心的擴建不是簡單物理空間的增大那么簡單。
其實解決問題的辦法往往就是把問題杜絕在源頭。百度南京云計算數據中心,整個機房的服務器陣列非常整齊壯觀。整機柜一直是眾多IDC夢寐以求的,布線、UPS設置、管理以及散熱都將得到完美地解決。但是IDC發展速度過猛、IDC擴建和高額成本等問題使大規模整機柜沒有出現,而像南京云計算數據中心這樣的整機柜無疑最大限度地解決擴建問題,同時,整機柜的一體化交付也解決了DIY服務器問題,只要服務器交付,即可上線,省去了DIY服務器調試的中間環節。據其工作人員介紹:“除了解決IDC的物理問題之外,整機柜的模塊化設計和一體化交付都讓成本節約找到了出路。像這么大規模定制化整機柜在國內并不多見,其TCO下降了10%,交付效率提升10倍!”
國內最大的萬兆集群
今天以太網的速度正在不斷提高,從開始的10兆(10M)、百兆(100M),發展到千兆(1G)、直到現在的萬兆(10G),而以太網設備的價格則隨著大規模的采用和生產而逐漸下調。在越來越多的服務器改用千兆以太網作為上聯技術后,數據中心或集群的骨干帶寬相應增加,以千兆或千兆捆綁作為平臺已經不夠使用,升級到萬兆以太網在服務質量及成本上都將占有相對的優勢。
雖然國內擁有萬兆集群的IDC并不是新鮮事,不過IDC的萬兆集群數量并不多。南京云計算數據中心擁有5000臺萬兆集群,被稱為國內最大絕對不為過。值得一提的是,這些萬兆TOR(Top of Rack柜頂式)交換機全部由百度自主研發設計。萬兆以太網提供給高性能計算支持非常給力,用戶訪問、服務器管理、存儲連接性以及集群互連都將得到完美的支持。5000臺萬兆集群給南京云計算數據中心所帶來的好處就是接入成本對比同類商用方案下降83%。
業內首家自主研發及規模應用的SSD
百度云首席架構師林仕鼎講到,個人云服務、開放云平臺、云計算基礎軟硬件架構和操作系統研發,構成了百度云的整體布局。其中,百度個人云服務自2012年7月底正式開放, 從數據存儲服務向一人一云的方向發展。截至2012年12月,用戶量就突破了2600萬,個人云文件數突破10億,在行業中增速最快。此舉推動了傳統云計算向個人云的轉變,做到用戶數據的統一性,不被終端和應用等分割。其中百度自主研發SSD,系業內首家自主研發及規模應用,相對SATASSD性能提升6倍成本降低10%,相對PCIEFlash性能提升2倍成本降低40%。
總結
百度作為一家中國的互聯網公司,這樣一個IDC無疑在面對外國公司時都毫豪不遜色。某些技術與國外同行(Google、Facebook、Amazon、Microsoft等)相比,也處于領先或者相當水平。百度在ARM架構、整機柜和萬兆集群等方面積累的軟硬件技術,對于整個IDC行業都將是一個借鑒。