從深度定制到聯合研發,騰訊云攜手希捷打造穩健云計算基礎設施
云計算像水和電一樣,成為數字經濟時代不可或缺的基礎設施。怎樣讓云更穩更快?如何構建高效全能、靈活易用、穩定可靠的基礎設施?這是云計算提供商思考的首要問題。
為此,騰訊云和希捷一直在緊密協作,引入新品、聯合測試、驗證優化,通過構建可靠的基礎設施,為數據價值的深度挖掘和激活打下穩健根基。
具體說來,針對騰訊云自研服務器的研發、測試,數據的保護和恢復、硬盤的固件定制與健康管理等方面,雙方共同攜手,保持著緊密的技術溝通,共同打造穩定、可靠、高可用、可擴展的數據存儲方案。
充分測試騰訊自研服務器,提升系統可靠性可用性
伴隨騰訊云業務規模的快速增長,基礎設施架構與運營成本面臨重大挑戰。自研服務器對騰訊云的重要性不言而喻。騰訊云自研服務器專注于騰訊獨特的應用需求,在散熱、功耗、性能、成本等方面相較標準化服務器均有一定差異。
在騰訊云自主開發的服務器產品投入使用前,雙方就針對服務器樣機,導入希捷銀河系列企業級硬盤進行測試。聯合實驗測試關注硬盤在系統層面的表現,針對兼容性、抗震性、性能、可靠性進行了測試,確保希捷產品能夠在騰訊自研服務器中順利運轉,進而提升騰訊云自研服務器的整體性能與密度,并幫助最終用戶降低總體擁有成本。
在聯合測試的過程中,希捷產品的抗震性、性能、可靠性、兼容性得到充分驗證。希捷也聆聽到騰訊云的需求和建議,從而對下一代硬盤產品優化設計。
易失性寫緩存數據丟失檢測,提升數據恢復效率
在雙方的技術協作中,數據安全是非常重要的研究項目。希捷和騰訊云一直努力尋求更為可靠的數據安全保障。易失性寫緩存數據丟失檢測(data loss detection)就是希捷專為騰訊云定制的研發項目。希捷基于硬盤自身機制,開發相關技術,并配合騰訊云的上層指令來消除數據丟失風險。
Fleet management硬盤健康管理,改善用戶體驗
Fleet management硬盤健康管理是雙方共同探索的一個重點。2017年11月開始,希捷開始為騰訊云部署FARM(Field Accessibility Reliability Metrics),基于大數據機器學習的健康監測建模;并于近期開發了硬盤在線故障診斷工具(Field Events Log)。該項目旨在重塑硬盤日志以及進行故障預測,從而保障硬盤的可靠性及數據安全。
通過部署FARM項目,希捷聯合騰訊云對硬盤的運行數據(磁頭數據、碟片數據、溫度、濕度等數據)進行檢測,應用大數據建模分析存在失效風險的硬盤。
通過大數據分析,該項目可提前15天上報不同風險等級的預警,提示用戶采取措施以避免硬盤批量失效導致的業務和數據風險。
定制固件,全面優化產品并降低成本
希捷還為騰訊云專門定制固件,優化產品特性。定制化全面體現在產品的研發設計、固件優化、前期生產制造控制、后期測試、調試等等環節。
通過定制固件,希捷在多個產品系列中為騰訊云進行了優化。定制產品已經大量生產并應用在一線。定制化以后,產品質量和用戶體驗均得到了顯著提升。
Fleet Management硬盤健康管理與定制化兩項技術相得益彰,助力客戶年換盤率和硬盤非故障換盤率顯著降低;不僅提升產品質量,更大幅降低成本。
截至目前,騰訊云和希捷的合作已超越了產品測試層面,雙方還積極參與到產品研發、架構設計、驗證部署等過程。希捷的工程師團隊在針對騰訊的特定工作負載與特定應用,探索如何提升產品性能、降低延遲、不斷調優,以適配騰訊云的應用需求。
“產業智變,云啟未來”,面對未來高速變化的市場,希捷還將與騰訊云繼續攜手,讓云計算至快至穩。