“價值千萬”的數據全部丟失,創業公司怒懟騰訊云!騰訊的回應卻讓全行業陷入反思
此次騰訊云“數據丟失”事件暫告一段落,業內專家認為,或許這次的糾紛能夠促成行業形成一些約定。
近日,創業公司“前沿數控”針對騰訊云的一篇檄文引發了行業關注。前沿數控發文稱,公司放在騰訊云服務器上的數據全部丟失且無法恢復。
對于造成用戶數據丟失的問題,騰訊云在隨后的回應中予以承認并進行了道歉。
但讓雙方形成分歧是賠償金額。據悉,前沿數控提出了1100萬余元的索賠,而騰訊云提出的“賠償+補償”總金額為13萬余元,二者相差甚遠。
不過該事件經過多日發酵后,8月8日晚間,前沿數控對外宣稱,基于盡快恢復“前沿數控”平臺業務運營的共同出發點,經過充分的溝通,“前沿數控”與騰訊云誤會已經消除,雙方已制定出雙方認可的業務解決方案。
但解決方案的具體細節,包括此前引發爭議的賠償金額,雙方均未透露。對于騰訊云和前沿數控來說,雙方之間達成共識,該事件也可以告一段落。
但實際上,這件事不僅僅是給當事雙方造成了影響,也為整個行業敲響了警鐘。在云服務已經無處不在的今天,數據的重要性毋庸置疑,但其安全性究竟能否得到保證以及該如何保證,現在似乎又需要畫上一個問號。
小概率事件引發大問題
根據騰訊云8月7日披露的信息顯示,該故障起源于因磁盤靜默錯誤導致的單副本數據錯誤,再加上數據遷移過程中的兩次不規范的操作,導致云盤的三副本安全機制失效,并最終導致客戶數據完整性受損。
這兩次違規操作分別是運維人員為了加速完成搬遷任務,違規關閉了數據校驗;以及運維人員為了盡快降低倉庫使用率,違規對源倉庫進行了數據回收。
在正常情況下,數據搬遷流程會默認開啟數據校驗,開啟之后可以有效發現并規避源端數據異常,從而保障搬遷數據正確性。而數據搬遷完成之后,源倉庫數據應保留24小時,用于搬遷異常情況下的數據恢復。
一位熟悉該操作流程的業內人士告訴21世紀經濟報道記者:
整個事件的根本原因是極小概率出現的“磁盤靜默錯誤”發生了。若磁盤靜默錯誤沒有發生,運維人員的上述操作也不會引發后面這些問題。
一般這種遷移不會出現什么問題,要不他們也不敢這樣操作,只不過當小概率事件真的發生以后,原本的保護措施也沒了。
磁盤靜默錯誤究竟是什么?
據21世紀經濟報道記者了解,通常大家遇到一些磁盤異常,比如硬件錯誤、固件BUG等都會得到報錯,但靜默錯誤的發生往往沒有任何警告,磁盤顯示一切正常,只有在進行數據完整性檢驗時才能發現。
在此次事件中,原本應該進行數據檢驗的步驟卻被運維人員關閉了,所以,人員違規操作不是引發故障的根本原因,但卻是擴大故障影響的重要因素。
圖/圖蟲
損失值1000萬還是13萬?
此外,外界關注的另外一個焦點是這個事件的賠償問題。
據了解,在數據丟失之后,前沿數控向騰訊云提交了一份損失預估文件,內容包含前沿數控技術產品線發展及相關情況、丟失的數據、給前沿數控技術平臺帶來的影響、平臺損失價值評估等。綜合這些,前沿數控提出的索賠金額為11016000元。
騰訊云制定的“賠償+補償”方案,總金額為136469元。其中,賠償部分為3569元,是騰訊云依據賠償條款,按照前沿數控自去年12月份開戶至今產生的實際消耗予以的賠償。
二者提出的賠償金額相差之多,也引發了業界關于“數據值多少錢”的討論。
信息安全專家陸寶華在接受21世紀經濟報道記者的采訪時指出:
對于數據價值的判斷,現在業內沒有統一標準,所以也沒有可參考的依據。但是在做損失評估時,應該由第三方機構來做,而不是當事企業。
一位云計算行業資深從業者向記者表示:
賠償問題可以依據服務商與客戶之間的協議,看是按照數據的價值,還是按照數據的大小或使用的時長來計費。
但通常因為數據的價值難以衡量(不是一般等價物如黃金等可以折算成錢),所以通用的服務費用是按照時長、規模來計費的,賠償往往也會照此計算。
其舉例說道,電力公司是按照每度電的價格向家庭收費,不會因為這度電是用來炒股還是開燈而產生不同的收費方式。
所以,按照服務協議條款,騰訊云的賠償方案并無問題,但涉及到數據的價值,似乎又很難用云服務費去衡量。陸寶華認為,或許在這件事之后,能夠促成行業形成一些約定。
云服務還安全嗎?
從云服務開始出現的時候,不斷提升其安全性就是所有服務商持續在做的事情,現在云服務的安全性也已經達到了一定的高度。但不可否認的是,受限于技術能力,當前對數據存儲而言沒有徹底安全的方式。
一位云計算行業專家向記者表示,凡是在使用的數據都有丟失的風險。首先基礎設施就存在局限性,因為沒有設備能達到100%可靠;其次,人為因素風險難以避免,目前絕大部分的數據丟失其實都是人為操作造成的,比如說中病毒、誤操作等等。
對此,陸寶華告訴記者,通過技術手段其實可以規避掉一些人為風險。比如在此事件中,可以設定在沒有進行數據校驗的情況下,不允許數據搬遷。
但上述行業專家坦言,數據丟失的風險必須主動考慮,數據丟失的可能性永遠存在,數據容災能力是必須具備的。
多位云計算行業從業者向記者表示,很多企業對于云服務存在一定誤解,認為將數據放到云平臺上就萬無一失了。從云計算的本質來看,它為企業提供的是一個低成本的計算資源共享池,它能幫助企業提升效率,減少成本,但這不代表它是一個不會出問題的服務。
目前,云服務商在提供服務時都會明確知會客戶,因為當前人類技術水平的限制,服務商能夠提供的服務的可用性、可靠性都做不到100%,大致能做到幾個9(如99.9999%)。
該行業專家表示,為了在此基礎上繼續提高數據的安全性,一般的解決方案是,同時使用該服務商不同區域的服務器,這樣出問題的概率就會更低。此外,對于重要數據,不管是個人用戶還是企業用戶,都需要定期做好備份。如果使用云服務,快照、災備、離線備份等多種方式都可實現數據備份。
但需要明確的是,云服務商對于風險的技術解決能力、容災能力都要遠遠高于企業個體,在云服務商這邊可能出現的問題,企業即便在自己的機房也同樣可能會出現,而且維護及處理成本會更高。