CrowdStrike中斷事件一周年:企業(yè)可汲取的五大安全升級(jí)啟示
“7月19日一周年,標(biāo)志著對(duì)我們客戶和合作伙伴產(chǎn)生了深遠(yuǎn)影響,成為CrowdStrike歷史上最具決定性的篇章之一。”CrowdStrike總裁邁克·森托納斯(Mike Sentonas)在一篇博客中詳細(xì)闡述了公司為增強(qiáng)彈性所經(jīng)歷的一年歷程。
震動(dòng)全球基礎(chǔ)設(shè)施的事件
相關(guān)數(shù)據(jù)仍然令人警醒:一次有缺陷的Channel File 291更新于世界協(xié)調(diào)時(shí)04:09部署,僅78分鐘后就被撤回,卻導(dǎo)致全球850萬(wàn)臺(tái)Windows系統(tǒng)崩潰。據(jù)保險(xiǎn)業(yè)估算,僅美國(guó)500強(qiáng)企業(yè)就因此損失了54億美元,航空業(yè)受沖擊尤為嚴(yán)重,全球范圍內(nèi)有5078架次航班取消。
Proximus Global旗下公司Telesign的產(chǎn)品和投資組合高級(jí)副總裁斯特芬·施賴爾(Steffen Schreier)解釋了為什么這一事件一年后仍令人記憶猶新:“一年后,CrowdStrike事件不僅沒(méi)有被遺忘,反而讓人難以忘懷。一次常規(guī)的軟件更新,沒(méi)有惡意意圖,僅在78分鐘內(nèi)就被撤回,卻仍然導(dǎo)致全球關(guān)鍵基礎(chǔ)設(shè)施癱瘓。沒(méi)有數(shù)據(jù)泄露,沒(méi)有網(wǎng)絡(luò)攻擊,僅僅是一次內(nèi)部故障,就產(chǎn)生了全球性后果。”
他的技術(shù)分析揭示了現(xiàn)代基礎(chǔ)設(shè)施令人不安的真相:“這才是真正的警鐘:即使是那些擁有良好實(shí)踐、分階段部署和快速回滾機(jī)制的公司,也無(wú)法超越那些由支持快速、云原生交付的基礎(chǔ)設(shè)施所帶來(lái)的風(fēng)險(xiǎn),正是這種讓我們能夠更快交付的同樣速度,在出現(xiàn)問(wèn)題時(shí)也加速了影響的擴(kuò)散范圍。”
了解問(wèn)題根源
CrowdStrike的根源分析揭示了一系列技術(shù)故障:IPC模板類型中的輸入字段不匹配、缺少運(yùn)行時(shí)數(shù)組邊界檢查以及內(nèi)容驗(yàn)證器中的邏輯錯(cuò)誤,這些并非邊緣案例,而是基本的質(zhì)量控制漏洞。
即將擔(dān)任Enkrypt AI首席安全官、Andesite等公司顧問(wèn)的梅里特·貝爾(Merritt Baer)提供了關(guān)鍵背景:“CrowdStrike的服務(wù)中斷讓人警醒,它提醒我們,即使是規(guī)模龐大、成熟的公司,有時(shí)也會(huì)在流程上出錯(cuò),這一結(jié)果在某種程度上是巧合,但本不應(yīng)發(fā)生,這表明他們未能建立一些基本的持續(xù)集成/持續(xù)部署(CI/CD)協(xié)議。”
她的評(píng)價(jià)直接而公正:“如果CrowdStrike按照最佳實(shí)踐,在沙箱環(huán)境中推出更新,并僅以增量方式在生產(chǎn)環(huán)境中部署,那么即使發(fā)生問(wèn)題,影響也不會(huì)如此災(zāi)難性。”
然而,貝爾也認(rèn)可了CrowdStrike的應(yīng)對(duì)措施:“CrowdStrike的溝通策略展現(xiàn)了良好的高管責(zé)任感,高管們應(yīng)該始終承擔(dān)責(zé)任,這不是實(shí)習(xí)生的錯(cuò),如果你的初級(jí)操作員會(huì)犯錯(cuò),那就是我的錯(cuò),是我們整個(gè)公司的錯(cuò)。”
領(lǐng)導(dǎo)層的責(zé)任
CrowdStrike創(chuàng)始人兼CEO喬治·庫(kù)爾茨(George Kurtz)踐行了這一責(zé)任原則。在領(lǐng)英上回顧周年紀(jì)念時(shí),庫(kù)爾茨寫(xiě)道:“一年前,我們面臨了一個(gè)考驗(yàn)一切的時(shí)刻:我們的技術(shù)、我們的運(yùn)營(yíng),以及他人對(duì)我們的信任。作為創(chuàng)始人和CEO,我個(gè)人承擔(dān)了這份責(zé)任,過(guò)去如此,未來(lái)亦然。”
他的觀點(diǎn)揭示了公司如何將危機(jī)轉(zhuǎn)化為變革:“定義我們的不是那個(gè)時(shí)刻,而是之后發(fā)生的一切。從一開(kāi)始,我們的目標(biāo)就很明確:打造一個(gè)更強(qiáng)大的CrowdStrike,以彈性、透明和不懈執(zhí)行為基礎(chǔ),我們的北極星始終是我們的客戶。”
CrowdStrike全力投入新的“設(shè)計(jì)即彈性”框架
CrowdStrike的應(yīng)對(duì)措施圍繞其“設(shè)計(jì)即彈性”(Resilient by Design)框架展開(kāi),森托納斯稱該框架超越了“快速修復(fù)或表面改進(jìn)”,該框架的三大支柱,包括基礎(chǔ)性、適應(yīng)性和持續(xù)性組件,代表了安全平臺(tái)運(yùn)營(yíng)方式的全面重構(gòu)。
關(guān)鍵實(shí)施措施包括:
? 傳感器自我恢復(fù):自動(dòng)檢測(cè)崩潰循環(huán)并切換到安全模式
? 新的內(nèi)容分發(fā)系統(tǒng):基于環(huán)的部署,配備自動(dòng)化保障措施
? 增強(qiáng)的客戶控制:精細(xì)的更新管理和內(nèi)容固定功能
? 數(shù)字運(yùn)營(yíng)中心:專為全球基礎(chǔ)設(shè)施監(jiān)控而建的設(shè)施
? Falcon超級(jí)實(shí)驗(yàn)室:測(cè)試數(shù)千種操作系統(tǒng)、內(nèi)核和硬件組合
“我們不只是增加了一些內(nèi)容配置選項(xiàng),”森托納斯在博客中強(qiáng)調(diào),“我們從根本上重新思考了客戶如何與企業(yè)安全平臺(tái)交互和控制。”
全行業(yè)供應(yīng)鏈的覺(jué)醒
這一事件促使人們更廣泛地審視對(duì)供應(yīng)商的依賴。貝爾直截了當(dāng)?shù)刂赋隽私逃?xùn):“一個(gè)重要的實(shí)際教訓(xùn)是,你的供應(yīng)商是你供應(yīng)鏈的一部分,因此,作為CISO,你應(yīng)該測(cè)試風(fēng)險(xiǎn)以了解它,但簡(jiǎn)單來(lái)說(shuō),這個(gè)問(wèn)題屬于共享責(zé)任模型中供應(yīng)商的責(zé)任范圍,客戶無(wú)法控制它。”
CrowdStrike的服務(wù)中斷永久性地改變了供應(yīng)商評(píng)估方式:“我看到高效的CISO和CSO從這次事件中吸取教訓(xùn),關(guān)注他們希望合作的公司以及作為業(yè)務(wù)合作產(chǎn)品的安全性,我只會(huì)與那些從安全態(tài)勢(shì)角度讓我尊重的公司合作,他們不需要完美,但我希望知道,隨著時(shí)間的推移,他們正在執(zhí)行正確的流程。”
Zscaler的CISO山姆·庫(kù)里(Sam Curry)補(bǔ)充道:“CrowdStrike遭遇的不幸事件,本可能發(fā)生在許多公司身上,因此,或許我們不應(yīng)事后諸葛亮地歸咎于他們。我想說(shuō)的是,世界已經(jīng)借此重新聚焦,更加關(guān)注彈性,這對(duì)每個(gè)人來(lái)說(shuō)都是好事,因?yàn)槲覀兊墓餐繕?biāo)是讓互聯(lián)網(wǎng)對(duì)所有人來(lái)說(shuō)都更安全。”
強(qiáng)調(diào)需要新的安全范式
施賴爾的分析超越了CrowdStrike,觸及了基礎(chǔ)安全架構(gòu):“大規(guī)模的速度是有代價(jià)的,現(xiàn)在,每一次常規(guī)更新都承載著潛在系統(tǒng)性故障的風(fēng)險(xiǎn),這意味著不僅要進(jìn)行測(cè)試,還要建立彈性保障措施:分層防御、自動(dòng)回滾路徑,以及假設(shè)在最需要時(shí)遙測(cè)數(shù)據(jù)可能會(huì)消失的故障安全機(jī)制。”
他最關(guān)鍵的見(jiàn)解觸及了許多人未曾考慮的場(chǎng)景:“當(dāng)遙測(cè)數(shù)據(jù)中斷時(shí),你需要假設(shè)可見(jiàn)性可能會(huì)消失的故障安全機(jī)制。”
這代表了一種范式轉(zhuǎn)變,正如施賴爾總結(jié)的那樣:“因?yàn)槿缃竦陌踩粌H僅是阻止攻擊者,而且是要絕對(duì)確保你自己的系統(tǒng)永遠(yuǎn)不會(huì)成為單一故障點(diǎn)。”
展望未來(lái):AI與未來(lái)挑戰(zhàn)
貝爾看到了下一個(gè)變革已經(jīng)初現(xiàn)端倪:“自從云計(jì)算使我們能夠使用基礎(chǔ)設(shè)施即代碼以來(lái),尤其是現(xiàn)在AI正在使我們以不同的方式開(kāi)展安全工作,我正在關(guān)注基礎(chǔ)設(shè)施決策如何與人類和AI的自主性相結(jié)合,我們能夠而且應(yīng)該為強(qiáng)制更新等流程增加推理和有效的風(fēng)險(xiǎn)緩解措施,尤其是在高權(quán)限級(jí)別下。”
CrowdStrike的前瞻性舉措包括:
? 聘請(qǐng)首席彈性官,直接向首席執(zhí)行官匯報(bào)
? 探索內(nèi)核空間之外能力的“登峰項(xiàng)目”(Project Ascent)
? 與微軟在Windows端點(diǎn)安全平臺(tái)上的合作
? 獲得業(yè)務(wù)連續(xù)性管理的ISO 22301認(rèn)證
更強(qiáng)大的生態(tài)系統(tǒng)
一年后,變革顯而易見(jiàn)。庫(kù)爾茨反思道:“今天的我們比一年前更強(qiáng)大,工作仍在繼續(xù),使命依然堅(jiān)定,我們正在前進(jìn):更強(qiáng)大、更聰明,比以往任何時(shí)候都更加堅(jiān)定。”
庫(kù)爾茨還感謝了那些支持公司的人:“感謝每一位在困難時(shí)刻仍與我們同在的客戶,感謝你們始終如一的信任。感謝我們出色的合作伙伴,他們與我們并肩作戰(zhàn),卷起袖子加油干,感謝你們成為我們大家庭的一員。”
這一事件的影響遠(yuǎn)不止于CrowdStrike,現(xiàn)在,各企業(yè)都在實(shí)施分階段部署、保持手動(dòng)覆蓋能力,以及至關(guān)重要的是,為安全工具本身可能失效的情況制定計(jì)劃,供應(yīng)商關(guān)系得到了更嚴(yán)格的評(píng)估,人們認(rèn)識(shí)到,在我們相互連接的基礎(chǔ)設(shè)施中,每個(gè)組件都至關(guān)重要。
正如森托納斯所承認(rèn)的:“這項(xiàng)工作尚未完成,也永遠(yuǎn)不會(huì)完成,彈性不是一個(gè)里程碑,而是一種需要持續(xù)承諾和演進(jìn)的紀(jì)律。”2024年7月19日的CrowdStrike事件將被銘記,不僅因?yàn)樗斐傻钠茐模驗(yàn)樗苿?dòng)了整個(gè)行業(yè)向真正的彈性演進(jìn)。
在面對(duì)最大挑戰(zhàn)的過(guò)程中,CrowdStrike和更廣泛的安全生態(tài)系統(tǒng)有了更深刻的理解:防范威脅意味著確保保護(hù)者本身不會(huì)造成傷害,通過(guò)這艱難的78分鐘和一年的變革所學(xué)到的教訓(xùn),可能是這一事件最有價(jià)值的遺產(chǎn)。