“大數據”=“大曝光” 廠商如何解決這個問題?
廠商正在尋找“大數據”來幫助政府解決目前面臨的一些緊迫問題。但是,大數據本身通常也會帶來一些IT和信息安全方面的問題。廠商經常接觸大數據,仿佛這些大數據能夠使他們的數據庫容量迅速擴展和增加。因此,大數據的含義并不僅僅是大型數據庫,它包括新的工具、技術、部署和運營方式。大數據通常是云計算和虛擬化戰略不可分割的一部分。如果僅從傳統的IT角度來看,大數據意味著“大曝光”,這給信息安全帶來了風險。
類似于它接觸的傳統
雖然大數據的權威定義存在著爭議,但由于傳統IT專業人士的任務主要集中于如何處理、存儲和傳輸大數據,市場研究公司Forrester的分析師Mike Gualtieri給出的如下定義則易于被這些專業人士接受:大數據是一家公司存儲、處理和訪問所有數據能力的前沿。企業需要這些數據以便更有效地運營、作出決策、減少風險并服務客戶。
大數據的某些方面,包括應對傳統挑戰的傳統IT方式,并不需要全新的觀點。事實上,許多廠商已經為開發大數據安全的方法奠定了基礎。這個基礎包括云計算成熟的流程、持續監控和遵守《聯邦信息安全管理法案》(FISMA)。例如,隨著廠商優化自己持續不斷的監控能力,他們可以利用現有的支持大數據的工具,包括安全漏洞管理和補丁服務。雖然這些能力都是解決大數據安全問題必不可少的第一步,但是,當考慮大數據與過去的海量數據處理和存儲之間的差異時,還需要一種新觀點。
差異
大數據包含許多新技術、工具和做法(如,Hadoop, NoSQL, Pig, Hive, HBase等)以及數據倉庫策略,其中許多東西對于專業的安全人士來說都是陌生的,也形成了一個復雜的運營環境。
下面的例子充分展示了一些運營環境的復雜性,從安全角度和IT技術治理角度來看,這些復雜性屬于非傳統因素。
數據庫結構:雖然大多數傳統的數據庫廠商支持大數據,但是,他們是通過基于SQL或者其他相關結構來運行的。Hadoop和下一代數據庫都是為非結構化數據而設計的。
伸縮性:雖然基于主機的大小,大多數結構化數據庫系統是向上擴展的,但是,下一代技術則是水平擴展或是集群。一個廠商也許會利用500個小型系統同時運行形成一個集群,來代替一臺單一的數據庫服務器。這些小型系統中有些可能是虛擬的,有些可能是物理的,有些可能是在云中的。
配置管理:曾經,《聯邦信息安全管理法案》要求廠商開發出強勁的配置管理計劃,改組管理委員會,并確保安全影響分析作為系統改變的一部分來執行。當處理大數據的時,成熟且強勁的配置以及改變管理方式都是必須的。
成本:由于新的節點可以在任何云提供商環境中或在一個廠商里的附加桌面上自動添加,所以要嚴格控制IT資源及支出成本。
運營:誰負責修補漏洞?誰負責漏洞掃描?如果軟件有漏洞且聯系不上廠商修復這個漏洞會發生什么事情?保證最基本的運營維護并且在決策制定過程中分配附加資源。由于擁有許多能夠利用云服務的大數據平臺,安全團隊一定要清楚任何改變都應該作為系統壽命的一部分來實施。
大數據仍然依賴同樣的IT基礎設施,就像系統在過去做的一樣。但是,大數據能夠極大地擴張并且使它復雜化。Hadoop等新軟件缺少成熟的安全模式、評估技術和自動化工具。這意味著安全團隊基本上依賴一些可操作的和可管理的技術,包括隔離和強大的可審計的訪問控制技術,以保證大數據不會成為“大曝光”。安全團隊必須以保護基礎設施和操作系統的整體的角度觀察大數據,盡可能使用自動化的和現有的政策。
根據《聯邦信息安全管理法案》,通過使用具有成熟的改變和配置管理流程的方法,廠商可以利用大數據安全的好處。安全團隊需要更加相互協調并且參加數據科學家和業務部門的生活以便了解他們的工作方式以及他們的需要。雖然大數據對于許多廠商來說都是新的,但是,保護信息的原則和為運營引進成熟的管理通常不是新的。廠商應該利用其現有的運營和管理控制保護新的技術,同時開發自動化工具以增強嚴謹性、成熟度和自動化。(編譯/胡楊)