企業如何確保數據湖安全
企業的數據湖充滿了敏感信息,確保數據安全是當務之急。而人們需要了解使信息免受黑客攻擊的優秀實踐。
數據湖是一種專用平臺,可存儲來自各種來源的大量結構化和非結構化數據。調研機構的分析師可以使用各種工具直接訪問數據湖中的信息,也可以將其作為準備要加載到數據倉庫中信息的暫存區。
換句話說,數據湖擁有有關企業業務的信息寶庫。與所有企業數據存儲一樣,需要保護數據湖免遭未經授權的訪問。
識別和分類現有數據和傳入數據
如果不知道所存儲的數據是敏感數據,就不會采取必要的預防措施來保護它。大多數企業都有將數據元素分為敏感度級別的安全分類。其級別基于行業和政府法規的安全標準,以及如果未經授權披露或修改該數據將對企業產生什么影響。
這些分類使管理人員可以部署適當級別的基準安全機制和過程控制。為了確保正確分類,企業需要評估數據湖中的現有數據,并制定程序以分析傳入的信息。
保護輸入、輸出和工作文件
在討論數據庫安全性時,其原則是“沒有數據庫就是孤島”。而這個原則也適用于數據湖。
黑客的常見策略是獲得對加載系統的輸入文件,日常處理中使用的工作文件,以及輸出文件的訪問權限。企業需要保護的輸出包括用于將數據傳輸到其他應用程序的文件、報告文件和數據湖備份。
帳戶管理和訪問權限
有許多數據湖平臺可供選擇。亞馬遜、甲骨文、Cloudera、微軟和Teradata都有流行的數據湖選項。盡管每個平臺可能具有不同的機制和過程來創建帳戶和分配訪問權限,但數據湖安全優秀實踐對于每個環境都是相同的。
為了正確保護數據湖,企業應該遵循傳統的行業建議,其范圍從授予用戶執行工作所需的最低安全權限到設置適當的密碼復雜性、有效期和鎖定設置。
還應使用雙因素身份驗證、密碼庫和企業身份驗證機制來保護平臺。數據湖的管理指南是極好的資源。大多數供應商手冊都包含詳細的準則,以幫助管理人員保護其系統。
系統保護優秀實踐
操作系統和數據湖的供應商手冊還提供信息,以幫助企業正確安裝和配置其軟件,以防止未經授權的訪問。使軟件保持最新狀態并識別、分析和應用安全修復程序是所有平臺(包括數據湖)的標準做法。同樣,應用行業優秀實踐也很重要,其中包括正確的系統配置和補丁程序管理。
基本的配置錯誤問題和優秀實踐的缺失會導致安全問題。根據SiliconAngle公司發表的一篇文章,越來越多的黑客利用基本的安全管理錯誤對Hadoop系統(數據湖的主要平臺)造成了嚴重破壞。
正在進行的安全評估
定期計劃的滲透測試、漏洞掃描和審計都是有效的數據湖安全計劃的基本要素。
這些掃描的共同目標是識別安全漏洞。重要的是要注意,所有這三個標識針對特定時間點的漏洞,并且必須定期執行以維護高水平的數據湖安全性。
滲透測試軟件允許安全分析師執行一系列進程,試圖利用已知系統漏洞訪問目標平臺。漏洞軟件還可以識別已知的系統漏洞,但不會試圖利用這些漏洞獲取訪問權限。漏洞掃描的侵入性較小,運行頻率高于滲透測試。安全審計審查現有控制措施的執行情況,并評估對組織政策和程序的行政遵守情況。
企業使用滲透測試、漏洞掃描和審核產生的輸出來識別安全問題,并采取必要的糾正措施來補救或減輕其影響。
學習和培訓
學習如何保護環境就像學習其他任何東西一樣。人們需要花費時間學習各種安全最佳實踐,可以通過大量培訓材料進行學習,并且在Udemy和Coursera等網站上提供安全等級和認證。