怎樣才能讓你的云端數據管理更專業?
譯文【51CTO.com快譯】當Carolinas HealthCare系統的腫瘤學家在腫瘤委員會進行審查前討論患者病例時,表示他們正在尋求有關治療計劃和臨床試驗的反饋。這些醫生在演示過程中展示了基因數據、病理報告、實驗室結果和醫生的筆記。而所有內容都是通過指尖點擊就完成了,因為這些數據都存儲在了Azure的Hadoop云中。
這是非盈利性醫院網絡第一次進入云計算,也體現了CHS對如何保護和管理其云端數據的一些細致地考慮。這家醫療服務組織擁有員工62000多人,在東南亞經營39家醫院和900個其他醫療機構。
對此,CHS信息和分析服務(IAS)副總裁Chris Danzi表示,CHS需要解決的兩大問題是網絡和治理問題。管理內部和外部數據之間的一個顯著區別是:在云端,數據可能會在數百英里之外。Danzi指出:“你正在談論遠程移動數據,所以你必須有一個電路和安全的網絡來連接。”為確保每天晚上都能夠準確無誤地將云數據傳輸到云提供商那里,光這數千兆字節的傳輸就要求他們必須與電信運營商購買一條安全的醫療保健網絡專線。
在將數據遷移到云端的一年中,CHS一直在使用一個VPN,來實現與Azure的私有連接。同時該線路也用于其Office 365系統。“另一件你必須考慮的事情是,我買這條線路不僅是為了獲得更好的速度,還必須為需要實時訪問的互動用戶分段,以及將要做的大批量文件傳輸。” Danzi解釋說。
他認為,在云中管理數據不同于在內部管理數據,包括在員工技能方面,都需要考慮如何設置數據治理計劃以及如何啟用部分技術基礎架構。
Danzi說:“從可能試圖竊取您的數據的人的角度來看,這些領域都必須完全重新考慮。我們已經掌握了很好的內部部署,現在我們正在傳輸數據并將其存儲在不同的地方,所以我們必須重新考慮它。你必須不斷去重新思考,因為每天我們都會聽到一些新的,更為聰明的方式能破譯數據。”
更多公司選擇了外部數據存儲
毫無疑問,云已成為許多組織的IT和數據環境的組成部分。IDC數據集成軟件研究總監Stewart Bond表示,最近的IDC調查顯示,越來越多的組織正在將數據整合到混合和僅云環境中,而不是將數據嚴格地保留在內部。
“云中數據可以是SaaS應用程序,PaaS系統或包含在IaaS中實現的數據庫和文件服務器。”Bond表示,在SaaS應用程序中訪問數據通常需要使用API,使用Web服務訪問數據與使用SQL腳本與關系應用程序數據庫非常不同。
“在PaaS環境中,實施將決定是否需要Web服務API,或者如果使用SQL或NoSQL方法來訪問數據。”Bond說,在IaaS環境中的數據可能可以使用也可用于內部部署數據源的編程結構來訪問,但該訪問需要通過安全通信通道進行。無論如何,主數據管理技術有助于在多個不同的數據孤島之間進行調和。
技術業務管理(TBM)理事會的新任總裁Erez Yarkoni表示,在考慮如何管理云數據的步驟時,首先組織需要非常仔細地規劃網絡容量。
“當我們的數據中心的數據是正確的時候,我們所理解的顯而易見的事情正在發生變化,基本上是擴展你的網絡足跡,你必須非常小心你的設計方式。”Yarkoni另一個身份是Telstra和T-Mobile的CIO,“這又增加了另外一個因素,如果你不仔細地計劃出口和退出環境,從往返云本身以及人們如何與你放入云中的信息進行互動,那么這個花費可能非常昂貴。”他說。
Yarkoni表示,當他參與設計數據環境時,他盡可能避免將大量數據傳輸到云端,如果有必要,可以在一天的某些時間進行。“如果你將信息從數據中心移動到云端,并且希望獲得一些服務質量保證,則必須保證這些位置之間的鏈接。”
檢查云供應商
Forrester公司副總裁兼首席分析師Andras Cser表示,雖然組織通常會對云提供商進行審核,但這一過程往往出現脫節。“我們看到大多數組織對云計算提供商進行初步審核,他們計劃存儲數據,但持續的審計很少。”這可能是由于其他優先事項,流程的復雜性,云中存儲的數據量以及采用云的速度加快等因素使然。而Forrester通常會看到公司要求ISO27001和SOC1/SOC2認證。CHS則規定其云提供商將進行SOC2審核,并且可以訪問這些結果。CHS的Danzi表示,CHS可以審核他們與計費做法相關的記錄。通過適當的通知,CHS也可以檢查其供應商的數據中心。
不過,像Azure的ExpressRoute和Amazon的Direct Connect這樣的產品可以在內部部署環境和各自的云端之間提供專門的網絡連接。“一旦數據在云中,IT商店就不再需要數據庫管理工具來管理數據庫,因為管理數據庫性能、調優和設置的耗時過程都由云提供商處理。”咨詢公司全球數據戰略公司信息管理總經理Donna Burbank說。
她指出:“了解你的數據,并知道它在哪里和保護它是重要的,但它的許多日常管理已經消失了。云提供商現在監督諸如性能和調優等任務,并檢查服務器是否正在運行并正在進行備份。(換言之,在某種程度上監督供應商是一個很好的做法)”
保護云數據
“管理云中的數據不同于在內部管理數據,特別是在處理敏感數據(例如客戶信息)時。”Burbank說。當另一個實體控制個人信息時,她建議使用PCI數據安全標準和令牌化密鑰。當公司利用云提供的效率時,“有很多假設的信任,但是你仍然沒有完全控制它。”
Forrester高級分析師Heidi Shey同意Burbank的意見,即安全令牌是保護數據的一種方式,但她表示,組織應該規定誰掌握這些數據,“一些安全解決方案將加密作為這些控制之一,誰擁有的是關鍵問題。有些公司希望擁有自己的控制權,而其他公司則會相信供應商。控制你自己的鑰匙是最好的選擇。這樣做有時會增加另一層復雜性,因為你是一個管理者,但它是一個額外的控制。”
除了確保云端數據安全外,確保數據在傳輸過程中的安全也很重要。這可能需要VPN連接、HTTPS、SFTP/FTPS和其他安全的通信方式。
IDC的調查還表明,隨著數據在云中分布越來越多,信任越來越困難,主數據特別是有關組織關心的人員,地點和事物的數據是最分散的,因為某些形式的需求將需要存在于每個應用程序中。
然而,在2017年1月份的Forrester調查中,通過對美國和加拿大的150位數據安全專業人員的調查,只有31%的受訪者會根據其敏感度對云中的企業數據進行分類。另外,只有約三分之一(34%)的數據安全專業人員知道他們的云計算公司數據位于何處。
對此,Forrester的Shey認為,還必須考慮云安全治理流程,以及將企業安全要求與合規性和隱私權法律相一致,特別是涉及個人信息時。
因為是一個醫療保健實體,CHS正在尋求在云中更加復雜的安全性。CHS的Danzi解釋說,人們在云中使用的大量Hadoop環境并不比結構化關系數據庫環境成熟。CHS正在使用Apache Hadoop的HDInsight,它具有Apache Ranger等產品用于管理和管理用戶級訪問的Enterprise Hadoop的安全層。
Azure支持兩個版本的Hadoop實現。完全管理的HDInsight版本不支持Ranger以及IaaS版本HDP。“HDInsight符合HIPAA標準”,但沒有Ranger的用戶級安全特性,所以我們必須限制訪問。”Danzi解釋說。這是CHS早期學習的重要課程,即確保云端供應商支持公司正在使用或希望使用的軟件版本。“你不能以為這些東西提供你所使用的所有安全協議和保護。”
此外,“我們知道,我們使用的Hadoop版本是全部或無論在誰被授予訪問權限。但CHS只希望其信息和分析服務(IAS)管理員能夠訪問其環境。因此,CHS在Microsoft SharePoint中構建了一個安全的應用程序,僅向腫瘤板上的醫生提供患者信息。
Shey補充說,云中管理數據的另一個重要方面是數據駐留和數據傳輸。“如果你有來自特定國家或地區的客戶數據,你會看到一般數據保護條例的作用,但具體國家可能有自己的數據居住要求。”
Global Data Strategy的Burbank認為:“你需要知道數據在何處存在數據,因為法律在不同國家是不同的。”
其他云管理考慮
Burbank指出,數據備份和恢復應該在云提供商的服務級別協議中闡明,這是他們應該提供的關鍵優勢之一。這些SLA應包括有關提供者是否具有故障切換站點以及該故障轉移站點所在位置的信息。“另外需要考慮你是否可以選擇這些故障轉移的地方。”
“組織還應該考慮他們在云中管理的數據的格式。它可能在關系數據庫、平面文件或電子郵件中。如果客戶數據存儲在大容量的數據倉庫中,他們還需要考慮是否擁有內部管理技能。”Burbank指出,“如果你在數據周圍進行大量的清理和管理,那么這是需要考慮的事情,而且很多云技術都不那么先進。但是,如果你有原始數據可以輕松擴展和遷移,那么它非常適合于云端,因為它不需要很多管理。”
“由于技術如此之新,所以管理云中數據所需的技能可能難以實現。”IDC的 Bond表示,必要的技能將取決于數據是SaaS、PaaS還是IaaS模型。在技術層面上,IT人員可能需要熟悉互聯網技術,如Web服務、SSL、安全FTP和RESTful API。他們也可能需要熟悉IaaS體系結構,如虛擬機、對象存儲,可用區域和子網絡。在業務層面,用戶需要意識到管理數據輸入和維護的策略,以及跨多個系統進行數據復制的延遲問題。
計劃意外
CHS的Danzi表示,他們發現CHS的一些“熱切的數據科學家”剛剛開始運行R編程語言編寫模型來研究再入院風險。因此,在Azure,IAS小組撰寫腳本,以便在不需要計算時在晚上關閉模型。“云像一個擴大的氣球,你必須告訴它讓空氣流出來,它讓你有能力編寫腳本關閉服務器。這就是所謂的彈性,你想確保你的云供應商能夠彈性上下,只有在你使用它們的時候才支付資源。”
他還建議受監管機構應該擁有良好法律技能的人員,“你與第三方服務提供商必須確保所有HIPAA合規性和良好的業務關聯協議”。
許多云供應商提供分析產品,并為潛在客戶提供基準分析,Danzi認為,需要確保這些供應商在將你的數據提供給你所在的行業同行時,將其數據匿名化。
組織可能不會考慮的另一個問題是,如果他們在Azure上編寫算法,可能希望保護該算法的知識產權,以免其他人在云中使用它。Danzi認為,所有數據將在15年時間內在云端托管。在管理云數據時需要大量的額外工作,但這些是值得的,“雖然新環境需要更加持續的警惕,但你可以訪問這種令人驚奇的技術。”
原文標題:Expert tips for managing your cloud data,作者:Esther Shein
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】
了解更多熱點新聞,請關注51CTO《科技新聞早報》欄目!