云端分析面臨的關鍵挑戰及克服方法
譯文【51CTO.com快譯】與在內部部署設施進行批處理分析的方法相比,將分析業務遷移到云平臺需要新的方法、技能和架構。像許多其他IT功能一樣,數據分析工作也遷移到云中,這既帶來了機遇,也面臨著挑戰。
在調研機構Gartner公司列舉的 2021年十大數據和分析技術趨勢中,使分析功能更易組合的開放的、容器化的分析架構就是其中的一個趨勢。該公司表示,這使組織能夠快速創建靈活而智能的應用程序,以幫助數據分析師將見解與決策聯系起來。
Gartner公司指出,“隨著組織將數據重心轉移到云中,可組合數據和分析將成為一種更靈活方式,以構建由云計算市場以及低代碼和無代碼解決方案提供支持的分析應用程序。”
云計算服務可以將數據分析提高到一個新的水平。創意服務提供商Loveurope and Partners(LEAP)公司系統和技術總監Aidan Taub表示:“云計算可以為我們提供更高計算負載所需的可擴展性。隨著各行業組織繼續實現數字化,需要以指數級的規模構建文件數據。當組織擁有大量的非結構化數據(例如LEAP公司所處理的視頻、圖像和音頻)時,永遠無法知道其工作量有多大,而傳統分析方法無法像云平臺一樣擴展規模。”
然而,在云中進行的分析需要不同的方法、技能、架構和經濟性。伴隨著這些變化,勢必需要克服一些障礙。
以下組織可能會面臨的一些挑戰以及當向在云中執行數據分析時能夠解決這些挑戰的方法:
由于未知而害怕失去控制
數據分析對于組織來說具有高度的戰略意義,對于習慣于完全控制數據資源的技術領導者而言,將分析過程遷移到云中的想法可能令人望而生畏。
德勤咨詢公司高級分析支持主管Anthony Abbattista說,“我們看到客戶面臨的主要挑戰之一是組織慣性或對失去控制的恐懼。”Abbattist曾與眾多企業的IT高管合作,并致力于推廣基于云的分析。
Abbattista說:“IT主管和首席信息官的傳統角色是保護數據資產并成為數據資產的守護者。”他表示,在某些情況下,云計算技術對數據分析的現狀構建了挑戰,因為它可以更快地推向市場。例如產品選擇和評估,點擊配置的數量有限,無需大量增加資本支出等等。
Abbattista說:“首席數據官和首席信息官需要共同努力,以審核和熟悉云平臺,這樣他們可以幫助獲得商業價值和競爭優勢,至少不落后于競爭對手。這可能需要采用市場上可接受的、經過驗證的新興模式,而不是從頭開始設計或重建分析環境。”
提供保險服務的非營利機構全球公共機構雇員保險公司(WAEPA)首席信息官Brandon Jones表示,由于現有的分析流程缺乏靈活性,許多組織在探索新的分析能力方面進展緩慢。他說:“組織需要嘗試新功能,并推動創新的激勵措施和計劃。”
為了克服這個問題,WAEPA公司的IT部門使用了一個支持云計算的沙盒環境來建立一個試錯思維過程,使用關鍵利益相關者的關鍵性能指標創建了一個原型優先的分析環境。
進行轉變
除了克服IT領導者認為的失去控制之外,他們還需要應對向云平臺的遷移,并確保服務不會中斷。
Taub說,“這對于許多IT領導者來說,他們最困難的決定就是向云平臺遷移。但是,如果他們選擇正確的解決方案,就不必這樣做。”
Taub說,將數據分析遷移到云端時,IT領導者在很多情況下都是從“提升和轉移”的方法開始,將現有的操作移植到云端。他補充道:“這通常意味著重新設計應用程序和系統,而為了進入云平臺需要重新構建。”
作為2019年對其原有數據基礎設施進行全面改革的一部分,LEAP公司使用Qumulo公司的分析平臺將大量非結構化文件數據遷移到云中。LEAP公司的文件和數據以前分布在各種不同的傳統存儲系統中,而數據在工作流的不同位置管理和定位則非常耗費人力。
Taub說,“幸運的是,Qumulo公司幫助我們轉移了所有數據,而無需為進入云平臺重構應用程序,我建議組織找到一種工具,使在多個環境中復制和提取數據變得更加簡單。”
這一轉變使該公司能夠優化其數據分析,并將其性能提高240倍以上。采用谷歌分析軟件,可以查看已連接的客戶端數量、使用帶寬最多的客戶端,以及數據在哪里快速增長。
Taub說:“創造性工作流程的成功很大程度上取決于我們在云中訪問數據分析的能力。我們在全球各地擁有由數百名藝術家、設計師和動態圖形編輯人員組成的團隊,因此,我們需要利用云計算服務來有效安全地協作開發創意項目。如果沒有基于云計算的數據分析,我們的生產流程將陷入困境。”
掌握正確的技能
成功的IT工作似乎總是歸功于掌握必要的技能,而將數據分析遷移到云平臺也不例外。
Abbattista表示,德勤咨詢公司的調查表明,組織對技能的需求開始發生變化。他說:“云計算分析環境不需要專家來支持傳統分析/商業智能中技術堆棧的每個部分,而是需要更多的‘全棧式’思維。為應對這一挑戰,支持這些新時代環境的技術團隊需要了解云平臺上的產品,采用標準模式,然后隨著新技術、工具和產品的出現而不斷發展。”
美國零售商Dollar Tree公司前任首席信息官Josh Jewett表示,選擇在云計算環境中構建自己的分析平臺或依靠云計算供應商提供服務的組織將需要具有特定的專業知識和技能。
Jewett指出,這些技能包括創建、維護和從數據湖中獲得分析的技能,以及如何最好地利用云原生或第三方人工智能和機器學習能力,并從分析中獲得更多的見解。
在Dollar Tree公司任職期間,Jewett幫助該公司實現了許多系統的現代化,其中包括數據分析。他說,“和其他許多零售商一樣,Dollar Tree公司采用了混合策略,部署了軟件即服務平臺,為關鍵業務功能提供特定的分析功能。例如,這些工具包括用于庫存生產率、價格優化、減輕損失預防,人才獲取,以及績效管理等。”
該公司還在云計算環境中開發了一些分析應用程序,以利用云計算的靈活性、可擴展性,并加快產品上市的優勢。
保護數據安全
無論云計算服務提供商怎么強調其云計算基礎設施的安全性,其客戶都需要始終關注其數據在云中的實際安全性。
對于數據分析來說尤其如此,因為從數據分析中獲得的見解可以成為一種競爭優勢,此外還要關注不能泄露諸如客戶信息之類的高度敏感的數據。
Taub說,“當將組織的數據從其內部部署數據中心遷移出去的時候,安全性成為頭等大事。LEAP公司利用了包括自由職業者在內的全球員工網絡,這意味著我們必須確保數據將在內部和外部用戶訪問的云平臺中得到保護。”
軟件提供商Precisely公司數據首席信息官Amy O’Connor表示,最大的安全問題之一是控制對云計算應用程序和數據的訪問。他說:“人們使用云計算應用程序在獲得便捷性的同時也帶來了挑戰,其中許多根源在于人們可能會無意間造成安全、隱私和經濟方面的問題。在云計算帳戶之間進行安全切換以及安全地存儲和交換密鑰是一個關鍵問題。需要圍繞適當使用數據進行強有力的治理。與內部部署數據中心相比,云中的安全事項更緊急,因為能夠很容易地以未經授權的方式復制和使用數據。”
O’Connor說:“Precisely公司采用混合多云模式,可以利用多個云計算供應商提供的服務來滿足其計算和存儲需求。我們基于云計算的數據湖是存儲大量數據的地方。如果數據起源于云平臺,我們將在云平臺中開始處理。如果具有本質上突發性的分析需求,則可以利用云計算服務進行處理。如果需要快速開始分析處理,則可以從云平臺開始。當我們需要處理非結構化數據以及使用包括機器學習在內的高級分析處理時,我們可以利用基于云計算的數據湖。”
避免云計算成本陷阱
盡管使用云計算服務可以幫助組織避免諸如內部部署存儲系統之類的成本,但其支出可能會很快失控或超出預期。
Taub說。“預算始終是一個問題。一刀切的數據架構可能是IT支出的陷阱。因此在決定將分析遷移到云中時,組織通常會感到更多的壓力,需要支付高昂的前期成本,并受到無法滿足其當前需求的長期合同的限制。”
Taub表示,關鍵是找到一個不會強制鎖定的云計算提供商。他說:“組織在評估云計算平臺時需要進行評估和比較,選擇滿足組織當前分析需求的靈活解決方案,并可以根據需要靈活地擴展以滿足組織的未來需求。”
O’Connor表示,雖然采用云服務很容易,但也很容易將錯誤的作業類型轉移到云中,并在不再需要使用云計算應用程序和資源之后繼續運行。
他指出,控制云計算成本的兩種最有效方法是控制云帳戶的創建方式,并且對于誰在使用云資源完全透明。
O'Connor說:“為了解決第一個問題,我們將每個提供商的所有云帳戶都遷移到一個主帳戶中,我們還集中了新創建的云帳戶。需要新的云計算資源的個人和團隊都要經過正式的請求流程,該請求必須包括業務理由、部門預算信息和業務所有者等內容。”
O'Connor說:“至于其透明性,只要批準了請求,中央團隊就會在主帳戶下創建任何新的云帳戶。這種治理政策使我們能夠透明地了解云計算提供商開具發票的費用。每個帳戶都是用請求中提供的信息創建的,然后可以使用云計算提供商的門戶或控制臺來監控與每個初始請求匹配的支出。”
O'Connor表示,將云計算成本應用到請求者的預算中,從而精確地將這些支出信息用于內部按存儲容量使用計費模型。IT部門使用這些方法推動云計算成本的問責制,并確保為正當的業務原因而提供適當的預算。
原文標題:Analytics in the cloud: Key challenges and how to overcome them,作者:Bob Violino
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】