DataOps是“數據的DevOps”嗎?
原創???
作者丨徐杰承
【51CTO.com原創稿件】DevOps 一直以來都是轉變 IT 工作方式的主要催化劑,它能夠使項目變得更加敏捷,使企業能夠更快的對客戶需求作出響應。正如企業需要 DevOps 幫助研發團隊在保持高質量情況下提高交付效率一樣,企業同樣需要依賴這些功能來實現對于數據工程的分析與開發,而應對這一挑戰的方案便是 DataOps。
什么是 DataOps?
DataOps 概念由 Lenny Liebmann 于 2014 年首次提出,DataOps 的核心是一種面向過程的方法,用于提高數據分析團隊與數據工程團隊所使用的數據質量并縮短數據分析的時間周期。DataOps 統一了數據分析團隊和數據工程團隊,使企業的數據團隊能夠更快速、更準確地提供分析解決方案及數據產品。
對企業而言,數據的價值從未像今天這般重要,這也就是為什么一些企業愿意采取不同的方式來獲取所需數據以及可用于數據驅動的解決方案。而 DataOps 便是可應用于這些方面的最佳實踐,且如今,DataOps 已逐漸發展成為了一種獨特的數據加工、配置與分析方法。
為什么 DataOps 對數據驅動的企業很重要?
DataOps 對于數據驅動的企業而言至關重要,它有助于提高數據分析的質量和速度,提升數據項目的“時間的價值”。DataOps 能夠優化從數據采集到分析的整個流程,而數據分析質量和速度的提高可以帶來以下幾個好處:
- 增強預測能力
- 提高生產效率
- 降低資源消耗
DataOps 可以幫助企業提高總體的數據質量,并能夠將數據處理流程中的各個階段進行集成。數據分析師與數據工程師通過協同工作能夠更早的發現和解決數據問題,以避免數據問題對企業項目產生影響。不僅如此,DataOps 還關注數據的交付流程,其目標是通過不斷改善和更新數據模型、可視化效果、數據報告與數據報表,來滿足企業的各類訴求。
在企業的發展與成長過程中,需要獲取大量的數據以支持企業不斷做出新的決策,而 DataOps 的另一個優勢則是其所形成的數據質量與解決方案會隨著企業數據量的增大而具有更高的可靠性。
DataOps 與 DevOps
雖然兩者都是基于敏捷結構所設計的用來加速工作周期的方法,但是 DevOps 將重點放在了產品開發上。相反,DataOps 側更為關注數據的管理和交付速度。DevOps 往往以應用層為中心,而 DataOps 則包含了從數據獲取到用戶消費的整個數據鏈。
此外,DevOps 強調開發團隊和運營團隊之間的協作,通常由企業中的開發團隊單獨使用。而 DataOps 則強調了所有數據使用者之間的關聯,使得數據在被使用時能夠得到更為全面的管理,這對于確保產品開發過程中的數據完整性至關重要。
因此,雖然 DevOps 為 DataOps 奠定了基礎,但 DataOps 并非是用于數據層面的 DevOps。
DataOps 與 DevOps 的相似之處
DataOps 的許多原則都是從 DevOps 中類似的原則里衍生出來的。企業需要 DevOps 幫助研發團隊在保持高質量情況下提高交付效率。而在執行與數據相關的任務時,企業則需要依靠 DataOps 進行敏捷的數據分析與數據處理。
由于 DataOps 與 DevOps 使用相同的工具鏈,因此對于已經具有 DevOps 架構的企業來說,使用 DataOps 將會非常簡單。以下是 DataOps 從 DevOps 中獲取的一些主要概念:
- 快速增長
- 重用與自動化
- 專注于提供市場價值
- 自動化測試與代碼升級
- 持續集成 / 持續交付 (CI/CD)
DevOps 和 DataOps 的差異
盡管 DevOps 和 DataOps 在基礎上有一些相似之處,但兩者之間其實還是存在著許多顯著區別的。
流程:DataOps 和 DevOps 的生命周期具有一定的交互特性。但 DataOps 的不同之處在于,它由數據管道和分析開發過程組成,其二者是實時交互的,而 DevOps 則由軟件的開發與交付組成。
編排:應用程序源代碼不需要在 DevOps 方法中進行大量編排。但對 DataOps 來說,數據管道和分析開發的編排都是必須的。盡管 DataOps 中經常發生數據管道的編排,但在應用程序開發和 DevOps 過程中通常不會出現這樣的管道協調。
數據管理:在大多數 DevOps 中,測試數據管理與權限變更并沒有優先權,但在 DataOps 中這些操作將擁有更高的優先級別。
受眾:DataOps 和 DevOps 的使用者有著不同的技術能力。DevOps 是為軟件開發工程師量身定制的,而 DataOps 更多的是面向數據工程師、數據科學家和數據分析師,他們在工作中更多的依靠模型與可視化工具的輔助。
工具:DataOps 是從 DevOps 中衍生出來的,雖然在 DevOps 中的測試主要是自動化的,但是 DataOps 并不具備這樣的優勢。現階段支持 DataOps 的自動化測試工具并不十分完善,大多數用戶仍需要自行修改自動化測試工具或重新構建自己所需的自動化測試工具。
DataSecOps 及其重要性
DataSecOps 是一種敏捷、整體、安全的嵌入式方法,用于協調不斷變化的用戶數據,核心是在 DataOps 中內嵌數據安全屬性,這樣的結合對于那些通過數據驅動的企業來說是至關重要的。這使得企業在快速獲取數據價值的同時能夠保持自身數據的私密性、安全性并對數據進行有效管理。
DataSecOps 與 DataOps 的相似之處在于,它們都專注于通過數據分析以改善安全問題,但它們在安全性標準、安全思想和執行過程上的側重點不同。隨著互聯網的不斷發展,數據活動也在不斷發生改變,而 DataSecOps 能夠幫助企業始終保持對數據的掌控權。DataSecOps 是一種動態的、全方位的思維方式,可以將數據解決方案與快速變化的數據集成起來,并支持數據治理,保障企業的數據隱私與數據安全。
DataSecOps 強調安全與 DataOps 的融合,這種方法的目的是確保數據項目不會給企業帶來額外的安全風險。這需要企業在數據操作中的每一個階段都進行安全性考量,而不是在項目完成后再去思考安全問題,這樣能夠確保所有的數據項目和數據操作都是安全可查的。
很明顯,DataSecOps 是 DataOps 的一個子集,將“Sec”組件集成到 DataOps 能夠幫助于企業在數據使用的整個生命周期中避免數據安全問題。在如今的互聯網背景下,保障數據的安全性和完整性是每家企業的發展過程中都會面臨的嚴峻挑戰。
結語
DataOps 和 DevOps 都是能夠給企業帶來幫助的重要方法,但它們之間有著很大的不同,DataOps 并非“用于數據的 DevOps”。DataOps 是一種敏捷方法,對于擁有著眾多數據使用者、數據生產者和其他數據涉眾的以數據為中心的企業至關重要。
原文鏈接:https://dzone.com/articles/is-dataops-devops-for-data
會議推薦
隨著數字經濟在全球經濟中占比的不斷提升,數字化帶來了新的機遇和挑戰。數據、算力、算法推動數字世界持續進化,隨著產業數字化、數字產業化的深入,數據驅動逐漸成為企業經營與創新的源動力、經濟發展的新常態。
2022 年 4 月 9 日至 10 日的 WOT 全球技術創新大會“數據驅動新常態”專題中,多為來自業界優秀企業的技術專家,將圍繞技術演進、架構變革、應用探索、治理優化等方向,與大家分享大數據生態的前沿趨勢與最佳實踐,旨在為廣大聽眾帶來一些新的思考與借鑒。感興趣的同學可以掃下圖二維碼或點擊閱讀原文查看活動詳情。
目前大會 6 折購票中,現在購票立減 2320 元,團購還有更多優惠!有任何問題歡迎聯系票務小姐姐秋秋:15600226809(電話同微信)
???
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】