2023展望:新的一年將給大數據分析領域帶來什么?
世界充斥著數據,數據生成的速度也在加快。
實時數據興起
數據倉庫一直很受歡迎,尤其是在云端。但SAS執行副總裁兼首席信息官Jay Upchurch表示,預計2023年將有更多客戶從傳統數據倉庫轉向實時數據存儲和分析。“2023年,我們將繼續看到從傳統的數據倉庫向支持實時分析和響應數據的存儲選項的轉變。組織將傾向于實時處理數據,并將其以用戶友好的格式存儲,無論是監控機器流式物聯網數據的制造商,還是監控電子商務流量的零售商,能夠實時識別趨勢將有助于避免代價高昂的錯誤,并利用實時數據抓住機會。”
多元化分析
在過去,企業尋求“唯一”真相。但在新的大數據世界中,開明的組織意識到這并不總是那么簡單,所謂條條大路通羅馬。
“通常,一個問題可能有多個正確的答案,這取決于如何定義該問題的參數。比單一版本的真相或一個正確答案更重要的是處理問題的潛在能力,即“為什么”。基于此,公司可以以理解和推動業務結果的方式獲取數據,并通過提出更好的問題,認識到尋找答案的細微差別,發現自己的不同見解,而不是依靠單一版本的真理,在分析上變得更加成熟。最終,將推動數據的多元分析文化。“
數字孿生蓬勃發展
與數字孿生或元宇宙相關的ML/AI進化將取得進展。其目標超越僅僅預測機器故障或購買傾向的傳感器,轉而預測經濟市場、糧食生產、人口健康等更加廣泛和宏觀的數字分析和預測。
世界上大多數數據都是非結構化的。然而,大多數分析數據庫都是關系型的,旨在處理表格數據。答案很明確:世界需要矢量數據庫來釋放非結構化數據中的價值。
“隨著企業擁抱人工智能時代,并試圖在生產中充分利用其優勢,需要理解的各種形式的非結構化數據量出現了大幅增長。為了應對這些從非結構化數據中提取有形價值的挑戰,vector數據庫是專為非結構化數據構建的一種新型數據庫管理技術數據處理——正在上升,并將在未來幾年內占據主導地位。
數據為中心的商業模式
Fluree總裁Eliud Polanco預測,2023年,從特定功能的商業模式向以數據為中心的商業模式的轉變將加速。
“在過去的20年中,業務IT投資都集中在提高功能級別的生產力上……我們已經達到了功能優化生產力的峰值閾值,而競爭差異化的新領域是在競爭中脫穎而出,而不是在執行中脫穎而出。這需要將數據放在中心,并使所有業務功能能夠安全地協作。”測試和利用來自所有其他功能的數據。在這種以數據為中心的模型中,數據就是產品,功能來自數據。
數據網格概念
2023年,數據網格(data mesh)概念將繼續增長。但Exasol產品和創新高級副總裁Jens Graupmann表示,如果不是錯誤信息,數據網格將增長更快。
“在2023年,預計組織將面臨更大的壓力,要求他們更快地行動,建立有彈性、靈活的數據架構,從而推動數據團隊實現數據網格。然而,盡管對數據網格的熱情越來越高,但預計會因錯誤信息而遇到障礙。為了向前發展,需要消除錯誤信息,以便成功采用數據網格按比例計算。例如,你不能購買數據網格——它不是一種技術。關于如何防止數據網格加劇數據豎井,以及數據網格和數據經緯(data fabric)是否實際上是一回事,仍有許多討論和困惑。為了克服這些挑戰并超越任何爭論或不確定性,公司必須負責教育自己,以加強對數據網格是什么以及如何優化數據管理策略的理解。”
人工智能和機器學習模型在突出數據中的潛在相關性方面發揮了至關重要的作用,而這些相關性通常對人類解釋來說并不明顯。在未來的兩三年中,這些模型將進一步發展,以根據分析提出糾正措施。
人工智能的未來是低代碼
SAP北美總裁Lloyd Adams認為:人工智能將越來越多地支持由其他軟件更主動地指導和編寫的軟件開發過程。
這將允許商業用戶在應用程序開發工具的幫助下使用文本提示創建新的應用程序。雖然這種前景可能會讓專業開發人員感到焦慮,但這種轉變有望創造新的機會而不是淘汰舊的。軟件開發人員將通過學習如何向AI工具提供正確的提示來生成無代碼應用程序開發人員所需的代碼,從而熟練地實現這一進化。