成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

云計算成為數據倉庫的新重心

云計算 數據倉庫
絕大多數組織計劃在2021年擴大對云計算數據倉庫和數據湖的投資。然而,圍繞數據管理和ETL的許多問題仍然存在。

調研機構IDG公司最近發布的一份調查報告表明,雖然組織的數據向云平臺的大規模遷移并不是從2020年開始的,但在這一年中得以快速發展。絕大多數組織計劃在2021年擴大對云計算數據倉庫和數據湖的投資。然而,圍繞數據管理和ETL的許多問題仍然存在。

[[377458]]

調查發現,77%的IT決策者計劃在未來6到12個月內遷移到云計算數據倉庫或擴展現有的云計算數據倉庫。另有21%的IT決策者計劃在未來24個月擴展其云數據倉庫。只有1%的IT決策者表示,他們沒有遷移或擴展云數據倉庫的計劃。

這些調查數據非常突出,特別是考慮到IDG公司的調查參與者中只有38%(他們是商業智能、分析或數據科學領域的主管和更高級別的決策者)擁有云計算數據倉庫。調查發現,30%的組織正在運行內部部署的數據倉庫,而23%的組織使用非云數據倉庫。

顯然,在2021年的數據分析計劃中,云計算對各種規模的組織都有重要影響。例如Snowflake、AWS、Microsoft Azure、Google Cloud和Databrickss提供的云計算數據倉庫正在搶占市場份額。除了這些頂級的云計算數據倉庫供應商之外,大多數為內部部署開發數據倉庫的供應商在這一方面也提供了類似的產品。

根據ETL供應商Matillion公司委托IDG公司進行的調查,盡管云計算數據倉庫顯然正在快速增長,但不到一半的用戶計劃使用云計算數據倉庫。

IDG調查表明云數據倉庫部署正在增長

調查表明,57%的組織將采用內部部署和云計算數據倉庫相結合的數據管理策略,22%的組織采用多云數據倉庫的策略。在采用云數據倉庫策略的公司中,只有21%的組織使用單一的云平臺。

這項調查在數據湖方面也有類似的故事,數據湖是一個無限可擴展且價格低廉的數據存儲,在過去十年中已經接替了Hadoop的職責。IDG公司的調查發現,雖然目前只有16%的組織正在使用數據湖,但高達56%的組織表示在將來使用數據湖,而另外26%的組織正在考慮使用數據湖。只有2%的組織表示并未考慮使用數據湖。

盡管很多組織正在將大量數據遷移到各種云存儲庫,但不應將云計算技術視為應對所有數據管理挑戰的靈丹妙藥。IDG公司的調查報告顯示,數據分析從業者需要一周的時間才能得到一個給定的數據集來進行分析。總的來說,準備和匯總數據進行分析需要花費將近一半的時間(45%),另外30%的時間用于探索和訓練大型模型。只有25%的時間用于處理部署到生產中的模型。

Matillion公司產品總監David Langton對原有分析陷阱正在增長并不感到驚訝。他說:“有很多原因使這種問題難以解決。首先也是最重要的一點是,組織所能生成的最有趣的分析和報告并不是來自單一的數據源,必須結合起來。”

他表示,云計算數據倉庫是將有趣的數據組合在一起,從而為用戶帶來有利可圖的見解。他說,一些客戶具有在內部部署設施進行這一操作的經驗,并且只是在利用云計算數據倉庫提供的規模,而其他一些客戶現在才開始參與其中。

Langton說,“我們過去經常在內部部署設施做所有這類事情。我們現在正在重新構想、重新配置工具,并將大量數據移動到云平臺中。有一些客戶對需要達到什么目標,進行現代化改造并以新的方式來做到這一點很了解。但也有很多新客戶從未做過。”

他表示,客戶選擇在ETL/ELT工具上進行大量選擇,以選擇在云存儲庫中移動和轉換其數據。他注意到最近出現的一個趨勢,即供應商將主要專注于提取和加載,而將轉換留給數據倉庫供應商。一些ETL/ELT供應商也支持轉換,但僅提供通用轉換。

在Matillion公司的案例中,該公司旨在提供功能齊全的ETL工具,該工具不僅可以提取和加載數據,而且還支持針對各種不同的內部部署和云計算數據倉庫系統的數據庫內轉換。他表示,即保持靈活性使其能夠跨多個數據目的使用許多不同的數據類型,是Matillion公司提供的產品的重要價值。

Langton說,“對我們來說,這是一個與眾不同的地方。許多ETL工具提供商都表示,具有一個讀取數據和寫入數據的標準適配器,并且中間是我們的轉換邏輯,因此獲得的好處是只需要編寫一次轉換邏輯。我們為支持的每個目標系統編寫轉換邏輯,以對其進行優化。因此,我們將在Snowflake上以首選方式進行操作,或者在Redshift上以首選方式進行操作,而不是將它們全部視為黑盒,并且它們的工作原理都是相同的。”

由于采取許多不同的方法,因此靈活性很重要。一些數據倉庫使用一種讀模式方法(Hadoop就是這樣設計的),而另一些則在數據寫入數據庫時強制使用一種模式。事實上,許多云計算數據倉庫都配備了查詢處理功能,允許它們查詢駐留在云計算數據湖中的數據,這也加劇了混淆。支持JSON數據類型的各種方法也是如此,在使用SQL語言查詢JSON數據類型之前,通常必須將其扁平化。

總體而言,云計算分析中的工具和技術已經得到了極大的改進,隨著客戶發現適合他們的方法,這推動了實驗的發展。Langton表示,在中間使用ETL/ELT工具定義數據的客戶具有一個優勢,即可以輕松地更換數據倉庫。

他說:“我們越來越多地看到人們在成為客戶后遷移和嘗試不同的數據倉庫,并希望嘗試采用另一個數據倉庫。顯然,我們有辦法幫助遷移。但這確實表明組織已經全力以赴,在這些決策上進行了很大的投入,希望在幾年之內可以更新并嘗試新的解決方案。”

 

責任編輯:趙寧寧 來源: 企業網D1Net
相關推薦

2022-07-28 13:47:30

云計算數據倉庫

2019-09-26 10:56:04

云計算數據中心公共云

2021-09-01 10:03:44

數據倉庫云數據倉庫數據庫

2021-06-03 14:34:15

數據倉庫計算存儲分離

2021-05-27 09:22:41

云計算數據科技

2013-07-18 09:42:10

大數據云計算落地

2022-06-24 09:38:43

數據庫大數據

2009-01-18 16:01:42

數據倉庫數據建模常用術語

2020-02-17 11:37:54

大數據數據倉庫技術

2013-10-25 09:14:30

Teradata數據倉庫服務

2021-11-02 10:25:50

邊緣計算云計算基礎設施

2019-10-28 13:54:45

多云數據云計算

2023-01-11 10:29:26

2012-06-14 15:30:58

Teradata數據倉庫私有云

2018-11-28 17:25:47

2022-10-14 14:20:20

云原生數據倉庫

2013-03-20 16:23:53

數據清洗

2010-11-17 10:14:35

2022-06-30 18:17:00

數據集云數據建模計數據倉庫

2016-05-11 09:18:21

AWS云數據倉庫Redshift
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲国产偷 | 国产欧美精品一区二区三区 | 成人在线免费观看 | 久久久日韩精品一区二区三区 | 在线中文字幕av | 午夜av一区二区 | 亚洲综合大片69999 | 精品国产乱码久久久久久牛牛 | 日韩激情在线 | 97超碰在线播放 | 成人网视频 | 亚洲欧美一区二区三区国产精品 | 久久综合久色欧美综合狠狠 | 日韩精品一区二区三区免费观看 | 国产精品国产a级 | 国产精品揄拍一区二区久久国内亚洲精 | 国产婷婷精品 | 亚洲高清在线 | 精品久久九九 | 久久久久久久一级 | 在线免费中文字幕 | 一级a性色生活片久久毛片波多野 | 久久久久久久综合色一本 | 视频一区在线 | 国产一区二区三区四区 | 精品亚洲一区二区 | 中文字幕黄色大片 | 亚洲欧美一区二区三区1000 | 亚洲欧美一区二区三区国产精品 | 在线免费观看a级片 | 你懂的国产 | 免费国产视频在线观看 | 国产中文区二幕区2012 | 91免费在线 | 天天草天天干天天 | 国产精品高清在线 | 99热视| 国产偷录叫床高潮录音 | 久久久www成人免费无遮挡大片 | 久久国产精品久久久久久 | 天天干天天操天天看 |