成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Cloudera Lakehouse Optimizer助力企業(yè)輕松交付高性能Iceberg表

大數(shù)據(jù)
為進(jìn)一步簡化數(shù)據(jù)湖倉一體架構(gòu)的管理,Cloudera推出了Cloudera Lakehouse Optimizer。該服務(wù)可智能化自動處理Iceberg表,使得許多維護(hù)作業(yè)能夠在后臺自動運(yùn)行。

IDC調(diào)研中國數(shù)據(jù)顯示,在落地GenAI應(yīng)用時(shí),68%的企業(yè)認(rèn)為需要梳理內(nèi)部數(shù)據(jù)資產(chǎn),66%的企業(yè)希望搭建數(shù)據(jù)湖等數(shù)據(jù)底座。開放數(shù)據(jù)湖倉一體架構(gòu)正迅速成為海量數(shù)據(jù)進(jìn)行統(tǒng)一、多功能分析的標(biāo)準(zhǔn)架構(gòu)。這種架構(gòu)既融合了數(shù)據(jù)湖的靈活性和可擴(kuò)展性,又具備數(shù)據(jù)倉庫的數(shù)據(jù)分析、治理和管理功能,為企業(yè)提供了強(qiáng)大的數(shù)據(jù)處理能力。開放表格式是這一架構(gòu)的關(guān)鍵組成部分,它直接在數(shù)據(jù)湖存儲上提供了大量傳統(tǒng)數(shù)據(jù)倉庫的功能。目前,Apache Iceberg正迅速成為廠商和客戶的標(biāo)準(zhǔn)格式。

盡管Iceberg的諸多特性可大幅降低實(shí)現(xiàn)高性能數(shù)據(jù)視圖所需的工作量,但這些特性也帶來了額外的開銷,并且需要手動執(zhí)行作業(yè)以優(yōu)化性能和成本。為進(jìn)一步簡化數(shù)據(jù)湖倉一體架構(gòu)的管理,Cloudera推出了Cloudera Lakehouse Optimizer。該服務(wù)可智能化自動處理Iceberg表,使得許多維護(hù)作業(yè)能夠在后臺自動運(yùn)行。下面,我們將詳細(xì)介紹Cloudera Lakehouse Optimizer的功能、優(yōu)勢以及未來的發(fā)展方向。

Cloudera Lakehouse Optimizer的功能

Cloudera Lakehouse Optimizer根據(jù)用戶配置和Iceberg表統(tǒng)計(jì)數(shù)據(jù),自動運(yùn)行基于策略的Iceberg表優(yōu)化任務(wù)。自動優(yōu)化任務(wù)包括:

壓縮Compaction企業(yè)通常會通過微批處理(Micro Batching或流式攝取(Streaming Ingestion等方式接收大量小文件,而讀取這些小文件會嚴(yán)重影響查詢性能。壓縮是將小文件合并為大文件以提升性能的過程。Cloudera Lakehouse Optimizer能夠自主判斷自動壓縮數(shù)據(jù)文件的最佳時(shí)機(jī),確保用戶的表始終保持最佳性能。該服務(wù)還會根據(jù)使用模式優(yōu)先優(yōu)化高價(jià)值的表,確保每次優(yōu)化都能帶來實(shí)際的投資回報(bào)。

表清理Table Cleanup):隨著表的增長,往往會積累大量不再使用的數(shù)據(jù)文件、清單文件和快照。用戶通常需要執(zhí)行表維護(hù)功能,例如清除過期快照、移除舊元數(shù)據(jù)文件以及清理孤立文件,以優(yōu)化存儲利用率并提升性能。Cloudera Lakehouse Optimizer能夠判斷維護(hù)任務(wù)的最佳時(shí)機(jī),確保存儲利用率最大化

除了優(yōu)化措施和基于策略的控制措施,Cloudera Lakehouse Optimizer還提供了優(yōu)化任務(wù)的可觀測,以幫助數(shù)據(jù)團(tuán)隊(duì)清晰了解策略對表和存儲健康狀況及性能的影響。

Cloudera Lakehouse Optimizer的優(yōu)勢

Cloudera Lakehouse Optimizer為使用Iceberg表的企業(yè)帶來了諸多優(yōu)勢

  1. 通過優(yōu)化存儲占用空間和減少查詢運(yùn)行時(shí)間,降低總體擁有成本(TCO)。
  2. 通過減少查詢中需要讀取的文件數(shù)量,提供高性能的數(shù)據(jù)視圖
  3. 通過自動執(zhí)行一些繁瑣的湖倉維護(hù)任務(wù),減少數(shù)據(jù)管理工作和開銷。

Cloudera內(nèi)部基準(zhǔn)測試表明,使用Cloudera Lakehouse Optimizer維護(hù)ICloudera內(nèi)部基準(zhǔn)測試表明,使用Cloudera Lakehouse Optimizer維護(hù)I

未來方向

對于想要轉(zhuǎn)向開放數(shù)據(jù)湖倉一體架構(gòu)的企業(yè),Cloudera Lakehouse Optimizer當(dāng)前推出的功能為他們解決了個(gè)重要難題。Cloudera的愿景是提供高性能的數(shù)據(jù)視圖變得更加容易,而這僅僅是實(shí)現(xiàn)這一愿景所邁出的第一步。未來,我們計(jì)劃增加對更多優(yōu)化功能的支持,包括通過分區(qū)重組解決影響查詢性能的數(shù)據(jù)分布問題查詢優(yōu)化。

我們的目標(biāo)是確保Cloudera成為管理和訪問Iceberg表的最佳平臺之一,同時(shí)讓企業(yè)更輕松地采用開放數(shù)據(jù)湖倉一體架構(gòu)。

責(zé)任編輯:鳶瑋 來源: Cloudera
相關(guān)推薦

2009-03-10 19:16:17

IT虛擬化SUN

2023-04-24 14:18:54

Cloudera動態(tài)數(shù)據(jù)大數(shù)據(jù)

2012-02-22 16:35:01

浪潮高性能計(jì)算

2017-11-28 17:14:16

華為云

2021-09-26 18:02:17

JSJavaScript交付

2011-10-13 15:46:47

F5應(yīng)用交付

2009-04-22 18:26:55

高性能計(jì)算多核服務(wù)器

2014-12-01 09:51:44

Radware應(yīng)用交付

2012-05-23 14:10:33

深信服應(yīng)用交付

2022-12-07 13:58:56

Cloudera

2024-10-16 11:03:30

Linux高性能編程

2019-10-12 11:12:37

云計(jì)算高性能計(jì)算系統(tǒng)

2010-04-14 20:00:42

廣域網(wǎng)負(fù)載均衡Radware

2013-10-08 17:01:29

華為LTE華為

2017-12-18 16:39:27

華為云

2009-06-25 18:07:03

刀片高性能計(jì)算曙光

2009-06-03 14:24:12

ibmdwWebSphere

2022-12-09 15:03:17

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲欧美一区二区三区1000 | 精品欧美一区二区三区久久久 | 天天操天天天干 | 久久精品中文字幕 | a欧美 | 天天爽网站| 8x国产精品视频一区二区 | 久草久草久草 | 成人精品区 | 日本在线免费视频 | 午夜影院官网 | 日韩欧美精品在线播放 | 国产色网| 中文字幕视频在线看5 | 亚洲精品一区二区三区中文字幕 | 性欧美精品一区二区三区在线播放 | 色.com| 国产午夜在线观看 | 久久aⅴ乱码一区二区三区 亚洲国产成人精品久久久国产成人一区 | 国产黄色小视频在线观看 | 综合视频在线 | 成人免费视频在线观看 | 请别相信他免费喜剧电影在线观看 | 中文字幕在线视频免费观看 | 精品久久久久久 | 久久久一| 国产在线观看不卡一区二区三区 | 91亚洲精选 | 日韩欧美在线观看视频 | 日韩播放 | 成人欧美一区二区三区白人 | 免费观看av网站 | 国产伦精品一区二区三区照片91 | 成人在线免费观看 | 91.色 | 成人影院免费视频 | 在线91 | 久久国产成人 | 日韩一区三区 | 免费国产一区 | 麻豆av在线 |