成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark SQL優化策略

企業動態 Spark
查詢優化是傳統數據庫中最為重要的一環,這項技術在傳統數據庫中已經很成熟。除了查詢優化,Spark SQL在存儲上也進行了優化。下面介紹Spark SQL的一些優化策略。

查詢優化是傳統數據庫中最為重要的一環,這項技術在傳統數據庫中已經很成熟。除了查詢優化,Spark SQL在存儲上也進行了優化。

下面介紹Spark SQL的一些優化策略。

[[178956]]

(1)內存列式存儲與內存緩存表

Spark SQL可以通過cacheTable將數據存儲轉換為列式存儲,同時將數據加載到內存緩存。cacheTable相當于在分布式集群的內存物化視圖,將數據緩存,這樣迭代的或者交互式的查詢不用再從HDFS讀數據,直接從內存讀取數據大大減少了I/O開銷。列式存儲的優勢在于Spark SQL只需要讀出用戶需要的列,而不需要像行存儲那樣每次都將所有列讀出,從而大大減少內存緩存數據量,更高效地利用內存數據緩存,同時減少網絡傳輸和I/O開銷。數據按照列式存儲,由于是數據類型相同的數據連續存儲,所以能夠利用序列化和壓縮減少內存空間的占用。

(2)列存儲壓縮

為了減少內存和硬盤空間占用,Spark SQL采用了一些壓縮策略對內存列存儲數據進行壓縮。Spark SQL的壓縮方式要比Shark豐富很多,如它支持PassThrough、RunLengthEncoding、DictionaryEncoding、BooleanBitSet、IntDelta、LongDelta等多種壓縮方式,這樣能夠大幅度減少內存空間占用、網絡傳輸和I/O開銷。

(3)邏輯查詢優化

SparkSQL在邏輯查詢優化(見圖8-4)上支持列剪枝、謂詞下壓、屬性合并等邏輯查詢優化方法。列剪枝為了減少讀取不必要的屬性列、減少數據傳輸和計算開銷,在查詢優化器進行轉換的過程中會優化列剪枝。

下面介紹一個邏輯優化的例子。

SELECT Class FROM (SELECT ID,Name,Class FROM STUDENT ) S WHERE S.ID=1

Catalyst將原有查詢通過謂詞下壓,將選擇操作ID=1優先執行,這樣過濾大部分數據,通過屬性合并將***的投影只做一次,最終保留Class屬性列。

(4)Join優化

Spark SQL深度借鑒傳統數據庫的查詢優化技術的精髓,同時在分布式環境下調整和創新特定的優化策略。現在Spark SQL對Join進行了優化,支持多種連接算法,現在的連接算法已經比Shark豐富,而且很多原來Shark的元素也逐步遷移過來,如BroadcastHashJoin、BroadcastNestedLoopJoin、HashJoin、LeftSemiJoin,等等。

下面介紹其中的一個Join算法。

BroadcastHashJoin將小表轉化為廣播變量進行廣播,這樣避免Shuffle開銷,***在分區內做Hash連接。這里使用的就是Hive中Map Side Join的思想,同時使用DBMS中的Hash連接算法做連接。 隨著Spark SQL的發展,未來會有更多的查詢優化策略加入進來,同時后續Spark SQL會支持像Shark Server一樣的服務端和JDBC接口,兼容更多的持久化層,如NoSQL、傳統的DBMS等。一個強有力的結構化大數據查詢引擎正在崛起。

【本文為51CTO專欄作者“王森豐”的原創稿件,轉載請注明出處】

責任編輯:趙寧寧 來源: 神算子
相關推薦

2021-07-16 23:01:03

SQL索引性能

2021-07-26 18:23:23

SQL策略優化

2023-05-10 10:30:02

性能優化Tomcat

2023-03-30 09:06:20

HiveSpark大數據

2019-01-22 08:45:57

SQL語句策略

2009-09-08 09:45:23

App Engine性

2016-12-14 19:20:07

Spark SQL架構分布式

2025-02-18 08:10:00

SQL數據表數據庫

2011-07-25 18:03:12

組策略

2024-05-08 10:59:04

云計算AI優化云策略

2025-01-15 08:05:06

MySQLLEFT JOIN數據庫

2021-03-29 23:12:51

機器學習人工智能游戲

2016-12-08 15:47:54

sql優化數據

2016-11-17 09:00:46

HBase優化策略

2023-05-26 18:52:55

2014-03-11 15:47:29

大型網站速度優化運維人員

2023-07-26 15:46:26

數據中心數據存儲

2024-07-26 07:59:25

2011-07-03 18:44:45

網站優化

2024-08-06 10:02:42

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人精品午夜视频免费 | 欧洲视频一区二区 | 日日夜夜天天 | 国产目拍亚洲精品99久久精品 | 人人干天天干 | 成人av激情| 欧美在线一区二区三区 | 日韩成人一区 | 亚洲黄色一级 | 亚洲欧美aⅴ | 久久久久国产一区二区三区 | 天堂中文在线播放 | 嫩草网| 国产高清视频在线观看 | 国产一区二区三区精品久久久 | 亚洲看片网站 | 成人在线免费观看视频 | 日本不卡免费新一二三区 | 久久精品小视频 | 不卡一区 | 一区二区免费看 | 久久精品国产免费高清 | 欧美 日韩 在线播放 | 亚洲精品高清视频 | 国产精品毛片一区二区在线看 | 亚洲综合国产 | 久久久久久成人网 | 国产传媒 | 99精品网 | 韩国av电影网 | 亚洲精品电影在线观看 | 日韩精品一区在线 | 欧美性成人| av一区二区三区 | 一级免费在线视频 | 毛片99 | 中文字幕在线观看一区 | 日韩欧美国产精品 | 国产精品视频免费观看 | 国产精品一区视频 | 国产在线观看av |