成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark調優的關鍵—RDD Cache緩存使用詳解

存儲 存儲軟件 大數據 Spark
Spark的開發調優有一個原則,即對多次使用的RDD進行持久化。如果要對一個RDD進行持久化,只要對這個RDD調用cache()和persist()即可。

1.概述

Spark的開發調優有一個原則,即對多次使用的RDD進行持久化。如果要對一個RDD進行持久化,只要對這個RDD調用cache()和persist()即可。

cache()方法表示:使用非序列化的方式將RDD的數據全部嘗試持久化到內存中,cache()只是一個transformtion,是lazy的,必須通過一個action觸發,才能真正的將該RDD cache到內存中。

persist()方法表示:手動選擇持久化級別,并使用指定的方式進行持久化。

2.緩存類型

  • NONE :什么類型都不是
  • DISK_ONLY:磁盤
  • DISK_ONLY_2:磁盤;雙副本
  • MEMORY_ONLY: 內存;反序列化;把RDD作為反序列化的方式存儲,假如RDD的內容存不下,剩余的分區在以后需要時會重新計算,不會刷到磁盤上。
  • MEMORY_ONLY_2:內存;反序列化;雙副本
  • MEMORY_ONLY_SER:內存;序列化;這種序列化方式,每一個partition以字節數據存儲,好處是能帶來更好的空間存儲,但CPU耗費高
  • MEMORY_ONLY_SER_2 : 內存;序列化;雙副本
  • MEMORY_AND_DISK:內存 + 磁盤;反序列化;雙副本;RDD以反序列化的方式存內存,假如RDD的內容存不下,剩余的會存到磁盤
  • MEMORY_AND_DISK_2 : 內存 + 磁盤;反序列化;雙副本
  • MEMORY_AND_DISK_SER:內存 + 磁盤;序列化  
  • MEMORY_AND_DISK_SER_2:內存 + 磁盤;序列化;雙副本

*********** 序列化能有效減少存儲空間,默認MEMORY_ONLY

[[230661]]

3.如何選擇存儲級別

如果RDD對于默認的存儲級別是滿足的,就不要選擇其他了。這是性能最優的,最高效的(前提內存要足夠,這是第一選擇)

如果MEMORY_ONLY不一定滿足(即:內存不夠),可以嘗試使用MEMORY_ONLY_SER再加上一個序列化框架(kyro),這樣內存的空間更好。序列化就是為了減少空間

 不要把數據寫到磁盤,成本是非常高的。當數據太大的時候,可以過濾一部分數據再存,這樣的話可能會更快

可以使用副本的存儲級別能更快的容錯,所以的storage level都提供了副本機制,這個機制能讓你繼續再RDD上運行task,并不需要等待重新計算。(從另外的節點拿)

************************首選第1種方式,滿足不了再使用第2種。后兩種不推薦

4.移除緩存數據

Spark會自動地監控每個節點的使用情況,以一種LRU的機制(least-recently-used:最近很少使用)去自動移除。如果想手工代替這種自動去移除,可以使用RDD.unpersist()去處理

責任編輯:武曉燕 來源: 若澤大數據
相關推薦

2021-03-04 08:39:21

SparkRDD調優

2023-11-10 09:29:30

MySQLExplain

2019-11-01 08:49:07

JVM監控性能

2018-07-18 12:12:20

Spark大數據代碼

2019-07-17 15:45:24

Spark內存Java

2016-10-24 09:52:45

SparkRDD容錯

2016-10-24 23:04:56

SparkRDD數據

2017-07-07 11:01:04

Spark性能調優

2017-10-20 13:41:11

Spark集群代碼

2011-03-10 14:40:54

LAMPMysql

2012-01-10 14:35:08

JavaJVM

2023-10-13 12:28:38

2023-05-05 18:38:33

多級緩存Caffeine開發

2021-12-26 00:03:25

Spark性能調優

2009-04-01 11:17:52

內存分配調優Oracle

2009-09-22 10:50:04

Hibernate c

2017-07-21 08:55:13

TomcatJVM容器

2025-02-10 08:49:40

2011-05-20 14:23:01

Oracle調優

2016-11-11 20:16:23

數據傾斜spark
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天干人人 | 久久久www成人免费精品 | 久久久青草婷婷精品综合日韩 | 91精品国产99 | 免费毛片网 | 日韩在线国产精品 | 色片在线观看 | 天天干天天爽 | 99热首页| 亚洲成人免费观看 | 伊人网一区 | 九色av | 一区二区精品在线 | 中文字幕亚洲一区二区三区 | 国产专区在线 | 亚洲国产欧美在线人成 | 成人免费视频7777777 | 日韩一区二区在线视频 | 超碰在线观看97 | 国产精品久久久久久久久久三级 | 久久国产精品91 | 久久久亚洲 | 超级乱淫av片免费播放 | 国产欧美精品一区二区三区 | 日韩欧美在线免费观看视频 | 日本成年免费网站 | 日韩一区二区三区视频 | 日韩欧美中文在线 | 欧美在线 | 国产99久久久国产精品 | 亚洲女人的天堂 | 久久久久免费精品国产 | 日韩欧美在线观看 | 在线观看黄免费 | 日韩欧美精品在线 | 久久久精品一区二区三区 | 成人免费观看男女羞羞视频 | 日韩一级黄色毛片 | 玖玖玖在线观看 | 亚洲国产精品va在线看黑人 | 亚洲欧美一区二区在线观看 |