成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

存儲(chǔ) 存儲(chǔ)軟件
使用Elasticsearch的時(shí)候,我們常常需要關(guān)注數(shù)據(jù)存儲(chǔ)在Elasticsearch中的存儲(chǔ)容量。下面,我們來了解一下Elasticsearch中的數(shù)據(jù)是如何存儲(chǔ)。

 使用Elasticsearch的時(shí)候,我們常常需要關(guān)注數(shù)據(jù)存儲(chǔ)在Elasticsearch中的存儲(chǔ)容量。下面,我們來了解一下Elasticsearch中的數(shù)據(jù)是如何存儲(chǔ)。

[[319021]]

一、Elasticsearch索引結(jié)構(gòu)

Elasticsearch對(duì)外提供的是index的概念,可以類比為MySQL DB,用戶查詢是在index上完成的,每個(gè)index由若干個(gè)shard組成,以此來達(dá)到分布式可擴(kuò)展的能力。比如下圖是一個(gè)由10個(gè)shard組成的index。

 

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

 

shard是Elasticsearch數(shù)據(jù)存儲(chǔ)的最小單位,index的存儲(chǔ)容量為所有shard的存儲(chǔ)容量之和。Elasticsearch集群的存儲(chǔ)容量則為所有index存儲(chǔ)容量之和。

一個(gè)shard就對(duì)應(yīng)了一個(gè)lucene的library。對(duì)于一個(gè)shard,Elasticsearch增加了translog的功能,類似于HBase WAL,是數(shù)據(jù)寫入過程中的中間數(shù)據(jù),其余的數(shù)據(jù)都在lucene庫中管理的。

所以,Elasticsearch索引使用的存儲(chǔ)內(nèi)容主要取決于lucene中的數(shù)據(jù)存儲(chǔ)。

二、lucene數(shù)據(jù)存儲(chǔ)

下面了解一下lucene的基本概念。

1. lucene基本概念

  • segment : lucene內(nèi)部的數(shù)據(jù)是由一個(gè)個(gè)segment組成的,寫入lucene的數(shù)據(jù)并不直接落盤,而是先寫在內(nèi)存中,經(jīng)過了refresh間隔,lucene才將該時(shí)間段寫入的全部數(shù)據(jù)refresh成一個(gè)segment,segment多了之后會(huì)進(jìn)行merge成更大的segment。lucene查詢時(shí)會(huì)遍歷每個(gè)segment完成。由于lucene 寫入的數(shù)據(jù)是在內(nèi)存中完成,所以寫入效率非常高。但是也存在丟失數(shù)據(jù)的風(fēng)險(xiǎn),所以Elasticsearch基于此現(xiàn)象實(shí)現(xiàn)了translog,只有在segment數(shù)據(jù)落盤后,Elasticsearch才會(huì)刪除對(duì)應(yīng)的translog。
  • doc : doc表示lucene中的一條記錄。
  • field :field表示記錄中的字段概念,一個(gè)doc由若干個(gè)field組成。
  • term :term是lucene中索引的最小單位,某個(gè)field對(duì)應(yīng)的內(nèi)容如果是全文檢索類型,會(huì)將內(nèi)容進(jìn)行分詞,分詞的結(jié)果就是由term組成的。如果是不分詞的字段,那么該字段的內(nèi)容就是一個(gè)term。
  • 倒排索引(inverted index): lucene索引的通用叫法,即實(shí)現(xiàn)了term到doc list的映射。

 

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

 

  • 正排數(shù)據(jù):搜索引擎的通用叫法,即原始數(shù)據(jù),可以理解為一個(gè)doc list。
  • doc values:Elasticsearch中的列式存儲(chǔ)的名稱,Elasticsearch除了存儲(chǔ)原始數(shù)據(jù)、倒排索引,還存儲(chǔ)了一份doc values,用作分析和排序。doc values 的存在是因?yàn)榈古潘饕粚?duì)某些操作是高效的。 倒排索引的優(yōu)勢(shì)在于查找包含某個(gè)項(xiàng)的文檔,而對(duì)于從另外一個(gè)方向的相反操作并不高效,即:確定哪些項(xiàng)是否存在單個(gè)文檔里,聚合需要這種次級(jí)的訪問模式。

 

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

 

2. lucene文件內(nèi)容

lucene包的文件是由很多segment文件組成的,segments_xxx文件記錄了lucene包下面的segment文件數(shù)量。每個(gè)segment會(huì)包含如下的文件。

 

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

 

 

Elasticsearch中數(shù)據(jù)是如何存儲(chǔ)的?

 

一份數(shù)據(jù)寫入Elasticsearch 會(huì)產(chǎn)生多份數(shù)據(jù)用于不同查詢方式,會(huì)比原數(shù)據(jù)占用更多磁盤空間。

對(duì)照上面的lucene文件表,進(jìn)行簡(jiǎn)要?dú)w納:

  • 存儲(chǔ)原文_source的文件.fdt .fdm .fdx;
  • 存儲(chǔ)倒排索引的文件.tim .tip .doc;
  • 用于聚合排序的列存文件.dvd .dvm;
  • 全文檢索文件.pos .pay .nvd .nvm等;
  • 加載到內(nèi)存中的文件有.fdx .tip .dvm;

其中.tip占用內(nèi)存最大,而.fdt、.tim、.dvd文件占用磁盤最大。

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2024-12-16 17:02:58

MySQLInnoDB數(shù)據(jù)庫

2023-01-12 15:25:51

Curve數(shù)據(jù)存儲(chǔ)

2024-03-01 09:57:19

數(shù)據(jù)庫檢索項(xiàng)目

2017-11-27 08:17:38

存儲(chǔ)數(shù)據(jù)位置

2017-11-01 14:29:38

2019-09-18 11:03:01

數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫

2018-05-09 10:40:15

云存儲(chǔ)數(shù)據(jù)對(duì)象存儲(chǔ)

2022-04-08 08:30:42

大數(shù)據(jù)網(wǎng)絡(luò)

2021-12-21 09:35:59

CSV存儲(chǔ)數(shù)據(jù)Python

2014-02-27 10:08:33

NoSQL

2025-02-19 10:18:29

2018-05-03 08:53:41

Redis存儲(chǔ)對(duì)象

2013-07-25 14:17:17

2011-12-28 13:30:39

云計(jì)算云存儲(chǔ)

2018-11-02 09:16:05

數(shù)據(jù)存儲(chǔ)磁帶

2012-08-28 09:29:41

虛擬化

2021-07-20 09:33:46

數(shù)據(jù)應(yīng)用程序開發(fā)

2025-02-28 05:50:12

2013-09-10 09:04:41

云計(jì)算大數(shù)據(jù)存儲(chǔ)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩国产中文字幕 | 国产69精品久久99不卡免费版 | 色欧美片视频在线观看 | 天天色av | 国产精品99久久久久久久久久久久 | 久久国产精品久久久久久 | 精品久久视频 | 91精品国产一区二区三区 | 久久久精品一区二区三区四季av | 不卡一二三区 | 99久久精品视频免费 | 精品一区二区三区不卡 | 中文字幕四虎 | 色网站入口 | 在线成人 | 天天干天天操天天射 | 国产欧美精品 | 亚洲二区精品 | 欧洲一区二区视频 | 久久精品亚洲精品 | 久久新视频 | 国产中文区二幕区2012 | 久久人人网 | 又黄又色| 婷婷丁香综合网 | 粉嫩一区二区三区性色av | 精品国产欧美日韩不卡在线观看 | av首页在线 | 欧美激情一区 | 久久久国产精品一区 | 91麻豆精品国产91久久久更新资源速度超快 | 激情a | 欧美一级全黄 | 免费看91| 超碰97人人人人人蜜桃 | 免费在线观看av | 日本欧美国产在线观看 | 三级黄色片在线观看 | 日韩精品网站 | 国产精品亚洲成在人线 | 亚洲 中文 欧美 日韩 在线观看 |