成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Elasticsearch與文件描述符的恩恩怨怨

系統(tǒng) 開發(fā)
本文主要說了 文件描述符 和 Elasticsearch 為什么要這么多文件描述符,希望對你有幫助.

提到Elasticsearch,讓筆者最惡心的倒不是它的反人類的DSL設(shè)計,而是每次安裝都需要修改進(jìn)程的最大文件描述符。那ES與文件描述符有啥恩怨呢,下面就來嘮叨嘮叨。首先說說文件描述符、在說說ES為什么要這么多文件描述符。

一、文件描述符

1、什么是文件描述符

文件描述符(File descriptor)是操作系統(tǒng)為了高效管理文件所創(chuàng)建的一種索引,用于指向被打開的文件,所有I/O操作都是通過文件描述符來實現(xiàn)。有的地方也會說成是文件句柄,他倆有些區(qū)別,這里為了方便理解,暫且認(rèn)為一樣。

如果以文件句柄(File Handle)來理解的話,也很形象。Handle是門把手的意思,我們用門把手操作門,類似的,進(jìn)程用文件句柄操作底層操作系統(tǒng)的資源。

在Linux中,遵循一切皆是文件的原則,磁盤文件、目錄、設(shè)備、網(wǎng)絡(luò)套接字、硬件等都是文件。當(dāng)進(jìn)程讀寫文件,在打開時,文件和進(jìn)程就建立了連接,文件描述符就是這個連接。

文件描述符實際上就是對內(nèi)核層的一個硬件資源實例的指針的引用。當(dāng)然啦,它和指針也是有區(qū)別的,指針是棧上的變量,用來操作堆內(nèi)存里的對象。

文件描述符在系統(tǒng)里的位置見下圖:

2、為什么需要文件描述符

這里還用門把手舉例。一扇門如果有多個把手,被不同的人操作,那門往哪兒走就不確定了,很容易出現(xiàn)爭論。為了避免這種情況,門只有一個把手。

為了解決系統(tǒng)資源浪費和資源沖突的問題,操作系統(tǒng)不會讓每個用戶層的進(jìn)程都在內(nèi)核層創(chuàng)建一個硬件資源實例。在操作同一個系統(tǒng)硬件資源時,用戶層可能有多個進(jìn)程,但是都對應(yīng)到內(nèi)核層的一個進(jìn)程。

3、文件描述符數(shù)量限制

操作系統(tǒng)會為進(jìn)程設(shè)置一個默認(rèn)的可以操作的文件描述符數(shù)量,進(jìn)程打開的文件數(shù)量或者需要的文件數(shù)量超過這個數(shù)字時就會拋出異常。

通過ulimit -a命令可以查看可操作的文件描述符數(shù)量。通過vim /etc/security/limits.con可以修改進(jìn)程可操作性的文件描述符數(shù)量。

二、ES為什么要這么多文件描述符

在說ES為什么要這么多文件描述符之前,先簡單說說ES寫入數(shù)據(jù)的過程。

1.ES寫入數(shù)據(jù)的過程

(1) 寫入的主要流程

假設(shè)有3個節(jié)點:node1、node2、node3,其中node2是主節(jié)點,寫入數(shù)據(jù)的主要流程如下:

  • 客戶端的請求攜帶數(shù)據(jù),到達(dá)node1,node1找到主分片所在的node2。
  • node1將數(shù)據(jù)轉(zhuǎn)發(fā)到主分片所在node2,node2將數(shù)據(jù)寫入主分片。
  • 主分片寫入成功后,node2將數(shù)據(jù)轉(zhuǎn)發(fā)到node1和node3,node1和node3將數(shù)據(jù)寫入副本分片。
  • 所有副本分片都寫入成功后,node2向 客戶端所請求的節(jié)點node1 返回寫入成功的消息。
  • 客戶端所請求的節(jié)點node1向客戶端返回成功。

(2) 寫入的細(xì)節(jié)流程

ES寫入數(shù)據(jù)的細(xì)節(jié)流程分為4步:Refresh操作、寫Transaction Log、Flush操作、Merge操作。

  • Refresh操作:在文檔寫入ES時首先會寫到Index Buffer里,然后每隔一秒執(zhí)行一次Refresh操作,把Index Buffer里的數(shù)據(jù)寫入磁盤緩存里,但不會調(diào)用fsync刷到硬盤。因為數(shù)據(jù)被Refresh 后才能被檢索出來,所以ES是近實時的搜索引擎。
  • 寫Transaction Log:文檔寫入到Index Buffer后,數(shù)據(jù)是沒有刷到硬盤的,存在數(shù)據(jù)丟失的風(fēng)險。為了保證數(shù)據(jù)不丟失,在寫完 Index Buffer 后,系統(tǒng)還要寫Transaction Log,寫Transaction Log默認(rèn)是調(diào)用 fsync 進(jìn)行刷盤的。ES重啟時會從Transaction Log中恢復(fù)數(shù)據(jù),防止數(shù)據(jù)丟失。
  • Flush操作:Flush操作會將磁盤緩存持久化到磁盤中,默認(rèn)30分鐘 或 在Transaction Log寫滿時觸發(fā)。Flush將磁盤緩存 持久化到磁盤后,會清空Transaction Log。
  • Merge操作:在每次Refresh 后都會創(chuàng)建一個新的Segment文件,隨著時間推移和索引越來越多,Segment文件會暴增,這時會帶來許多問題,比如消耗過多的文件描述符、內(nèi)存、CPU時間周期等,而且每次搜索都要檢查每個Segment然后再合并結(jié)果,所以Segment越多、搜索也就越慢,因此需要合并Segment。ES會自動執(zhí)行Merge操作,然后物理刪除過多的Segment文件。

2、為什么要這么多文件描述符

通過以上ES寫數(shù)據(jù)的流程可以知道,ES在每次Refresh時都會創(chuàng)建新的Segment,創(chuàng)建索引的過程中會創(chuàng)建大量的Segment。Segment內(nèi)部一般包含著:詞項、詞頻、文檔之間的關(guān)系。每個Segment都是一個文件,ES使用了大量的文件。每一個Segment都會消耗文件描述符、內(nèi)存和CPU運行周期。同時,ES 在節(jié)點之間進(jìn)行通信和數(shù)據(jù)拷貝、ES在和客戶端之間進(jìn)行通信等,也使用了大量的網(wǎng)絡(luò)資源。

基于以上原因,ES需要大量的文件描述符。Linux 系統(tǒng)為進(jìn)程準(zhǔn)備了一個默認(rèn)的文件描述符數(shù)量,但是這對ES節(jié)點來說有點低了,所以要調(diào)大文件描述符數(shù)量。

3、Linux命令lsof

lsof命令是Linux系統(tǒng)管理工具,人如其名,“列出打開文件(lists openfiles)”。

lsof -p pid命令:顯示系統(tǒng)中某個進(jìn)程當(dāng)前已打開的所有文件列表。

執(zhí)行l(wèi)sof -p 29624時,可以看到大量的文件,索引越多,寫入的數(shù)據(jù)越多,文件描述符數(shù)量越多。

執(zhí)行l(wèi)sof -p 29624|wc -l,可以查看進(jìn)程打開文件的總數(shù)。

4、其余的文件描述符不夠用的情況

大量新的數(shù)據(jù)源源不斷的快速寫入到ES,造成臨時的Segment文件越來越多,ES無法快速合并成一個大的Segment。在查詢時,如果查詢的數(shù)據(jù)對應(yīng)到多個Segment,那么打開的文件描述符就很多了。

機器內(nèi)存過小,資源緊張時內(nèi)存不夠,會觸發(fā)OOM-Killer將ES進(jìn)程殺死,其實是一種假死的,因為進(jìn)程被Kill掉之后,保活進(jìn)程又會將ES重啟,而每次重啟后都會產(chǎn)生新的translog文件,并且沒有把之前舊的日志文件刪除,最終把系統(tǒng)的文件描述符耗盡。

如果還有其余場景的話,歡迎朋友們在留言區(qū)補充。

三、總結(jié)

本文主要說了 文件描述符 和 ES為什么要這么多文件描述符,希望對你有幫助,核心概念如下:

  • 文件描述符:用戶層的進(jìn)程  對  內(nèi)核層一個  硬件資源實例  的指針  的引用。
  • ES寫入流程:Refresh操作、寫Transaction Log、Flush操作、Merge操作。
  • 為什么要這么多:ES在每次Refresh時都會創(chuàng)建新的Segment,隨著時間的推移和索引的增多,會導(dǎo)致短時間內(nèi)的Segment數(shù)量暴增。ES 在節(jié)點之間進(jìn)行通信和數(shù)據(jù)拷貝、ES在和客戶端之間進(jìn)行通信等原因,所以需要大量的文件描述符。
責(zé)任編輯:趙寧寧 來源: 不焦躁的程序員
相關(guān)推薦

2009-07-08 09:46:45

Servlet注釋部署描述符

2025-01-10 15:13:38

2012-08-08 10:31:41

IBMdW

2019-03-05 22:15:08

BashLinux命令

2020-02-07 18:16:01

進(jìn)程線程底層原理

2021-06-18 06:02:24

內(nèi)核文件傳遞

2017-02-05 10:06:53

Python黑魔法描述符

2016-10-28 21:55:28

Javascript屬性特性屬性描述符

2023-04-06 15:22:15

Linux進(jìn)程系統(tǒng)

2021-05-19 14:48:58

Linux文件fd

2009-09-04 14:04:53

C#文檔

2019-07-09 14:30:16

LinuxJava 服務(wù)器

2019-07-09 15:30:31

Linuxulimit文件描述符

2010-03-19 09:27:04

云計算思科HP

2019-07-05 14:20:45

RPC服務(wù)器模型

2011-05-30 13:29:06

2020-03-11 10:26:51

開發(fā)者技能工具

2021-06-04 07:55:30

Node Fs 操作

2019-01-29 09:18:00

開源代碼GitHub

2016-08-23 17:21:51

UnixLinux重定向
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 日韩美女在线看免费观看 | 国产精品国产三级国产aⅴ中文 | 亚洲二区视频 | 亚洲精品久久久 | 欧洲免费视频 | 成人免费在线观看 | 久热国产在线 | 成人二区| 福利精品在线观看 | 久久久久国产精品一区二区 | 亚洲黄色成人网 | 一区二区三区播放 | 黄色毛片在线观看 | 欧美高清dvd| 一区二区av| 国产h在线 | 国产精品久久久久久久久免费 | 亚洲视频在线观看一区二区三区 | 欧美一级欧美一级在线播放 | 国产精品亚洲综合 | 91国在线观看| 久久99网 | 国产精彩视频 | 久久久青草婷婷精品综合日韩 | 天天色官网 | 一区二区三区欧美在线观看 | 欧美在线观看一区 | 狠狠色综合久久婷婷 | 在线观看亚洲欧美 | 国产精品日韩欧美一区二区三区 | 国产精品精品久久久久久 | 日韩欧美手机在线 | 国产乱码一区 | 免费美女网站 | 成人做爰69片免费观看 | 午夜电影合集 | 日韩在线免费视频 | 男女羞羞视频免费 | 亚洲视频中文 | 偷拍第一页 | 亚洲精品电影在线观看 |