成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ElasticSearch這些坑記得避開

數(shù)據(jù)庫 其他數(shù)據(jù)庫
對于ES索引的結(jié)構(gòu)維護,數(shù)據(jù)主體如果相對簡單的話,可以考慮手動管理,但實際上使用索引時,通常主體結(jié)構(gòu)都比較復(fù)雜,字段個數(shù)超過三五十都很常見,所以基于流程化的管理很有必要。

一、管理方式

ElasticSearch作為最常用的搜索引擎組件,在系統(tǒng)架構(gòu)中發(fā)揮極其重要的能力,可以極大的提升數(shù)據(jù)的加載和檢索效率;但不可否認(rèn)的是,在長期的應(yīng)用實踐中,也發(fā)現(xiàn)很多不好處理的流程和場景;

圖片

從直觀感覺上說,業(yè)務(wù)中對索引的使用主要涉及如圖的幾個流程,其核心也就是索引的結(jié)構(gòu)維護與數(shù)據(jù)的流動管理兩個模塊;

如果數(shù)據(jù)結(jié)構(gòu)比較簡單且體量小,那么使用起來可能很順手;如果數(shù)據(jù)主體復(fù)雜且會動態(tài)擴展,并且體量偏大,那么就很容易踩中一些比較坑的點;

比如:索引中字段一旦有誤,調(diào)整的流程十分復(fù)雜;數(shù)據(jù)流向索引中的方式,需要根據(jù)場景靈活選擇;以及數(shù)據(jù)查詢時的深度分頁問題;下面將圍繞這些問題來總結(jié)下應(yīng)對策略;

順帶補充一句,其實很多組件在應(yīng)用的時候都有不太符合預(yù)期的地方,所以在集成時可以考慮編寫自定義的管理程序,來解決使用時可能存在的問題;

二、結(jié)構(gòu)維護

對于ES索引的結(jié)構(gòu)維護,數(shù)據(jù)主體如果相對簡單的話,可以考慮手動管理,但實際上使用索引時,通常主體結(jié)構(gòu)都比較復(fù)雜,字段個數(shù)超過三五十都很常見,所以基于流程化的管理很有必要;

圖片

?結(jié)構(gòu)映射:將需要構(gòu)建索引的主體結(jié)構(gòu),在字段庫中統(tǒng)一維護,值得注意的是字段名稱和類型,字段可以與關(guān)系型數(shù)據(jù)庫的查詢一致,但是不同組件類型的描述不一樣,尤其對ES來說,如果字段類型不合理,會影響搜索的使用;

索引結(jié)構(gòu):在實際的業(yè)務(wù)場景中,字段的信息是會動態(tài)變化的,這就會給索引結(jié)構(gòu)的維護帶來很多麻煩,字段的增減都好管理,但是如果涉及類型的變動,則存在索引重建的過程,會導(dǎo)致數(shù)據(jù)多次重新調(diào)度,這也是風(fēng)險較高的操作;

程序維護:這種結(jié)構(gòu)維護的機制,其核心目的是把整個流程進行程序化管理,避免人工進行干預(yù),以此來確保索引結(jié)構(gòu)的穩(wěn)定擴展;

不得不提的一個經(jīng)驗教訓(xùn),曾經(jīng)在管理業(yè)務(wù)日志的索引結(jié)構(gòu)時,出現(xiàn)過一次誤刪動作,好在可以重新構(gòu)建和數(shù)據(jù)備份恢復(fù),但是依舊給心里留下了幾厘米的陰影,此后也將維護流程徹底程序化,避免失誤動作發(fā)生;

三、數(shù)據(jù)調(diào)度

1、同步方案

數(shù)據(jù)的調(diào)度管理,其本質(zhì)就是將數(shù)據(jù)從一個容器向另一個容器搬運或者拷貝,其核心操作就是讀和寫兩個動作,但是為了讓流程具備容錯和穩(wěn)定性,通常需要做策略和方案的設(shè)計;

圖片

?同步雙寫:對數(shù)據(jù)的實時性要求極高,通常在一個事務(wù)中完成數(shù)據(jù)的雙寫動作,保證數(shù)據(jù)層面的強一致性;

異步解耦:在完成數(shù)據(jù)庫的寫動作之后,基于MQ消息解耦索引的寫入,流程存在輕微的延遲,如果消費失敗會導(dǎo)致數(shù)據(jù)缺失;

定時任務(wù):通過任務(wù)調(diào)度的方式,以指定的時間周期執(zhí)行新增數(shù)據(jù)的同步機制,存在明顯的時效問題;

組件同步:采用合適的同步組件,比如官方提供的組件或者一些第三方開源的組件,在原理上與任務(wù)同步類似;

數(shù)據(jù)同步的選型方案有多種,如何選擇完全看具體的場景,在過往的使用過程中,對于核心業(yè)務(wù)會采用同步雙寫,對于內(nèi)部的活動類業(yè)務(wù)會采用異步的方式,對于業(yè)務(wù)日志會采用任務(wù)調(diào)度,對于系統(tǒng)的監(jiān)控或執(zhí)行日志則多是依賴同步組件;

2、中斷和恢復(fù)

無論采用何種方式將數(shù)據(jù)同步到索引中,都不得不面對一個靈魂問題,如果流程突然異常中斷,恢復(fù)后如何保證索引數(shù)據(jù)不丟失?這個問題適應(yīng)于很多復(fù)雜的流程;

圖片

容錯性是衡量一個復(fù)雜流程的核心指標(biāo),比如在索引數(shù)據(jù)同步的過程,需要短暫性的暫停,或者流程被迫中斷時,都應(yīng)該具備恢復(fù)后自動修復(fù)索引中數(shù)據(jù)缺失的能力;

ES實踐中一個非常經(jīng)典的問題,修改索引的結(jié)構(gòu)時需要進行索引重建,此時要將當(dāng)前索引遷入臨時索引中,在完成索引結(jié)構(gòu)調(diào)整之后,需要從臨時索引中遷回數(shù)據(jù),在此過程中,可以對服務(wù)交互的索引名稱動態(tài)調(diào)整;

圖片

當(dāng)然也可以直接使用臨時索引作為交互索引,避免一次遷移動作,這種動態(tài)的識別需要在服務(wù)中嵌入,在整個??reindex??過程中要避免手動干預(yù),個人還是更相信程序的安全性和準(zhǔn)確性;

四、刷新策略

在向ES索引中寫數(shù)據(jù)時,存在三種不同的數(shù)據(jù)刷新機制,查看??6.8???版本的設(shè)置中,參數(shù)??refresh_interval??設(shè)置的是1s時間,即執(zhí)行寫入動作1秒后數(shù)據(jù)才可以被搜索到,避免頻繁寫入消耗過多的資源;

NONE:默認(rèn)的刷新策略,請求提交之后不會等待數(shù)據(jù)刷新,降低資源消耗但數(shù)據(jù)實時性低;

IMMEDIATE:請求提交后立即刷新索引,數(shù)據(jù)的實時性很高但是資源消耗過大,API文檔中建議測試使用;

WAIT_UNTIL:請求提交之后會等待索引刷新完成才會結(jié)束,相對來說是一種比較平衡的策略;

刷新機制對于索引的數(shù)據(jù)維護來說,主要在增刪改的動作中,對即時查詢有直接的影響,至于如何選擇還是要結(jié)合具體的場景,尤其與同步方案關(guān)聯(lián)密切,也可以在索引交互中動態(tài)維護策略,來應(yīng)對不時之需;

五、深度分頁

對于數(shù)據(jù)查詢來說,幾乎都存在分頁的需求,在常見的應(yīng)用中,不斷下拉的功能都是存在最大的極限值;

ES中常用From/Size進行分頁查詢,但是存在一個限制,在索引的設(shè)置中存在??max_result_window???分頁深度的限制,??6.8??版本默認(rèn)值是10000條,即10000之后的數(shù)據(jù)無法使用From/Size翻頁;

先從實際應(yīng)用場景來分析,大多數(shù)的翻頁需求最多也就前10頁左右,所以從這個角度考慮,ES的翻頁限制在合理區(qū)間,在實踐中也存在對部分索引調(diào)高的情況,暫未出現(xiàn)明顯問題;

再從技術(shù)角度來思考一下,如果翻頁的參數(shù)過大意味著更多的數(shù)據(jù)過濾,那計算資源的占用也會升高,ES引擎的強大在于搜索能力,檢索出符合要求的數(shù)據(jù)即可;

圖片

不管是ES還是其它類似的分布式存儲組件,甚至是MySQL分庫分表模式,其本質(zhì)都是數(shù)據(jù)分布在不同服務(wù)節(jié)點的不同數(shù)據(jù)片上;常規(guī)的執(zhí)行原理都是給請求分配一個主節(jié)點,協(xié)調(diào)各個節(jié)點執(zhí)行相同的查詢,并完成結(jié)果匯總和響應(yīng),深度分頁時計算資源的占用自然非常高;

如果一定需要深度分頁,在??6.8???的版本中提供了??Scroll???或??Search-After??兩種其他的方式,用法參考相關(guān)文檔即可。

六、參考源碼

編程文檔: https://gitee.com/cicadasmile/butte-java-note

應(yīng)用倉庫: https://gitee.com/cicadasmile/butte-flyer-parent

責(zé)任編輯:武曉燕 來源: 知了一笑
相關(guān)推薦

2021-09-22 13:08:06

開發(fā)技能SQL

2024-05-30 19:01:53

AI技術(shù)大會

2018-09-11 08:05:44

千兆路由器廠商

2021-09-07 14:35:48

DevSecOps開源項目

2018-07-05 06:02:38

綜合布線弱電動力線

2021-05-18 08:02:40

面試面試問題職業(yè)規(guī)劃

2017-01-23 08:41:43

云計算

2022-11-10 10:19:06

業(yè)務(wù)項目工具代碼

2022-12-12 08:23:34

Java 5ordrialname

2018-10-31 11:30:28

Redis數(shù)據(jù)分布式鎖

2019-02-25 23:02:16

數(shù)據(jù)科學(xué)職業(yè)數(shù)據(jù)科學(xué)家

2017-02-23 08:08:58

2021-08-19 07:34:55

RabbitMQLinuxWindows

2013-05-14 13:59:13

開發(fā)者廣告商廣告平臺

2015-03-23 10:16:35

蘋果庫克

2015-07-13 09:04:10

互聯(lián)網(wǎng)設(shè)備設(shè)備

2023-06-12 07:00:40

Rust進度任務(wù)

2021-01-26 00:46:40

微服務(wù)架構(gòu)微服務(wù)應(yīng)用

2025-03-24 07:10:00

嚴(yán)格模式JavaScript代碼

2023-11-30 08:34:29

批量消息消息隊列
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 在线国产视频 | 亚洲成人久久久 | 精品精品视频 | 国产精品久久久久久久久久久久久久 | 夜夜爽夜夜操 | 韩三级在线观看 | 亚洲图片一区二区三区 | 精品在线一区 | www日本高清| 国产日韩欧美在线播放 | 国产乱码一二三区精品 | 亚洲欧美综合精品另类天天更新 | 日韩福利 | 夜夜av| 精品1区2区 | 中文字幕一区二区三区精彩视频 | 欧美日韩国产一区二区 | 国产精品123区 | av网址在线 | 一区二区三区不卡视频 | 一区二区三区视频 | 99久久久99久久国产片鸭王 | 亚洲免费毛片 | 亚洲精品中文字幕 | 国产一区二区三区四区五区加勒比 | 免费久久久久久 | 天天色图 | 国产成人91| 成人3d动漫一区二区三区91 | 国产乱性| 国产成人免费在线 | 精品久久久久久久久久久下田 | 国产在线一区二区三区 | 黄色电影在线免费观看 | 国产福利精品一区 | 国产精品色 | 精精国产xxxx视频在线播放7 | 在线播放中文字幕 | 黄网址在线观看 | 午夜丰满少妇一级毛片 | 免费a国产 |