使用 RediSearch 在 Redis 中進(jìn)行全文檢索
Redis 大家肯定都不陌生了,作為一種快速、高性能的鍵值存儲(chǔ)數(shù)據(jù)庫,廣泛應(yīng)用于緩存、隊(duì)列、會(huì)話存儲(chǔ)等方面。
然而,Redis 在原生狀態(tài)下并不支持全文檢索功能,這使得處理文本數(shù)據(jù)變得相對(duì)困難。但是在有一些場景下還需要這樣的功能,有什么好辦法呢?答案就是 RediSearch。
RediSearch 是 Redis 的一個(gè)插件,它為 Redis 數(shù)據(jù)庫添加了全文搜索和查詢功能,使開發(fā)人員能夠在 Redis 中高效地執(zhí)行全文檢索操作。
它基于 Redis Module API 構(gòu)建,通過使用自定義的數(shù)據(jù)結(jié)構(gòu)和索引算法,實(shí)現(xiàn)了高效的全文搜索功能。
安裝
如果單純用來測(cè)試的話,可以直接通過 docker 來啟動(dòng);如果是生產(chǎn)環(huán)境,就需要根據(jù)公司的實(shí)際情況來支持了。
$ docker run -p 6379:6379 redis/redis-stack-server:latest
啟動(dòng)服務(wù)之后,可以使用 FT.* 命令集來體驗(yàn)搜索功能。
概覽
為了使用全文搜索功能,我們必須將文檔存儲(chǔ)在哈希中,使用命令 FT.CREATE 創(chuàng)建索引并使用 FT.SEARCH 做文本搜索。
這樣說可能會(huì)比較懵,看下面的示意圖就明白了:
圖片
現(xiàn)在,讓我們插入兩條文檔:
redis-cli 'hset post:1 title "hello world" body "this is a cool document"'
redis-cli 'hset post:2 title "goodbye everybody" body "this is the best document"'
上面命令創(chuàng)建兩個(gè)哈希值,分別是 post:1 和 post:2,其中包含的字段是 title 和 body。
創(chuàng)建索引
接下來創(chuàng)建索引:
FT.CREATE post_index prefix 1 post: SCHEMA title TEXT body text
圖片
在這里,我們創(chuàng)建了 post_index 索引,它將索引以 post: 前綴開頭的所有 Redis 哈希鍵。只有 title 和 body 字段才會(huì)被索引,并且索引立即生效。
搜索索引
使用 FT.SEARCH 命令,參數(shù)是索引名稱和需要搜索的關(guān)鍵詞:
FT.SEARCH post_index "world"
圖片
實(shí)時(shí)索引
當(dāng)新增一個(gè)文檔時(shí),它會(huì)被自動(dòng)添加到索引:
redis-cli 'hset post:3 title "really?" body "yeah"'
立即可以被搜索到:
> ft.search post_index "really"
1) (integer) 1
2) "post:3"
3) 1) "title"
2) "really?"
3) "body"
4) "yeah"
搜索特定字段
可以選擇要搜索的字段,比如 title:
ft.search post_index "@title:world"
按列表中的任何單詞搜索
類似于邏輯 OR 操作,比如要查找與 hello 或 goodbye 匹配的所有文檔:
ft.search post_index "hello|goodbye"
搜索結(jié)果分頁
和 SQL 是一樣的,使用 LIMIT 關(guān)鍵詞,比如:
ft.search post_index "world" LIMIT 10, 5
反向搜索
在搜索關(guān)鍵詞前使用 - 來排除結(jié)果中包含該字段的信息:
ft.search post_index "-foo"
部分搜索
還可以使用 * 只搜索單詞的一部分,比如要查找以 good 開頭的單詞的所有文檔:
ft.search post_index "good*"
需要注意的是,這樣做僅限于前綴,比如關(guān)鍵詞是這樣的話 *good,是不支持的。
模糊匹配
這個(gè)功能很強(qiáng)大,它是一種近似的搜索手段,使用 %。
假設(shè)你把想要查找的單詞寫錯(cuò)了,把 world 寫成了 wold,它依然能查出來,比如:
ft.search post_index "%wold%"
總結(jié)
最近在工作中遇到了一個(gè)問題,因?yàn)閿?shù)據(jù)都存儲(chǔ)在了 Redis 中,而且大部分功能都可以滿足。但其中有一個(gè)接口需要模糊查詢,這在 Redis 原生方法中是不容易的。
所以查找了一些資料,了解到 RediSearch,使用一下還是挺方便的,并且完美地解決了我的問題。也把這篇文章分享給大家,希望對(duì)大家有幫助。
以上就是本文的全部內(nèi)容,如果覺得還不錯(cuò)的話歡迎點(diǎn)贊,轉(zhuǎn)發(fā)和關(guān)注,感謝支持。
參考文章:
- https://github.com/RediSearch
- https://medium.com/datadenys/full-text-search-in-redis-using-redisearch-31df0deb4f3e