成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

阿里面試這樣問:Redis為什么把簡單的字符串設計成SDS?

數據庫 其他數據庫 Redis
redis 數據結構的一點基礎知識,沒什么難度,但以我的面試經驗,如果被問這類問題,不要只含糊其辭的說出底層是SDS,有理有據的把為什么這樣實現也說出來。

面試官:了解redis的String數據結構底層實現嘛?

鐵子:當然知道,是基于SDS實現的

面試官:redis是用C語言開發的,那為啥不直接用C的字符串,還單獨設計SDS這樣的結構呢?

鐵子:·····

“其實看得出面試官是想看看,鐵子是只停留在redis的使用層面,還是對底層數據結構有過更深入的研究,面試嘛都愛這樣問大家都懂得。

我們知道redis是用C寫的,但它卻沒有完全直接使用C的字符串,而是自己又重新構建了一個叫簡單動態字符串SDS(simple dynamic string)的抽象類型。

redis也支持使用C語言的傳統字符串,只不過會用在一些不需要對字符串修改的地方,比如靜態的字符輸出。

而我們開發中使用redis,往往會經常性的修改字符串的值,這個時候就會用SDS來表示字符串的值了。有一點值得注意:在redis數據庫中,key-value鍵值對含有字符串值的,都是由SDS來實現的。

比如:在redis執行一個最簡單的set命令,這時redis會新建一個鍵值對。

127.0.0.1:6379> set xiaofu "AAA" 

此時鍵值對的key和value都是一個字符串對象,而對象的底層實現分別是兩個保存著字符串xiaofu和AAA的SDS結構。

再比如:我向一個列表中壓入數據,redis 又會新建一個鍵值對。 

127.0.0.1:6379> lpush xiaofu "AAA" "BBB" 

這時候鍵值對的鍵和上邊一樣,還是一個由SDS實現的字符串對象,鍵值對的值是一個包含兩個字符串對象的列表對象了,而這兩個對象的底層也是由SDS實現。

SDS結構

一個SDS值的數據結構,主要由len、free、buf[]這三個屬性組成。 

struct sdshdr{    int free; // buf[]數組未使用字節的數量    int len; // buf[]數組所保存的字符串的長度    char buf[]; // 保存字符串的數組  } 

其中buf[]為實際保存字符串的char類型數組;free表示buf[]數組未使用字節的數量;len表示buf[]數組所保存的字符串的長度。

???

例如上圖表示的是buf[]保存長度為6個字節的字符串,未使用的字節數free為0,但是眼尖的同學會發現這明明是7個字符,還有一個"\0"啊?

上邊提到過SDS沒有完全直接使用C的字符串,還是沿用了一些C特性的,比如遵循C的字符串以空格符結尾的規則,這樣還可以使用一部分C字符串的函數。而對于SDS來說,空字符串占用的一字節是不計算在len屬性里的,會為他分配額外的空間。

簡單了解SDS結構后,下邊我們來看看SDS相比于C字符串有哪些優點。

效率高

舉個例子:工作中使用redis,經常會通過STRLEN命令得到一個字符串的長度,在SDS結構中len屬性記錄了字符串的長度,所以我們獲取一個字符串長度直接取len的值,復雜度是O(1)。

???

而如果用C字符串,在獲取一個字符串長度時,需對整個字符串進行遍歷,直至遍歷到空格符結束(C中遇到空格符代表一個完整字符串),此時的復雜度是O(N)。

在高并發場景下頻繁遍歷字符串,獲取字符串的長度很有可能成為redis的性能瓶頸,所以SDS性能更好一些。

數據溢出

上邊提到C字符串是不記錄自身長度的,相鄰的兩個字符串存儲的方式可能如下圖,為字符串分配了合適的內存空間。

???

如果此時我想把“AAA”改成“AAA123”,可之前分配的內存只有6個字節,修改后的字符串需要9個字節才能放下啊,怎么搞?

???

沒辦法只能侵占相鄰字符串的空間,自身數據溢出導致其他字符串的內容被修改。

而SDS很好的規避了這點,當我們需要修改數據時,首先會檢查當前SDS空間len是否滿足,不滿足則自動擴容空間至修改所需的大小,然后再執行修改,如下圖所示。

???

不過有個特殊的地方,在把“AAA”的6個字節擴容到“AAA123”9個字節后,發現free屬性的值變成了擴容后字符串的總長度,這就涉及到下邊要說的內存重分配策略了。

內存重分配策略

C字符串長度是一定的,所以每次在增長或者縮短字符串時,都要做內存的重分配,而內存重分配算法通常又是一個比較耗時的操作,如果程序不經常修改字符串還是可以接受的。

但很不幸,redis作為一個數據庫,數據肯定會被頻繁修改,如果每次修改都要執行一次內存重分配,那么就會嚴重影響性能。

SDS通過兩種內存重分配策略,很好的解決了字符串在增長和縮短時的內存分配問題。

1.空間預分配

空間預分配策略用于優化SDS字符串增長操作,當修改字符串并需對SDS的空間進行擴展時,不僅會為SDS分配修改所必要的空間,還會為SDS分配額外的未使用空間free,下次再修改就先檢查未使用空間free是否滿足,滿足則不用在擴展空間。

通過空間預分配策略,redis可以有效的減少字符串連續增長操作,所產生的內存重分配次數。

???

額外分配未使用空間free的規則:


  •  如果對 SDS 字符串修改后,len 值小于 1M,那么此時額外分配未使用空間 free 的大小與len相等。
  •  如果對 SDS 字符串修改后,len 值大于等于 1M,那么此時額外分配未使用空間 free 的大小為1M。

2.惰性空間釋放

惰性空間釋放策略則用于優化SDS字符串縮短操作,當縮短SDS字符串后,并不會立即執行內存重分配來回收多余的空間,而是用free屬性將這些空間記錄下來,如果后續有增長操作,則可直接使用。

???

數據格式多樣性

C字符串中的字符必須符合某些特定的編碼格式,而且上邊我們也提到,C字符串以\0空字符結尾標識一個字符串結束,所以字符串里邊是不能包含\0的,不然就會被誤認是多個。

由于這種限制,使得C字符串只能保存文本數據,像音視頻、圖片等二進制格式的數據是無法存儲的。

redis 會以處理二進制的方式操作Buf數組中的數據,所以對存入其中的數據未做任何的限制、過濾,只要存進來什么樣,取出來還是什么樣。

總結

上邊只是 redis 數據結構的一點基礎知識,沒什么難度,但以我的面試經驗,如果被問這類問題,不要只含糊其辭的說出底層是SDS,有理有據的把為什么這樣實現也說出來。

一來可以顯得自己基本功扎實,如果表達的在條理清晰,是個很不錯的加分項;在一個主動打消面試官問下去的念頭,當然就怕不按套路出牌的人! 

責任編輯:龐桂玉 來源: Hollis
相關推薦

2021-02-18 07:45:09

redis 字符串SDS

2021-02-23 09:35:33

redis字符串數據庫

2019-03-07 15:43:22

Redis數據SDS

2021-02-07 21:16:04

字節跳動面試字符串

2020-05-13 12:17:33

RedisC字符C語言

2024-02-20 20:12:09

C語言字符串Redis

2020-07-23 16:00:38

Redis字符串Java

2024-05-27 08:04:41

2023-03-21 15:27:00

RedisC語言字符串

2024-05-27 08:01:15

2023-01-03 08:07:33

Go字符串指針

2023-09-21 10:50:23

MySQL數據庫

2015-03-19 15:04:06

2023-05-29 08:03:41

代碼Go語言

2019-02-27 09:00:13

阿里巴巴for循環Java

2019-01-29 10:30:32

阿里巴巴Java字符串

2025-06-16 08:10:00

2021-02-02 18:03:00

字符串面試官子序列

2020-12-16 07:36:46

Redis字符串數據

2009-08-26 13:24:54

C#字符串
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久91 | 国产精品www| 欧美精品 在线观看 | 亚洲一区二区av | 欧美综合视频在线 | 中文字幕一区二区三区四区 | 久久国产精品偷 | 精品一二区 | 日韩一二区在线 | 国产精品美女久久久 | 欧美一区二区三区在线 | 国产成年人视频 | 欧美性生活免费 | 欧美日本亚洲 | 7777在线| 第一区在线观看免费国语入口 | h视频免费在线观看 | 久草视频网站 | 特级特黄特色的免费大片 | 亚洲久久在线 | www.久久.com | 狠狠亚洲| 男女羞羞免费网站 | 91日韩 | 亚洲视频观看 | 成人毛片网 | 日日干日日操 | 在线免费观看成年人视频 | 欧美在线视频网站 | www.久| 欧美一区二区三区在线 | 蜜臀网站 | 最新中文字幕第一页视频 | 国产亚洲www | 国产精品高清在线 | 国产欧美在线 | 成人午夜影院 | 91中文字幕在线 | 国产精品久久久久免费 | 综合精品| 国产精品永久免费 |