摘要:對象源碼結構如下對象類型對象編碼引用統計指向底層實現數據結構的指針字段對象類型,就是我們常說的。。對象編碼對應跳躍表壓縮列表集合動態字符串等八種底層數據結構。
相信很多人應該都知道 Redis 有五種數據類型:字符串、列表、哈希、集合和有序集合。但這五種數據類型是什么含義?Redis 的數據又是怎樣存儲的?今天我們一起來認識下 Redis 這五種數據結構的含義及其底層實現。
首先要明確的是,Redis 并沒有直接使用這五種數據結構來實現鍵值對數據庫,而是基于這些數據結構創建了一套對象系統,我們常說的數據類型,準確來說,是 Redis 對象系統的類型。
1 對象對于 Redis 而言,所有鍵值對的存儲,都是將數據存儲在對象結構中。所不同的是,鍵總是一個字符串對象,值可以是任意類型的對象。
對象源碼結構如下:
typedef struct redisObject { unsigned type:4; // 對象類型 unsigned encoding:4; // 對象編碼 unsigned lru:LRU_BITS; // LRU int refcount; // 引用統計 void *ptr; // 指向底層實現數據結構的指針 } robj;
type 字段:對象類型,就是我們常說的。string、list、hash、set、zset。
encoding:對象編碼。也就是我們上面說的底層數據結構。
LRU:鍵值對的 LRU。
refcount:鍵值對對象的引用統計。當此值為 0 時,回收對象。
*ptr:指向底層實現數據結構的指針。就是實際存放數據的地址。
1.2 對象類型對象有五種數據類型,就是我們上面提過的:
字符串類型
列表類型
哈希類型
集合類型
有序集合類型
結合我們上面提到的鍵值對存儲類型的差別,可以了解到,我們常說的“一個列表鍵或一個哈希鍵”,本質上指的是:一個 key 對應的 value 是列表對象或哈希對象。
對于 type 字段,我們可以使用 TYPE 命令來查看指定 key 對應 value 值的對象類型。
按道理講,已經有了 type,為什么還要搞個編碼呢?
想想看,通過 encoding 屬性,我們是不是使用不同編碼的對象?這種使用方式可以根據不同的使用場景來為一個對象設置不同的編碼,從而優化在某一場景下的效率,極大的提升了 Redis 的靈活性和效率。
舉個栗子,在列表對象包含的元素比較少時,Redis 使用壓縮列表作為列表對象的底層實現:
壓縮列表比快速鏈表更節約內存,并且在元素數量較少時,在內存中以連續塊方式報錯的壓縮列表比起快速列表可以更快的載入到緩存中;
隨著列表對象包含的元素越來越多,使用壓縮列表保存元素的優勢消失時,對象就會將底層實現從壓縮列表轉為功能更強、也更適合保存大量元素的快速鏈表。
后面介紹完編碼類型后,我們會詳細認識不同類型對應的各個編碼方式。
encoding 屬性有以下取值:
OBJ_ENCODING_RAW
OBJ_ENCODING_INT
OBJ_ENCODING_HT
OBJ_ENCODING_QUICKLIST
OBJ_ENCODING_ZIPLIST
OBJ_ENCODING_INTSET
OBJ_ENCODING_SKIPLIST
OBJ_ENCODING_EMBSTR
對象的編碼類型可以由 OBJECT ENCODING 命令獲取。
OBJECT ENCODING 命令對應源碼如下:
# src/object.c char *strEncoding(int encoding) { switch(encoding) { case OBJ_ENCODING_RAW: return "raw"; case OBJ_ENCODING_INT: return "int"; case OBJ_ENCODING_HT: return "hashtable"; case OBJ_ENCODING_QUICKLIST: return "quicklist"; case OBJ_ENCODING_ZIPLIST: return "ziplist"; case OBJ_ENCODING_INTSET: return "intset"; case OBJ_ENCODING_SKIPLIST: return "skiplist"; case OBJ_ENCODING_EMBSTR: return "embstr"; default: return "unknown"; } }
OBJECT ENCODING 命令輸出值與 encoding 屬性取值對應關系如下:
對象使用的底層數據結構 | 編碼常量 | OBJECT ENCODING 輸出 |
---|---|---|
簡單動態字符串 | OBJ_ENCODING_RAW | "raw" |
整數 | OBJ_ENCODING_INT | "int" |
embstr 編碼的簡單動態字符串 | OBJ_ENCODING_EMBSTR | "embstr" |
字典 | OBJ_ENCODING_HT | "hashtable" |
壓縮列表 | OBJ_ENCODING_ZIPLIST | "ziplist" |
快速列表 | OBJ_ENCODING_QUICKLIST | "quicklist" |
整數集合 | OBJ_ENCODING_INTSET | "intset" |
跳躍表 | OBJ_ENCODING_SKIPLIST | "skiplist" |
總結來看,如下圖:
十一種不同編碼的對象分別是:
使用雙端或快速列表實現的列表對象
使用壓縮列表實現的列表對象
使用字典實現的哈希對象
使用壓縮列表實現的哈希對象
使用字典實現的集合對象
使用整數集合實現的集合對象
使用壓縮列表實現的有序集合對象
使用跳躍表實現的有序集合對象
使用普通 SDS 實現的字符串對象
使用 embstr 編碼的 SDS 實現的字符串對象
使用整數值實現的字符串對象
接下來,我們將對上述十一種對象一一介紹。之后再一一認識對象編碼。
2 字符串對象字符串對象的可選編碼分別是:int、raw 或者 embstr。
2.1 int 編碼的字符串對象如果一個字符串對象保存的是整數值,并且這個整數值可以用 long 類型表示,那么字符串對象會將整數值保存在字符串對象結構的 ptr 屬性中,并將字符串對象的編碼設置為 int。
我們執行以下 SET 命令,服務器將創建一個如下圖所示的 int 編碼的字符串對象作為 num 鍵的值:
# redis-cli 127.0.0.1:6380> set num 12345 OK 127.0.0.1:6380> OBJECT ENCODING num "int"2.2 raw 編碼的字符串對象
如果字符串對象保存的是一個字符串值,并且這個字符串值的長度大于 44 字節(根據版本的不同,這個值會有差異。詳見 object.c 文件中的 OBJ_ENCODING_EMBSTR_SIZE_LIMIT 常量),那么字符串對象將使用**簡單動態字符串(SDS)來保存這個字符串值,并將對象的編碼設置為 raw。
我們執行下面的 SET 命令,服務器將創建一個圖 7 所示的 raw 編碼的字符串對象作為 k1 鍵的值(45 字節):
127.0.0.1:7379> set story "k01234567890123456789012345678901234567890123" OK 127.0.0.1:7379> OBJECT ENCODING k4 "raw"2.3 embstr 編碼的字符串對象
如果字符串保存的是一個字符串值,并且這個字符串值的長度小于等于 44 字節(根據版本的不同,這個值會有差異。詳見 object.c 文件中的 OBJ_ENCODING_EMBSTR_SIZE_LIMIT 常量),那么字符串對象將使用 embstr 編碼的方式來保存這個字符串。
embstr 編碼是專門用于保存段字符串的一種優化編碼方式,這種編碼和 raw 編碼一樣,都使用 redisObject 和 sdshdr 結構來表示字符串對象。但和 raw 編碼的字符串對象不同的是:
raw 編碼會調用兩次內存分配函數來分別創建 redisObject 和 sdshdr 結構
embstr 編碼通過一次內存分配函數分配一塊連續的空間,空間中依次包含 redisObject 和 sdsHdr 兩個結構。
相對應的,釋放內存時,embstr 編碼的對象也只需調用一次內存釋放函數。
因此,使用 embstr 編碼的字符串對象來保存短字符串值有以下好處:
創建字符串對象時,內存分配次數從兩次降低為一次。
釋放 embstr 編碼的字符串對象時,調用內存釋放函數的次數從兩次降低為一次。
更好地利用緩存優勢。embstr 編碼的字符串對象的所有數據都保存在一塊連續的內存中 ,這種方式比 raw 編碼的字符串對象能夠更好的利用緩存帶來的優勢。
以下命令創建了一個 embstr 編碼的字符串對象作為 msg 鍵的值,值對象結構如圖 8。
127.0.0.1:6380> SET msg hello OK 127.0.0.1:6380> OBJECT ENCODING msg "embstr"2.4 浮點數編碼
Redis 中,long double 類型的浮點數也是作為字符串值來保存的。
我們要保存一個浮點數到字符串對象中,程序會先將這個浮點數轉換成字符串值,然后再保存轉換所得的字符串值。
執行以下代碼,將創建一個包含 3.14 的字符串表示 "3.14" 的字符串對象:
127.0.0.1:6380> SET pi 3.14 OK 127.0.0.1:6380> OBJECT ENCODING pi "embstr"
在有需要的時候,程序會將保存在字符串對象里的字符串值轉換成浮點數值,執行某些操作,然后將所得的浮點數值轉換回字符串值,繼續保存在字符串對象中。
比如,我們對 pi 鍵執行以下操作:
127.0.0.1:6380> INCRBYFLOAT pi 2.0 "5.14" 127.0.0.1:6380> OBJECT ENCODING pi "embstr"
執行 INCRBYFLOAT 命令過程中,實際上就會出現字符串與浮點數值互相轉換的情況。
2.5 編碼轉換int 編碼的字符串對象和 embstr 編碼的字符串對象在滿足某些條件的情況下,會被轉換為 raw 編碼的字符串對象。
對于 int 編碼的字符串對象來說,如果我們在執行命令后,使得這個對象保存的不再是整數值,而是一個字符串,那么字符串對象就會從 int 變為 raw。比如 APPEND 命令等。
另外,對于 embstr 編碼的字符串,由于 Redis 沒有為其編寫任何相應的修改程序,所以 embstr 編碼的字符串對象實際上是只讀的。當我們對 embstr 編碼的字符串對象執行任何修改命令時,程序都會先將對象的編碼從 embstr 轉換成 raw。也就是說,embstr 編碼的字符串一旦修改,一定會轉換成 raw 編碼的字符串對象。
2.6 值與編碼對應關系對于字符串對象各個編碼的情況,總結如下:
值 | 編碼 |
---|---|
可以用 long 表示的整數值 | int |
可以用 long double 保存的浮點數 | raw 或 embstr |
不可以用 long 或 long double 表示的整數或小數值 | raw 或 embstr |
大于 44 字節的字符串 | raw |
小于或等于 44 字節的字符串 | embstr |
列表對象的可選編碼分別是:quicklist(3.2 版本前是 ziplist 和 linkedlist)。
3.1 quicklist 編碼的列表對象3.2 版本引入了 quicklist 編碼,此編碼結合了 ziplist 和 linkedlist,使用雙向鏈表的形式,在每個節點上存儲一個 ziplist,而每個 ziplist 又可以存儲多個鍵值對。也就是說,quicklist 每個節點上存儲的不是一個數據,而是一片數據。
執行以下命令,服務器將會創建一個列表對象,quicklist 結構如圖 8 所示:
127.0.0.1:7379> RPUSH animal "dog" "cat" "pig" (integer) 3 (5.12s) 127.0.0.1:7379> OBJECT ENCODING animal "quicklist"總結
Redis 自己實現了一套對象系統來實現所有功能。
對象有對象類型和對象編碼。
對象類型對應字符串、列表、哈希、集合、有序集合五種。
對象編碼對應跳躍表、壓縮列表、集合、動態字符串等八種底層數據結構。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/62139.html
摘要:哈希對象哈希對象的可選編碼分別是和。編碼的哈希對象編碼的哈希對象使用壓縮列表作為底層實現。關于哈希編碼轉換的函數,可以參考,源碼如下是原始對象,是目標編碼。對應源碼如下對象元素數量為,或者總結哈希對象有和編碼。 繼續擼我們的對象和數據類型。 上節我們一起認識了字符串和列表,接下來還有哈希、集合和有序集合。 1 哈希對象 哈希對象的可選編碼分別是:ziplist 和 hashtable。...
摘要:沒有直接使用語言傳統的字符串表示以空字符串結尾的字符數組,而是構建了一種名為簡單動態字符串的抽象類型,并將用作的默認字符串表示。對比字符串,有幾大優點常數復雜度獲取字符串長度杜絕緩沖區溢出減少修改字符串時所需的內存重分配次數。 Redis 沒有直接使用 C 語言傳統的字符串表示(以空字符串結尾的字符數組),而是構建了一種名為簡單動態字符串(simple dynamic string)的...
摘要:此時服務器處于休眠狀態,并使用進行事件輪詢,等待監聽事件的發生。繼續執行被調試程序,直至下一個斷點或程序結束縮寫。服務啟動包括初始化基礎配置數據結構對外提供服務的準備工作還原數據庫執行事件循環等。 一直很羨慕那些能讀 Redis 源碼的童鞋,也一直想自己解讀一遍,但迫于 C 大魔王的壓力,解讀日期遙遙無期。 相信很多小伙伴應該也都對或曾對源碼感興趣,但一來覺得自己不會 C 語言,二來也...
閱讀 2491·2021-11-24 09:39
閱讀 3415·2021-11-15 11:37
閱讀 2267·2021-10-08 10:04
閱讀 3977·2021-09-09 11:54
閱讀 1890·2021-08-18 10:24
閱讀 1060·2019-08-30 11:02
閱讀 1805·2019-08-29 18:45
閱讀 1661·2019-08-29 16:33