聽說有人不了解柔性數組
本文轉載自微信公眾號「C語言與CPP編程」,可以通過以下二維碼關注。轉載本文請聯系C語言與CPP編程公眾號。
1 引言
定長數組包
在平時的開發中,緩沖區數據收發時,如果采用緩沖區定長包,假定大小是 1k,MAX_LENGTH為 1024。結構體如下:
- // 定長緩沖區
- struct max_buffer
- {
- int len;
- char data[MAX_LENGTH];
- };
數據結構的大小 >= sizeof(int) + sizeof(char) * MAX_LENGTH為了防止數據溢出的情況,data 的長度一般會設置得足夠大,但也正是因為這樣,才會導致數組的冗余。
假如發送 512 字節的數據, 就會浪費 512 個字節的空間, 平時通信時,大多數是心跳包,大小遠遠小于 1024,除了浪費空間還消耗很多流量。
內存申請:
- if ((m_buffer = (struct max_buffer *)malloc(sizeof(struct max_buffer))) != NULL)
- {
- m_buffer->len = CUR_LENGTH;
- memcpy(m_buffer->data, "max_buffer test", CUR_LENGTH);
- printf("%d, %s\n", m_buffer->len, m_buffer->data);
- }
內存釋放:
- free(m_buffer);
- m_buffer = NULL;
指針數據包
為了避免空間上的浪費,我們可以將上面的長度為 MAX_LENGTH 的定長數組換為指針, 每次使用時動態的開辟 CUR_LENGTH 大小的空間。數據包結構體定義:
- struct point_buffer
- {
- int len;
- char *data;
- };
數據結構大小 >= sizeof(int) + sizeof(char *)但在內存分配時,需要兩步進行:
- 需為結構體分配一塊內存空間;
- 為結構體中的成員變量分配內存空間;
內存申請:
- if ((p_buffer = (struct point_buffer *)malloc(sizeof(struct point_buffer))) != NULL)
- {
- p_buffer->len = CUR_LENGTH;
- if ((p_buffer->data = (char *)malloc(sizeof(char) * CUR_LENGTH)) != NULL)
- {
- memcpy(p_buffer->data, "point_buffer test", CUR_LENGTH);
- printf("%d, %s\n", p_buffer->len, p_buffer->data);
- }
- }
內存釋放:
- free(p_buffer->data);
- free(p_buffer);
- p_buffer = NULL;
雖然這樣能夠節約內存,但是兩次分配的內存是不連續的, 需要分別對其進行管理,導致的問題就是需要對結構體和數據分別申請和釋放內存,這樣對于程序員來說無疑是一個災難,因為這樣很容易導致遺忘釋放內存造成內存泄露。
有沒有更好的方法呢?那就是今天的主題柔性數組。
2 柔性數組
什么是柔性數組?
柔性數組成員(flexible array member)也叫伸縮性數組成員,這種代碼結構產生于對動態結構體的需求。在日常的編程中,有時候需要在結構體中存放一個長度動態的字符串,鑒于這種代碼結構所產生的重要作用,C99 甚至把它收入了標準中:
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
柔性數組是 C99 標準引入的特性,所以當你的編譯器提示不支持的語法時,請檢查你是否開啟了 C99 選項或更高的版本支持。
C99 標準的定義如下:
- struct test {
- short len; // 必須至少有一個其它成員
- char arr[]; // 柔性數組必須是結構體最后一個成員(也可是其它類型,如:int、double、...)
- };
- 柔性數組成員必須定義在結構體里面且為最后元素;
- 結構體中不能單獨只有柔性數組成員;
- 柔性數組不占內存。
在一個結構體的最后,申明一個長度為空的數組,就可以使得這個結構體是可變長的。對于編譯器來說,此時長度為 0 的數組并不占用空間,因為數組名本身不占空間,它只是一個偏移量,數組名這個符號本身代表了一個不可修改的地址常量,
但對于這個數組的大小,我們可以進行動態分配,對于編譯器而言,數組名僅僅是一個符號,它不會占用任何空間,它在結構體中,只是代表了一個偏移量,代表一個不可修改的地址常量!
對于柔性數組的這個特點,很容易構造出變成結構體,如緩沖區,數據包等等, 其實柔性數組成員在實現跳躍表時有它特別的用法,在Redis的SDS數據結構中和跳躍表的實現上,也使用柔性數組成員。它的主要用途是為了滿足需要變長度的結構體,為了解決使用數組時內存的冗余和數組的越界問題。
柔性數組解決引言的例子
- //柔性數組
- struct soft_buffer
- {
- int len;
- char data[0];
- };
數據結構大小 = sizeof(struct soft_buffer) = sizeof(int),這樣的變長數組常用于網絡通信中構造不定長數據包, 不會浪費空間浪費網絡流量。
申請內存:
- if ((softbuffer = (struct soft_buffer *)malloc(sizeof(struct soft_buffer) + sizeof(char) * CUR_LENGTH)) != NULL)
- {
- softbuffer->len = CUR_LENGTH;
- memcpy(softbuffer->data, "softbuffer test", CUR_LENGTH);
- printf("%d, %s\n", softbuffer->len, softbuffer->data);
- }
釋放內存:
- free(softbuffer);
- softbuffer = NULL;
對比使用指針和柔性數組會發現,使用柔性數組的優點:
- 由于結構體使用指針地址不連續(兩次 malloc),柔性數組地址連續,只需要一次 malloc,同樣釋放前者需要兩次,后者可以一起釋放。
- 在數據拷貝時,結構體使用指針時,必須拷貝它指向的內存,內存不連續會存在問題,柔性數組可以直接拷貝。
- 減少內存碎片,由于結構體的柔性數組和結構體成員的地址是連續的,即可一同申請內存,因此更大程度地避免了內存碎片。另外由于該成員本身不占結構體空間,因此,整體而言,比普通的數組成員占用空間要會稍微小點。
缺點:對結構體格式有要求,必要放在最后,不是唯一成員。
3 總結
在日常編程中,有時需要在結構體中存放一個長度是動態的字符串(也可能是其他數據類型),可以使用柔性數組,柔性數組是一種能夠巧妙地解決數組內存的冗余和數組的越界問題一種方法。非常值得大家學習和借鑒。