C語言內存對齊的介紹

2020-02-24 14:31:08

字體：大中小

來源：轉載

供稿：網友

內存對齊在編譯器的管轄范圍，編譯器可以將程序中的每個“數據單元”安排在適當的位置上，如果你想了解更深層的秘密，那么現在就跟隨武林小編去看看C語言內存對齊的介紹。

一.內存對齊的初步講解

內存對齊可以用一句話來概括：

“數據項只能存儲在地址是數據項大小的整數倍的內存位置上”

例如int類型占用4個字節，地址只能在0，4，8等位置上。

例1：

#include <stdio.h>
struct xx{
??????? char b;
??????? int a;
??????? int c;
??????? char d;
};

int main()
{
??????? struct xx bb;
??????? printf("&a = %p/n", &bb.a);
??????? printf("&b = %p/n", &bb.b);
??????? printf("&c = %p/n", &bb.c);
??????? printf("&d = %p/n", &bb.d);
??????? printf("sizeof(xx) = %d/n", sizeof(struct xx));

??????? return 0;
}

執行結果如下：

&a = ffbff5ec
&b = ffbff5e8
&c = ffbff5f0
&d = ffbff5f4
sizeof(xx) = 16

會發現b與a之間空出了3個字節，也就是說在b之后的0xffbff5e9,0xffbff5ea,0xffbff5eb空了出來，a直接存儲在了0xffbff5ec，因為a的大小是4，只能存儲在4個整數倍的位置上。打印xx的大小會發現，是16，有些人可能要問，b之后空出了3個字節，那也應該是13啊？其余的3個呢？這個往后閱讀本文會理解的更深入一點，這里簡單說一下就是d后邊的3個字節，也會浪費掉，也就是說，這3個字節也被這個結構體占用了.

可以簡單的修改結構體的結構，來降低內存的使用，例如可以將結構體定義為：

struct xx{
??????? char b;
??????? char d;
??????? int a;?????????
??????? int c;?????????????????
};

這樣打印這個結構體的大小就是12，省了很多空間，可以看出，在定義結構體的時候，一定要考慮要內存對齊的影響，這樣能使我們的程序占用更小的內存。

二.操作系統的默認對齊系數

每個操作系統都有自己的默認內存對齊系數，如果是新版本的操作系統，默認對齊系數一般都是8，因為操作系統定義的最大類型存儲單元就是8個字節，例如 long long（為什么一定要這樣，在第三節會講解），不存在超過8個字節的類型（例如int是4，char是1，long在32位編譯時是4，64位編譯時是 8）。當操作系統的默認對齊系數與第一節所講的內存對齊的理論產生沖突時，以操作系統的對齊系數為基準。

例如：

假設操作系統的默認對齊系數是4，那么對與long long這個類型的變量就不滿足第一節所說的，也就是說long long這種結構，可以存儲在被4整除的位置上，也可以存儲在被8整除的位置上。

可以通過#pragma pack()語句修改操作系統的默認對齊系數，編寫程序的時候不建議修改默認對齊系數，在第三節會講解原因

例2：

#include <stdio.h>
#pragma pack(4)
struct xx{
??????? char b;
??????? long long a;
??????? int c;
??????? char d;
};
#pragma pack()

??????? return 0;
}

打印結果為：

&a = ffbff5e4
&b = ffbff5e0
&c = ffbff5ec
&d = ffbff5f0
sizeof(xx) = 20

發現占用8個字節的a，存儲在了不能被8整除的位置上，存儲在了被4整除的位置上，采取了操作系統的默認對齊系數。

三.內存對齊產生的原因

內存對齊是操作系統為了快速訪問內存而采取的一種策略，簡單來說，就是為了放置變量的二次訪問。操作系統在訪問內存時，每次讀取一定的長度（這個長度就是操作系統的默認對齊系數，或者是默認對齊系數的整數倍）。如果沒有內存對齊時，為了讀取一個變量是，會產生總線的二次訪問。

例如假設沒有內存對齊，結構體xx的變量位置會出現如下情況：

struct xx{
??????? char b;???????? //0xffbff5e8
??????? int a;??????????? //0xffbff5e9??????
??????? int c;???????????? //0xffbff5ed?????
??????? char d;???????? //0xffbff5f1
};

操作系統先讀取0xffbff5e8-0xffbff5ef的內存，然后在讀取0xffbff5f0-0xffbff5f8的內存，為了獲得值c，就需要將兩組內存合并，進行整合，這樣嚴重降低了內存的訪問效率。（這就涉及到了老生常談的問題，空間和效率哪個更重要？這里不做討論）。

這樣大家就能理解為什么結構體的第一個變量，不管類型如何，都是能被8整除的吧（因為訪問內存是從8的整數倍開始的，為了增加讀取的效率）！

內存對齊的問題主要存在于理解struct等復合結構在內存中的分布。

首先要明白內存對齊的概念。
許多實際的計算機系統對基本類型數據在內存中存放的位置有限制，它們會要求這些數據的首地址的值是某個數k(通常它為4或8)的倍數，這就是所謂的內存對齊。

這個k在不同的cpu平臺下，不同的編譯器下表現也有所不同。比如32位字長的計算機與16位字長的計算機。這個離我們有些遠了。我們的開發主要涉及兩大平臺，windows和linux（unix），涉及的編譯器也主要是microsoft編譯器(如cl),和gcc。

內存對齊的目的是使各個基本數據類型的首地址為對應k的倍數，這是理解內存對齊方式的終極法寶。另外還要區分編譯器的分別。明白了這兩點基本上就能搞定所有內存對齊方面的問題。

不同編譯器中的k：
1、對于microsoft的編譯器，每種基本類型的大小即為這個k。大體上char類型為8，int為32，long為32，double為64。
2、對于linux下的gcc編譯器，規定大小小于等于2的，k值為其大小，大于等于4的為4。

明白了以上的說明對struct等復合結構的內存分布就應該很清楚了。

下面看一下最簡單的一個類型：struct中成員都為基本數據類型，例如：

struct test1
{
char a;
short b;
int c;
long d;
double e;
};

在windows平臺，microsoft編譯器下：

假設從0地址開始，首先a的k值為1，它的首地址可以使任意位置，所以a占用第一個字節，即地址0；然后b的k值為2，他的首地址必須是2的倍數，不能是1，所以地址1那個字節被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，他的k值為8，首地址為8的倍數，所以地址12，13，14，15被填充，他的首地址應為16，占用地址16-23。顯然其大小為24。

這就是 test1在內存中的分布情況。我們建立一個test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址依次打印出內存中每個字節對應的16進制數為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 0 0 0 0 40 40

驗證：
顯然推斷是正確的。

在linux平臺，gcc編譯器下：
假設從0地址開始，首先a的k值為1，它的首地址可以使任意位置，所以a占用第一個字節，即地址0；然后b的k值為2，他的首地址必須是2的倍數，不能是1，所以地址1那個字節被填充，b首地址為地址2，占用地址2，3；然后到c，c的k值為4，他的首地址為4的倍數，所以首地址為4，占用地址4，5，6，7；再然后到d，d的k值也為4，所以他的首地址為8，占用地址8，9，10，11。最后到e，從這里開始與microsoft的編譯器開始有所差異，他的k值為不是8，仍然是4，所以其首地址是12，占用地址12-19。顯然其大小為20。

驗證：
我們建立一個test1類型的變量，a、b、c、d、e分別賦值2、4、8、16、32。然后從低地址依次打印出內存中每個字節對應的16進制數為：
2 0 4 0 8 0 0 0 10 0 0 0 0 0 0 0 0 0 40 40

顯然推斷也是正確的。

接下來，看一看幾類特殊的情況，為了避免麻煩，不再描述內存分布，只計算結構大小。

第一種：嵌套的結構

struct test2
{
char f;
struct test1 g;
};

在windows平臺，microsoft編譯器下：

這種情況下如果把test2的第二個成員拆開來，研究內存分布，那么可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內存分布不變，仍然滿足所有基本數據成員的首地址都為其對應k的倍數這一原則，那么test2的大小就還是24了。但是實際上test2的大小為32，這是因為：不能因為test2的結構而改變test1的內存分布情況，所以為了使test1種各個成員仍然滿足對齊的要求，f成員后面需要填充一定數量的字節，不難發現，這個數量應為7個，才能保證test1的對齊。所以test2相對于test1來說增加了8個字節，所以test2的大小為32。

在linux平臺，gcc編譯器下：

同樣，這種情況下如果把test2的第二個成員拆開來，研究內存分布，那么可以知道，test2的成員f占用地址0，g.a占用地址1，以后的內存分布不變，仍然滿足所有基本數據成員的首地址都為其對應k的倍數這一原則，那么test2的大小就還是20了。但是實際上test2的大小為24，同樣這是因為：不能因為test2的結構而改變test1的內存分布情況，所以為了使test1種各個成員仍然滿足對齊的要求，f成員后面需要填充一定數量的字節，不難發現，這個數量應為3個，才能保證test1的對齊。所以test2相對于test1來說增加了4個字節，所以test2的大小為24。

第二種：位段對齊

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};

或者

struct test3
{
unsigned int a:4;
int b:4;
char c;
};

在windows平臺，microsoft編譯器下：

相鄰的多個同類型的數(帶符號的與不帶符號的，只要基本類型相同，也為相同的數),如果他們占用的位數不超過基本類型的大小，那么他們可作為一個整體來看待。不同類型的數要遵循各自的對齊方式。
如：test3中，a、b可作為一個整體，他們作為一個int型數據來看待，所以test3的大小為8字節。并且a與b的值在內存中從低位開始依次排列，位于4字節區域中的前0-3位和4-7位

如果test4位以下格式

struct test4
{
unsigned int a:30;
unsigned int b:4;
char c;
};

那么test4的大小就為12個字節，并且a與b的值分別分布在第一個4字節的前30位，和第二個4字節的前4位。

如過test5是以下形式

struct test5
{
unsigned int a:4;
unsigned char b:4;
char c;
};

那么由于int和char不同類型，他們分別以各自的方式對齊，所以test5的大小應為8字節，a與b的值分別位于第一個4字節的前4位和第5個字節的前4位。

在linux平臺，gcc編譯器下：

struct test3
{
unsigned int a:4;
unsigned int b:4;
char c;
};

gcc下，相鄰各成員，不管類型是否相同，占的位數之和超過這些成員中第一個的大小的時候，在結構中以k值為1對齊，在結構外k值為其基本類型的值。不超過的情況下在內存中依次排列。
如test3，其大小為4。a，b的值在內存中依次排列分別為第一個四字節中的0-3和4-7位。

如果test4位以下格式

struct test4
{
unsigned int a:20;
unsigned char b:4;
char c;
};

test4的大小為4個字節，并且a與b的值分別分布在第一個4字節的0-19位，和20-23位，c存放在第4個字節中。
如過test5是以下形式

struct test5
{
unsigned int a:10;
unsigned char b:4;
short c;
};

那么test5的大小應為4字節，a，b的值為0-9位和10-13位。c存放在后兩個字節中。如果a的大小變成了20
那么test5的大小應為8字節。即

struct test6
{
unsigned int a:20;
unsigned char b:4;
short c;
};

此時，test6的a、b共占用0，1，2共3字節，c的k值為2，其實可以4位首位置，但是在結構外，a要以int的方式對齊。也就是說連續兩個test6對象在內存中存放的話，a的首位置要保證為4的倍數，那么c后面必須多填充2位。所以test6的大小為8個字節。

以上就是關于C語言內存對齊的介紹，還有關于位段結構的部分是比較復雜的，小編暫時知道的就這么多。

上一篇：詳解C語言用malloc函數申請二維動態數組的實例

下一篇：VC程序設計技巧匯總

學習交流

筆記本開機提示error loading os錯誤的問

筆記本開機提示error loading os錯誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

中國科大首次利用糾纏測量實現量子定向

2020-02-23 21:48:57

華為聯合行業伙伴發布系列5G模組海思提供模組中間件

2020-02-23 21:46:19

良品鋪子明日IPO！將成為上交所首家網絡上市企業

2020-02-23 21:41:41

拉卡拉與華為軟件簽訂《業務合作框架協議》開展手機POS收款

2020-02-23 17:28:12

中國聯通：三季度力爭完成全國25萬5G基站建設

2020-02-23 17:24:45

雷軍：小米成立10年收入突破2000億

2020-02-23 14:27:16

疑難解答

圖片精選

網友關注

a亚洲精品_精品国产91乱码一区二区三区_亚洲精品在线免费观看视频_欧美日韩亚洲国产综合_久久久久久久久久久成人_在线区

C語言內存對齊的介紹