C语言、C++内存对齐问题详解

更新时间：2014年10月09日 10:59:10 作者：果冻想

这篇文章主要介绍了C语言、C++内存对齐问题详解,内存对齐的问题主要存在于理解struct和union等复合结构在内存中的分布,需要的朋友可以参考下

这也可以？

#include <iostream>

using namespace std;

struct Test_A

{

     char a;

     char b;

     int c;

};

struct Test_B

{

     char a;

     int c;

     char b;

};

struct Test_C

{

     int c;

     char a;

     char b;

};

int main()

{

     struct Test_A a;

     memset(&a, 0, sizeof(a));

     struct Test_B b;

     memset(&b, 0, sizeof(b));

     struct Test_C c;

     memset(&c, 0, sizeof(c));

     // Print the memory size of the struct

     cout<<sizeof(a)<<endl;

     cout<<sizeof(b)<<endl;

     cout<<sizeof(c)<<endl;

     return 0;

}

好了，一段简单的程序，上面的这段程序输出是什么？如果你很懂，也就会知道我接下来要讲什么了，可以略过了；如果，你不知道，或者还很模糊，请继续阅读。

这是为什么？

上面这段程序的输出结果如下（windows 8.1 + visual studio 2012 update3下运行）:

复制代码代码如下:

// Print the memory size of the struct

cout<< sizeof(a)<<endl; // 8bytes

cout<< sizeof(b)<<endl; // 12bytes

cout<< sizeof(c)<<endl; // 8bytes

很奇怪么？定义的三个结构体，只是换了一下结构体中定义的成员的先后顺序，怎么最终得到的结构体所占用的内存大小却不一样呢？很诡异么？好了，这就是我这里要总结的内存对齐概念了。

内存对齐

内存对齐的问题主要存在于理解struct和union等复合结构在内存中的分布。许多实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k（通常它为4或8）的倍数，这就是所谓的内存对齐。这个值k在不同的CPU平台下，不同的编译器下表现也有所不同，现在我们涉及的主流的编译器是Microsoft的编译器和GCC。

对于我们这种做上层应用的程序员来说，真的是很少考虑内存对齐这个问题的，内存对齐对于上层程序员来说，是“透明的”。内存对齐，可以说是编译器做的工作，编译器为程序中的每个数据块安排在适当的内存位置上。很多时候，我们要写出效率更高的代码，此时我们就需要去了解这种内存对齐的概念，以及编译器在后面到底偷偷摸摸干了点什么。特别是对于C和C++程序员来说，理解和掌握内存对齐更是重要的。

为什么要有内存对齐呢？该占用多大的内存，那就开辟对应大小的内存就好了，好比上面的结构体，两个char类型和一个int类型，大小应该是6bytes才对啊，怎么又是8bytes，又是12bytes的啊？对于内存对齐，主要是为了提高程序的性能，数据结构，特别是栈，应该尽可能地在自然边界上对齐。原因在于，为了访问未对其的内存，处理器需要做两次内存访问；然而，对齐的内存访问仅仅需要一次内存访问。

在计算机中，字、双字和四字在自然边界上不需要在内存中对齐（对字、双字和四字来说，自然边界分别是偶数地址，可以被4整除的地址和可以被8整除的地址）。如果一个字或双字操作数跨越了4字节边界，或者一个四字操作数跨越了8字节边界，就被认为是未对齐的，从而需要两次总线周期来访问内存。一个字起始地址是奇数，但却没有跨越字边界，就被认为是对齐的，能够在一个总线周期中被访问。综上所述，内存对齐可以用一句话来概括——数据项只能存储在地址是数据项大小的整数倍的内存位置上。

我们再来看看一个简答的例子：

复制代码代码如下:

#include <stdio.h>

struct Test

{

     char a;

     int b;

     int c;

     char d;

};

int main()

{

     struct Test structTest;

     printf("&a=%p\n", &structTest.a);

     printf("&b=%p\n", &structTest.b);

     printf("&c=%p\n", &structTest.c);

     printf("&d=%p\n", &structTest.d);

     printf("sizeof(Test)=%d\n", sizeof(structTest));

     return 0;

}

输出结果如下：

复制代码代码如下:

&a=00C7FA44

&b=00C7FA48

&c=00C7FA4C

&d=00C7FA50

sizeof(Test)=16

结构体Test的成员变量b占用字节数为4bytes，所以只能存储在4的整数倍的位置上，由于a只占用1一个字节，而a的地址00C7FA44和b的地址00C7FA48之间相差4bytes，这就说明，a其实也占用了4个字节，这样才能保证b的起始地址是4的整数倍。这就是内存对齐。如果没有内存对齐，我们再拿上面的代码作为例子，则可能输出结果如下：

复制代码代码如下:

&a=ffbff5e8

&b=ffbff5e9

&c=ffbff5ed

&d=ffbff5f1

sizeof(Test)=10

可以看到，a占用了一个字节，紧接着a之后就是b；之前也说了，内存对齐是操作系统为了快速访问内存而采用的一种策略，简单来说，就是为了防止变量的二次访问。操作系统在访问内存时，每次读取一定的长度（这个长度就是操作系统的默认对齐系数，或者是默认对齐系数的整数倍）。没有了内存对齐，当我们读取变量c时，第一次读取0xffbff5e8~0xffbff5ef的内存，第二次读取0xffbff5f0~0xffbff5f8的内存，由于变量c所占用的内存跨越了两片地址区域，为了正确得到变量c的值，就需要读取两次，将两次内存合并进行整合，这样就降低了内存的访问效率。

我在这里说了这么多，也挺绕口，这就是内存对齐的规则。在C++中，每个特定平台上的编译器都有自己的内存对齐规则，下面我们就内存对齐的规则进行总结。

内存对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”。我们可以通过预编译命令#pragma pack(k)，k=1,2,4,8,16来改变这个系数，其中k就是需要指定的“对齐系数”；也可以使用#pragma pack()取消自定义字节对齐方式。具体的对齐规则如下：

规则1：struct或者union的数据成员对齐规则：第一个数据成员放在offset为0的地方，对齐按照#pragma pack指定的数值和自身占用字节数中，二者比较小的那个进行对齐；比如；

复制代码代码如下:

#pragma pack(4) // 指定对齐系数为4，当占用字节数大于等于4时，就按照4进行对齐

struct Test

{

     char x1;

     short x2;

     float x3;

     char x4;

};

x1占用字节数为1，1 < 4，按照对齐系数1进行对齐，所以x1放置在offset为0的位置；
x2占用字节数为2，2 < 4，按照对齐系数2进行对齐，所以x2放置在offset为2，3的位置；
x3占用字节数为4，4 = 4，按照对齐系数4进行对齐，所以x3放置在offset为4，5，6，7的位置；
x4占用字节数为1，1 < 4，按照对齐系数1进行对齐，所以x4放置在offset为8的位置；
现在已经占了9bytes的内存空间了，但是实际在visual studio 2012中实测为12bytes，为什么呢？看下一条规则。

规则2：struct或者union的整体对齐规则：在数据成员完成各自对齐以后，struct或者union本身也要进行对齐，对齐将按照#pragma pack指定的数值和struct或者union中最大数据成员长度中比较小的那个进行；

继续使用规则1种的例子进行解释，按照规则1的理解，struct Test已经占用了9bytes，实际为什么是12bytes呢？根据规则2，在所有成员对齐完成以后，struct或者union自身也要进行对齐；我们设定的对齐系数为4，而struct Test中占用字节数最大的是float类型的x3，由于x3占用字节数小于或等于设定的对齐系数4，所以struct或者union整体需要按照4bytes进行对齐，也就是说，struct或者union占用的字节数必须能够被4整除，好了。struct Test已经占用了9bytes了，10bytes不能被4整除，11bytes也不能，12bytes正好；所以，struct Test最终占用的字节数为12bytes。

上述两条规则就是内存对齐的基本规则，先局部对齐，后整体对齐。

实例分析

总结了那么多的规则，不来点实际的code，总觉的少点什么，好吧。以下就按照上述总结的内存对齐规则，来进行一些实际的代码分析（注：测试环境Windows 8.1 + Visual Studio 2012 update 3）。

测试代码如下，先确认测试环境：

复制代码代码如下:

#include <iostream>

using namespace std;

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

int main()

{

     cout<<"sizeof(char)"<<sizeof(char)<<endl;          // 1byte

     cout<<"sizeof(short)"<<sizeof(short)<<endl;        // 2bytes

     cout<<"sizeof(int)"<<sizeof(int)<<endl;            // 4bytes

     cout<<"sizeof(double)"<<sizeof(double)<<endl;      // 8bytes

     return 0;

}

我分别设置#pragma pack(k)，k=1,2,4,8,16进行测试。

复制代码代码如下:

#pragma pack(1) // 设定对齐系数为1

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

首先使用规则1，对成员变量进行对齐：
x1 <= 1，按照1进行对齐，x1占用0；
x2 > 1，按照1进行对齐，x2占用1，2，3，4，5，6，7，8；
x3 > 1，按照1进行对齐，x3占用9，10；
x4 > 1，按照1进行对齐，x4占用11，12，13，14；
x5 > 1，按照1进行对齐，x5占用15；
最后使用规则2，对struct整体进行对齐：
x2占用内存最大，为8bytes，8bytes > 1byte，所以整体按照1进行对齐；16%1=0。
所以，在#pragma pack(1) 的情况下，struct Test占用内存为16bytes；内存占用如下图所示：

复制代码代码如下:

#pragma pack(2) // 设定对齐系数为2

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

首先使用规则1，对成员变量进行对齐：
x1 <= 2，按照1进行对齐，x1占用0；
x2 > 2，按照2进行对齐，x2占用2，3，4，5，6，7，8，9；
x3 >= 2，按照2进行对齐，x3占用10，11；
x4 > 2，按照2进行对齐，x4占用12，13，14，15；
x5 < 2，按照1进行对齐，x5占用16；
最后使用规则2，对struct整体进行对齐：
x2占用内存最大，为8bytes，8bytes > 2byte，所以整体按照2进行对齐；17%2!=0
所以，在#pragma pack(2) 的情况下，struct Test占用内存为18bytes；内存占用如下图所示：

复制代码代码如下:

#pragma pack(4) // 设定对齐系数为4

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

首先使用规则1，对成员变量进行对齐：
x1 <= 4，按照1进行对齐，x1占用0；
x2 > 4，按照4进行对齐，x2占用4，5，6，7，8，9，10，11；
x3 < 4，按照2进行对齐，x3占用12，13；
x4 >= 4，按照4进行对齐，x4占用16，17，18，19；
x5 < 4，按照1进行对齐，x5占用20；
最后使用规则2，对struct整体进行对齐：
x2占用内存最大，为8bytes，8bytes > 4byte，所以整体按照4进行对齐；21%4!=0
所以，在#pragma pack(4) 的情况下，struct Test占用内存为24bytes；内存占用如下图所示：

复制代码代码如下:

#pragma pack(8) // 设定对齐系数为8

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

首先使用规则1，对成员变量进行对齐：
x1 <= 8，按照1进行对齐，x1占用0；
x2 >= 8，按照8进行对齐，x2占用8，9，10，11，12，13，14，15；
x3 < 8，按照2进行对齐，x3占用16，17；
x4 <= 8，按照4进行对齐，x4占用20，21，22，23；
x5 < 8，按照1进行对齐，x5占用24；
最后使用规则2，对struct整体进行对齐：
x2占用内存最大，为8bytes，8bytes >= 8byte，所以整体按照8进行对齐；25%8!=0
所以，在#pragma pack(8) 的情况下，struct Test占用内存为32bytes；内存占用如下图所示：

复制代码代码如下:

#pragma pack(16) // 设定对齐系数为16

struct Test

{

     char x1;

     double x2;

     short x3;

     float x4;

     char x5;

};

首先使用规则1，对成员变量进行对齐：
x1 < 16，按照1进行对齐，x1占用0；
x2 < 16，按照8进行对齐，x2占用8，9，10，11，12，13，14，15；
x3 < 16，按照2进行对齐，x3占用16，17；
x4 < 16，按照4进行对齐，x4占用20，21，22，23；
x5 < 16，按照1进行对齐，x5占用24；
最后使用规则2，对struct整体进行对齐：
x2占用内存最大，为8bytes，16bytes >= 8byte，所以整体按照8进行对齐；25%8!=0
所以，在#pragma pack(16) 的情况下，struct Test占用内存为32bytes；内存占用如下图所示：

总结

经过上面的实例分析，我对内存对齐有了全面的认识和了解。现在再回过来看看文章开头的那段代码，问题就迎刃而解了，同时经过这段代码，让我们认识到定义struct或者union时，也是有讲解的。在以后的编码生涯时，是不是又要多考虑一些呢？纠结~

您可能感兴趣的文章:

C++编辑距离（动态规划）
这篇文章主要介绍了C++编辑距离（动态规划），编辑距离是指两个字符串之间，由一个转成另一个所需的最少编辑操作次数，限免详细内容，需要的小伙伴可以参考一下
2022-01-01
基于Opencv实现颜色识别
这篇文章主要为大家详细介绍了基于Opencv实现颜色识别，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-07-07
详解设计模式中的中介者模式在C++编程中的运用
这篇文章主要介绍了设计模式中的中介者模式在C++编程中的运用,中介者模式将对象间的通信封装到一个类中,将多对多的通信转化为一对多的通信,降低了系统的复杂性,需要的朋友可以参考下
2016-03-03
C语言实现窗口抖动
这篇文章主要为大家详细介绍了C语言实现窗口抖动，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-11-11
c++优先队列(priority_queue)用法详解
这篇文章主要介绍了c++优先队列(priority_queue)用法详解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-12-12
c++核心编程之函数的重载
这篇文章主要介绍了c++核心编程之函数的重载,函数可以重复使用，提高了复用性，但前提是必须在一个作用域并且函数名称相同，下面附代码详细介绍，需要的小伙伴可以参考一下
2022-03-03
C++分析类的对象作类成员调用构造与析构函数及静态成员
终于到了对象的初始化和清理的最后阶段了，在这里分享一个cpp里有多个类时，一个类的对象作为另一个类成员的时候构造函数和析构函数调用的时机。还有一个静态成员也是经常考到的点，在这篇博客将会详解其概念并举出案例巩固，让我们开始
2022-05-05
详解C++文件读写操作
这篇文章主要为大家详细介绍了C++文件读写操作，感兴趣的小伙伴们可以参考一下
2016-03-03
C++ QT QThread启动、停止、暂停和恢复的实现
本文主要介绍了C++ QT QThread启动、停止、暂停和恢复的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-06-06
C/C++实现跨文件共享全局变量详解
这篇文章主要为大家详细介绍了C/C++如何实现跨文件共享全局变量,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下
2024-01-01

C语言、C++内存对齐问题详解

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具