C++中的数据对齐示例详解

 更新时间:2021年03月15日 09:56:17   作者:老胡写代码  
这篇文章主要介绍了C++中数据对齐的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

前言

对于C/C++程序员来说,掌握数据对齐是很有必要的,因为只有了解了这个概念,才能知道编译器在什么时候会偷偷的塞入一些字节(padding)到我们的结构体(struct/class),也唯有这样我们才能更好的理解、优化结构体和内存。

几个栗子

看看几个简单的Struct,能猜出他们的SIZE吗?(运行于64Bit win10 vs2017)

struct A
{
	char c1;
};

struct B
{
	int i1;
};

struct C
{
	char c1;
	int i1;
};

struct D
{
	char c1;
	int i1;
	char c2;
};

struct E
{
	char c1;
	char c2;
	int i1;
};

int main()
{
	std::cout << "A's size is " << sizeof(A) << std::endl;
	std::cout << "B's size is " << sizeof(B) << std::endl;
	std::cout << "C's size is " << sizeof(C) << std::endl;
	std::cout << "D's size is " << sizeof(D) << std::endl;
	std::cout << "E's size is " << sizeof(E) << std::endl;	
}

先揭晓答案

如果对任何一个结构体的大小有疑问,那么这篇文章非常适合你,请接着往下看,我们会解释数据对齐。

数据对齐

处理器读取数据的行为

在C/C++中,每种数据类型都有对齐的要求(这个更多是处理器的要求而非语言层面),大家都知道,处理器工作的时候需要数据总线(data bus)、控制总线(control bus)和地址总线(address bus)一起配合工作。而在数据总线取数据的时候,处理器为了高效的工作,一次会取4byte或者8byte数据(依系统32bit或者64bit而不同),这就是所谓数据字长(word size)。同时在读取内存的时候,也会从4byte或者8byte边界开始读取,这是处理器行为,我们只能尊重不能改变。考虑下面的例子,

struct F
{
  int i1
  char c1;
  int i2;
  char c2;
};
#include <iostream>

int main()
{
  F f;
  printf("0x%p\n", &f);
}

它的起始地址输出是:

0x000000FE8BCFFB88

所以在内存中可能的排列就是:

读取数据的时候,每次读入8btye,8个字节为一个读取单元,就像蒸笼的一格,这样做的好处是每次可以尽可能多的读入数据,减少读取次数。设想,如果一次只读入一个字节数据,那么一个Int就需要4次读取,明显效率就很低。

编译器的做法

如果没有对齐

了解了处理器如何读取数据的,我们就不难理解编译器为什么会做出调整。试想,如果编译器不在后台做出填充(padding),那么我们就会遇到这种情况

像这样的话,访问i1, c1 都不会有问题,但是访问i2就会发现,数据散落在不同的蒸笼,原本只需要一次读取就行的数据,还需要一次额外的数据读取才行,这就造成了读取数据的低效,在某些严格的CPU,比如ARM上面,这种非对齐的数据读操作甚至会被拒绝。

编译器对齐

所以,为了让数据读取效率最大化,编译器会选择牺牲一部分空间来换取效率,他们不会允许i2横跨两个读取单元。在实际中,上面的结构体会是这样的

可以看出,

  • 为了解决i2的对齐问题,c1之后填充了3个空字节
  • 同时为了保持整个结构体的对齐(结构体对齐字节数等于其最大的数据成员的对齐字节数,这里是4),在结构体的尾部还会有3个空字节
  • 整个结构体的大小就是16字节,有6个字节是空字节。

所以,在编译器的作用下,最开始几个Struct实际上扩展为,

struct A
{
	char c1; //no padding
};

struct B
{
	int i1; //no padding
};

struct C
{
	char c1;
	char pad[3]; //padding
	int i1;
};

struct D
{
	char c1;
	char pad1[3]; //padding
	int i1;
	char c2;
	char pad2[3]; //padding
};

struct E
{
	char c1;
	char c2;
	char pad[2]; //padding
	int i1;
};

对齐的目的是要让数据访问更高效,一般来说,数据类型的对齐要求和它的长度是一致的,比如,

  • char 是 1
  • short 是 2
  • int 是 4
  • double 是 8

这不是巧合,比如short,2对齐保证了short只可能出现在一个读取单元的0, 2, 4, 6格,而不会出现在1, 3, 5, 7格;再比如int,4对齐保证了一个读取单元可以装载2个int——在0或者4格。从根本上杜绝了同一个数据横跨读取单元的问题。

总结

可能有人会疑惑了,知道这些对我们工作有什么帮助吗?如果仅仅是比较High-Level的应用程序编程,可能确实感觉不明显,最多就当成一个知识点了解一下,但是对于搞比较底层开发的,比如游戏引擎,或者是在内存环境很紧张的情况下开发,比如嵌入式开发,那了解这个有助于在某些情况下节约内存。

考虑前面的D和E结构体,他们拥有完全一样的成员,却有着不同的结构体大小,就是因为E选择把对齐要求接近的变量类型放在一起,减小了填充padding的数量从而达到了减小结构体大小的目的。

在设计结构体的时候,这个可以作为一个考量,有一些函数可以帮助我们查看某个类型的对齐要求,比如Visual Studio中的__alignof函数。

这就是关于数据对齐的一些基础知识,希望能帮助大家解惑,如果您发现本文有任何写的不对的地方,欢迎留言指出来;如果有其他问题,也欢迎留言一起讨论。

到此这篇关于C++中的数据对齐的文章就介绍到这了,更多相关C++数据对齐内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用remalloc的注意事项说明(必看篇)

    使用remalloc的注意事项说明(必看篇)

    下面小编就为大家带来一篇使用remalloc的注意事项说明(必看篇)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-03-03
  • 怎样用cmd运行C程序

    怎样用cmd运行C程序

    这篇文章主要介绍了怎样用cmd运行C程序?今天就来和大家分享一下用cmd运行C程序的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-10-10
  • C/C++项目编译工具简单介绍

    C/C++项目编译工具简单介绍

    我们给大家带来了一篇关于C/C++项目编译工具简单介绍的文章,大家在项目编译前可以先阅读下。
    2019-12-12
  • C++解析ini文件的实现方法

    C++解析ini文件的实现方法

    在C++编程中,有时我们需要处理配置文件来存储应用程序的设置和参数,而INI文件是一种常见的选择,这篇文章主要给大家介绍了关于C++解析ini文件的实现方法,需要的朋友可以参考下
    2024-08-08
  • C++ decltype 说明符

    C++ decltype 说明符

    这篇文章主要介绍了C++ decltype 说明符,检查实体的声明类型,或表达式的类型和值类别。下面我们来看看文章中的具体内容吧

    2021-12-12
  • Opencv实现画笔功能

    Opencv实现画笔功能

    这篇文章主要为大家详细介绍了Opencv实现画笔功能,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-08-08
  • 详解C语言整数和浮点数在内存中的存储

    详解C语言整数和浮点数在内存中的存储

    这篇文章主要介绍了C语言整数和浮点数在内存中是如何存储的,文中有详细的代码示例供大家参考,对大家了解学习C语言整数和浮点数在内存中的存储有一定的帮助,需要的朋友可以参考下
    2024-03-03
  • 浅谈C++11的std::function源码解析

    浅谈C++11的std::function源码解析

    类模版std::function是一种通用的多态函数包装器std::function的实例可以对任何可以调用的目标实体进行存储、复制、和调用操作,本文详细的介绍一下,感兴趣的可以了解一下
    2021-06-06
  • 一文带你学习一下C++中的构造函数

    一文带你学习一下C++中的构造函数

    构造函数是一种特殊的函数,它用于在创建对象时初始化对象的值。在本文中,我们将学习C++的构造函数以及如何使用它们来创建对象,希望对大家有所帮助
    2023-05-05
  • C++读取文件的四种方式总结

    C++读取文件的四种方式总结

    C++可以根据不同的目的来选取文件的读取方式,C++中有四种常见的读取方式,本文主要介绍了这四种方法的具体实现,需要的可以参考一下
    2023-04-04

最新评论