深入剖析C++中的struct结构体字节对齐

📅 2026/6/30 18:28:54
深入剖析C++中的struct结构体字节对齐
什么是字节对齐,为什么要对齐?现代计算机中内存空间都是按照byte划分的从理论上讲似乎对任何类型的变量的访问可以从任何地址开始但实际情况是在访问特定类型变量的时候经常在特 定的内存地址访问这就需要各种类型数据按照一定的规则在空间上排列而不是顺序的一个接一个的排放这就是对齐。对齐的作用和原因各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况但是最常见的是如果不按照适合其平台要求对数据存放进行对齐会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始如果一个int型假设为32位系统如果存放在偶地址开始的地方那么一个读周期就可以读出这32bit而如果存放在奇地址开始的地方就需要2个读周期并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。结构的存储分配编译器按照结构体成员列表的顺序为每个成员分配内存当存储成员时需要满足正确地边界对齐要求时成员之间可能出现用于填充地额外内存空间。32位系统每次分配字节数最多为4个字节,64位系统分配字节数最多为8个字节。以下图表是在不同系统中基本类型数据内存大小和默认对齐模数:注此外指针所占内存的长度由系统决定在32位系统下为32位即4个字节64位系统下则为64位即8个字节.没有#pragma pack宏的对齐对齐规则:结构体的起始存储位置必须是能够被该结构体中最大的数据类型所整除。每个数据成员存储的起始位置是自身大小的整数倍(比如int在32位机为4字节则int型成员要从4的整数倍地址开始存储)。结构体总大小也就是sizeof的结果必须是该结构体成员中最大的对齐模数的整数倍。若不满足会根据需要自动填充空缺的字节。结构体包含另一个结构体成员则被包含的结构体成员要从其原始结构体内部最大对齐模数的整数倍地址开始存储。(比如struct a里存有struct bb里有char,int,double等元素,那b应该从8的整数倍开始存储。)结构体包含数组成员比如char a[3],它的对齐方式和分别写3个char是一样的也就是说它还是按一个字节对齐。如果写typedef char Array[3],Array这种类型的对齐方式还是按一个字节对齐而不是按它的长度3对齐。结构体包含共用体成员则该共用体成员要从其原始共用体内部最大对齐模数的整数倍地址开始存储。现在给出一个结构体我们针对win-32和Linux-32进行分析,例1123456structMyStruct{chara;intb;longdoublec;};解答win-32位系统下由上图可知该结构体的最大对齐模数为sizeof(long double)8假设MyStruct从地址空间0x0000开始存放。char为1个字节所以a存放于0x0000中int为4个字节根据规则b存储的起始地址必须为其对齐模数4的整数倍所以a后面自动填充空缺字节空间0x0001-0x0003因此b存放于0x0004-0x0007中。long double是8个字节由于32位系统每次最多分配4个字节则首先分配0x0008-0x000B由于不够存储空间则继续分配0x000C-0x000F,所以c存储在0x0008-0x000F中由于此时总存储空间为44816则16满足最大对齐模数sizeof(long double)8的整数倍因此sizeof(MyStruct)16个字节。Linux-32位系统下由上图可知该结构体的最大对齐模数为4假设MyStruct从地址空间0x0000开始存放。char为1个字节所以a存放于0x0000中int为4个字节根据规则b存储的起始地址必须为其对齐模数4的整数倍所以a后面自动填充空缺字节空间0x0001-0x0003因此b存放于0x0004-0x0007中。long double是12个字节由于32位系统每次最多分配4个字节则首先分配0x0008-0x000B由于不够存储空间则继续分配0x000C-0x000F,仍然不满足存储c则继续分配0x0010-0x0013所以c存储在0x0008-0x0013中由于此时总存储空间为441220则20满足最大对齐模数4的整数倍因此sizeof(MyStruct)20个字节。注以下的所有例子都是在win-32下实现例212345structB{chara;intb;charc;};由上图可知该结构体的最大对齐模数为sizeof(int)4假设B从地址空间0x0000开始存放。char为1个字节所以a存放于0x0000中int为4个字节根据规则b存储的起始地址必须为其对齐模数4的整数倍所以a后面自动填充空缺字节空间0x0001-0x0003因此b存放于0x0004-0x0007中。c也是char类型所以c存放在0x0008中此时结构体B总的大小为4419个字节则9不能满足最大对齐模数4的整数倍因此在c的后面自动填充空间0x0009-0x000B使其满足最大对齐模数的倍数最终结构体B的存储空间为0x0000-0x000B则sizeof(B)12个字节。例3空结构体123structC{};sizeof(C) 0或sizeof(C);C为空结构体在C语言中占0字节在C中占1字节。例4结构体有静态成员12345structD{chara;intb;staticdoublec;//静态成员};静态成员变量存放在全局数据区内在编译的时候已经分配好内存空间所以对结构体的总内存大小不做任何贡献因此sizeof(D)448个字节例5结构体中包含结构体1234567891011structE{inta;doubleb;floatc;};structF{chare[2];intf;shorth;structE i;};在结构体E中最大对齐模数是sizeof(double)8且sizeof(E)88824个字节在结构体F中除了结构体成员E之外其他的最大对齐模数是sizeof(int)4又因为结构体E中最大对齐模数是sizeof(double)8所以结构体F的最大对齐模数取E的最大对齐模数8因此sizeof(F)4482440个字节。例6结构体包含共用体12345678910111213unionunion1{longa;doubleb;charname[9];intc[2];};structE{inta;doubleb;floatc;union1 MyUnion;};共用体中的最大对齐模式是sizeof(double)8则sizeof(union1)16结构体E的最大对齐模数也是8则sizeof(E)8881640个字节。例7结构体包含指针成员123456789typedefstructA{chara;intb;floatc;doubled;int*p;char*pc;shorte;}A;结构体包含的指针成员的大小根据系统类型决定由于这里是在win-32位系统下分析则指针大小为4个字节因此结构体A的最大对齐模数为sizeof(double)8则sizeof(A)448844840个字节。存在#pragma pack宏的对齐12#pragma pack (n) //编译器将按照n个字节对齐#pragma pack () //取消自定义字节对齐方式对齐规则结构联合或者类的数据成员第一个放在偏移为0的地方以后每个数据成员的对齐按照#pragma pack指定的数值和自身对齐模数中较小的那个。例8按指定的对齐模数12345678#pragma pack (2) /*指定按2字节对齐*/structG{charb;inta;doubled;shortc;};#pragma pack () /*取消指定对齐恢复缺省对齐*/在结构体G中成员变量的最大对齐模数是sizeof(double)8又因为指定对齐模数是2所以取其较小者2为结构体G的最大对齐模数则sizeof(G)248216由于16是2的整数倍则不需要填充。总结在分析结构体字节对齐时首先确定有没有利用#pragma pack()宏定义指定对齐模数根据情况对应上面进行两种情况分析针对不同的系统会得到不同的结果。补充在Visual C下可以用__declspec(align(#))声明数据按#字节对齐GUN C下可以使用以下命令:__attribute__((aligned (n)))让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n则按照最大成员的长度来对齐__attribute__((__packed__))取消结构在编译过程中的优化对齐按照实际占用字节数进行对齐。C11新加关键字alignas(n)