您的位置：首页 > 编程语言 > C语言/C++

C语言结构体的大小——内存对齐和位域的使用

2014-02-18 21:07 344 查看

C语言结构体对齐

C语言结构体对齐也是老生常谈的话题了。基本上是面试题的必考题。内容虽然很基础，但一不小心就会弄错。写出一个struct，然后sizeof，你会不会经常对结果感到奇怪？sizeof的结果往往都比你声明的变量总长度要大，这是怎么回事呢？结合网上的资料和自己的编程实践，总结如下。

首先考虑一个问题，为什么要设计内存对齐的处理方式呢？如果体系结构是不对齐的，成员将会一个挨一个存储，显然对齐更浪费了空间。那么为什么要使用对齐呢？体系结构的对齐和不对齐，是在时间和空间上的一个权衡：对齐节省了时间。假设一个体系结构的字长为w，那么它同时就假设了在这种体系结构上对宽度为w的数据的处理最频繁也是最重要的。它的设计也是从优先提高对w位数据操作的效率来考虑的。

既然内存对齐是必要的，那么结构体到底是怎样对齐的呢？

       （在没有定义#pragma pack宏的情况下）：

       原则1、数据成员对齐规则：结构（struct或联合union）的数据成员，第一个数据成员放在offset为0的地方，以后每个数据成员按其类型大小和默认对齐参数(32位系统通常默认按4字节对齐)中较小的一个对齐。每个成员的起始地址%每个成员的自身对齐值=0，否则补空直至满足条件。比如对于char型数据，其自身对齐值为1，对于short型为2，对于int型为4，double型在32位机大小为8字节、系统默认对齐方式是4字节，取其较小者，所以其对齐值是4。

       原则2、结构体作为成员：如果一个结构里有结构体成员，则按照其成员中自身对齐值最大的那个值对齐。（struct a里存有struct b，b里有char，int，double等元素，那b应该从4的整数倍开始存储。）

       原则3、收尾工作：结构体的总大小，也就是sizeof的结果，必须为所用过的最大对齐参数的整数倍，不够就补空字节。比如在32位系统中最大对齐参数是4，如果一个结构中有类型为int、long、float、double等长度等于或大于4的成员，则其总大小必须是4的整数倍。

       这三个原则具体怎样理解呢？我们看下面几个例子，通过实例来加深理解。

       例1：

typedef struct _A {
                     short a1;
                     short a2;
                     short a3;
                    }A;

typedef struct _B{
                   long a1;
                   short a2;
                  }B;

       sizeof(A) = 6; 这个很好理解，三个short对齐方式都是2。

       sizeof(B) = 8; 这个是不是比预想的大2个字节？long为4，short为2，整个为8，因为原则3。

       例2：

typedef struct _A{
                    int a;
                    char b;
                    short c;
                    }A;

typedef struct _B{
                   char b;
                   int a;
                   short c;
                    }B;

       sizeof(A) = 8; int为4，char为1，short为2，这里用到了原则1和原则3。

       sizeof(B) = 12; 是否超出预想范围？char为1，int为4，short为2，怎么会是12？还是原则1和原则3。

       深究一下，为什么是这样，我们可以看看内存里的布局情况。


  a b         c
       A的内存布局：1111, 1*, 11


  b a c
       B的内存布局：1***,     1111,   11**

       其中星号*表示填充的字节。A中，b后面为何要补充一个字节？因为c为short类型，其起始位置要为2的倍数，就是原则1。c的后面没有补充，因为b和c正好占用4个字节，整个A占用空间为4的倍数，也就是最大成员int类型的倍数，所以不用补充。

       B中，b是char为1，b后面补充了3个字节，因为a是int为4，根据原则1，起始位置要为4的倍数，所以b后面要补充3个字节。c后面补充两个字节，根据原则3，整个B占用空间要为4的倍数。如果c后面不补充，整个B的空间为10，不符，所以要补充2个字节。

       再看一个结构中含有结构成员的例子：

       例3：typedef struct _A{
                     int a;
                     double b;
                     float c;
                    }A;

                typedef struct _B{
                     char e[2];
                     int f;
                     double g;
                     short h;
                     A i;
                    }B;

       sizeof(A) = 16; 这个比较好理解，int为4，double为8，float为4，double对齐方式取了较小的默认方式，按4字节对齐。所以整个A的大小为16。

       sizeof(B) = 36; 看看B的内存布局。


  e
f   g
h i
       B的内存布局：11* *,   1111,   11111111, 11 * * ,  1111, 11111111, 1111

       i其实就是A的内存布局。i的起始位置要为4的倍数，所以h后面要补齐。把B的内存布局弄清楚，有关结构体的对齐方式基本就算掌握了。

       以上讲的都是没有#pragma pack宏的情况，如果有#pragma pack宏，那么对齐方式就要按照宏的定义来。比如上面的结构体前加#pragma pack(1)，内存的布局就会完全改变。sizeof(A) = 16; sizeof(B) = 32;

       有了#pragma pack(1)，内存不会再遵循原则1和原则3了，按1字节对齐。没错，这不正是理想中的没有内存对齐的世界吗？！


  a         b
c
       A的内存布局：1111,     11111111,   1111


e   f
  g          h i
       B的内存布局：11, 1111, 1111111, 11 , 1111, 11111111, 1111

       那#pragma pack(2)的结果又是多少呢？#pragma pack(8)呢？留给大家自己思考吧，相信没有问题。

       还有一种常见的情况，结构体中含位域字段。位域成员不能单独被取sizeof值。C99规定int、unsigned int和bool可以作为位域类型，但编译器几乎都对此作了扩展，允许其它类型类型的存在。

       使用位域的主要目的是压缩存储，其大致规则为：
       1) 如果相邻位域字段的类型相同，且其位宽之和小于类型的sizeof大小，则后面的字段将紧邻前一个字段存储，直到不能容纳为止；
       2) 如果相邻位域字段的类型相同，但其位宽之和大于类型的sizeof大小，则后面的字段将从新的存储单元开始，其偏移量为其类型大小的整数倍；
       3) 如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，gcc通常采用压缩的方式；
       4) 如果位域字段之间穿插着非位域字段，则不进行压缩；
       5) 整个结构体的总大小为对齐方式的整数倍。对齐方式去最宽基本类型成员大小和默认对齐方式的较小者。

        还是让我们来看看例子。

       例4：typedef struct _A{
                     char f1 : 3;
                     char f2 : 4;
                     char f3 : 5;
                     }A;

                     a       b       c
       A的内存布局：111,    1111 *,   11111 * * *

       位域类型为char，第1个字节仅能容纳下f1和f2，所以f2被压缩到第1个字节中，而f3只能从下一个字节开始。因此sizeof(A)的结果为2。

       例5：typedef struct _B{
                    char f1 : 3;
                    short f2 : 4;
                    char f3 : 5;
                    }B;

       由于相邻位域类型不同，在VC6中其sizeof为6，在gcc中为2。

如果是

typedef struct _B{
                    char f1 : 3;
                    int f2 : 4;
                    char f3 : 5;
                    }B;
在gcc中大小则是4，它们仍然被压缩在了一起，但是长度必须是基本类型int型大小的整数倍；

如果是

typedef struct _B{
                    char f1 : 3;
                    long long  f2 : 4;
                    char f3 : 5;
                    }B;

在32位系统，gcc编译后大小仍然是4，它们仍然被压缩在了一起。虽然long long大小是8，但默认对齐参数是4；

       例6：struct C{
                     char f1 : 3;
                     char f2;
                     char f3 : 5;
                    };

       非位域字段穿插在其中，不会产生压缩，在VC6和gcc中得到的大小均为3。

       最后顺便提一点，在设计结构体的时候，一般会尊照一个习惯，就是把占用空间小的类型排在前面，占用空间大的类型排在后面，这样可以相对节约一些对齐空间。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 内存对齐位域结构体大小 c语言面试题

相关文章推荐

新的分享

章节导航