您的位置:首页 > 其它

内存对齐问题

2010-11-08 19:00 295 查看
结构体和共用体的内存分配是C语言的一个难点,也是面试题中的热点。

编译器是按照什么样的原则进行对齐的?

先让我们看四个重要的基本概念:

1.数据类型自身的对齐值:

对于char型数据,其自身对齐值为1,对于short型为2,对于int,float类型,其自身对齐值

为4,double类型在VC下是8,GCC下是4,单位字节。

2.结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。

3.指定对齐值:#pragma pack (value)时的指定对齐值value。

4.数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

有 了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最

终用来决定数据存放地址方式的值,最重要。有效对齐N,就是

表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0".而数据结构中的数据变量都是按定义的先

后顺序来排放的。第一个数据变量的起始地址就是数

据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是

结构体成员变量占用总长度需要是对结构体有效对齐值的整数

倍,结合下面例子理解)。这样就不能理解上面的几个例子的值了。

例子分析:

分析例子B;

struct B

{

char b;

int a;

short c;

};

假 设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。第

一个成员变量b的自身对齐值是1,比指定或者默认指定

对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0.第二个成员变量a,其自身

对齐值为4,所以有效对齐值也为4,

所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,复核0x0004%4=0,且紧靠第一个

变量。第三个变量c,自身对齐值为

2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从

0x0000到0x0009存放的

都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的

有效对齐值也是4。根据结构体圆整的要求,

0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000

到0x000B

共有12个字节,sizeof(struct B)=12;其实如果就这一个就来说它已将满足字节对齐了,

因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组

的存取效率,试想如果我们定义了一个结构B的数组,那

么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的

,如果我们不把结构的大小补充为4的整数倍,那么下一

个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了,因此我们要把结构补充成有效对齐

大小的整数倍.其实诸如:对于char型数据,其

自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,这些已有类型的自

身对齐值也是基于数组考虑的,只

是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了.

内存对齐要点:

1、总体上按最大基本类型对齐

2、每个变量字段还需满足:其首地址能被其类型的自身对齐值整除,比如:int i;那么i的地址必须要能被4整除,不能整除时,就移到下一个最大基本类型开始处。

如:

struct mystruct
{
int a;
double b;
};//所此结构体在VC下占用16字节,在GCC下占用12字节。


示例1:

Union data1
{
double  d;
int     i;
char    c1;
char    c2[9];
};


sizeof(union data1)的值为16.在编译器默认设置的情况下,该共用体最大基本类型为double,它占8字节,所以此共用体以8来对齐。字符数组c2占9个字节,那么整个共用体应该占9个字节,但按照对齐原则,实际分配给它的内存为16字节。

如果是:

struct data1
{
double  d;
int         i;
char      c1;
char      c2[9];
};


sizeof(struct data1)的值为24,首先按照存储大小,该结构体所占存储空间为:8+4+1+9=22字节,这个结构体也是以8对齐,因此实际分配的是24字节。即空出最后2个字节未使用

示例2:

union data2
{
int     i;
char    c1;
char    c2[9];
};


sizeof(union data2)的值为12,该共用体占内存空间最大的基本数据类型为int,其长度为4,所以该共用体以4来对齐。该共用体的长度取决于字符c2,其长度为9,9不是4的倍数,要进行对齐,因此实际分配的存储空间为12.

struct data2
{
int   i;
char  c1;
char  c2[9];
};


sizeof(struct data2)的值为16,与上面共用体一样,该结构体以4对齐。按照存储大小,该结构体所占存储空间为:4+1+9=14,14不是4的倍数,进行对齐,对齐后的值为16.

示例3:

union data3
{
char c1;
char c2[3];
};


sizeof(union data3)的值为3,该共用体占内存空间最大的基本数据类型为chart,其长度为1,所以该共用体以1来对齐。该共用体的长度取决于字符c2,其长度为3,因此分配的存储空间为3.

struct data3
{
char  c1;
char  c2[2];
};


sizeof(struct data3)的值为3,与上面共用体一样,该结构体以1对齐。按照存储大小,该结构体所占存储空间为:1+2=3字节。

示例4:

struct inner
{
char     c1;
double   d;
char     c2;
};


这个结构体显然是8字节对齐的,在给c1分配存储空间时,考虑到对齐,分配给c1的字节数就是8,然后给d分配8字节,最后给c2分配时,因为也要以8对齐,所以也分配了8个字节的存储空间。所以sizeof(struct inner)值为24.

如果是:

struct inner
{
char    c1;
char    c2;
double  d;
};


当然这个结构体也是以8字节对齐的,编译器编译程序时,给c1、c2分配存储空间没有必要各自给它们分配8字节,只要8字节就可以了。给d分配8字节,所以sizeof(struct inner)值为16.

struct inner
{
char    c1;
double  d;
char    c2;
};
union data4
{
struct inner t1;
int i;
char c;
};


由于data4共用体中有一个inner结构体,所以最大的基本数据类型为double,因此以8字节对齐。共用体的存储长度取决于t1,而t1长度为24,因此sizeof(union data4)的值为24.

struct inner
{
char     c1;
double   d;
char     c2;
};
struct data4
{
struct inner t1;
int i;
char c;
};


data4结构体中有一个inner结构体,所以以8对齐,变量i和c共分配8字节就可以了,因此sizeof(struct data4)的值为32.

示例5:

struct  data
{
int    a;
long   b;
double c;
float  d;
char   e;
short  f;
}d;


这个结构体所占的字节数是多少呢?这里假设long所占字节数为4字节,short占2字节。这个结构体与示例4中第二个struct inner类似。首先这个结构体是以8字节对齐的,因为最长基本数据类型为double,它占8字节,d、e、f、总和为7个字节。分配存储空间时,成员 a和b各分配4字节,d分配4字节,f分配2字节,e也分配2字节。d、e、f总和刚好占8个字节,所以sizeof(struct data)值为24.

struct data
{
int    a;
long   b;
double c;
float  d;
char   e[3];
short  f;
}d;


sizeof(struct data)值为32.

例1:对于一个频繁使用的短小函数,在C语言中最好用什么实现?

答:最好用宏定义,这样可以节省调用函数的开销,效率最高。

例2:已知一个数组table,写一个宏定义,求出数组的元素个数

答:#define NTBL (sizeof(table)/sizeof(table[0]))

对于数组,sizeof(table)获取数组的总长度,而sizeof(table[0])是数组第一个元素所占的长度。当然若是可以用strlen()函数也行。

例3:给定结构

struct A
{
unsigned short t:4;
unsigned short k:4;
unsigned short i:8;
unsigned long m;
};


问sizeof(A)的值。

程序分析:unsigned short 一般占2个字节,unsigned long一般占4个字节,结构体A以4字节对齐,A中成员t、k、i共占4+4+8=16位,由于要内存对齐,实际那三个成员共占32位即4字节,成员m占4字节,因此sizeof(A)=8.

例4:求函数返回值,输入x=9999

int func(int x)
{
int count=0;
while(x)
{
count ++;
x=x&(x-1);
}
return count;
}


程序分析:这是统计9999的二进制形式中有多少个1的函数。9999=9*1024+512+256+15,2*1024的二进制表示中含有1的 个数为2;512的二进制表示中含有1的个数为1;256的二进制表示中含有1的个数为1;15的二进制表示中含有1的个数为4;故共有1的个数为8,结 果为8 。1000(2)-1(2)=0111(2),正好是原数取反,用这种方法来求1的个数是高效率的。

例5:已知运行这个程序的主机中数据类型long占8字节,请分析程序的运行结果。

#include<stdio.h>
int main()
{
struct data
{
long l;
char *s;
short int i;
char  c;
short int a[5];
}d;
struct data *p=&d;
printf("%d/n",sizeof(d));
printf("%x/t%x/n",p,p+1);
printf("%x/t%x/n",p,(char *)p+1);
printf("%x/t%x/n",p,(long *)p+1);
return 0;
}


运行结果:

32

bffff60 bffff80

bffff60 bffff61

bffff60 bffff64

程序分析:struct data以8个字节对齐,long类型的成员1分配8个字节。s、i、c、a原本分别占4、2、1、10个字节。由于考虑到对齐,s分配4个字节,i分配 2个字节,c分配2个字节,此时刚好用完8个字节。a原本分配10个字节,由于考虑到对齐,要使整个结构体所占的存储空间是8的倍数,所以分配给它16个 字节。因此结构体data占8+4+4+2+16=32个字节。

第二条printf语句,p+1中的加1并不是加1个字节,而是1个struct data的长度,16进制下,bffff60+20(十进制数32以十六进制数表示是20)=bffff80.

第三条printf语句,p+1中的加1,由于对指针p进行了强制类型转换,使p指向char类型的数据,此时的加1就是加上1个char类型的长度,因此p+1的输出是bffff61.

第四条语句分析与第三条类似。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: