您的位置:首页 > 编程语言 > C语言/C++

Daily-C-Study(4):C语言struct关键字

2013-05-30 18:32 246 查看

Daily-C-Study(4):C语言struct关键字

成于坚持,败于止步

struct 是个神奇的关键字,它将一些相关联的数据打包成一个整体,方便使用。

在网络协议、通信控制、嵌入式系统、驱动开发等地方,我们经常要传送的不是简单的字节流(char 型数组),而是多种数据组合起来的一个整体,其表现形式是一个结构体。

经验不足的开发人员往往将所有需要传送的内容依顺序保存在char 型数组中,通过指针偏移的方法传送网络报文等信息。这样做编程复杂,易出错,而且一旦控制方式及通信协议有所变化,程序就要进行非常细致的修改,非常容易出错。这个时候只需要一个结构体就能搞定。平时我们要求函数的参数尽量不多于4 个,如果函数的参数多于4 个使用起来非常容易出错(包括每个参数的意义和顺序都容易弄错),效率也会降低(与具体CPU 有关,ARM芯片对于超过4 个参数的处理就有讲究,具体请参考相关资料)。这个时候,可以用结构体压缩参数个数。

空结构体多大?

结构体所占的内存大小是其成员所占内存之和(关于结构体的内存对齐,请参考预处理那章)。这点很容易理解,但是下面的这种情况呢?

struct student

{

}stu;

sizeof(stu)的值是多少呢?在Visual C++ 6.0 上测试一下。

很遗憾,不是0,而是1。为什么呢?你想想,如果我们把struct student 看成一个模子的话,你能造出一个没有任何容积的模子吗?

显然不行。编译器也是如此认为。编译器认为任何一种数据类型都有其大小,用它来定义一个变量能够分配确定大小的空间。既然如此,编译器就理所当然的认为任何一个结构体都是有大小的,哪怕这个结构体为空。那万一结构体真的为空,它的大小为什么值比较合适呢?

假设结构体内只有一个char 型的数据成员,那其大小为1byte(这里先不考虑内存对齐的情况).也就是说非空结构体类型数据最少需要占一个字节的空间,而空结构体类型数据总不能比最小的非空结构体类型数据所占的空间大吧。这就麻烦了,空结构体的大小既不能为0,也不能大于1,怎么办?定义为0.5个byte?但是内存地址的最小单位是1 个byte,0.5 个byte 怎么处理?解决这个问题的最好办法就是折中,编译器理所当然的认为你构造一个结构体数据类型是用来打包一些数据成员的,而最小的数据成员需要1
个byte,编译器为每个结构体类型数据至少预留1 个byte的空间。所以,空结构体的大小就定位1 个byte。


优秀的程序设计者这样设计传送的报文,是一个很不错的使用实例,可以借鉴使用:

struct CommuPacket
{
	int iPacketType; //报文类型标志
	union  //每次传送的是三种报文中的一种,使用union
	{
		struct structA packetA;
		struct structB packetB;
		struct structC packetC;
	}
};


在进行报文传送时,直接传送struct CommuPacket一个整体。

假设发送函数的原形如下:

//pSendData:发送字节流的首地址,iLen:要发送的长度

Send(char * pSendData, unsigned int iLen);

发送方可以直接进行如下调用发送struct CommuPacket的一个实例sendCommuPacket:

Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );

假设接收函数的原形如下:

//pRecvData:发送字节流的首地址,iLen:要接收的长度

//返回值:实际接收到的字节数

unsigned int Recv(char * pRecvData, unsigned int iLen);

接收方可以直接进行如下调用将接收到的数据保存在struct CommuPacket的一个实例recvCommuPacket中:

Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );

接着判断报文类型进行相应处理:

switch(recvCommuPacket. iPacketType)
{
	case PACKET_A:
	… //A类报文处理
	break;
	case PACKET_B:
	… //B类报文处理
	break;
	case PACKET_C:
	… //C类报文处理
	break;
}
以上程序中最值得注意的是

Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );

Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );

中的强制类型转换:(char *)&sendCommuPacket、(char *)&recvCommuPacket,先取地址,再转化为char型指针,这样就可以直接利用处理字节流的函数。

利用这种强制类型转化,我们还可以方便程序的编写,例如要对sendCommuPacket所处内存初始化为0,可以这样调用标准库函数memset():

memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));

柔性数组

也许你从来没有听说过柔性数组(flexible array)这个概念,但是它确实是存在的。

C99 中,结构中的最后一个元素允许是未知大小的数组,这就叫做柔性数组成员,但结构中的柔性数组成员前面必须至少一个其他成员。柔性数组成员允许结构中包含一个大小可变的数组。sizeof 返回的这种结构大小不包括柔性数组的内存。包含柔性数组成员的结构用malloc ()函数进行内存的动态分配,并且分配的内存应该大于结构的大小,以适应柔性数组的预期大小。

柔性数组到底如何使用呢?看下面例子:

typedef struct st_type
{
	int i;
	int a[0];
}type_a;
有些编译器会报错无法编译可以改成:

typedef struct st_type
{
	int i;
	int a[];
}type_a;
这样我们就可以定义一个可变长的结构体, 用sizeof(type_a) 得到的只有4 , 就是sizeof(i)=sizeof(int)。那个0 个元素的数组没有占用空间,而后我们可以进行变长操作了。通过如下表达式给结构体分配内存:

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));

type_a *p = (type_a*)malloc(sizeof(type_a)+100*sizeof(int));

这样我们为结构体指针p 分配了一块内存。用p->item
就能简单地访问可变长元素。

但是这时候我们再用sizeof(*p)测试结构体的大小,发现仍然为4。是不是很诡异?我们不是给这个数组分配了空间么?

别急,先回忆一下我们前面讲过的“模子”。在定义这个结构体的时候,模子的大小就已经确定不包含柔性数组的内存大小。柔性数组只是编外人员,不占结构体的编制。只是说在使用柔性数组时需要把它当作结构体的一个成员,仅此而已。再说白点,柔性数组其实与结构体没什么关系,只是“挂羊头卖狗肉”而已,算不得结构体的正式成员。

需要说明的是:C89 不支持这种东西,C99 把它作为一种特例加入了标准。但是,C99所支持的是incomplete type,而不是zero array,形同int item[0];这种形式是非法的,C99 支持的形式是形同int item[];只不过有些编译器把int item[0];作为非标准扩展来支持,而且在C99 发布之前已经有了这种非标准扩展了,C99 发布之后,有些编译器把两者合而为一了。

当然,上面既然用malloc 函数分配了内存,肯定就需要用free 函数来释放内存:

free(p);

经过上面的讲解,相信你已经掌握了这个看起来似乎很神秘的东西。不过实在要是没掌握也无所谓,这个东西实在很少用。

struct 与class 的区别

在C++里struct 关键字与class 关键字一般可以通用,只有一个很小的区别。struct 的成员默认情况下属性是public 的,而class 成员却是private 的。很多人觉得不好记,其实很容易。你平时用结构体时用public 修饰它的成员了吗?既然struct 关键字与class 关键字可以通用,你也不要认为结构体内不能放函数了。许多文献写到这里就认为已经给出了C++中struct和class的全部区别,实则不然,另外一点需要注意的是:

C++中的struct保持了对C中struct的全面兼容(这符合C++的初衷——“a better c”),因而,下面的操作是合法的:

struct structA
{
	char a;
	char b;
	int c;
};
structA a = {'a' , 'a' ,1}; // 定义时直接赋初值
即struct可以在定义的时候直接以{ }对其成员变量赋初值,而class则不能,在经典书目《thinking C++ 2nd edition》中作者对此点进行了强调。

字节序

说到struct,就不得不说说字节序的事了,先看个实例吧,看看怎么样?

#include <iostream.h>
#pragma pack(8)
struct example1
{
	short a;
	long b;
};

struct example2
{
	char c;
	example1 struct1;
	short e;    
};
#pragma pack()

int main(int argc, char* argv[])
{
	example2 struct2;

	cout << sizeof(example1) << endl;
	cout << sizeof(example2) << endl;
	cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2) << endl;

	return 0;
}

输出结果是8,16,4,怎么样,你答对了么,下面就着手来学习字节序的内容

自然对界

struct是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如array、struct、union等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界(natural alignment)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。自然对界(natural
alignment)即默认对齐方式,是指按结构体的成员中size最大的成员对齐。


例如:

struct naturalalign
{
	char a;
	short b;
	char c;
};
在上述结构体中,size最大的是short,其长度为2字节,因而结构体中的char成员a、c都以2为单位对齐,sizeof(naturalalign)的结果等于6;

如果改为:

struct naturalalign
{
	char a;
	int b;
	char c;
};
size最大的是int,其长度为4字节,因而结构体中的char成员a、c都以4为单位对齐,sizeof(naturalalign)的结果等于12;

指定对界

一般地,可以通过下面的方法来改变缺省的对界条件:

1)使用伪指令#pragma pack (n),编译器将按照n个字节对齐;

2)使用伪指令#pragma pack (),取消自定义字节对齐方式。

注意:如果#pragma pack (n)中指定的n大于结构体中最大成员的size,则其不起作用,结构体仍然按照size最大的成员进行对界。

例如:

#pragma pack (n)
struct naturalalign { char a; int b; char c; };
#pragma pack ()
当n为4、8、16时,其对齐方式均一样,sizeof(naturalalign)的结果都等于12。而当n为2时,其发挥了作用,使得sizeof(naturalalign)的结果为8。

在VC++ 6.0编译器中,我们可以指定其对界方式,其操作方式为依次选择projetct > setting > C/C++菜单,在struct member alignment中指定你要的对界方式。

另外,通过__attribute((aligned (n)))也可以让所作用的结构体成员对齐在n字节边界上,但是它较少被使用,因而不作详细讲解。

到这里上面刚刚说的实例是不是也该迎刃而解了,还是分析一下吧,现在会了不代表一直会了,好记性不让烂笔头,不对,是指头(码字不容易啊)O(∩_∩)O~

程序中第2行#pragma pack (8)虽然指定了对界为8,但是由于struct example1中的成员最大size为4(long变量size为4),故struct example1仍然按4字节对界,struct example1的size为8

struct example2中包含了struct example1,其本身包含的简单数据成员的最大size为2(short变量e),但是因为其包含了struct example1,而struct example1中的最大成员size为4,struct example2也应以4对界,#pragma pack (8)

指定的对界对struct example2也不起作用,故输出结果为16;

由于struct example2中的成员以4为单位对界,故其char变量c后应补充3个空,其后才是成员struct1的内存空间,20行的输出结果为4。

到这里再看一个小程序,结束这一小节

#include <iostream.h>
struct structA
{
	int iMember;
	char *cMember;
};

int main(int argc, char* argv[])
{
	structA instant1,instant2;
	char c = 'a';
	instant1.iMember = 1;
	instant1.cMember = &c; 
	instant2 = instant1;
	cout << *(instant1.cMember) << endl;
	*(instant2.cMember) = 'b';
	cout << *(instant1.cMember) << endl;
	return 0;
}

输出结果:a b

tell me why,原因在于instant2 = instant1赋值语句采用的是变量逐个拷贝,这使得instant1和instant2中的cMember指向了同一片内存,因而对instant2的修改也是对instant1的修改。

在C语言中,当结构体中存在指针型成员时,一定要注意在采用赋值语句时是否将2个实例中的指针型成员指向了同一片内存。

在C++语言中,当结构体中存在指针型成员时,我们需要重写struct的拷贝构造函数并进行“=”操作符重载。

就先到这里,O(∩_∩)O~

我的专栏地址:http://blog.csdn.net/column/details/c-daily-study.html

待续。。。。。。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: