关于结构体中最后的 char [0]
2011-06-07 16:01
253 查看
摘自:http://hi.baidu.com/wangjianzhong1981/blog/item/d7ca9df38fb5c6c30b46e029.html
问题:
结构体中最后定义一个类似 char p[0] 这样的成员,有何意义?
回复1:
这是个广泛使用的常见技巧,常用来构成缓冲区。比起指针,用空数组有这样的优势:
1.不需要初始化,数组名直接就是所在的偏移
2.不占任何空间,指针需要占用int长度空间,空数组不占任何空间。
从herryhuang(Herry)的回复看,你只是看到了表面,并没有想到这种特性是很有利用价值的。“这个数组不占用任何内存”,意味着这样的结构
节省空间;“该数组的内存地址就和他后面的元素的地址相同”,意味着无需初始化,数组名就是后面元素的地址,直接就能当做指针使用。
这样的写法最适合制作动态buffer。因为可以这样分配空间:
malloc(sizeof(struct XXX)+ buff_len);
看出来好处没有?直接就把buffer的结构体和缓冲区一块分配了
。用起来也非常方便,因为现在空数组其实变成了buff_len长度的数组了
。
这样的好处是:
一次分配解决问题,省了不少麻烦。大家知道为了防止内存泄漏,如果是分两次分配(结构体和缓冲区),那么要是第二次malloc失败了,必须回滚释放第一
个分配的结构体。这样带来了编码麻烦。其次,分配了第二个缓冲区以后,如果结构里面用的是指针,还要为这个指针赋值。同样,在free这个buffer的
时候,用指针也要两次free。如果用空数组,所有问题一次解决。
其次,大家知道小内存的管理是非常困难的,如果用指针,这个buffer的struct部分就是小内存了,在系统内存在多了势必严重影响内存管理的性能。要是用空数组把struct和实际数据缓冲区一次分配大块问题,就没有这个问题。
如此看来,用空数组既简化编码,又解决了小内存碎片问题提高了性能,何乐不为?应该广泛采用。
如果你做过操作系统的开发或者嵌入式开发,这种技巧应该是见得滥了
回复2:
关于这个问题,从楼主的代码来看,存在几个需要弄清楚的地方。第一,char p[0]是否合法;其次,如果非法,按照标准,合法的代码是怎样的?
先解释第一点,在ISO/IEC 9899-1999里面,这么写铁定是非法的,这个仅仅是GNU C的扩展,gcc可以允许这一语法现象的存在。考虑以下代码:
#include <stdio.h>
int main(int argc, char* argv[])
{
char ia[0];
printf("%d/n", sizeof(ia));
return 0;
}
这个在gcc里面编译,即使你使用了-Wall参数,gcc仍然会让这段代码通过……如果需要强制编译器按照ISO
C标准进行编译,你需要给出-pedantic(或者-pedantic_error)参数,这样,编译器会报告:ISO C forbids
zero-size array `ia'
这个仅仅是在C99没有出台的情况下,gcc为了使用类似于C99 flexible array member
而
做出的一个work-around,但是现在C99出现了,并且正式支持了flexible array member的语法,这样的一个GNU
C扩展就有点显得不合时宜了……按照ISO/IEC 9899-1999的要求,flexible array
member的定义应当是这样:
struct foo
{
int variable;
int bar[ ];//here!!!! this is the C99 flexible array member
};
这个才是符合标准要求的写法,当你的代码需要跨平台、跨编译器移植,并且需要这个特性的时候,这个才是唯一准确的写法!
本来这里有一个trick,只不过flexible array member将其标准化了而已。
原来的trick应该是写作
struct foo
{
int variable;
int i_am_a_trick[1];
};
struct foo *ptr_to_foo = malloc(sizeof(struct foo) + SOMELENGTH);
因为标准看到了这种trick可能造成的问题:
struct foo something[2];//本以可能并不是这样,对于flexible array member来说,这个会被标记为错误或者警告,防止出现问题……
-------------------------------------------补充:
1. 上面的回复中都是用 sizeof 来计算结构体大小。对于含有变长数组的结构体,sizeof 的返回结果很诡异。请参考 :http://bbs3.chinaunix.net/thread-1455677-1-1.html
,可以用 偏移量来代替 sizeof 。
例如,针对上面的 struct foo ,:
#define offsetof(type, element) ((size_t)&((type *)0)->element)
struct foo *ptr_to_foo = malloc(offsetof(struct foo, variable) + LENGTH);
2. 关于 C99 flexible array member
C99中,允许结构中的最后一个成员可以是未知大小的数组(结构中,在该数组之前必须至少有一个其他成员),这被称为 flexible array
member 。由 sizeof 返回的结构的大小不包括 flexible array member 的大小 。
问题:
结构体中最后定义一个类似 char p[0] 这样的成员,有何意义?
回复1:
这是个广泛使用的常见技巧,常用来构成缓冲区。比起指针,用空数组有这样的优势:
1.不需要初始化,数组名直接就是所在的偏移
2.不占任何空间,指针需要占用int长度空间,空数组不占任何空间。
从herryhuang(Herry)的回复看,你只是看到了表面,并没有想到这种特性是很有利用价值的。“这个数组不占用任何内存”,意味着这样的结构
节省空间;“该数组的内存地址就和他后面的元素的地址相同”,意味着无需初始化,数组名就是后面元素的地址,直接就能当做指针使用。
这样的写法最适合制作动态buffer。因为可以这样分配空间:
malloc(sizeof(struct XXX)+ buff_len);
看出来好处没有?直接就把buffer的结构体和缓冲区一块分配了
。用起来也非常方便,因为现在空数组其实变成了buff_len长度的数组了
。
这样的好处是:
一次分配解决问题,省了不少麻烦。大家知道为了防止内存泄漏,如果是分两次分配(结构体和缓冲区),那么要是第二次malloc失败了,必须回滚释放第一
个分配的结构体。这样带来了编码麻烦。其次,分配了第二个缓冲区以后,如果结构里面用的是指针,还要为这个指针赋值。同样,在free这个buffer的
时候,用指针也要两次free。如果用空数组,所有问题一次解决。
其次,大家知道小内存的管理是非常困难的,如果用指针,这个buffer的struct部分就是小内存了,在系统内存在多了势必严重影响内存管理的性能。要是用空数组把struct和实际数据缓冲区一次分配大块问题,就没有这个问题。
如此看来,用空数组既简化编码,又解决了小内存碎片问题提高了性能,何乐不为?应该广泛采用。
如果你做过操作系统的开发或者嵌入式开发,这种技巧应该是见得滥了
回复2:
关于这个问题,从楼主的代码来看,存在几个需要弄清楚的地方。第一,char p[0]是否合法;其次,如果非法,按照标准,合法的代码是怎样的?
先解释第一点,在ISO/IEC 9899-1999里面,这么写铁定是非法的,这个仅仅是GNU C的扩展,gcc可以允许这一语法现象的存在。考虑以下代码:
#include <stdio.h>
int main(int argc, char* argv[])
{
char ia[0];
printf("%d/n", sizeof(ia));
return 0;
}
这个在gcc里面编译,即使你使用了-Wall参数,gcc仍然会让这段代码通过……如果需要强制编译器按照ISO
C标准进行编译,你需要给出-pedantic(或者-pedantic_error)参数,这样,编译器会报告:ISO C forbids
zero-size array `ia'
这个仅仅是在C99没有出台的情况下,gcc为了使用类似于C99 flexible array member
而
做出的一个work-around,但是现在C99出现了,并且正式支持了flexible array member的语法,这样的一个GNU
C扩展就有点显得不合时宜了……按照ISO/IEC 9899-1999的要求,flexible array
member的定义应当是这样:
struct foo
{
int variable;
int bar[ ];//here!!!! this is the C99 flexible array member
};
这个才是符合标准要求的写法,当你的代码需要跨平台、跨编译器移植,并且需要这个特性的时候,这个才是唯一准确的写法!
本来这里有一个trick,只不过flexible array member将其标准化了而已。
原来的trick应该是写作
struct foo
{
int variable;
int i_am_a_trick[1];
};
struct foo *ptr_to_foo = malloc(sizeof(struct foo) + SOMELENGTH);
因为标准看到了这种trick可能造成的问题:
struct foo something[2];//本以可能并不是这样,对于flexible array member来说,这个会被标记为错误或者警告,防止出现问题……
-------------------------------------------补充:
1. 上面的回复中都是用 sizeof 来计算结构体大小。对于含有变长数组的结构体,sizeof 的返回结果很诡异。请参考 :http://bbs3.chinaunix.net/thread-1455677-1-1.html
,可以用 偏移量来代替 sizeof 。
例如,针对上面的 struct foo ,:
#define offsetof(type, element) ((size_t)&((type *)0)->element)
struct foo *ptr_to_foo = malloc(offsetof(struct foo, variable) + LENGTH);
2. 关于 C99 flexible array member
C99中,允许结构中的最后一个成员可以是未知大小的数组(结构中,在该数组之前必须至少有一个其他成员),这被称为 flexible array
member 。由 sizeof 返回的结构的大小不包括 flexible array member 的大小 。
相关文章推荐
- 关于结构体中最后一个成员为char[1]或char[0]的技巧
- 关于VC网络编程中用 char 发送结构体的说明
- C++中 关于结构体中有char *类型的指针 赋值问题
- mysql中char(n)和varchar(n)在数据存入的时候关于是否丢弃最后的空格的区别
- 结构体最后定义一个char p[0];这样的成员有何意义(转)
- 【C语言】关于结构体最后的长度为0或1数组的思考
- 关于零长度的数组——结构体最后一个成员char[0]和char[1]
- cocos2d-x 关于 std::string 与 const char* 之间转换的奇怪问题
- 关于编译报错 error: cannot convert ‘const std::__cxx11::basic_string’ to ‘const char*’ 的处理
- Oracle中关于时间的to_char和to_date
- 关于JS获取某月最后一天
- char1-关于对象
- windows和Linux之间socket传输结构体关于字节对齐产生的问题
- 关于“不能将参数1 从“CString”转换为“const char *””的一些思考
- c#中关于结构体和字节数组转化
- 关于int fun(char *)的一个注释
- C++ primer plus 第六版课后作业和题——第四章——关于字符串、结构体、共同体、枚举的知识
- 关于iOS真机调试这块总结(不是很全 可以点开最后连接查看详细的步骤)
- 关于String字符串空格的处理[用(char)12288解决空格问题]
- 关于结构体对齐