您的位置：首页 > 其它

char、signed char、unsigned char的区别

2012-11-15 15:16 381 查看

ANSI C 提供了3种字符类型，分别是char、signed char、unsigned char

char相当于signed char或者unsigned char，但是这取决于编译器！

这三种字符类型都是按照1个字节存储的，可以保存256个不同的值。

不同的是取值范围

signed char取值范围是 -128 到 127

unsigned char 取值范围是 0 到 255

signed char的最高位为符号位，因此char能表示-128~127, unsigned char没有符号位，因此能表示0~255。

但是char究竟相当于signed char呢还是相当于unsigned char呢？？

这就是char和int的不同之处！

int＝＝signed int，但是char不能简单以为＝＝signed char

要确定char究竟等同什么要基于不同的编译器做测试

大多数机器使用补码来存储整数，在这些机器中按照整数类型存储的－1的所有位均是1

假设我的机器也是如此存储，就能据此判断char究竟是等于signed char还是unsigned char

在实际使用过程种有什么区别呢？

主要是符号位，但是在普通的赋值，读写文件和网络字节流都没什么区别，反正就是一个字节，不管最高位是什么，最终的读取结果都一样，只是你怎么理解最高位而已，在屏幕上面的显示可能不一样。

但是我们却发现在表示byte时，都用unsigned char，这是因为byte没有符号位之说。

如果是char，那么系统认为最高位是符号位，而int可能是16或者32位，那么会对最高位进行扩展（注意，赋给unsigned int也会扩展），而如果是unsigned char，那么不会扩展。

这就是二者的最大区别。

同理可以推导到其它的类型，比如short， unsigned short。等等

具体可以通过下面的小例子看看其区别

static get_utili(const char *p) 
{ int util;
  … 
  while (isspace((int)*p)) //跳过空格 
    ++p; 
  util = (int) *p++;
  …
}

现象&后果:

当传入的参数p指向的内容为0x9A、0XAB等内容(最高位为1)时，得到的int型变量util的值将会出错，因为char会进行符号扩展，使得0x9A(十进制的154)变成了-102。会造成程序运行时的数据处理错误。

Bug分析:

char符号扩展是与编译器相关的，但在x86平台上，对于任何主流的编译平台，char总是进行符号扩展的。上述代码在将char型的*p赋给int型变量util的时候，需要先进行char型到unsigned char型的转换，以避免按照char的最高位进行符号扩展。

上述出错代码的符号扩展过程如下：

因为要扩展的短数据类型为有符号数的-- char x=10011100b（即0x9A）

因而在int y=(int)x时--进行符号扩展，即短数据类型的符号位填充到长数据类型的高字节位（比短数据类型多出的那一部分），则y的值为11111111 10011100b(变成了十进制的-102)；

但是，将要扩展的短数据类型变成无符号数后--unsigned char x=10011100b（即0x9A）

在 int y=(int)x时--进行扩展的时候是以零扩展，即用零来填充长数据类型的高字节位，则y的值应为00000000 10011100b(十进制的154)。

正确代码:

util = (int) *p++;改成 
util = (int)(unsigned char) *p++

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航