C语言中的类型提升——基础概念,但还有很多人搞不清
2015-10-23 14:45
323 查看
每天都会看CU的博客,尤其是CU首页上面的博客。个人感觉有很多同学并不关注基础知识,
在遇到问题时,经常会舍本求末。遇到问题,总是找不到根本原因,得出了一些结论。但这些结论并不是真正的原因,整个儿过程,也把真正的原因给掩盖了。
今天主要说一下C语言的类型提升的事情。
下面是引用的一个例子——这个代码是从一个朋友的博文中复制过来的,但是当时这位朋友没有去说明类型提升的问题,而是阐述汇编的过程。
/***************************************************************/
int main()
{
int i;
unsigned char *p;
char *p1;
int a[] = {0xffffffff, 0xffffffff, 0xffffffff};
p = a;
p1 = a;
for(i = 0 ; i < 8 ; i++) {
printf(" 0x%02x 0x%02x \n", p[i], p1[i]);
}
}
$ gcc main.c
main.c: In function ‘main’:
main.c:10: warning: assignment from incompatible pointer type
main.c:11: warning: assignment from incompatible pointer type
$ ./a.out
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
。。。。。。 。。。。。。
/***************************************************************/
根本原因其实很简单。
%x是打印无符号整数的16进制,而例子中传递的类型是字符型,那么这里就有一个字符提升的问题,将类型提升为无符号整形。
*p是unsigned char,其值为0xff,那么对应的无符号整形的值仍然是0xff。
而*p1确实char,其值为0xff,其对应的无符号整形的值为0xffffffff。为什么这次是0xffffffff呢?
因为*p1为-1,而无符号整数的-1则是0xffffffff。
为什么是这样呢?
因为在在编码为补码的情形下,类型提升有两种情况:
1. 符号扩展:对于有符号数,扩展存储位数的方法。在新的高位字节使用当前最高有效位即符号位的值进行填充。
2. 零扩展:对于无符号数,扩展存储位数的方法。在新的高位直接填0.
对于这个例子来说。*p是无符号数,所以填充的是0,即为0x000000ff。而*p1是有符号数,所以填充的是1,即为0xffffffff。
因此,从char型到unsigned int,是对有符号数的提升,因此用的是符号扩展,oxff被扩展为oxffffffff;而从unsigned char型到unsigned int型,是对无符号数的扩展,使用零扩展,oxff被扩展为ox000000ff,而填充的这些零是不会被打印出来的。
如果说这样教科书式的概念不容易理解。还有这样一种理解方式,也许不一定准确,但更容易理解。
对于这里的类型提升,整个步骤可以这样理解:
1. %x要求参数为无符号整数,需要参数为4个字节;
2. *p, *p1为(unsigned) char型,只占1个字节;
3. 因为参数的类型不符,需要扩展;
4. 定位需要扩展到4个字节;
5. 那么就需要填充增加的3个字节;
6. 这3个字节需要什么值?这里就需要上面所需要的概念了。针对有符号数和无符号数,进行不同值的填充。
这就是为什么在编程的过程中,要避免有符号数和无符号数的混用。我个人认为,在我们解决问题的时候,不要一味儿的想着怎么用高级的技术解决。其实最重要的是基础。一般情况下,大部分的问题都可以由C语言基础解决。
接下来再看一个例子:
1 #include <stdio.h>
2
3 int main(int argc, char **argv){
4 int a=1000000,b=1000000;
5 long int c,c1,c2,c3;
6 c=a*b;//note1
7 c1=(long)a*b;//note2
8 c2=(long)a*(long)b;//note3
9 c3=(long)(a*b);//note4
10 printf("c=%ld, c1=%ld,c2=%ld, c3=%ld\n",c,c1,c2,c3);
11 return 0;
12 }
运行结果:
c=-727379968, c1=1000000000000,c2=1000000000000, c3=-727379968
note1和note4的打印结果是一样的,原理也是一样的,只不过在代码里note1是隐式类型转换,note4是显式类型转换,此处a*b的结果位数大于int的32位的范围,发生了溢出,高于第31位的数值丢弃,剩下的在进行符号扩展,最后显示为-727379968。而note2和note3,在计算出a*b的结果之前将a或b扩展为long型,提前避免了溢出问题,最后显示为1000000000000。
结束!
在遇到问题时,经常会舍本求末。遇到问题,总是找不到根本原因,得出了一些结论。但这些结论并不是真正的原因,整个儿过程,也把真正的原因给掩盖了。
今天主要说一下C语言的类型提升的事情。
下面是引用的一个例子——这个代码是从一个朋友的博文中复制过来的,但是当时这位朋友没有去说明类型提升的问题,而是阐述汇编的过程。
/***************************************************************/
int main()
{
int i;
unsigned char *p;
char *p1;
int a[] = {0xffffffff, 0xffffffff, 0xffffffff};
p = a;
p1 = a;
for(i = 0 ; i < 8 ; i++) {
printf(" 0x%02x 0x%02x \n", p[i], p1[i]);
}
}
$ gcc main.c
main.c: In function ‘main’:
main.c:10: warning: assignment from incompatible pointer type
main.c:11: warning: assignment from incompatible pointer type
$ ./a.out
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
0xff 0xffffffff
。。。。。。 。。。。。。
/***************************************************************/
根本原因其实很简单。
%x是打印无符号整数的16进制,而例子中传递的类型是字符型,那么这里就有一个字符提升的问题,将类型提升为无符号整形。
*p是unsigned char,其值为0xff,那么对应的无符号整形的值仍然是0xff。
而*p1确实char,其值为0xff,其对应的无符号整形的值为0xffffffff。为什么这次是0xffffffff呢?
因为*p1为-1,而无符号整数的-1则是0xffffffff。
为什么是这样呢?
因为在在编码为补码的情形下,类型提升有两种情况:
1. 符号扩展:对于有符号数,扩展存储位数的方法。在新的高位字节使用当前最高有效位即符号位的值进行填充。
2. 零扩展:对于无符号数,扩展存储位数的方法。在新的高位直接填0.
对于这个例子来说。*p是无符号数,所以填充的是0,即为0x000000ff。而*p1是有符号数,所以填充的是1,即为0xffffffff。
因此,从char型到unsigned int,是对有符号数的提升,因此用的是符号扩展,oxff被扩展为oxffffffff;而从unsigned char型到unsigned int型,是对无符号数的扩展,使用零扩展,oxff被扩展为ox000000ff,而填充的这些零是不会被打印出来的。
如果说这样教科书式的概念不容易理解。还有这样一种理解方式,也许不一定准确,但更容易理解。
对于这里的类型提升,整个步骤可以这样理解:
1. %x要求参数为无符号整数,需要参数为4个字节;
2. *p, *p1为(unsigned) char型,只占1个字节;
3. 因为参数的类型不符,需要扩展;
4. 定位需要扩展到4个字节;
5. 那么就需要填充增加的3个字节;
6. 这3个字节需要什么值?这里就需要上面所需要的概念了。针对有符号数和无符号数,进行不同值的填充。
这就是为什么在编程的过程中,要避免有符号数和无符号数的混用。我个人认为,在我们解决问题的时候,不要一味儿的想着怎么用高级的技术解决。其实最重要的是基础。一般情况下,大部分的问题都可以由C语言基础解决。
接下来再看一个例子:
1 #include <stdio.h>
2
3 int main(int argc, char **argv){
4 int a=1000000,b=1000000;
5 long int c,c1,c2,c3;
6 c=a*b;//note1
7 c1=(long)a*b;//note2
8 c2=(long)a*(long)b;//note3
9 c3=(long)(a*b);//note4
10 printf("c=%ld, c1=%ld,c2=%ld, c3=%ld\n",c,c1,c2,c3);
11 return 0;
12 }
运行结果:
c=-727379968, c1=1000000000000,c2=1000000000000, c3=-727379968
note1和note4的打印结果是一样的,原理也是一样的,只不过在代码里note1是隐式类型转换,note4是显式类型转换,此处a*b的结果位数大于int的32位的范围,发生了溢出,高于第31位的数值丢弃,剩下的在进行符号扩展,最后显示为-727379968。而note2和note3,在计算出a*b的结果之前将a或b扩展为long型,提前避免了溢出问题,最后显示为1000000000000。
结束!
相关文章推荐
- 我的iOS学习历程 - 第十二天(C语言学习的最后一天,对C语言的知识进行一个整体需求)
- ubuntu下C/C++集成环境 -- codeblocks
- C++设计模式之简单工厂模式
- c++ set
- C++中的函数指针
- 九度王道考研机试真题 2010-2北邮 题目1173:查找.cpp
- c/c++内存管理注意的问题
- [C++] [算法] KMP算法
- C++ 类的静态成员详细讲解
- vs中建立动态链接库的步骤
- C++学习笔记33 转换操作符
- C++ MFC中的CMenu---动态添加菜单/菜单项
- 基于51单片机SJA1000 CAN通讯实现(C语言程序)
- C++多级指针的”解引用“
- 2015年奇虎360服务器开发C++电话面试问题
- Java, C++ 单例模式与静态成员初始化对比
- 求最大公约数 1.0
- C++STL之priority_queue优先队列容器
- C++——将成员函数作为参数
- Leetcode Next Permutation