您的位置:首页 > 理论基础

计算机内部数据格式 浮点数精度 显示的一些总结

2015-03-08 13:47 351 查看
31 30 23 22 0

SEM
符号位(sign)占1位,S=0表示+,S=1表示-

指数位(exponent)占8位,阶码E=e+127

尾数位(mantissa),占23位,规格化1.M,小数点前面的1隐藏

为什么要加上指数偏移值?2^(e-1)-1=127

好处是可以用长度为e个bit的无符号整数来表示所有的指数取值,使得两个浮点数的指数大小的比较更为容易直观

为什么偏移值是127?

阶码E全0(0)和全1(255)保留用作特殊值的处理,表示0(-127)和∞(128),对于规格化浮点数,E的变化范围为1-254,真正的指数值为e为-126-127

关于原码,反码,补码,移码的概念 参考这篇博文,总结的很好点击打开链接

关于补码-128

原码:+0=00000000

-0=10000000

反码:+0=00000000

-0=11111111

补码:+0=00000000=-0

-128=10000000

补码是为了处理0不分+-的问题而引入的 即+0=-0=0,都是用00000000来表示,那么多余的10000000就用来表示-128

float的精度为何只有6-7位?

float:2^23=8388608,一共7位,这意味着最多能有7位有效数字,绝对能保证的为6位

double的精度为何是15-16位?

double:2^52=4503599627370496,一共16位

浮点数为何不能用==来判断是否相等?

就是因为浮点数的精度问题,计算机内部不能精确的表示一些浮点数值,如果想要判断两个浮点数x和y是否相等,不是x==y,而是x-y<=0.000001,具体看精度要求

%f %e %g的区别?

double a=1000000;

double b=123.456;

%f 1000000.000000 浮点数计数法

123.456000

%e 1.000000e+6 科学技术法

1.234560e+2

%g 1e+6 指数小于-4或者大于5采用%e,否则采用%f

123.456

十六进制浮点常量(PS:没有八进制浮点常量)

0x0.3P10表示的值位0.0011*2^10=11000000=192

将变量声明为unsign int、long int 、short int时,关键字int可以省略,unsigned只能限定int和char

long int、long long int属于各自的类型,必须使用NSLog字符%li、%lli显示

浮点数常量输入默认为十进制,八进制、十六进制NSLog字符%o、%x只能显示整数
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐