java int转float精度丢失问题
2017-05-10 00:04
971 查看
前几天,看java核心卷上面有一句java的int转float会有精度丢失的问题,
第一次看的不太深入,最近又碰到了这个问题,就去深入的看了下。
建议一块看看这些(有助于理解下面的问题)
源码,反码,补码相关
IEEE754标准
大家乍一看float的范围比int大得多啊,那么包含它应该没问题啊,事实反应出来的确实另一个问题。
转化为什么会有精度丢失的问题呢??
int是准确值,而float是精确值,准确转精确当然会精度丢失。
int和float的存储结构不一致的原因导致的。
int的存储结构是:
一个符号位 31个指数位
如果你看了上面的补码的话,应该能够理解并且能计算出int的最大/小值范围了。
而float虽然也是4字节32位,但是float的存储结构是很不一样的
以这一例子来说明,由图可知,float的存储结构是1个符号位,8个指数位,23个尾数。
符号位,表述浮点数的正或者负,0代表正,1代表负。
指数位,实际也是有正负的,但是没有单独的符号位,在计算机的世界里,进位都是二进制的,指数表示的也是2的N次幂,8位指数表达的范围是0到255,而对应的实际的指数是-127到128。也就是说实际的指数等于指数位表示的数值减127。这里特殊说明,-127和+128这两个指数数值在IEEE当中是保留的用作多种用途的,这里就不多做介绍了,有兴趣的可以查阅其他资料。
尾数位,只代表了二进制的小数点后的部分,小数点前的那位被省略了,当指数位全部为0时省略的是0否则省略的是1。
由此我们可以明白,实际上尾数确定了浮点数的精度,而数的大小主要是靠指数位,尾数只有23位,加上省略的那一位便是24位,float只能有24位来确定精度,而int是32位。其他类型也如此进行理解即可。
——————-补充——————-
java中的float类型遵循 IEEE754标准(这个规定了二进制浮点型数标准)。
举个例子来说明下吧。
12.5在计算机中的储存结构是什么样呢??
先将十进制转化为二进制
12.5(10) = 1100.1(2) 这个不会的去搜下十进制转二进制。
然后计算尾数。
也就是最后的23位,第24位默认为1。所以1100.1左移3位即为1.1001,又因为高位位1,所以1可以省略,所以尾数部分为 1001000 00000000 00000000。
再然后呢,就是计算指数。
刚才计算尾数左移了3位,相当于乘以2的3次方即为8,再加上127即为最后的指数,10000111,
因为是正数,所以符号位为0
12.5在计算机中的储存就是
0 1000011 1 1001000 00000000 00000000
我在看的时候还纠结一个问题,那就是关于float最大最小值的问题。
通过上面的那个公式还有那个IEEE754标准 就可以算出float的最大值及最小值,包括浮点型的有效位数。
大家可以自己先挣扎下,我明天再写。
float的取值范围:
负无穷 —— −2的128次方 ~~~ −2的149次方 —— 0 —— 2的149次方 ~~2的128次方 —— 正无穷
有意义的指数,正规形式的最大,取其最大值2的8次方-2,即为254,减去127,即为实际计算的指数127.
后面的指数都为1的情况下,值最大。
大家套用上面那个图上的公式。
(-1) sign次方 * 2的127次方 * (1+1*2的-1次方+1*2的-2次方+…+1*2的-23次方)
maxOrMinValue = (+/-)2的127次方*(1+(2的23次方-1)/2的23次方)
这个就是它的最大/小值。接近(+/-)2的128次方,但是取不到128次方的值。
至于(+/-)2的-149次方,这个怎么得出来的。 按照非规约形式得到的。
指数部分为0的情况下,减去127得到实际计算指数-127,后面位数部分在非规约模式的情况下,不能为0最小的情况就是指数为0位值为1,也就是2的-23次方。
两者相加,是(+/-2的150次方)。 为什么是149次方呢。解释是全0,1位特殊值,不做范围内取值,所以指数位最小为1.则实际计算指数则为-126.最终的结果就是(+/-)2的149次方。
这样就计算得出了。
在IEEE754标准 中还规定了无穷大,无意义的值,有兴趣可以去看下啊。
float精度值
float的尾数:23位,其范围为:0~223,而2的23次方=8388608=106.92,所以float的精度为6~7位,能保证6位为绝对精确,7位一般也是正确的,8位就不一定了(但不是说8位就绝对不对了),注意这里的6~7位是有效小数位(大的数你先需要转换成小数的指数形式,例如:8317637.5,其有效小数位:8.3176375E6,七位),而有效位(从第一个不为0的开始数)是7~8位,是包括整数位的,像8317637.5,你不转换,则要从有效位的角度来看,有8位有效位。
你可以用大于2的30次方的int类型数强转成float对比下,看看是不是出现了精度丢失。
参考链接
参考链接1
第一次看的不太深入,最近又碰到了这个问题,就去深入的看了下。
建议一块看看这些(有助于理解下面的问题)
源码,反码,补码相关
IEEE754标准
大家乍一看float的范围比int大得多啊,那么包含它应该没问题啊,事实反应出来的确实另一个问题。
转化为什么会有精度丢失的问题呢??
因为二者的存储结构决定的。
int是准确值,而float是精确值,准确转精确当然会精度丢失。
int和float的存储结构不一致的原因导致的。
int的存储结构是:
一个符号位 31个指数位
如果你看了上面的补码的话,应该能够理解并且能计算出int的最大/小值范围了。
理论上,指数全为1即为最大/小值。 maxInt = 2*1的0次方+2*1的1次方+2*1的2次方+....+2*1的30次方 = 2的31次方-1 minInt = -2的31次方-1 但是你去看下java中定义的int的最大/小值却发现,最小值却不是上面那个,而是-2的31次方。 为什么呢? 原因就是补码啊.用补码可以来向下表示1. 详情可以看看我上面推荐的那篇文章(好好看,不难的)。看完了,你就应该明白我说的啦。-2的31次方存储的格式应该就是 10000000 00000000 00000000 00000000
而float虽然也是4字节32位,但是float的存储结构是很不一样的
以这一例子来说明,由图可知,float的存储结构是1个符号位,8个指数位,23个尾数。
符号位,表述浮点数的正或者负,0代表正,1代表负。
指数位,实际也是有正负的,但是没有单独的符号位,在计算机的世界里,进位都是二进制的,指数表示的也是2的N次幂,8位指数表达的范围是0到255,而对应的实际的指数是-127到128。也就是说实际的指数等于指数位表示的数值减127。这里特殊说明,-127和+128这两个指数数值在IEEE当中是保留的用作多种用途的,这里就不多做介绍了,有兴趣的可以查阅其他资料。
尾数位,只代表了二进制的小数点后的部分,小数点前的那位被省略了,当指数位全部为0时省略的是0否则省略的是1。
由此我们可以明白,实际上尾数确定了浮点数的精度,而数的大小主要是靠指数位,尾数只有23位,加上省略的那一位便是24位,float只能有24位来确定精度,而int是32位。其他类型也如此进行理解即可。
——————-补充——————-
java中的float类型遵循 IEEE754标准(这个规定了二进制浮点型数标准)。
举个例子来说明下吧。
12.5在计算机中的储存结构是什么样呢??
先将十进制转化为二进制
12.5(10) = 1100.1(2) 这个不会的去搜下十进制转二进制。
然后计算尾数。
也就是最后的23位,第24位默认为1。所以1100.1左移3位即为1.1001,又因为高位位1,所以1可以省略,所以尾数部分为 1001000 00000000 00000000。
再然后呢,就是计算指数。
刚才计算尾数左移了3位,相当于乘以2的3次方即为8,再加上127即为最后的指数,10000111,
因为是正数,所以符号位为0
12.5在计算机中的储存就是
0 1000011 1 1001000 00000000 00000000
我在看的时候还纠结一个问题,那就是关于float最大最小值的问题。
通过上面的那个公式还有那个IEEE754标准 就可以算出float的最大值及最小值,包括浮点型的有效位数。
大家可以自己先挣扎下,我明天再写。
float的取值范围:
负无穷 —— −2的128次方 ~~~ −2的149次方 —— 0 —— 2的149次方 ~~2的128次方 —— 正无穷
有意义的指数,正规形式的最大,取其最大值2的8次方-2,即为254,减去127,即为实际计算的指数127.
后面的指数都为1的情况下,值最大。
大家套用上面那个图上的公式。
(-1) sign次方 * 2的127次方 * (1+1*2的-1次方+1*2的-2次方+…+1*2的-23次方)
maxOrMinValue = (+/-)2的127次方*(1+(2的23次方-1)/2的23次方)
这个就是它的最大/小值。接近(+/-)2的128次方,但是取不到128次方的值。
至于(+/-)2的-149次方,这个怎么得出来的。 按照非规约形式得到的。
指数部分为0的情况下,减去127得到实际计算指数-127,后面位数部分在非规约模式的情况下,不能为0最小的情况就是指数为0位值为1,也就是2的-23次方。
两者相加,是(+/-2的150次方)。 为什么是149次方呢。解释是全0,1位特殊值,不做范围内取值,所以指数位最小为1.则实际计算指数则为-126.最终的结果就是(+/-)2的149次方。
这样就计算得出了。
在IEEE754标准 中还规定了无穷大,无意义的值,有兴趣可以去看下啊。
float精度值
float的尾数:23位,其范围为:0~223,而2的23次方=8388608=106.92,所以float的精度为6~7位,能保证6位为绝对精确,7位一般也是正确的,8位就不一定了(但不是说8位就绝对不对了),注意这里的6~7位是有效小数位(大的数你先需要转换成小数的指数形式,例如:8317637.5,其有效小数位:8.3176375E6,七位),而有效位(从第一个不为0的开始数)是7~8位,是包括整数位的,像8317637.5,你不转换,则要从有效位的角度来看,有8位有效位。
你可以用大于2的30次方的int类型数强转成float对比下,看看是不是出现了精度丢失。
参考链接
参考链接1
相关文章推荐
- java理解int转float为何会可能精度丢失的问题
- 关于java中float和int 精度和范围的问题
- Java中double和float精度丢失问题及解决方法
- java数值范围以及float与double精度丢失问题
- Java Float类型 减法运算时精度丢失问题
- java中double和float精度丢失问题
- Java Float类型 减法运算时精度丢失问题
- java float double精度为什么会丢失?浅谈java的浮点数精度问题
- 【java解惑】int转化为float精度问题
- java float double精度为什么会丢失?浅谈java的浮点数精度问题
- JAVA程序中Float和Double精度丢失问题
- JAVA程序中Float和Double精度丢失问题
- java中double、float类型计算精度丢失问题
- Java Float类型 减法运算时精度丢失问题
- java中double和float精度丢失问题及解决方法
- java float double精度为什么会丢失?浅谈java的浮点数精度问题
- Java Float类型 减法运算时精度丢失问题
- Java Float类型 减法运算时精度丢失问题 -
- Java Float类型 减法运算时精度丢失问题
- Java double和 float丢失精度问题