您的位置：首页 > 编程语言 > Java开发

在Java中实现浮点数的精确计算

2013-06-04 03:04 525 查看

问题的提出：

如果我们编译运行下面这个程序会看到什么？

public class Test{

public static void main(String args[]){

System.out.println(0.05+0.01);

System.out.println(1.0-0.42);

System.out.println(4.015*100);

System.out.println(123.3/100);

}

};

你没有看错！结果确实是

0.060000000000000005

0.5800000000000001

401.49999999999994

1.2329999999999999

Java中的简单浮点数类型float和double不能够进行运算。不光是Java，在其它很多编程语言中也有这样的问题。在大多数情况下，计算的结果是准确的，但是多试几次（可以做一个循环）就可以试出类似上面的错误。现在终于理解为什么要有BCD码了。

这个问题相当严重，如果你有9.999999999999元，你的计算机是不会认为你可以购买10元的商品的。

在有的编程语言中提供了专门的货币类型来处理这种情况，但是Java没有。现在让我们看看如何解决这个问题。

四舍五入

我们的第一个反应是做四舍五入。Math类中的round方法不能设置保留几位小数，我们只能象这样（保留两位）：

public double round(double value){

return Math.round(value*100)/100.0;

}

非常不幸，上面的代码并不能正常工作，给这个方法传入4.015它将返回4.01而不是4.02，如我们在上面看到的

4.015*100=401.49999999999994

因此如果我们要做到精确的四舍五入，不能利用简单类型做任何运算

java.text.DecimalFormat也不能解决这个问题：

System.out.println(new java.text.DecimalFormat("0.00").format(4.025));

输出是4.02

BigDecimal

在《Effective Java》这本书中也提到这个原则，float和double只能用来做科学计算或者是工程计算，在商业计算中我们要用 java.math.BigDecimal。BigDecimal一共有4个够造方法，我们不关心用BigInteger来够造的那两个，那么还有两个，它们是：

BigDecimal(double val)

Translates a double into a BigDecimal.

BigDecimal(String val)

Translates the String repre sentation of a BigDecimal into a BigDecimal.

上面的API简要描述相当的明确，而且通常情况下，上面的那一个使用起来要方便一些。我们可能想都不想就用上了，会有什么问题呢？等到出了问题的时候，才发现上面哪个够造方法的详细说明中有这么一段：

Note: the results of this constructor can be somewhat unpredictable. One might assume that new BigDecimal(.1) is exactly equal to .1, but it is actually equal to .1000000000000000055511151231257827021181583404541015625. This is so because .1 cannot be represented
exactly as a double (or, for that matter, as a binary fraction of any finite length). Thus, the long value that is being passed in to the constructor is not exactly equal to .1, appearances nonwithstanding.

The (String) constructor, on the other hand, is perfectly predictable: new BigDecimal(".1") is exactly equal to .1, as one would expect. Therefore, it is generally recommended that the (String) constructor be used in preference to this one.

原来我们如果需要精确计算，非要用String来够造BigDecimal不可！在《Effective Java》一书中的例子是用String来够造BigDecimal的，但是书上却没有强调这一点，这也许是一个小小的失误吧。

解决方案

现在我们已经可以解决这个问题了，原则是使用BigDecimal并且一定要用String来够造。

但是想像一下吧，如果我们要做一个加法运算，需要先将两个浮点数转为String，然后够造成BigDecimal，在其中一个上调用add方法，传入另一个作为参数，然后把运算的结果（BigDecimal）再转换为浮点数。你能够忍受这么烦琐的过程吗？下面我们提供一个工具类Arith来简化操作。它提供以下静态方法，包括加减乘除和四舍五入：

public static double add(double v1,double v2)

public static double sub(double v1,double v2)

public static double mul(double v1,double v2)

public static double div(double v1,double v2)

public static double div(double v1,double v2,int scale)

public static double round(double v,int scale)

附录

源文件Arith.java：

import java.math.BigDecimal;

/**

* 由于Java的简单类型不能够精确的对浮点数进行运算，这个工具类提供精

* 确的浮点数运算，包括加减乘除和四舍五入。

*/

public class Arith{

//默认除法运算精度

private static final int DEF_DIV_SCALE = 10;

//这个类不能实例化

private Arith(){

}

/**

* 提供精确的加法运算。

* @param v1 被加数

* @param v2 加数

* @return 两个参数的和

*/

public static double add(double v1,double v2){

BigDecimal b1 = new BigDecimal(Double.toString(v1));

BigDecimal b2 = new BigDecimal(Double.toString(v2));

return b1.add(b2).doubleValue();

}

/**

* 提供精确的减法运算。

* @param v1 被减数

* @param v2 减数

* @return 两个参数的差

*/

public static double sub(double v1,double v2){

BigDecimal b1 = new BigDecimal(Double.toString(v1));

BigDecimal b2 = new BigDecimal(Double.toString(v2));

return b1.subtract(b2).doubleValue();

}

/**

* 提供精确的乘法运算。

* @param v1 被乘数

* @param v2 乘数

* @return 两个参数的积

*/

public static double mul(double v1,double v2){

BigDecimal b1 = new BigDecimal(Double.toString(v1));

BigDecimal b2 = new BigDecimal(Double.toString(v2));

return b1.multiply(b2).doubleValue();

}

/**

* 提供（相对）精确的除法运算，当发生除不尽的情况时，精确到

* 小数点以后10位，以后的数字四舍五入。

* @param v1 被除数

* @param v2 除数

* @return 两个参数的商

*/

public static double div(double v1,double v2){

return div(v1,v2,DEF_DIV_SCALE);

}

/**

* 提供（相对）精确的除法运算。当发生除不尽的情况时，由scale参数指

* 定精度，以后的数字四舍五入。

* @param v1 被除数

* @param v2 除数

* @param scale 表示表示需要精确到小数点以后几位。

* @return 两个参数的商

*/

public static double div(double v1,double v2,int scale){

if(scale<0){

throw new IllegalArgumentException(

"The scale must be a positive integer or zero");

}

BigDecimal b1 = new BigDecimal(Double.toString(v1));

BigDecimal b2 = new BigDecimal(Double.toString(v2));

return b1.divide(b2,scale,BigDecimal.ROUND_HALF_UP).doubleValue();

}

/**

* 提供精确的小数位四舍五入处理。

* @param v 需要四舍五入的数字

* @param scale 小数点后保留几位

* @return 四舍五入后的结果

*/

public static double round(double v,int scale){

if(scale<0){

throw new IllegalArgumentException(

"The scale must be a positive integer or zero");

}

BigDecimal b = new BigDecimal(Double.toString(v));

BigDecimal one = new BigDecimal("1");

return b.divide(one,scale,BigDecimal.ROUND_HALF_UP).doubleValue();

}

};

-------------------------------------------------------------------------------------------------------------------------------------------------------------

-----------------------------------------------------------------------------------------------------------------------------------------------------------------

对于精确计算不提倡使用float，double，因为会丢失精度，这是为什么呢？让我细细说来

1. 什么是浮点数？

表示一个数字如100.2，可以是Fixed point也就是100.2，也可以是Floating point（也就是科学计数法scientific notation）1.002 × 102.

通常是以第一个非零数字作为小数点前的数，也被称为normalized form，也就是说上面的数字不会表示成100.2 ×
100

或0.1002 ×
103

浮点数的优点是能表示Fixed point无法表示的超大和超小数值

2. IEEE
Standard 754关于floating
number在计算机中表示的定义。

Java中float（单精度浮点），double（双精度浮点）也遵照次标准设计。

The
sign bit is 0 for positive, 1 for negative. 符号位0是正，1是负

The
exponent(幂值)'s base is two. 幂值是2

The
exponent field contains 127 plus the true exponent for single-precision(单精度),

or 1023 plus the true exponent for double precision(双精度).

The
first bit of the mantissa is typically assumed to be 1.f,
where f is
the field of fraction bits.

尾数中第一位任何情况下都是1（因为binary中只有0,1），所以不用占空间，所以fraction bits都用来存储.f

图示如下：
float(32位)：

double(64位):

3.为什么会有精度丢失？
拿单精度浮点float为例，正常的整数integer，可以用全部32位表示数字，而Single
Precision只能有24位存储数值，这24位是没办法
match 32位的精度的，所以就会丢失。例如：
11110000
11001100 10101010 00001111 // 32-bit integer = +1.1110000 11001100 10101010 x 231 //
Single-Precision Float = 11110000 11001100 10101010 00000000 // Corresponding Value

4.如何解决？
通常会用long和BigDecimal来替代float，double。比如eBay内部的Money类，

就是用long来做internal value存储amount的数值的。

5.Java考题常出现
当你不声明的时候，默认小数都用double来表示，所以如果要用float的话，则应该在其后加上f

例如：float
a=1.3;

则会提示不能将double转化成float 这是窄型转化。
如果要用float来修饰的话，则应该使用float
a=1.3f

6.Java变量取值范围
byte的取值范围为-128~127，占用1个字节（-2的7次方到2的7次方-1）short的取值范围为-32768~32767，占用2个字节（-2的15次方到2的15次方-1）int的取值范围为（-2147483648~2147483647），占用4个字节（-2的31次方到2的31次方-1）long的取值范围为（-9223372036854774808~9223372036854774807），占用8个字节（-2的63次方到2的63次方-1）float
(单精度浮点）约等于(-1 x 2-127
~ +1 x 2127），占4个字节（指数段8bits）

double（双精度浮点）约等于(-1 x 2-1023
~ +1 x 21023），占8个字节（指数段11bits）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航