阅读 5126

0.1+0.2 !== 0.3?

前言

众所周知,JavaScript在计算某些浮点数的运算时会出现精度的丢失,比如你在控制台输入0.1+0.2,得到的结果是0.30000000000000004而不是0.3,原因是什么?

世界上有两种人,懂二进制和不懂二进制的人

我们知道,计算机里所有的数据最终都是以二进制保存的,当然数字也一样。所以当计算机计算0.1+0.2的时候,实际上计算的是这两个数字在计算机里所存储的二进制,那么0.1在JavaScript里存储的二进制到底是多少? 我们先根据十进制转二进制的方法,把0.1转化为二进制是:0.0001100110011001100...(1100循环),然后把0.2转化为二进制是:0.00110011001100...(1100循环)。 我们发现,它们都是无限循环的二进制。显然,计算机当然不会用自己“无限的空间”去存储这些无限循环的二进制数字。那对于这类数据该怎么办?

JavaScript如何存储无限循环的二进制小数?

不同的语言可能会有不同的存储标准,JavaScript中所用的数字包括整数和小数,都只有一种类型就是Number,它的实现遵循IEEE 754标准,使用64位固定长度来表示,也就是标准的double双精度浮点数(相关的还有float 32位单精度),具体的双精度浮点数的存储方式这里不再赘述(可以看后面章节的详细描述),我们只需要知道,在二进制科学表示法中,双精度浮点的小数部分最多只能保留52位(比如1.xxx...*2^n,这里x最多保留52位)加上前面的1,其实就是保留53位有效数字,剩余的舍去,遵从“0舍1入”,那么0.1的二进制舍去之后就是:

0.00011001100110011001100110011001100110011001100110011010
复制代码

同理我们得到0.2的舍去之后的二进制表示为:

0.0011001100110011001100110011001100110011001100110011010
复制代码

二者相加得到:

0.00011001100110011001100110011001100110011001100110011010 +
0.0011001100110011001100110011001100110011001100110011010 =
0.0100110011001100110011001100110011001100110011001100111
复制代码

我们把结果根据公式或者工具转为十进制:

可以看到结果正好为:0.30000000000000004

注:大多数语言中的小数默认都是遵循 IEEE 754 的 float 浮点数,包括 Java、Ruby、Python,本文中的浮点数问题同样存在。

浮点数是如何保存的

在计算机中,浮点表示法,分为三大部分,如上图所示:

  • 第一部分(蓝色)用来存储符号位(sign),用来区分正负数,0表示正数
  • 第二部分(绿色)用来存储指数(exponent)
  • 第三部分(红色)用来存储小数(fraction)

双精度浮点数一共占据64位:

  • 符号位(sign)占用1位
  • 指数位(exponent)占用11位
  • 小数位(fraction)占用52位

这里的符号位、指数位、小数位是和科学记数法联系在一起的。 我们以78.735为例

最后的1.001110011*2^6就是科学记数法,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这就叫浮点数。 那我们不妨根据这个规定,对号入座,把78.735转化为双精度的表示法,符号位和小数位很明显能看出来,只需要把指数部分6转化为二进制是110就可以了,最终为:

0(sign) 00000000110(exponent) 00111001 10000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
复制代码

(这个结果其实错误的,具体为什么错,继续看下文)

我们再根据双精度规范,来看看上文提到的0.1到底是如何存储的,我们已知它的二进制是:

0.00011001100110011001100110011001100110011001100110011001 10011...
复制代码

转化为科学表示法就是:

1.1001100110011001100110011001100110011001100110011001*2^-4
复制代码

也就是说0.1的:

  • 符号位为:0
  • 小数位为:1001100110011001100110011001100110011001100110011001
  • 指数位为:-4

到这里我就懵逼了,-4怎么转为二进制呢,虽然双精度浮点规范规定了一个符号位,但是这个符号位表示的是整个数据的正负,而非指数的正负,难道还要保留一位专门存储指数的正负吗?答案是否定的。

指数位为负数的怎么保存?

为了减少不必要的麻烦,IEEE规定了一个偏移量,这个偏移量是干嘛用的呢,就是对于指数部分,每次都加这个偏移量进行保存,这样即使指数是负数,那么加上这个偏移量也变为正数啦。为了使所有的负指数加上这个偏移量都能够变为正数,这个偏移量的设置也是有规律的。 以double双精度为例,我们知道它的指数部分是二进制的11位,那么能够表示的数据范围就是0~2047,IEEE规定1023为双精度的偏移量。

  1. 当指数位不全是0也不全是1时(规格化的数值),IEEE规定,阶码计算公式为 e-Bias。 此时e最小值是1,则1-1023= -1022,e最大值是2046,则2046-1023=1023,可以看到,这种情况下取值范围是-1022~1013
  2. 当指数位全部是0的时候(非规格化的数值),IEEE规定,阶码的计算公式为1-Bias,即1-1023= -1022
  3. 当指数位全部是1的时候(特殊值),IEEE规定这个浮点数可用来表示3个特殊值,分别是正无穷,负无穷,NaN(not a number)。 具体的,小数位不为0的时候表示NaN;小数位为0时,当符号位s=0时表示正无穷,s=1时候表示负无穷。

这个时候我们再看78.735的到底该如何转化,指数部分存储的时候需要加上偏移量6+1023就是1029,转化为二进制就是: 10000000101,所以78.735正确存储方式为:

0 10000000101 00111001 10000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
复制代码

同理,你是否也知道0.1的双精度的浮点存储形式了呢?

浮点数值的范围

如果你认真读到了这里,想必你应该能推算出JavaScript的所能表示的数值范围了吧。 e的最大值是1023。 1.111..(52位)..11*2^1023 转为普通二进制就是:

1 111..(52位)..11 000..(971位)..00
复制代码

把二进制转为十进制就是:

我们会发现这个值和Number.MAX_VALUE的值一致,都是1.7976931348623157e+308。 但实际上这个值还不算最大,比如我们在此数值基础上继续加一些数,发现并没有返回Infinity
所以Number.MAX_VALUEInfinity之间还存在很多数,根据IEEE规范我们可以得知,正无穷当且仅当是指数部分全为1(指数部分的最大值Math.pow(2,11)-1-1023 == 1024),小数部分为0的时候,就是:

1.000...*2^1024
复制代码

所以Math.pow(2,1024)就是正无穷,那么其实JavaScript所能存储的最大数字是Math.pow(2,1024)-1。 但是Number.MAX_VALUEMath.pow(2,1024)之间的数据我们无法正常表示出来,精度会丢失。 同理也可推算最小数。

JavaScript的最大安全整数

所谓安全范围,就是我们在这个范围内计算不会出现精度的丢失。 根据双精度的定义,可以得知,最大的安全整数:

1.11..(52位)*2^52
复制代码

转为十进制就是Math.pow(2,53)-1,即9007199254740991

在JavaScript中,有Number.MAX_SAFE_INTEGER来表示最大安全整数

我们发现和我们自己推算出来的值是一样的。

如何解决计算误差问题

这里推荐Number-Precision库,不到1K的体积。

参考文章:

  1. 抓住数据的尾巴
  2. java浮点类型float和double的主要区别,它们的小数精度范围大小是多少? - Boss呱呱的回答 - 知乎