前言
众所周知,JavaScript在计算某些浮点数的运算时会出现精度的丢失,比如你在控制台输入0.1+0.2
,得到的结果是0.30000000000000004
而不是0.3
,原因是什么?
世界上有两种人,懂二进制和不懂二进制的人
我们知道,计算机里所有的数据最终都是以二进制保存的,当然数字也一样。所以当计算机计算0.1+0.2
的时候,实际上计算的是这两个数字在计算机里所存储的二进制,那么0.1
在JavaScript里存储的二进制到底是多少?
我们先根据十进制转二进制的方法,把0.1
转化为二进制是:0.0001100110011001100...
(1100循环),然后把0.2
转化为二进制是:0.00110011001100...
(1100循环)。
我们发现,它们都是无限循环的二进制。显然,计算机当然不会用自己“无限的空间”去存储这些无限循环的二进制数字。那对于这类数据该怎么办?
JavaScript如何存储无限循环的二进制小数?
不同的语言可能会有不同的存储标准,JavaScript中所用的数字包括整数和小数,都只有一种类型就是Number
,它的实现遵循IEEE 754标准,使用64位固定长度来表示,也就是标准的double双精度浮点数(相关的还有float 32位单精度),具体的双精度浮点数的存储方式这里不再赘述(可以看后面章节的详细描述),我们只需要知道,在二进制科学表示法中,双精度浮点的小数部分最多只能保留52位(比如1.xxx...*2^n
,这里x
最多保留52位)加上前面的1,其实就是保留53位有效数字,剩余的舍去,遵从“0舍1入”,那么0.1
的二进制舍去之后就是:
0.00011001100110011001100110011001100110011001100110011010
同理我们得到0.2
的舍去之后的二进制表示为:
0.0011001100110011001100110011001100110011001100110011010
二者相加得到:
0.00011001100110011001100110011001100110011001100110011010 +
0.0011001100110011001100110011001100110011001100110011010 =
0.0100110011001100110011001100110011001100110011001100111
我们把结果根据公式或者工具转为十进制:
可以看到结果正好为:0.30000000000000004
。
注:大多数语言中的小数默认都是遵循 IEEE 754 的 float 浮点数,包括 Java、Ruby、Python,本文中的浮点数问题同样存在。
浮点数是如何保存的
在计算机中,浮点表示法,分为三大部分,如上图所示:
- 第一部分(蓝色)用来存储符号位(sign),用来区分正负数,0表示正数
- 第二部分(绿色)用来存储指数(exponent)
- 第三部分(红色)用来存储小数(fraction)
双精度浮点数一共占据64位:
- 符号位(sign)占用1位
- 指数位(exponent)占用11位
- 小数位(fraction)占用52位
这里的符号位、指数位、小数位是和科学记数法联系在一起的。
我们以78.735
为例
最后的
1.001110011*2^6
就是科学记数法,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这就叫浮点数。
那我们不妨根据这个规定,对号入座,把78.735
转化为双精度的表示法,符号位和小数位很明显能看出来,只需要把指数部分6
转化为二进制是110
就可以了,最终为:
0(sign) 00000000110(exponent) 00111001 10000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
(这个结果其实错误的,具体为什么错,继续看下文)
我们再根据双精度规范,来看看上文提到的0.1
到底是如何存储的,我们已知它的二进制是:
0.00011001100110011001100110011001100110011001100110011001 10011...
转化为科学表示法就是:
1.1001100110011001100110011001100110011001100110011001*2^-4
也就是说0.1
的:
- 符号位为:
0
- 小数位为:
1001100110011001100110011001100110011001100110011001
- 指数位为:
-4
到这里我就懵逼了,-4
怎么转为二进制呢,虽然双精度浮点规范规定了一个符号位,但是这个符号位表示的是整个数据的正负,而非指数的正负,难道还要保留一位专门存储指数的正负吗?答案是否定的。
指数位为负数的怎么保存?
为了减少不必要的麻烦,IEEE规定了一个偏移量,这个偏移量是干嘛用的呢,就是对于指数部分,每次都加这个偏移量进行保存,这样即使指数是负数,那么加上这个偏移量也变为正数啦。为了使所有的负指数加上这个偏移量都能够变为正数,这个偏移量的设置也是有规律的。
以double双精度为例,我们知道它的指数部分是二进制的11位,那么能够表示的数据范围就是0~2047
,IEEE规定1023
为双精度的偏移量。
- 当指数位不全是0也不全是1时(规格化的数值),IEEE规定,阶码计算公式为
e-Bias
。 此时e最小值是1,则1-1023= -1022
,e最大值是2046
,则2046-1023=1023
,可以看到,这种情况下取值范围是-1022~1013
。 - 当指数位全部是0的时候(非规格化的数值),IEEE规定,阶码的计算公式为
1-Bias
,即1-1023= -1022
。 - 当指数位全部是1的时候(特殊值),IEEE规定这个浮点数可用来表示3个特殊值,分别是正无穷,负无穷,
NaN(not a number)
。 具体的,小数位不为0的时候表示NaN;小数位为0时,当符号位s=0时表示正无穷,s=1时候表示负无穷。
这个时候我们再看78.735
的到底该如何转化,指数部分存储的时候需要加上偏移量6+1023
就是1029
,转化为二进制就是:
10000000101
,所以78.735
正确存储方式为:
0 10000000101 00111001 10000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
同理,你是否也知道0.1
的双精度的浮点存储形式了呢?
浮点数值的范围
如果你认真读到了这里,想必你应该能推算出JavaScript的所能表示的数值范围了吧。
e的最大值是1023。
1.111..(52位)..11*2^1023
转为普通二进制就是:
1 111..(52位)..11 000..(971位)..00
把二进制转为十进制就是:
我们会发现这个值和
Number.MAX_VALUE
的值一致,都是1.7976931348623157e+308
。
但实际上这个值还不算最大,比如我们在此数值基础上继续加一些数,发现并没有返回Infinity
。
所以
Number.MAX_VALUE
和Infinity
之间还存在很多数,根据IEEE规范我们可以得知,正无穷当且仅当是指数部分全为1(指数部分的最大值Math.pow(2,11)-1-1023 == 1024
),小数部分为0的时候,就是:
1.000...*2^1024
所以Math.pow(2,1024)
就是正无穷,那么其实JavaScript所能存储的最大数字是Math.pow(2,1024)-1
。
但是Number.MAX_VALUE
和Math.pow(2,1024)
之间的数据我们无法正常表示出来,精度会丢失。
同理也可推算最小数。
JavaScript的最大安全整数
所谓安全范围,就是我们在这个范围内计算不会出现精度的丢失。 根据双精度的定义,可以得知,最大的安全整数:
1.11..(52位)*2^52
转为十进制就是Math.pow(2,53)-1
,即9007199254740991
。
在JavaScript中,有
Number.MAX_SAFE_INTEGER
来表示最大安全整数我们发现和我们自己推算出来的值是一样的。
如何解决计算误差问题
这里推荐Number-Precision库,不到1K的体积。
参考文章: