源码劝退师:看源码一定要会的位运算、补码、反码、原码

5,188 阅读8分钟

在平时看各种框架的源码的过程中,经常会看到一些位移运算,所以作为一个Java开发者是一定掌握位移运算的。 在这里插入图片描述

另外本人整理了20年面试题大全,包含spring、并发、数据库、Redis、分布式、dubbo、JVM、微服务等方面总结,以及面试真题总结,需要的话点连接自行领取:腾讯文档

正数位移运算

Java中有三个位移运算:

• <<:左移 • >>:右移 • >>>:无符号右移

我们直接看一下Demo:

System.out.println(2 << 1);     // 4
System.out.println(2 >> 1);     // 1
System.out.println(2 >>> 1);    // 1
System.out.println(-2 << 1);    // -4
System.out.println(-2 >> 1);    // -1
System.out.println(-2 >>> 1);   // 2147483647

乍一眼看到上面Demo的打印结果,你应该是懵逼的,接下来我来解释一下这个结果到底是如何运算出来的。 上面的Demo中有“2”和“-2”,这是两个十进制数,并且是int类型的(java中占四个字节),位运算是基于二进制bit来的,所以我们需要将十进制转换为二进制之后再进行运算

  • 2 << 1:十进制“2”转换成二进制为“00000000 00000000 00000000 00000010”,再将二进制左移一位,高位丢弃,低位补0,所以结果为“00000000 00000000 00000000 00000100”,换算成十进制则为“4”
  • 2 >> 1:十进制“2”转换成二进制为“00000000 00000000 00000000 00000010”,再将二进制右移一位,低位丢弃,高位补0,所以结果为“00000000 00000000 00000000 00000001”,换算成十进制则为“1” 对于这两种情况非常好理解,那什么是无符号右移,以及负数是怎么运算的呢? 我们先来看-2 << 1与-2 >> 1,这两个负数的左移与右移操作其实和正数类似,都是先将十进制数转换成二进制数,再将二进制数进行移动,所以现在的关键是负数如何用二进制数进行表示。

原码、反码、补码

接下来我们主要介绍十进制数用二进制表示的不同方法,所以为了简洁,我们用一个字节,也就是8个bit来表示二进制数。

原码

十进制原码
20000 0010
-21000 0010

原码其实是最容易理解的,只不过需要利用二进制中的第一位来表示符号位,0表示正数,1表示负数,所以可以看到,一个数字用二进制原码表示的话,取值范围是-111 1111 ~ +111 1111,换成十进制就是-127 ~ 127。

反码

在数学中我们有加减乘除,而对于计算机来说最好只有加法,这样计算机会更加简单高效,我们知道在数学中5-3=2,其实可以转换成5+(-3)=2,这就表示减法可以用加法表示,而乘法是加法的累积,除法是减法的累积,所以在计算机中只要有加法就够了。

一个数字用原码表示是容易理解的,但是需要单独的一个bit来表示符号位。并且在进行加法时,计算机需要先识别某个二进制原码是正数还是负数,识别出来之后再进行相应的运算。这样效率不高,能不能让计算机在进行运算时不用去管符号位,也就是说让符号位也参与运算,这就要用到反码。

十进制原码反码
20000 00100000 0010
-21000 00101111 1101

正数的反码和原码一样,负数的反码就是在原码的基础上符号位保持不变,其他位取反。 那么我们来看一下,用反码直接运算会是什么情况,我们以5-3举例。 5 - 3 等于 5 + (-3)

十进制原码反码
50000 01010000 0101
-31000 00111111 1100
5-3
= 5+(-3)
= 0000 0101(反码) + 1111 1100(反码) 
= 0000 0001(反码)
= 0000 0001(原码) 
= 1

这不对呀?!! 5-3=1?,为什么差了1? 我们来看一个特殊的运算:

1-1
= 1+(-1)
= 0000 0001(反码) + 1111 1110(反码)
= 1111 1111(反码)
= 1000 0000(原码)
= -0

我们再来看一个特殊的运算:

0+0
= 0000 0000(反码) + 0000 0000(反码)
= 0000 0000(反码)
= 0000 0000(原码)
= 0

我们可以看到1000 0000表示-0,0000 0000表示0,虽然-0和0是一样的,但是在用原码和反码表示时是不同的,我们可以理解为在用一个字节表示数字取值范围时,这些数字中多了一个-0,所以导致我们在用反码直接运算时符号位可以直接参加运算,但是结果会不对。

补码

为了解决反码的问题就出现了补码。

十进制原码反码补码
20000 00100000 00100000 0010
-21000 00101111 11011111 1110

正数的补码和原码、反码一样,负数的补码就是反码+1。

十进制原码反码补码
50000 01010000 01010000 0101
-31000 00111111 11001111 1101
5-3
= 5+(-3)
= 0000 0101(补码) + 1111 1101(补码)
= 0000 0010(补码)
= 0000 0010(原码) 
= 2

5-3=2!!正确。 再来看特殊的:

1-1
= 1+(-1)
= 0000 0001(补码) + 1111 1111(补码)
= 0000 0000(补码)
= 0000 0000(原码)
= 0

1-1=0!!正确 再来看一个特殊的运算:

0+0
= 0000 0000(补码) + 0000 0000(补码)
= 0000 0000(补码)
= 0000 0000(原码)
= 0

0+0=0!!也正确。 所以,我们可以看到补码解决了反码的问题。 所以对于数字,我们可以使用补码的形式来进行二进制表示。

负数位移运算

我们再来看-2 << 1与-2 >> 1。 -2用原码表示为10000000 00000000 00000000 00000010 -2用反码表示为11111111 11111111 11111111 11111101 -2用补码表示为11111111 11111111 11111111 11111110 -2 << 1,表示-2的补码左移一位后为11111111 11111111 11111111 11111100,该补码对应的反码为

11111111 11111111 11111111 11111100
- 1
= 11111111 11111111 11111111 11111011

该反码对应的原码为:符号位不变,其他位取反,为10000000 00000000 00000000 00000100,表示-4。 所以-2 << 1 = -4。 同理-2 >> 1是一样的计算方法,这里就不演示了。

无符号右移

上面在进行左移和右移时,我有一点没讲到,就是在对补码进行移动时,符号位是固定不动的,而无符号右移是指在进行移动时,符号位也会跟着一起移动。 比如-2 >>> 1。 -2用原码表示为10000000 00000000 00000000 00000010 -2用反码表示为11111111 11111111 11111111 11111101 -2用补码表示为11111111 11111111 11111111 11111110 -2的补码右移1位为:01111111 11111111 11111111 11111111 右移后的补码对应的反码、原码为:01111111 11111111 11111111 11111111 (因为现在的符号位为0,表示正数,正数的原、反、补码都相同) 所以,对应的十进制为2147483647。 也就是-2 >>> 1 = 2147483647

总结

文章写的可能比较乱,希望大家能看懂,能有所收获。这里总结一下,我们可以发现: 2 << 1 = 4 = 2* 2 2 << 2 = 8 = 2* 2* 2 2 << n = 2* 2n m << n = m * 2n 右移则相反,所以大家以后在源码中再看到位运算时,可以参考上面的公式。