编程导航算法通关村第十五关 | 用4KB内存寻找重复元素

60 阅读2分钟

用4KB内存寻找重复元素

题目要求:给定一个数组,包含从1到N的整数,N最大为32000,数组可能还有重复值,且N的取值不定,若只有4KB的内存可用,该如何打印数组中所有重复元素。

int [32000]={2,1,22,111,222 ...};

Hash  ->[32000]   o(n)

 int array[32000]->32K
正的推:
每个位置表示的是对应的十进制顺序数是否存在:
位:  [1][0][0][1] [0][1][0][0] [1][1][1][1]  [0][1][0][1]
二进制: [1001] [0100] [1111]  [0101]
十六进制:94 f5


位怎么存?
112
32000: [1][0][1][0][][][]..[1]..[][][][][][1][1][1][1][0][1][0][0]
32000: [1][0][1][0][][][]....[][][][][]  f4

反推:
32000位->4K*8位->4KB
int 32位
 
4KB-> 4*1024*8->   32*1024   我们需要的: 32000
32*24


int 32 ->位 

分析:本身是一道海量数据问题的热身题,如果去掉“只有4KB”的要求,我们可以先创建一个大小为N的数组,然后将这些数据放进来,但是整数最大为32000。如果直接采用数组存,则应该需要32000*4B=128KB的空间,而题目有4KB的内存限制,我们就必须先解决该如何存放的问题。

如果只有4KB的空间,那么只能寻址8*4*2^10个比特,这个值比32000要大的,因此我们可以创建32000比特的位向量(比特数组),其中一个比特位置就代表一个整数。

利用这个位向量,就可以遍历访问整个数组。如果发现数组元素是v,那么就将位置为v的设置为1,碰到重复元素,就输出一下。

public class FindDuplicatesIn32000 {
    public void checkDuplicates(int[] array) {
        BitSet bs = new BitSet(32000);
        for (int i = 0; i < array.length; i++) {
            int num = array[i];
            int num0 = num - 1;
            if (bs.get(num0)) {
                System.out.println(num);
            } else {
                bs.set(num0);
            }
        }
    }
    class BitSet {
        int[] bitset;

        public BitSet(int size) {
            this.bitset = new int[size >> 5];
        }

        boolean get(int pos) {
            int wordNumber = (pos >> 5);//除以32
            int bitNumber = (pos & 0x1F);//除以32
            return (bitset[wordNumber] & (1 << bitNumber)) != 0;
        }

        void set(int pos) {
            int wordNumber = (pos >> 5);//除以32
            int bitNumber = (pos & 0x1F);//除以32
            bitset[wordNumber] |= 1 << bitNumber;
        }
    }
}