哈希表

61 阅读5分钟

本文仅介绍拉链法和开放定址法两种实现哈希表的方法。

哈希表的特点:

  • 维护一个散列函数,可以通过对象的hash值进行定位。
  • 解决hash冲突。

Acwing 840. 模拟散列表

维护一个集合,支持如下几种操作:

  1. I x,插入一个整数 x;
  2. Q x,询问整数 x 是否在集合中出现过;

现在要进行 N 次操作,对于每个询问操作输出对应的结果。

输入格式

第一行包含整数 N,表示操作数量。

接下来 N 行,每行包含一个操作指令,操作指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤N≤105 −109≤x≤109

输入样例:

5
I 1
I 2
I 3
Q 2
Q 5

输出样例:

Yes
No

拉链法思路

通过维护三个数组, h, e, ne和数组下标idx去模拟哈希表。其中: h数组保存的是当前的对象存放的下标,e数组保存对象的值, ne保存的是h数组每个下标发生哈希冲突时候的链表。

Code

import java.util.*;


public class Main{
    final static int N = 100003;
    static int [] h = new int[N];
    static int [] e = new int[N];
    static int [] ne = new int[N];
    static int idx;
    public static void insert(int x) {
        int k = (x % N + N) % N; // 防止出现负数,x是负数的话也要进行映射
        e[idx] = x; // 保存当前插入的值
        ne[idx] = h[k]; // 映射链表指针, 这里相当于使用头插法的方式
        // 注意实际java中由于头插法在并发的时候可能会产生死循环, 所以更换为了尾插法
        h[k] = idx ++; // 更新k位置上的当前结点
    }
    
    public static boolean find(int x) {
        int k = (x % N + N) % N;
        for(int i = h[k] ; i != -1 ;i = ne[i]){
            if(e[i] == x) return true;
        }
        
        return false;
    }
    
    public static void main(String [] args) {
        int n;
        Arrays.fill(h, - 1);
        Scanner sc = new Scanner(System.in);
        n = sc.nextInt();
        sc.nextLine();
        for(int i = 0 ; i < n;i++){
            String [] s = sc.nextLine().split(" ");
            // System.out.println(s[1]);
            if(s[0].equals("I")) insert(Integer.parseInt(s[1]));
            else {
                
                if(find(Integer.parseInt(s[1]))) System.out.println("Yes");
                else System.out.println("No");
            }
        }
        
    }
    
    
}

开放定址法-线性探测法

ThreadLocal中使用的就是这个方法解决哈希冲突。

Code

#include <iostream>
#include <cstring>
using namespace std;
const int N = 200003,null = 0x3f3f3f3f;
int h[N],idx;

int  find(int x){//开放寻址法
    int t = ((x % N) + N) % N;//消去负数带来的影响
    while(h[t]!=null && h[t]!=x){//开放寻址法,如果这里没有数或者数相同就不用操作,返回t即可
        t++;
        if(t==N){//走到末尾就从头开始
            t = 0;
        }
    }
    return t;//找到最终的位置,如果这个位置是空的,返回的是应该存储的位置
}

int main(){
    int n;
    cin>>n;
    memset(h,0x3f,sizeof h);
    while(n--){
        string c;
        int x;
        cin>>c>>x;
        if(c == "I"){
            h[find(x)] = x;
        }else{
            if(h[find(x)] == null) puts("No");
            else puts("Yes");
        }
    }
    return 0;
}

AcWing 841. 字符串哈希

题目描述 给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2 请你判断[l1,r1] [12,r2]这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式 第一行包含整数n和m,表示字符串长度和询问次数。

第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。

接下来m行,每行包含四个整数l1,r1,l2,r2表示一次询问所涉及的两个区间。

注意,字符串的位置从1开始编号。

输出格式 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。

每个结果占一行。

数据范围 1≤n,m≤105

输入样例: 8 3

aabbaabb

1 3 5 7

1 3 6 8

1 2 1 2

输出样例:

Yes

No

Yes

解题思路

(字符串哈希) O(n)+O(m)

  1. 前缀哈希法,把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。
  2. 为了减少哈希冲突。我们通常使用p = 131和p = 13331这两个质数作为字符串哈希的进制数。
  3. 那么显然字符串长度太长的时候会出现数太大的情况甚至超过2的64次方。 这里由于long类型的表示范围就是2的64次方,并且超过会自动取模,所以叫做字符串哈希,因为这样的话相当于的用long的最大值作为模数。
  4. 对于字符串X1X2X3...Xn 映射公式 (X1 × Pn−1 + X2 × Pn−2 + ⋯ +Xn−1 × P1 + Xn × P0) mod Q 注意
  5. 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
  6. 冲突问题:设置P (131 或 13331) , Q (2的64次方) 的值,一般可以理解为不会产生冲突,但是只推荐在算法题使用。

Code

import java.util.*;
import java.io.*;

public class Main{
    static int P = 131;
    
    public static void main(String [] args) {
        int n, m;
        
        Scanner sc = new Scanner(System.in);
        n = sc.nextInt();
        m = sc.nextInt();
        long [] h = new long [n + 10];
        long [] p = new long[n + 10];
        p[0] = 1;
        String a;
        sc.nextLine();
        a = sc.nextLine();
        for(int i = 1; i <= n ;i++){
            p[i] = p[i - 1] * P;
            // 比如ABCDE,A是高位,E是低位, 理解成二进制,乘以P相当于二进制的左移操作
            h[i] = h[i - 1] * P + a.charAt(i - 1);
        }
        for(int i = 0 ; i < m;i++){
            int l1, r1, l2, r2;
            l1 = sc.nextInt(); r1 = sc.nextInt(); l2 = sc.nextInt(); r2 = sc.nextInt();
            // x1x2x3反着存储,x1 * p0 + ... + xn * pn-1
            String res = h[r1] - h[l1 - 1] * p[r1 - l1 + 1] == h[r2] - h[l2 - 1] * p[r2 - l2 + 1] ?
            "Yes" : "No";
            System.out.println(h[r1] - h[l1] * p[r1 - l1 + 1]);
            System.out.println(res);
        }
        
        
    }
    
}

参考

  • 题目来自于Acwing