本文仅介绍拉链法和开放定址法两种实现哈希表的方法。
哈希表的特点:
- 维护一个散列函数,可以通过对象的hash值进行定位。
- 解决hash冲突。
Acwing 840. 模拟散列表
维护一个集合,支持如下几种操作:
I x,插入一个整数 x;Q x,询问整数 x 是否在集合中出现过;
现在要进行 N 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 N,表示操作数量。
接下来 N 行,每行包含一个操作指令,操作指令为 I x,Q x 中的一种。
输出格式
对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1≤N≤105 −109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
拉链法思路
通过维护三个数组, h, e, ne和数组下标idx去模拟哈希表。其中: h数组保存的是当前的对象存放的下标,e数组保存对象的值, ne保存的是h数组每个下标发生哈希冲突时候的链表。
Code
import java.util.*;
public class Main{
final static int N = 100003;
static int [] h = new int[N];
static int [] e = new int[N];
static int [] ne = new int[N];
static int idx;
public static void insert(int x) {
int k = (x % N + N) % N; // 防止出现负数,x是负数的话也要进行映射
e[idx] = x; // 保存当前插入的值
ne[idx] = h[k]; // 映射链表指针, 这里相当于使用头插法的方式
// 注意实际java中由于头插法在并发的时候可能会产生死循环, 所以更换为了尾插法
h[k] = idx ++; // 更新k位置上的当前结点
}
public static boolean find(int x) {
int k = (x % N + N) % N;
for(int i = h[k] ; i != -1 ;i = ne[i]){
if(e[i] == x) return true;
}
return false;
}
public static void main(String [] args) {
int n;
Arrays.fill(h, - 1);
Scanner sc = new Scanner(System.in);
n = sc.nextInt();
sc.nextLine();
for(int i = 0 ; i < n;i++){
String [] s = sc.nextLine().split(" ");
// System.out.println(s[1]);
if(s[0].equals("I")) insert(Integer.parseInt(s[1]));
else {
if(find(Integer.parseInt(s[1]))) System.out.println("Yes");
else System.out.println("No");
}
}
}
}
开放定址法-线性探测法
ThreadLocal中使用的就是这个方法解决哈希冲突。
Code
#include <iostream>
#include <cstring>
using namespace std;
const int N = 200003,null = 0x3f3f3f3f;
int h[N],idx;
int find(int x){//开放寻址法
int t = ((x % N) + N) % N;//消去负数带来的影响
while(h[t]!=null && h[t]!=x){//开放寻址法,如果这里没有数或者数相同就不用操作,返回t即可
t++;
if(t==N){//走到末尾就从头开始
t = 0;
}
}
return t;//找到最终的位置,如果这个位置是空的,返回的是应该存储的位置
}
int main(){
int n;
cin>>n;
memset(h,0x3f,sizeof h);
while(n--){
string c;
int x;
cin>>c>>x;
if(c == "I"){
h[find(x)] = x;
}else{
if(h[find(x)] == null) puts("No");
else puts("Yes");
}
}
return 0;
}
AcWing 841. 字符串哈希
题目描述 给定一个长度为n的字符串,再给定m个询问,每个询问包含四个整数l1,r1,l2,r2 请你判断[l1,r1] [12,r2]这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式 第一行包含整数n和m,表示字符串长度和询问次数。
第二行包含一个长度为n的字符串,字符串中只包含大小写英文字母和数字。
接下来m行,每行包含四个整数l1,r1,l2,r2表示一次询问所涉及的两个区间。
注意,字符串的位置从1开始编号。
输出格式 对于每个询问输出一个结果,如果两个字符串子串完全相同则输出“Yes”,否则输出“No”。
每个结果占一行。
数据范围 1≤n,m≤105
输入样例: 8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
解题思路
(字符串哈希) O(n)+O(m)
- 前缀哈希法,把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。
- 为了减少哈希冲突。我们通常使用p = 131和p = 13331这两个质数作为字符串哈希的进制数。
- 那么显然字符串长度太长的时候会出现数太大的情况甚至超过2的64次方。 这里由于long类型的表示范围就是2的64次方,并且超过会自动取模,所以叫做字符串哈希,因为这样的话相当于的用long的最大值作为模数。
- 对于字符串X1X2X3...Xn 映射公式 (X1 × Pn−1 + X2 × Pn−2 + ⋯ +Xn−1 × P1 + Xn × P0) mod Q 注意:
- 任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0
- 冲突问题:设置P (131 或 13331) , Q (2的64次方) 的值,一般可以理解为不会产生冲突,但是只推荐在算法题使用。
Code
import java.util.*;
import java.io.*;
public class Main{
static int P = 131;
public static void main(String [] args) {
int n, m;
Scanner sc = new Scanner(System.in);
n = sc.nextInt();
m = sc.nextInt();
long [] h = new long [n + 10];
long [] p = new long[n + 10];
p[0] = 1;
String a;
sc.nextLine();
a = sc.nextLine();
for(int i = 1; i <= n ;i++){
p[i] = p[i - 1] * P;
// 比如ABCDE,A是高位,E是低位, 理解成二进制,乘以P相当于二进制的左移操作
h[i] = h[i - 1] * P + a.charAt(i - 1);
}
for(int i = 0 ; i < m;i++){
int l1, r1, l2, r2;
l1 = sc.nextInt(); r1 = sc.nextInt(); l2 = sc.nextInt(); r2 = sc.nextInt();
// x1x2x3反着存储,x1 * p0 + ... + xn * pn-1
String res = h[r1] - h[l1 - 1] * p[r1 - l1 + 1] == h[r2] - h[l2 - 1] * p[r2 - l2 + 1] ?
"Yes" : "No";
System.out.println(h[r1] - h[l1] * p[r1 - l1 + 1]);
System.out.println(res);
}
}
}
参考
- 题目来自于Acwing