本文主要讲述哈希表的实现及存储方式,存储方式包括开放寻址法和拉链法;其次讲述字符串的哈希方式。
作用是把一个庞大的空间映射到一个小的空间内,哈希即将一个数x映射到某一个范围之内,但是难免会有两个数或多个数经过映射函数h(x)后,映射的结果相同,则我们需要处理冲突。
哈希表的使用一般是添加和查找。
哈希表的存储结构
哈希表的存储方式主要包括拉链法和开放寻址法。
主要思路
- 拉链法:拉链法的使用方法非常类似于链表,即在遇到冲突的时候,将映射结果相同的x,在同一个位置向下拉链,即形成链表的结构,来实现处理冲突。
- 开放寻址法:而开放寻址法则是在遇到冲突之后,在这个冲突点继续向下一个位置寻找,直到找到x应该在的位置,即空位。开放寻址法的数组长度一般取到x数量的2-3倍。
例题
AcWing 840. 模拟散列表
维护一个集合,支持如下几种操作:
I x,插入一个数 xx;Q x,询问数 xx 是否在集合中出现过; 现在要进行 NN 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 NN,表示操作数量。
接下来 NN 行,每行包含一个操作指令,操作指令为 I x,Q x 中的一种。
输出格式
对于每个询问指令 Q x,输出一个询问结果,如果 xx 在集合中出现过,则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1≤N≤105,1≤N≤105
−109≤x≤109−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
解题代码:
本次题解主要从两个方向出发,一个是拉链法一个是开放寻址法。
/*
* @Author: IndexYang
* @Date: 2022-02-10 14:48:02
* @Last Modified by: IndexYang
* @Last Modified time: 2022-02-10 21:10:55
*/
/************拉链法************/
#include<iostream>
#include<cstring>
using namespace std;
const int N = 100003;
int h[N],e[N],ne[N],idx;
void insert(int x){
//将原数字映射到这个区间之内
int k = abs(x % N);
//使用拉链法将冲突的数连起来(链表)
e[idx] = x;
ne[idx] = h[k];
h[k] = idx++;
}
bool find(int x){
//使用哈希表查找,类似链表的操作
int k = abs(x % N);
for(int i = h[k];i != -1;i = ne[i]){
if(e[i] == x) return true;
}
return false;
}
int main(){
int n;
cin>>n;
//重置内存
memset(h,-1,sizeof h);
while(n--){
string s;
int x;
cin>>s>>x;
if(s == "I") insert(x);
else if(s == "Q"){
if(find(x)) puts("Yes");
else puts("No");
}
}
system("pause");
return 0;
}
/*
* @Author: IndexYang
* @Date: 2022-02-10 14:48:02
* @Last Modified by: IndexYang
* @Last Modified time: 2022-02-10 21:10:55
*/
/************开放寻址法************/
#include<iostream>
#include<cstring>
using namespace std;
const int N = 200003,null = 0x3f3f3f3f;
int h[N];
int find(int x){
int k = (x % N + N) % N;
while(h[k] != null && h[k] != x){
k++;
if(k == N) k=0;//如果查到头了,则回到第一个
}
return k; //返回x应该在的位置
}
int main(){
int n;
cin>>n;
memset(h,0x3f,sizeof h);
while(n--){
string s;
int x;
cin>>s>>x;
int k = find(x);
if(s == "I") h[k] = x;
else if(s == "Q"){
if(h[k] != null) puts("Yes");
else puts("No");
}
}
return 0;
}
字符串的哈希方式
主要思路
这里主要讲述的是字符串的前缀哈希方法,即当一个str="abcdef"时,使得h[1]="a"的哈希值,h[2]="ab"的哈希值……,h[x]=前x个字符的哈希值,之后使用前缀哈希算出所有字串的哈希值。
算法步骤
- 如何求哈希值
- "a b c d"是一个p进制的数。
即可将某一个字符串映射到0~Q-1这个区间内了。 - 在字符串的哈希中,不需要考虑冲突的情况,则我们需要取一定的p和Q值,这里p=131或13331,且Q=2^64时,不用考虑冲突的情况。
- 利用前缀哈希求出所有字段的哈希值
- 只用 h[l-1] 和 h[r] 即可算出从 l~r 的哈希值。
则l到r段的哈希值为
- 使用p求出所有前缀的哈希: ,这里的str[i]即为第i个字符的ASCII值。
例题
AcWing 841. 字符串哈希
给定一个长度为 nn 的字符串,再给定 mm 个询问,每个询问包含四个整数 l1,r1,l2,r2l1,r1,l2,r2,请你判断 [l1,r1][l1,r1] 和 [l2,r2][l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 nn 和 mm,表示字符串长度和询问次数。
第二行包含一个长度为 nn 的字符串,字符串中只包含大小写英文字母和数字。
接下来 mm 行,每行包含四个整数 l1,r1,l2,r2l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 11 开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1≤n,m≤1051≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes
解题代码:
/*
* @Author: IndexYang
* @Date: 2022-02-10 22:03:16
* @Last Modified by: IndexYang
* @Last Modified time: 2022-02-10 22:20:18
*/
#include<iostream>
#include<cstring>
using namespace std;
typedef unsigned long long ULL;
const int N = 100010,P = 131; //这里P取131为经验值,可以使得不用考虑冲突的情况
int n,m;
char str[N]; //str这里是输入的字符串,同时使用ASCII值
ULL h[N],p[N]; //h为前n个字母的哈希值,p为上述大P的n次幂
ULL get(int l,int r){
//这里是求l-r区间内的哈希值
return h[r] - h[l-1] * p[r-l+1];
}
int main(){
cin>>n>>m>>str+1;
p[0]=1;
for(int i=1;i<=n;i++){
//求P的n次幂和前n个字符的哈希值
p[i] = p[i-1] * P;
h[i] = h[i-1] * P + str[i];
}
while(m--){
int l1,r1,l2,r2;
cin>>l1>>r1>>l2>>r2;
if(get(l1,r1) == get(l2,r2)) puts("Yes");
else puts("No");
}
return 0;
}