算法笔记——字符串哈希

130 阅读2分钟

「这是我参与2022首次更文挑战的第8天,活动详情查看:2022首次更文挑战

字符串哈希主要用来比较字符串的两个字串是否相同。

对于字符串src[10] = "ABCAEFGBSK",h[0] = 0;h[1] = "A"的哈希值;h[2] = "AB"的哈希值;h[3] = "ABC"的哈希值;h[4] = "ABCAE"的哈希值......

而哈希值的求法,我们这里使用p进制来表示,即(ABCAEFGBSK)p;

即可预处理数组h(i) = h(i - 1) * p +src[i];

注意:根据经验,p一般取131或者13331

比较两个字串,即比较两个字串的哈希值

基本思路

image-20220125153306852

注意:这里计算的时间复杂度为O(1)

模板题目

给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l1,r1,l2,r2请你判断 [l1,r1]和 [l2,r2]这两个区间所包含的字符串子串是否完全相同。

字符串中只包含大小写英文字母和数字。

输入格式

第一行包含整数 nn和 m,表示字符串长度和询问次数。

第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。

接下来 m 行,每行包含四个整数 l1,r1,l2,r2表示一次询问所涉及的两个区间。

注意,字符串的位置从 1 开始编号。

输出格式

对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No

每个结果占一行。

数据范围

1≤n,m≤105

输入样例:

8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes

代码

#include <iostream>
#include <algorithm>

using namespace std;

typedef unsigned long long UUL;

const int N = 100010, P = 131;

int n, m;
char ch[N];
UUL h[N], p[N];

UUL get(int l, int r)
{
    return h[r] - h[l - 1] * p[r - l + 1];
}
int main()
{
  
    int n;
    int m;
   
  
    scanf("%d%d",&n,&m);
    scanf("%s",ch+1);
    p[0] = 1;
    for (int i = 1; i <= n; i ++ )
    {
        h[i] = h[i - 1] * P + ch[i];
        p[i] = p[i - 1] * P;
    }
    
    while (m -- )
    {
        int l1, r1, l2, r2;
        scanf("%d%d%d%d", &l1, &r1, &l2, &r2);

        if (get(l1, r1) == get(l2, r2)) puts("Yes");
        else puts("No");
    }

}