AcWing 835. Trie字符串统计

132 阅读3分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第4天,点击查看活动详情

AcWing 835. Trie字符串统计

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。

共有 N 个操作,输入的字符串总长度不超过 10^5,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。

接下来 N 行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。

每个结果占一行。

数据范围

1 ≤ N ≤ 2∗10^4

输入样例:

5
I abc
Q abc
Q ab
I ab
Q ab

输出样例:

1
0
1

思路

tire 树 又叫字典树 Snipaste_2022-07-09_18-38-15.png

31041_aed49a42ad-Trie2.png son[0][0-25] 分别存储从 a —— z 开头的字母的idx,idx为 0表示 没有当前节点

son[1][0] = 2表示当前节点的前驱节点是标记为1的节点,而当前节点的值为 a ,当前节点的编号为2;

如果son[1][0] = 0,则意味着没有值为a子结点。这里的son[N][26]相当于链表中的ne[N]。

Trie树模板

int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量

// 插入一个字符串
void insert(char *str){
    int p = 0;
    for (int i = 0; str[i]; i ++ ){
        int u = str[i] - 'a';
        if (!son[p][u]) son[p][u] = ++ idx;
        p = son[p][u];
    }
    cnt[p] ++ ;
}
// 查询字符串出现的次数
int query(char *str){
    int p = 0;
    for (int i = 0; str[i]; i ++ ){
        int u = str[i] - 'a';
        if (!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}

ac代码

#include <iostream>
using namespace std;
const int N = 100010;
int son[N][26], cnt[N], idx; 
//son[][]存储子节点的位置,分支最多26条;
//cnt[]存储以某节点结尾的字符串个数(同时也起标记作用)
//idx表示当前要插入的节点是第几个,每创建一个节点值+1,下标为0的点既是根节点又是空节点
char str[N];
void insert(char *str){
    int p = 0; //指针,指向当前节点
    for (int i = 0; str[i]; i ++ ){
        int u = str[i] - 'a'; //将字母转化为数字
        if (!son[p][u]) son[p][u] = ++ idx; //如果不存在就添加,值为下一个节点的位置
        p = son[p][u]; //使用p指针指向下一个节点位置
    }
    cnt[p] ++ ; //记录以此节点结束的字符串的个数
}
int query(char *str){
    int p = 0;
    for (int i = 0; str[i]; i ++ ){
        int u = str[i] - 'a'; //字母转换为数字
        if (!son[p][u]) return 0; //如果不存在
        p = son[p][u]; 
    }
    return cnt[p]; //返回出现次数
}
int main(){
    int n;
    scanf("%d", &n);
    while (n -- ){
        char op[2];
        scanf("%s%s", op, str);
        if (*op == 'I') insert(str);
        else printf("%d\n", query(str));
    }
    return 0;
}