字典树

46 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 2 月更文挑战」的第 9 天,点击查看活动详情

字典树是最简单的一种数据结构之一,可以在nlogn复杂度之内快速查找某个字符串以及前缀出现的次数,因为长得像字典,所以给他命名为字典树,,我们下面通过一个例题认识字典树Trie树

分析

这题就是要我们在线操作每次出现的串在之前出现过多少次,字典树有这么几个数组,son[N][M],一般M在100以内,N为1e5以上,(字符串的长度),这个比表示编号为i的点到编号为son[i][j]的点之间经过了j。然后有个cnt[N],cnt记录以某个编号为结尾的点的数量,idx记录的就是点的编号。

代码

#include <iostream>
#include <cstring>
#include <algorithm>
#include <cstdio>
#include <vector>
#include <map>
#include <set>
#include <iomanip>
#include <cmath>
#include <unordered_map>
#include <stack>
#include <queue>
#define ll long long
#define lowbit(x) x&(-x)
using namespace std;
typedef pair<int,int> PII;
typedef pair<string,int> PSI;
typedef stack<int> stk;
int gcd(int x,int y){
   return y?gcd(y,x%y):x;
}
ll qmi(ll x,ll y,int mod){
   ll res=1;
   while(y){
       if(y&1) res=res*x%mod;
       y>>=1;
       x=x*x%mod;
   }
   return res;
}
char op;
const int N=100010;
int son[N][26],cnt[N],idx=0,n;
inline void insert(string s){
   int p=0;
   for(int i=0;i<s.size();i++){
       int u=s[i]-'a';
       if(!son[p][u]) son[p][u]=++idx;
       p=son[p][u];
   }
   cnt[p]++;
}
int query(string s){
   int p=0;
   for(int i=0;i<s.size();i++){
       int u=s[i]-'a';
       if(!son[p][u]) return false;
       p=son[p][u];
   }
   return cnt[p];
}
int main(){
   ios::sync_with_stdio(0);
   cin.tie(0),cout.tie(0);
   cin>>n;
   while(n--){
       cin>>op;
       string s;
       cin>>s;
       if(op=='I') insert(s);
       else cout<<query(s)<<"\n";
   }
   return 0;
}

我们可以看看洛谷一道类似的题

【模板】字典树

题目描述

给定 nn 个模式串 s1,s2,,sns_1, s_2, \dots, s_nqq 次询问,每次询问给定一个文本串 tit_i,请回答 s1sns_1 \sim s_n 中有多少个字符串 sjs_j 满足 tit_isjs_j前缀

一个字符串 ttss 的前缀当且仅当从 ss 的末尾删去若干个(可以为 0 个)连续的字符后与 tt 相同。

输入的字符串大小敏感。例如,字符串 Fusu 和字符串 fusu 不同。

输入格式

本题单测试点内有多组测试数据

输入的第一行是一个整数,表示数据组数 TT

对于每组数据,格式如下:
第一行是两个整数,分别表示模式串的个数 nn 和询问的个数 qq
接下来 nn 行,每行一个字符串,表示一个模式串。
接下来 qq 行,每行一个字符串,表示一次询问。

输出格式

按照输入的顺序依次输出各测试数据的答案。
对于每次询问,输出一行一个整数表示答案。

样例 #1

样例输入 #1

3
3 3
fusufusu
fusu
anguei
fusu
anguei
kkksc
5 2
fusu
Fusu
AFakeFusu
afakefusu
fusuisnotfake
Fusu
fusu
1 1
998244353
9

样例输出 #1

2
1
0
1
2
1

提示

数据规模与约定

对于全部的测试点,保证 1T,n,q1051 \leq T, n, q\leq 10^5,且输入字符串的总长度不超过 3×1063 \times 10^6。输入的字符串只含大小写字母和数字,且不含空串。

说明

std 的 IO 使用的是关闭同步后的 cin/cout,本题不卡常。 这题就有点抽象,数组过大,qaq

代码

#include <iostream>
#include <cstring>
#include <algorithm>
#include <cstdio>
#include <vector>
#include <map>
#include <set>
#include <iomanip>
#include <cmath>
#include <unordered_map>
#include <stack>
#include <queue>
#define ll long long
#define lowbit(x) x&(-x)
using namespace std;
typedef pair<int,int> PII;
typedef pair<string,int> PSI;
typedef stack<int> stk;
int gcd(int x,int y){
    return y?gcd(y,x%y):x;
}
ll qmi(ll x,ll y,int mod){
    ll res=1;
    while(y){
        if(y&1) res=res*x%mod;
        y>>=1;
        x=x*x%mod;
    }
    return res;
}
char op;
const int N=3000010;
int son[N][70],cnt[N],idx=0,n,q,t;
inline void insert(string s){
    int p=0;
    for(int i=0;i<s.size();i++){
        int u;
        if(s[i]>='0' && s[i]<='9') u=s[i]-'0';
        else if(s[i]>='a' && s[i]<='z') u=s[i]-'a'+10;
        else u=s[i]-'A'+36;
        if(!son[p][u]) son[p][u]=++idx;
        p=son[p][u];
        cnt[p]++;
    }
    
}
int query(string s){
    int p=0;
    for(int i=0;i<s.size();i++){
        int u;
        if(s[i]>='0' && s[i]<='9') u=s[i]-'0';
        else if(s[i]>='a' && s[i]<='z') u=s[i]-'a'+10;
        else u=s[i]-'A'+36;
        if(!son[p][u]) return false;
        p=son[p][u];
    }
    return cnt[p];
}
inline void solve(){
   // idx=0;
    for(int i=0;i<=idx;i++) cnt[i]=0;
    for(int i=0;i<=idx;i++){
        for(int j=0;j<65;j++){
            son[i][j]=0;
        }
    }
    idx=0;
    cin>>n>>q;
    while(n--){
        string s;
        cin>>s;
        insert(s);
    }
    while(q--){
        string s;
        cin>>s;
        cout<<query(s)<<"\n";
    }
}
int main(){
    ios::sync_with_stdio(0);
    cin.tie(0),cout.tie(0);
    cin>>t;
    while(t--){
        solve();
    }
    return 0;
}

希望能帮助到大家!