acwing例题——835. Trie字符串统计

50 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第33天,点击查看活动详情

题目描述

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。

共有 N 个操作,所有输入的字符串总长度不超过 10510^5,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。

接下来 N 行,每行包含一个操作指令,指令为 I x 或 Q x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。

每个结果占一行。

数据范围

1N2×1041≤N≤2×10^4

思路分析(unordered_map)

众所周知,map二元的STL容器是非常好用的,我们可以用他来完成索引和键值的对应关系

在这个题目中,我们可以把输入的字符串作为key值,以string作为索引的键值码,对于次数我们可以用value值来表示->int记录,相当于计数器的思想。

给大家看看经典的unordered_map的做法:

unordered_map做法代码:

#include<iostream>
#include<unordered_map>
using namespace std;

unordered_map<string, int>mp;

int main()
{
	//cin、cout提速包
	ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
	int n;
	cin >> n;
	while (n--) {
		char op;
		string s;
		cin >> op >> s;
		if (op == 'I')mp[s]++;
		else {
			if (!mp.count(s))cout << "0" << endl;
			else cout << mp[s] << endl;
		}
	}
	return 0;
}

思路分析(tree数据结构)

什么是tree数据结构呢?

这是一种特殊的树形结构,比如说我们要将abcd、aac、acd插入到一个树中,顺序如图所示:

先插入abcd:

image.png 接着插入aac:

image.png 最后要插入acd:

image.png 以上就是一个Tire数的插入过程,那么就会有人问:如果要插入abc呢? 我们插入abc会发现原来的树中存在abcd,而abc是abcd的一部分,这样的话该怎么取区分呢?我们需要对相应的子串进行记录:

image.png 这就是Tire树的图像绘制

讲讲代码:

#include<iostream>
using namespace std;

const int N = 100010;

int son[N][26], cnt[N], idx;
char str[N];

//插入函数
void insert(char* str) {
	int p = 0;
	for (int i = 0; str[i]; i++) {
		int u = str[i] - 'a';
		if (!son[p][u])son[p][u] = ++idx;
		p = son[p][u];
	}
	cnt[p]++;
}

//查询函数
int query(char* str) {
	int p = 0;
	for (int i = 0; str[i]; i++) {
		int u = str[i] - 'a';
		if (!son[p][u])return 0;
		p = son[p][u];
	}
	return cnt[p];
}

int main()
{
	ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
	int n;
	cin >> n;
	while (n--) {
		char c;
		cin >> c >> str;
		if (c == 'I')insert(str);
		else cout << query(str) << endl;
	}
	return 0;
}

记录是用的数组:

image.png son数组就是记录这个Tire树的数组,因为每层就只有26个小写字母,所以二维是26即可,对于cnt数组就是记录对应的字符串在Tire树里面有多少次,idx代表着每个字符串的编码。str就是每次循环输入的字符串

对于插入函数:

image.png p刚开始是0,即第一层,然后不断地进行循环,直到char字符串到底,u就是下标i对应的数字,如果在Tire树中存在这个数,就直接到下一层,否则要重新记录。对于查询与插入相类似就不解释了。