☆打卡算法☆LeetCode 208. 实现 Trie (前缀树) 算法解析

707 阅读3分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第27天,点击查看活动详情

推荐阅读

大家好,我是小魔龙,Unity3D软件工程师,VR、AR,虚拟仿真方向,不定时更新软件开发技巧,生活感悟,觉得有用记得一键三连哦。

一、题目

1、算法题目

“实现Trie类,Trie类是一种树形数据结构,用于高效储存和检索字符串数据集中的键。”

题目链接:

来源:力扣(LeetCode)

链接: 208. 实现 Trie (前缀树) - 力扣(LeetCode)

2、题目描述

Trie(发音类似 "try")或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补完和拼写检查。

请你实现 Trie 类:

  • Trie() 初始化前缀树对象。
  • void insert(String word) 向前缀树中插入字符串 word 。
  • boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false 。
  • boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false 。
示例 1:
输入
["Trie", "insert", "search", "search", "startsWith", "insert", "search"]
[[], ["apple"], ["apple"], ["app"], ["app"], ["app"], ["app"]]
输出
[null, null, true, false, true, null, true]

解释
Trie trie = new Trie();
trie.insert("apple");
trie.search("apple");   // 返回 True
trie.search("app");     // 返回 False
trie.startsWith("app"); // 返回 True
trie.insert("app");
trie.search("app");     // 返回 True
示例 2:

二、解题

1、思路分析

题意要求实现一个Trie 类,也就是前缀树,前缀树是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。

Trie是一颗非典型的多叉树模型,也就是每个节点的分支数量可能为多个。

之所以说是非典型的树,是因为它跟一般的多叉树不一样,一般的多叉树的节点是有一个节点值,还有一个指向子节点的指针。

而Trie的节点有一个标记值,标记该节点是否是一个串的结束,还有一个字母映射表。

Trie为什么要这么设计呢,Trie的节点值并没有直接保存字符值的数据,而是用了一个字母映射表,字母映射表中保存了对当前节点而言下一个可能出现的所有字符的链接,比如下面三个单词"sea","sells","she"在Trie的样子:

image.png

Trie中一般含有大量的空链接,因此在绘制一颗前缀树通常忽略空链接,也就是这样:

image.png

接下来就来实现对Trie的一些常用操作方法吧。

首先是插入字符串,有两种情况:

  • 1、子节点存在,指针移动到子节点,继续处理下一个字符
  • 2、子节点不存在,创建一个新的节点,然后指针移动到子节点,继续搜序偶下一个字符

重复以上步骤,直到处理字符串的最后一个字符,将当前节点标记为字符串的结尾。

查找前缀,也有两种情况:

  • 1、子节点存在,指针移动到子节点,继续搜索下一个字符
  • 2、子节点不存在,说明字典树中不包含该前缀,返回空指针

重复以上步骤,直到返回空指针或搜索完前缀的最后一个字符。

2、代码实现

代码参考:

class Trie {
    private Trie[] children;
    private boolean isEnd;

    public Trie() {
        children = new Trie[26];
        isEnd = false;
    }
    
    public void insert(String word) {
        Trie node = this;
        for (int i = 0; i < word.length(); i++) {
            char ch = word.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                node.children[index] = new Trie();
            }
            node = node.children[index];
        }
        node.isEnd = true;
    }
    
    public boolean search(String word) {
        Trie node = searchPrefix(word);
        return node != null && node.isEnd;
    }
    
    public boolean startsWith(String prefix) {
        return searchPrefix(prefix) != null;
    }

    private Trie searchPrefix(String prefix) {
        Trie node = this;
        for (int i = 0; i < prefix.length(); i++) {
            char ch = prefix.charAt(i);
            int index = ch - 'a';
            if (node.children[index] == null) {
                return null;
            }
            node = node.children[index];
        }
        return node;
    }
}

image.png

3、时间复杂度

时间复杂度:O(1)

时间复杂度初始为O(1),其余操作为O(|S|),其中|S|是每次插入或查询字符串的长度。

空间复杂度:O(|T|·∑)

其中|T|是所有插入字符串的长度和,∑为字符集的大小。

三、总结

通过以上介绍和代码实现我们可以总结出 Trie 的几点性质:

  • Trie 的形状和单词的插入或删除顺序无关,也就是说对于任意给定的一组单词,Trie 的形状都是唯一的。

  • 查找或插入一个长度为 L 的单词,访问 next 数组的次数最多为 L+1,和 Trie 中包含多少个单词无关。

  • Trie 的每个结点中都保留着一个字母表,这是很耗费空间的。如果 Trie 的高度为 n,字母表的大小为 m,最坏的情况是 Trie 中还不存在前缀相同的单词,那空间复杂度就为 O(mn)。

最后,关于 Trie 的应用场景,希望你能记住 8 个字:一次建树,多次查询。