数据结构TS之哈希表实现

1,428 阅读2分钟

哈希表的结构特点

相比链表繁杂的遍历处理,哈希表的作用是存储无固定顺序的键值对哈希表的元素查找时间复杂度为O(1)

尝试手动构建一个哈希表。过程如下:

function HashCode(str) { // 散列函数
    let address = 0
    for (let i = 0; i < str.length; i++) {
        address += str.charCodeAt(i)
    }
    return address % 37 // 生成的哈希码
}
let table = {} // 哈希表
let keyValuePair = { key: "苹果手机", value: "4999元" } // 哈希表的基本单元: 键值对
table[HashCode(keyValuePair.key)] = keyValuePair // table添加对象,属性为哈希码,值为keyValuePair
console.log(table) // 输出哈希表: table { 28: { key: "苹果手机", value: "4999元" } }

我们需要清楚哈希表、键值对、哈希码和散列函数这四者的关系。过程分析如下:

第一步:创建哈希表table、键值对keyValuePair和散列函数HashCode

第二步:基于keyValuePair.key"苹果手机"这个字符串特征,通过散列函数生成哈希码HashCode(keyValuePair.key)

第三步:执行table[HashCode(keyValuePair.key)] = keyValuePair。即在table对象上新增一个HashCode(keyValuePair.key)属性,而它的值就是键值对keyValuePair

总结:键值对中的key可通过散列函数生成哈希码,而生成的哈希码则作为哈希表的属性存储对应的键值对。

面向对象方法封装哈希表

哈希冲突

试着考虑以下这种情况,我们需要存储的键由相同字母构成,但字母的排序不同。

console.log(HashCode('Mike')) // 20
console.log(HashCode('Meki')) // 20
console.log(HashCode('keMi')) // 20

显然,相同字符构成但排序不同的字符串会生成相同的哈希码。即在哈希表中我们原来存储的键值对可能会因为哈希冲突而产生被覆盖的情况。有很多手段可以解决哈希冲突的问题。本文采取的是链地址方法。

构造函数

基本单元:键值对

class keyValuePair<K extends number | string, V> {
    key: K
    value: V
    constructor(key: K, value: V) {
        this.key = key
        this.value = value
    }
}

主体:哈希表

class HashTable<K extends number | string, V> {
    length: number
    table: { [index: number]: LinkedList<keyValuePair<K, V>> }
    constructor() {
        this.length = 0
        this.table = {}
    }
}

散列函数

散列函数需要考虑的情况如下:

  1. 参数str字符串则通过散列函数生成哈希码。

  2. 参数str数字则直接返回作为哈希码。否则默认为0

function HashFunc(str: string) {
    let address = 0
    const primeNum = 5381
    const magicNum = 33
    for (let i = 0; i < str.length; i++) {
        address += primeNum * magicNum + str.charCodeAt(i)
    }
    return address % 1013
}
function HashCode(str: string | number): number {
    return typeof str === 'string' ? HashFunc(str) : typeof str === 'number' ? str : 0
}

增加键值对

增加键值对的情况分为两种。如下分析:

  1. 哈希表中没有这个哈希码属性:创建一个新链表,然后将键值对作为头节点插入链表。
  2. 哈希表中已存在相同的哈希码:即存在哈希冲突,在已创建的链表上追加一个键值对。
set(key: K, value: V): HashTable<K, V> {
    if (this.table[HashCode(key)] === undefined) {
        this.table[HashCode(key)] = new LinkedList()
    }
    this.table[HashCode(key)].insert(new keyValuePair(key, value))
    this.length++
    return this
}

获取键值

获取键值的情况分为三种。如下分析:

  1. 哈希表为空:抛出错误。
  2. 哈希表中不存在这个哈希码属性:抛出错误。
  3. 哈希表中存在这个哈希码属性:从头节点开始,遍历链表找到这个key参数对应的键值返回,否则抛出错误。
get(key: K): V | undefined {
    if (this.table[HashCode(key)] !== undefined) {
        let current = this.table[HashCode(key)].head
        while (current !== null) {
            if (key === current!.element!.key) {
                return current!.element!.value
            }
            current = current!.next
        }
    }
    return undefined
}

删除键值对

删除键值对的情况分为三种。如下分析:

  1. 哈希表为空:抛出错误。
  2. 哈希表中不存在这个哈希码属性:抛出错误。
  3. 哈希表中存在这个哈希码属性:链表长度为1,直接删除这个哈希码属性。链表长度大于1,遍历链表获取这个键值对在链表中对应的序号,然后利用链表方法删除这个键值对。
remove(key: K): boolean {
    if (this.table[HashCode(key)] !== undefined) {
        if (this.table[HashCode(key)].length === 1) {
            delete this.table[HashCode(key)]
        } else if (this.table[HashCode(key)].length > 1) {
            let current = this.table[HashCode(key)].head
            for (let i = 0; i < this.table[HashCode(key)].length; i++) {
                if (key === current!.element!.key) {
                    this.table[HashCode(key)].remove(i)
                    break
                }
                current = current!.next
            }
        }
        this.length--
        return true
    }
    return false
}

本文相关代码已放置我的Github仓库 👇


项目地址:Algorithmlib|HashTable