深入理解哈希表哈希表（Hash Table，又称散列表）是一种高效的数据结构，用于存储键值对（Key-Value Pai

深入理解哈希表

哈希表（Hash Table，又称散列表）是一种高效的数据结构，用于存储键值对（Key-Value Pairs），它通过哈希函数（Hash Function） 将键（Key）快速映射到存储位置，从而实现接近 O(1) 时间复杂度的查找、插入和删除。

当两个不同的键通过哈希函数得到相同的哈希值时，称为冲突。
解决方法：
- 链地址法：用链表存储冲突的键值对（如 Java 的 HashMap）。
- 开放寻址法：寻找下一个空闲位置存储（如 Python 的字典）。

插入数据
- 对键 Key 计算哈希值 → 找到对应的存储位置（桶/Bucket）→ 存入值 Value。
- 若发生冲突，按冲突解决策略处理（如链地址法）。
查找数据
- 对键 Key 计算哈希值 → 定位到存储位置 → 取出值 Value。
- 若冲突存在，需遍历链表或探测其他位置。
删除数据
- 类似查找过程，定位后删除键值对。

数据库索引：加速数据查询（如 MySQL 的哈希索引）。
缓存系统：如 Redis、Memcached 使用哈希表存储键值对。
编程语言内置结构：
- Python 的 dict
- Java 的 HashMap
- JavaScript 的 Object 和 Map
区块链与智能合约：
- Solidity 的 mapping 类型就是哈希表（如 mapping(address => uint256)）。

可以类比 字典或电话簿：

哈希表的核心思想是 用空间换时间，通过预计算哈希值快速定位数据，适合需要高频读写的场景

哈希表（Hash Table）的核心思想是通过哈希函数将键（Key）映射到存储位置，但不同键可能映射到同一位置（哈希冲突）。以下是常见的冲突解决方法：

原理：每个哈希桶（Bucket）存储一个链表（或红黑树），冲突的键值对以链表形式存储。
适用场景：大多数标准库实现（如 Java HashMap、Go map 的溢出桶）。

优点	缺点
✅ 实现简单	❌ 链表过长时退化为 O(n)
✅ 内存利用率高	❌ 需要额外指针存储链表

示例（Java HashMap）
Java 在链表长度 > 8 时转为红黑树（优化为 O(log n)）。

原理：所有键值对直接存储在数组中，冲突时按规则探测下一个空闲位置。
适用场景：内存紧凑的场景（如 Python 字典、Redis 哈希表）。

线性探测（Linear Probing）
- 冲突时顺序查找下一个位置：index = (hash(key) + i) % size（i = 1, 2, 3...）。
- 问题：易导致聚集（Clustering） ，降低性能。
平方探测（Quadratic Probing）
- 按平方步长探测：index = (hash(key) + i²) % size。
- 缓解聚集问题，但可能无法找到空位。
双重哈希（Double Hashing）
- 使用第二个哈希函数计算步长：index = (hash1(key) + i * hash2(key)) % size。
- 冲突率最低，但计算成本高。

优点	缺点
✅ 无额外内存开销	❌ 负载因子高时性能下降快
✅ 缓存友好（数据连续）	❌ 删除操作复杂（需标记墓碑）

示例（Python 字典）
Python 使用开放寻址法，结合伪随机探测优化冲突。

原理：当冲突较多时，扩容哈希表并重新哈希所有键值对。
适用场景：动态扩容的哈希表（如 Go map、C++ unordered_map）。

优点	缺点
✅ 降低冲突率	❌ 扩容时短暂性能下降
✅ 适应数据增长	❌ 需额外临时内存