哈希表介绍

1. 哈希的相关概念

Hash，音译为哈希，翻译为散列，我们说哈希或者散列其实就是一个东西

Hash就是把任意长度的输入，通过哈希算法（散列算法），变换成固定长度的输出，该输出就是哈希值（散列值）

这种转换是一种压缩映射（散列值的空间通常小于输入的空间）

根据同一散列函数计算出的散列值如果不同，那么输入值肯定不同

根据同一散列函数计算出的散列值如果相同，散列值不一定相同，即不同的输入可能会输出相同的散列

当两个不同的输入，根据同一散列函数计算出的散列值相同，称该现象为冲突（碰撞） （有冲突解决方法，下面会说）

2. 数据结构

数组特点：寻址容易，插入和删除困难
链表特点：寻址困难，插入和删除容易综合两者的特性，实现一种寻址容易、插入和删除也容易的数据结构——这就是哈希表（（HashMap），也叫散列表），我们可以理解为链表的数组

从上图我们可以看到数组的每个成员是一个链表，我们根据每个元素自身的特征将元素分配到不同的链表中去，反过来我们也正是通过这些特征找到正确的链表，再从链表中找到相应的元素

其中，根据元素特征计算元素数组下标的方法就是哈希算法

3. 哈希函数

当使用哈希表进行查询的时候，就是使用哈希函数将key转换为对应的数组下标，下面列出常用的三种哈希函数

除法散列法 index = value % 16 求模，叫除法是因为求模其实是通过除法运算的
平方散列法
斐波那契散列法

（这里我没有去深入看了，有点点头大）

4. 解决碰撞

冲突解决技术可以分为两类：

开散列方法（也称为拉链法）：把发生冲突的关键码存储在散列表主表之外
- 分离链接
闭散列方法（也称为开地址法）：发生冲突的关键码存储在表的另一个槽内
- 线性探测
- 双重哈希
- 随机散列

线性探测

线性探测基本上是在发生冲突时对空槽进行线性搜索

index = H（K）
如果位置index已经有密钥，则令index = （index + 1） mod M （M为表的大小）

举个例子：哈希表大小M = 7, 哈希函数：H(K) = K mod M
插入这些值：701, 145, 217, 19, 13, 749

H(K) = 701 % 7 = 1
H(K) = 145 % 7 = 5
H(K) = 217 % 7 = 0
H(K) = 19 % 7 = 2
H(K) = 13 % 7 = 1(冲突) --> 2(已经有值) --> 3(插入位置3)
H(K) = 749 % 7 = 2(冲突) --> 3(已经有值) --> 4(插入位置4)