关于 HashMap的知识1.HashMap的扩容算法 2.HashMap的时间复杂度 3.hash碰撞问题 4.Has

HashMap是什么

简单来说，HashMap就是一个散列表，是基于哈希表的Map接口实现，它存储的内容是键值对 (key-value) 映射，并且键值允许为null(键的话只允许一个为null)。\

1.扩容算法
2.时间复杂度是多少
3.hash碰撞问题
4.实现的原理

1.1 HashMap扩容算法

(1)根据键的hashCode存储数据。(String，和Integer、Long、Double这样的包装类都重写了hashCode方法，String比较特殊根据ascil码还有自己的算法计算，Double做位移运算【具体看源码的hashcode实现】，Integer，Long包装类则是自身大小int值)，
HashMap中的结构不能有基本类型，一方面是基本类型没有hashCode方法，还有HashMap是泛型结构，泛型要求包容对象类型，而基本类型在java中不属于对象。
(2)HashMap的存储单位是Node<k,v>,可以认作为节点。
(3)Hashmap中的扩容的个数是针对size(内部元素(节点)总个数)，而不是数组的个数。比如说初始容量为16，第十三个节点put进来，不管前面十二个占的数组位置如何，就开始扩容。

特征	说明
是否允许重复数据	key如果重复会覆盖，value允许重复
hashMap是否有序	无序，这里的无序指的是遍历HashMap的时候，得到的顺序大都跟put进去的顺序不一致
hashMap是否线程安全	非线程安全，因为里面的实现不是同步的，如果想要线程安全，推荐使用
键值是否允许为空	key和value都允许为空，但只允许一个为空

1.2 HashMap时间复杂度

1.2.1 时间复杂度o(1), o(n), o(logn), o(nlogn)

1、时间复杂度o(1), o(n), o(logn), o(nlogn)。算法时间复杂度有的时候说o(1), o(n), o(logn), o(nlogn)，这是算法的时空复杂度的表示。不仅仅用于表示时间复杂度，也用于表示空间复杂度。O后面的括号中有一个函数，指明某个算法的耗时/耗空间与数据增长量之间的关系。其中的n代表输入数据的量。

大O描述的是算法的运行时间和输入数据之间的关系。

2、时间复杂度为O(1)。　　是最低的时空复杂度了，也就是耗时/耗空间与输入数据大小无关，无论输入数据增大多少倍，耗时耗空间都不变。哈希算法就是典型的O(1)时间复杂度，无论数据规模多大，都可以在一次计算后找到目标（不考虑冲突的话）。

3、时间复杂度为O(n)。
就代表数据量增大几倍，耗时也增大几倍。比如常见的遍历算法。再比如时间复杂度O(n^2)，就代表数据量增大n倍时，耗时增大n的平方倍，这是比线性更高的时间复杂度。比如冒泡排序，就是典型的O(n^2)的算法，对n个数排序，需要扫描n×n次。

4、时间复杂度为O(logn)。
当数据增大n倍时，耗时增大logn倍（这里的log是以2为底的，比如，当数据增大256倍时，耗时只增大8倍，是比线性还要低的时间复杂度）。二分查找就是O(logn)的算法，每找一次排除一半的可能，256个数据中查找只要找8次就可以找到目标。

指数函数：一般地，y=a^x函数(a为常数且以a>0，a≠1)叫做指数函数。y=a^x表示a的x次方。
对数函数：如果a^x =N（a>0，且a≠1），那么数x叫做以a为底N的对数，记作x=logaN，读作以a为底N的对数，其中a叫做对数的底数，N叫做真数。

5、时间复杂度为O(nlogn)。
就是n乘以logn，当数据增大256倍时，耗时增大256*8=2048倍。这个复杂度高于线性低于平方。
归并排序就是O(nlogn)的时间复杂度。

1.2.2 HashMap 时间复杂度举例

HashMap容器O(1)的查找时间复杂度只是其理想的状态，而这种理想状态需要由java设计者去保证。

在由设计者保证了链表长度尽可能短的前提下，由于利用了数组结构，使得key的查找在O(1)时间内完成。

可以将 HashMap分成两部分来看待，hash和map。map只是实现了键值对的存储。而其整个O(1)的查找复杂度很大程度上是由hash来保证的。

HashMap对hash的使用体现出一些设计哲学，如：通过key.hashCode()将普通的object对象转换为int值，从而可以将其视为数组下标，利用数组O(1)的查找性能。

OK，下面我们来看看HashMap中新增元素的时间复杂度。

put操作的流程：

第一步：key.hashcode()，时间复杂度O(1)。

第二步：找到桶以后，判断桶里是否有元素，如果没有，直接new一个entey节点插入到数组中。时间复杂度O(1)。

第三步：如果桶里有元素，并且元素个数小于6，则调用equals方法，比较是否存在相同名字的key，不存在则new一个entry插入都链表尾部。时间复杂度O(1)+O(n)=O(n)。

第四步：如果桶里有元素，并且元素个数大于6，则调用equals方法，比较是否存在相同名字的key，不存在则new一个entry插入都链表尾部。时间复杂度O(1)+O(logn)=O(logn)。红黑树查询的时间复杂度是logn。

通过上面的分析，我们可以得出结论，HashMap新增元素的时间复杂度是不固定的，可能的值有O(1)、O(logn)、O(n)。

1.3 hash碰撞问题

HashMap在put元素时，首先会计算key的hashcode，这时候不会去调用equals方法。为什么呢？因为equals方法的时间复杂度是O(n)。但是HashMap存在hash碰撞问题，最坏的情况下，所有的key都被分配到了同一个桶，这时map的put和get时间复杂度都是O(n)。

所以HashMap的设计者必须要考虑的一个问题就是减少hash碰撞。

HashMap解决哈希冲突采用的是哪种方式呢？

答：HashMap解决哈希冲突采用的是链地址法。说白了就是把冲突的key连接起来，放到桶里。当桶中的元素个数不超过6个时，以单链表的形式串起来，当桶中的元素个数超过6个时，以红黑树的形式串起来。

经过上面的分析，我们可以得出结论，HashMap的hash操作的时间复杂度是O(1)，HashMap的equals操作的时间复杂度是O(n)。

1.4 HashMap底层实现原理解析

1.4.1 我们常见的有数据结构有三种结构：1、数组结构 2、链表结构 3、哈希表结构下面我们来看看各自的数据结构的特点：

1、数组结构：存储区间连续、内存占用严重、空间复杂度大

优点：随机读取和修改效率高，原因是数组是连续的（随机访问性强，查找速度快）缺点：插入和删除数据效率低，因插入数据，这个位置后面的数据在内存中都要往后移动，且大小固定不易动态扩展。 2、链表结构：存储区间离散、占用内存宽松、空间复杂度小

优点：插入删除速度快，内存利用率高，没有固定大小，扩展灵活缺点：不能随机查找，每次都是从第一个开始遍历（查询效率低） 3、哈希表结构：结合数组结构和链表结构的优点，从而实现了查询和修改效率高，插入和删除效率也高的一种数据结构常见的HashMap就是这样的一种数据结构

HashMap中的put()和get()的实现原理：

1、map.put(k,v)实现原理（1）首先将k,v封装到Node对象当中（节点）。（2）然后它的底层会调用K的hashCode()方法得出hash值。（3）通过哈希表函数/哈希算法，将hash值转换成数组的下标，下标位置上如果没有任何元素，就把Node添加到这个位置上。如果说下标对应的位置上有链表。此时，就会拿着k和链表上每个节点的k进行equal。如果所有的equals方法返回都是false，那么这个新的节点将被添加到链表的末尾。如其中有一个equals返回了true，那么这个节点的value将会被覆盖。 2、map.get(k)实现原理 (1)先调用k的hashCode()方法得出哈希值，并通过哈希算法转换成数组的下标。 (2)通过上一步哈希算法转换成数组的下标之后，在通过数组下标快速定位到某个位置上。如果这个位置上什么都没有，则返回null。如果这个位置上有单向链表，那么它就会拿着K和单向链表上的每一个节点的K进行equals，如果所有equals方法都返回false，则get方法返回null。如果其中一个节点的K和参数K进行equals返回true，那么此时该节点的value就是我们要找的value了，get方法最终返回这个要找的value。为何随机增删、查询效率都很高的原因是？原因: 增删是在链表上完成的，而查询只需扫描部分，则效率高。

HashMap集合的key，会先后调用两个方法，hashCode and equals方法，这这两个方法都需要重写。

为什么放在hashMap集合key部分的元素需要重写equals方法？因为equals方法默认比较的是两个对象的内存地址

1.4.2 HashMap红黑树原理分析

相比 jdk1.7 的 HashMap 而言，jdk1.8最重要的就是引入了红黑树的设计，当hash表的单一链表长度超过 8 个的时候，链表结构就会转为红黑树结构。为什么要这样设计呢？好处就是避免在最极端的情况下链表变得很长很长，在查询的时候，效率会非常慢。

红黑树查询：其访问性能近似于折半查找，时间复杂度 O(logn)；链表查询：这种情况下，需要遍历全部元素才行，时间复杂度 O(n)；简单的说，红黑树是一种近似平衡的二叉查找树，其主要的优点就是“平衡“，即左右子树高度几乎一致，以此来防止树退化为链表，通过这种方式来保障查找的时间复杂度为 log(n)。

关于 HashMap的知识