1 Collection子接口之一:List接口
1.1 List接口框架
- |----Collection接口:单列集合,用来存储一个一个的对象
- |----List接口:存储有序的、可重复的数据。 -->“动态”数组,替换原有的数组
- |----ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
- |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
- |----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
、* 1. List接口框架
* |----Collection接口:单列集合,用来存储一个一个的对象
* |----List接口:存储有序的、可重复的数据。 -->“动态”数组,替换原有的数组
* |----ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
* |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
* |----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
*
*
*
* 面试题:ArrayList、LinkedList、Vector三者的异同?
* 同:三个类都是实现了List接口,存储数据的特点相同:存储有序的、可重复的数据
* 同:见上
*/
1.2 ArrayList的源码分析:
1.2.1 jdk 7情况下
- ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
- list.add(123);//elementData[0] = new Integer(123);
- ...
- list.add(11);//如果此次的添加导致底层elementData数组容量不够,则扩容。
- 默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。
结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
1.2.2 jdk 8中ArrayList的变化:
- ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没有创建长度为10的数组
- list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
- ...
- 后续的添加和扩容操作与jdk 7 无异。
小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。
1.3 LinkedList的源码分析:
- LinkedList list = new LinkedList(); 内部声明了Node类型的first和last属性,默认值为null
- list.add(123);//将123封装到Node中,创建了Node对象。
- 其中,Node定义为:体现了LinkedList的双向链表的说法
private static class Node<E> {
E item;
LinkedList.Node<E> next;
LinkedList.Node<E> prev;
Node(LinkedList.Node<E> prev, E element, LinkedList.Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
1.4 Vector的源码分析:
jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。在扩容方面,默认扩容为原来的数组长度的2倍。
小结 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。
1.5面试题:
请问ArrayList/LinkedList/Vector的异同?谈谈你的理解?ArrayList底层是什么?扩容机制?Vector和ArrayList的最大区别?
-
ArrayList和LinkedList的异同
二者都线程不安全,相对线程安全的Vector,执行效率高。此外,ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。对于随机访问get和set,ArrayList觉得优于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove,LinkedList比较占优势,因为ArrayList要移动数据。
-
ArrayList和Vector的区别 Vector和ArrayList几乎是完全相同的,唯一的区别在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的Java程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。Vector每次扩容请求其大小的2倍空间,而ArrayList是1.5倍。Vector还有一个子类Stack。
区分List中remove(int index)和remove(Object obj)
public class ListExer {
@Test
public void testListRemove() {
List list = new ArrayList();
list.add(1);
list.add(2);
list.add(3);
updateList(list);
System.out.println(list);//
}
private void updateList(List list) {
// list.remove(2);//[1, 2]按照索引
list.remove(new Integer(2));//[1, 3]按照对象删除
}
}
2 Collection子接口之二:Set接口
2.1 Set接口的框架:
|----Collection接口:单列集合,用来存储一个一个的对象
-
|----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
- |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
- |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
- |----TreeSet:可以按照添加对象的指定属性,进行排序。 注意:
- |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
-
Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。
-
Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set 集合中,则添加操作失败。
-
Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法 要求
向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals()
要求:
- 重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
- 重写两个方法的小技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
2.2概述
Set:存储无序的、不可重复的数据
以HashSet为例说明:
- 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
- 不可重复性:保证添加的元素按照equals()判断时,不能返回true.即:相同的元素只能添加一个。
2.3添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:
- 如果此位置上没有其他元素,则元素a添加成功。 --->情况1
- 如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
- 如果hash值不相同,则元素a添加成功。--->情况2
- 如果hash值相同,进而需要调用元素a所在类的equals()方法:
- equals()返回true,元素a添加失败
- equals()返回false,则元素a添加成功。--->情况3
对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
- jdk 7 :元素a放到数组中,指向原来的元素。
- jdk 8 :原来的元素在数组中,指向元素a
- 总结:七上八下
HashSet底层:数组+链表的结构。
2.4 重写原则
重写hashCode() 方法的基本
- 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值。
- 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode()方法的返回值也应相等。
- 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
重写 equals() 方法的基本原则
以自定义的Customer类为例,何时需要重写equals()?
- 当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。
- 因此,违反了“相等的对象必须具有相等的散列码”。
- 结论:复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。
2.5 Set实现类之二:LinkedHashSet
LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个/数据和后一个数据。 优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
2.5 Set实现类之三:TreeSet
- 向TreeSet中添加的数据,要求是相同类的对象。
- 两种排序方式:自然排序(实现Comparable接口) 和 定制排序(Comparator)
可以参看www.cnblogs.com/yangecnu/p/…
排 序—自然排序
自然排序中,比较两个对象是否相同的标准为:compareTo()返回0.不再equals().
排 序—定制排序
定制排序中,比较两个对象是否相同的标准为:compare()返回0.不再是equals().
2.6 面试题
@Test
public void test3(){
HashSet set = new HashSet();
Person1 p1 = new Person1("AA",12);
Person1 p2 = new Person1("BB",21);
set.add(p1);
set.add(p2);
System.out.println(set);//[Person1{name='BB', age=21}, Person1{name='AA', age=12}]
p1.name = "CC";
set.remove(p1);
System.out.println(set);//[Person1{name='BB', age=21}, Person1{name='CC', age=12}]
set.add(new Person1("CC",19));
System.out.println(set);//[Person1{name='CC', age=19}, Person1{name='BB', age=21}, Person1{name='CC', age=12}]
set.add(new Person1("AA",90));
System.out.println(set);//[Person1{name='CC', age=19}, Person1{name='BB', age=21}, Person1{name='AA', age=90}, Person1{name='CC', age=12}]
}