java基础高级22_Java集合Collection子接口

152 阅读8分钟

1 Collection子接口之一:List接口

1.1 List接口框架

  • |----Collection接口:单列集合,用来存储一个一个的对象
    • |----List接口:存储有序的、可重复的数据。 -->“动态”数组,替换原有的数组
    • |----ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
    • |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
    • |----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储

、* 1. List接口框架
*    |----Collection接口:单列集合,用来存储一个一个的对象
*          |----List接口:存储有序的、可重复的数据。  -->“动态”数组,替换原有的数组
*              |----ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
*              |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
*              |----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储
*
*
*
* 面试题:ArrayListLinkedListVector三者的异同?
*          同:三个类都是实现了List接口,存储数据的特点相同:存储有序的、可重复的数据
*          同:见上
*/

1.2 ArrayList的源码分析:

1.2.1 jdk 7情况下

  • ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
  • list.add(123);//elementData[0] = new Integer(123);
  • ...
  • list.add(11);//如果此次的添加导致底层elementData数组容量不够,则扩容。
  • 默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。

结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)

1.2.2 jdk 8中ArrayList的变化:

  • ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没有创建长度为10的数组
  • list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
  • ...
  • 后续的添加和扩容操作与jdk 7 无异。

小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。

1.3 LinkedList的源码分析:

  • LinkedList list = new LinkedList(); 内部声明了Node类型的first和last属性,默认值为null
  • list.add(123);//将123封装到Node中,创建了Node对象。
  • 其中,Node定义为:体现了LinkedList的双向链表的说法
private static class Node<E> {
    E item;
    LinkedList.Node<E> next;
    LinkedList.Node<E> prev;

    Node(LinkedList.Node<E> prev, E element, LinkedList.Node<E> next) {
        this.item = element;
        this.next = next;
        this.prev = prev;
    }
}

1.4 Vector的源码分析:

jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。在扩容方面,默认扩容为原来的数组长度的2倍。

小结 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用。

1.5面试题:

请问ArrayList/LinkedList/Vector的异同?谈谈你的理解?ArrayList底层是什么?扩容机制?Vector和ArrayList的最大区别?

  • ArrayList和LinkedList的异同

    二者都线程不安全,相对线程安全的Vector,执行效率高。此外,ArrayList是实现了基于动态数组的数据结构,LinkedList基于链表的数据结构。对于随机访问get和set,ArrayList觉得优于LinkedList,因为LinkedList要移动指针。对于新增和删除操作add(特指插入)和remove,LinkedList比较占优势,因为ArrayList要移动数据。

  • ArrayList和Vector的区别 Vector和ArrayList几乎是完全相同的,唯一的区别在于Vector是同步类(synchronized),属于强同步类。因此开销就比ArrayList要大,访问要慢。正常情况下,大多数的Java程序员使用ArrayList而不是Vector,因为同步完全可以由程序员自己来控制。Vector每次扩容请求其大小的2倍空间,而ArrayList是1.5倍。Vector还有一个子类Stack。

区分List中remove(int index)和remove(Object obj)

public class ListExer {
    @Test
    public void testListRemove() {
        List list = new ArrayList();
        list.add(1);
        list.add(2);
        list.add(3);
        updateList(list);
        System.out.println(list);//
    }

    private void updateList(List list) {
//        list.remove(2);//[1, 2]按照索引
        list.remove(new Integer(2));//[1, 3]按照对象删除
    }

}

2 Collection子接口之二:Set接口

2.1 Set接口的框架:

|----Collection接口:单列集合,用来存储一个一个的对象

  • |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”

    • |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
      • |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
    • |----TreeSet:可以按照添加对象的指定属性,进行排序。 注意:
  • Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。

  • Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个Set 集合中,则添加操作失败。

  • Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法 要求

向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals()

要求:

  • 重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
  • 重写两个方法的小技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。

2.2概述

Set:存储无序的、不可重复的数据

以HashSet为例说明:

  1. 无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
  2. 不可重复性:保证添加的元素按照equals()判断时,不能返回true.即:相同的元素只能添加一个。

2.3添加元素的过程:以HashSet为例:

我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:

  • 如果此位置上没有其他元素,则元素a添加成功。 --->情况1
  • 如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
    • 如果hash值不相同,则元素a添加成功。--->情况2
    • 如果hash值相同,进而需要调用元素a所在类的equals()方法:
      • equals()返回true,元素a添加失败
      • equals()返回false,则元素a添加成功。--->情况3

对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。

  • jdk 7 :元素a放到数组中,指向原来的元素。
  • jdk 8 :原来的元素在数组中,指向元素a
  • 总结:七上八下

HashSet底层:数组+链表的结构。

image.png

2.4 重写原则

重写hashCode() 方法的基本

  • 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值。
  • 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode()方法的返回值也应相等。
  • 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。

重写 equals() 方法的基本原则

以自定义的Customer类为例,何时需要重写equals()?

  • 当一个类有自己特有的“逻辑相等”概念,当改写equals()的时候,总是要改写hashCode(),根据一个类的equals方法(改写后),两个截然不同的实例有可能在逻辑上是相等的,但是,根据Object.hashCode()方法,它们仅仅是两个对象。
  • 因此,违反了“相等的对象必须具有相等的散列码”。
  • 结论:复写equals方法的时候一般都需要同时复写hashCode方法。通常参与计算hashCode的对象的属性也应该参与到equals()中进行计算。

image.png

2.5 Set实现类之二:LinkedHashSet

LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个/数据和后一个数据。 优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet

image.png

2.5 Set实现类之三:TreeSet

  1. 向TreeSet中添加的数据,要求是相同类的对象。
  2. 两种排序方式:自然排序(实现Comparable接口) 和 定制排序(Comparator)

image.png 可以参看www.cnblogs.com/yangecnu/p/…

排 序—自然排序

自然排序中,比较两个对象是否相同的标准为:compareTo()返回0.不再equals().

排 序—定制排序

定制排序中,比较两个对象是否相同的标准为:compare()返回0.不再是equals().

image.png

2.6 面试题

image.png


@Test
public void test3(){
    HashSet set = new HashSet();
    Person1 p1 = new Person1("AA",12);
    Person1 p2 = new Person1("BB",21);

    set.add(p1);
    set.add(p2);
    System.out.println(set);//[Person1{name='BB', age=21}, Person1{name='AA', age=12}]

    p1.name = "CC";
    set.remove(p1);
    System.out.println(set);//[Person1{name='BB', age=21}, Person1{name='CC', age=12}]
    set.add(new Person1("CC",19));
    System.out.println(set);//[Person1{name='CC', age=19}, Person1{name='BB', age=21}, Person1{name='CC', age=12}]
    set.add(new Person1("AA",90));
    System.out.println(set);//[Person1{name='CC', age=19}, Person1{name='BB', age=21}, Person1{name='AA', age=90}, Person1{name='CC', age=12}]

}

image.png