Collection和Iterator接口

53 阅读8分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第24天,点击查看活动详情

Java集合概述

在编程时,常常需要集中存放多个数据,当然我们可以使用数组来保存多个对象,但数组长度不可变化,一旦在初始化数组时指定了数组长度,这个数组长度就是不可变的,如果需要保存数量变化的数据,数组就有点无能为力了;而且数组无法保存具有映射关系的数据,如成绩表:语文—79,数学—80,这种数据看上去像两个数组,但这两个数组的元素之间有一定的关联关系。

为了保存数量不确定的数据,以及保存具有映射关系的数据(也被称为关联数组),Java提供了集合类。集合类主要负责保存、盛装其他数据,因此集合类也被称为容器类。所有的集合类都位于java.util包下,后来为了处理多线程环境下的并发安全问题,Java 5还在java.util.concurrent包下提供了一些多线程支持的集合类。

集合类和数组不一样,数组元素既可以是基本类型的值,也可以是对象(实际上保存的是对象的引用变量);而集合只能保存对象(实际上只是保存对象的引用变量,但通常习惯上认为集合里保存的是对象)。

Java的集合类主要由两个接口派生而出:CollectionMap,Collection和Map是Java集合框架的根接口,这两个接口又包含了一些子接口或实现类。 在这里插入图片描述 我们可以把Java的所有集合分成三大类,其中Set集合类似于一个罐子,把一个对象添加到Set集合时,Set集合无法记住添加这个元素的顺序,所以Set里的元素不能重复(否则系统无法准确识别这个元素);List集合非常像一个数组,它可以记住每次添加元素的顺序,只是List的长度可变。Map集合也像一个罐子,只是它里面的每项数据都由两个值组成。图8.3显示了这三种集合的示意图。 在这里插入图片描述 在这里插入图片描述 如果访问List集合中的元素,可以直接根据元素的索引来访问;如果访问Map集合中的元素,可以根据每项元素的key来访问其value;如果访问Set集合中的元素,则只能根据元素本身来访问(这也是Set集合里元素不允许重复的原因)。

最常用的实现类在图中以灰色区域覆盖,分别是HashSet、TreeSet、ArrayList、ArrayDeque、LinkedList和HashMap、TreeMap等实现类。

2 Collection和Iterator接口

Collection接口List、SetQueue接口的父接口,该接口里定义的方法既可用于操作Set集合,也可用于操作List和Queue集合。Collection接口里定义了如下操作集合元素的方法。

  • boolean add(Object o):该方法用于向集合里添加一个元素。如果集合对象被添加操作改变了,则返回true。
  • boolean addAll(Collection c):该方法把集合c里的所有元素添加到指定集合里。如果集合对象被添加操作改变了,则返回true。
  • void clear():清除集合里的所有元素,将集合长度变为0。
  • boolean contains(Object o):返回集合里是否包含指定元素。
  • boolean containsAll(Collection c):返回集合里是否包含集合c里的所有元素。
  • boolean isEmpty():返回集合是否为空。当集合长度为0时返回true,否则返回false。
  • Iterator iterator():返回一个Iterator对象,用于遍历集合里的元素。
  • boolean remove(Object o):删除集合中的指定元素o,当集合中包含了一个或多个元素o时,这些元素将被删除,该方法将返回true。
  • boolean removeAll(Collection c):从集合中删除集合c里包含的所有元素(相当于用调用该方法
    public class CollectionTest
    {
        public static void main(String[] args)
        {
              Collection c=new ArrayList();
              //添加元素
              c.add("孙悟空");
              //虽然集合里不能放基本类型的值,但Java支持自动装箱
              c.add(6);
              System.out.println("c集合的元素个数为:" + c.size());
              //删除指定元素
              c.remove(6);
              System.out.println("c集合的元素个数为:" + c.size());
              //判断是否包含指定字符串
              System.out.println("c集合是否包含\"孙悟空\"字符串:"
                    + c.contains("孙悟空"));
              c.add("轻量级Java EE企业应用实战");
              System.out.println("c集合的元素:" + c);
              Collection books=new HashSet();
              books.add("轻量级Java EE企业应用实战");
              books.add("疯狂Java讲义");
              System.out.println("c集合是否完全包含books集合?"
                    + c.containsAll(books));
              //用c集合减去books集合里的元素
              c.removeAll(books);
              System.out.println("c集合的元素:" + c);
              //删除c集合里的所有元素
              c.clear();
              System.out.println("c集合的元素:" + c);
              //books集合里只剩下c集合里也包含的元素
              books.retainAll(c);
              System.out.println("books集合的元素:" + books);
        }
    }

上面程序中创建了两个Collection对象,一个是c集合,一个是books集合,其中c集合是ArrayList,而books集合是HashSet。虽然它们使用的实现类不同,但当把它们当成Collection来使用时,使用add、remove、clear等方法来操作集合元素时没有任何区别。

当使用System.out的println方法来输出集合对象时,将输出[ele1,ele2,...]的形式,这显然是因为所有的Collection实现类都重写了toString()方法,该方法可以一次性地输出集合中的所有元素。

如果想依次访问集合里的每一个元素,则需要使用某种方式来遍历集合元素,下面介绍遍历集合元素的两种方法。

注意:

在普通情况下,当我们把一个对象“丢进”集合中后,集合会忘记这个对象的类型——也就是说,系统把所有的集合元素都当成Object类的实例进行处理。从JDK 1.5以后,这种状态得到了改进:可以 使用泛型来限制集合里元素的类型,并让集合记住所有集合元素的类型。

2.1 使用Iterator接口遍历集合元素

Iterator接口也是Java集合框架的成员,但它与Collection系列、Map系列的集合不一样:Collection系列集合、Map系列集合主要用于盛装其他对象,而Iterator则主要用于遍历(即迭代访问)Collection集合中的元素,Iterator对象也被称为迭代器

Iterator接口隐藏了各种Collection实现类的底层细节,向应用程序提供了遍历Collection集合元素的统一编程接口。Iterator接口里定义了如下三个方法。

  • boolean hasNext():如果被迭代的集合元素还没有被遍历,则返回true。

  • Object next():返回集合里的下一个元素。

  • void remove():删除集合里上一次next方法返回的元素。下面程序示范了通过Iterator接口来遍历集合元素。

        public class IteratorTest
        {
            public static void main(String[] args)
            {
                  //创建一个集合
                  Collection books=new HashSet();
                  books.add("轻量级Java EE企业应用实战");
                  books.add("疯狂Java讲义");
                  books.add("疯狂Android讲义");
                  //获取books集合对应的迭代器
                  Iterator it=books.iterator();
                  while(it.hasNext())
                  {
                        //it.next()方法返回的数据类型是Object类型
                        //需要强制类型转换
                        String book=(String)it.next();
                        System.out.println(book);
                        if (book.equals("疯狂Java讲义"))
                        {
                              //从集合中删除上一次next方法返回的元素
                              it.remove();
                        }
                        //对book变量赋值,不会改变集合元素本身
                        book="测试字符串";   //①
                  }
                  System.out.println(books);
            }
        }

当使用Iterator对集合元素进行迭代时,Iterator并不是把集合元素本身传给了迭代变量,而是把集合元素的值传给了迭代变量,所以修改迭代变量的值对集合元素本身没有任何影响。

当使用Iterator迭代访问Collection集合元素时,Collection集合里的元素不能被改变,只有通过Iterator的remove方法删除上一次next方法返回的集合元素才可以;否则将会引发java.util.Concurrent ModificationException异常。下面程序示范了这一点。

        public class IteratorErrorTest
        {
            public static void main(String[] args)
            {
                  //创建一个集合
                  Collection books=new HashSet();
                  books.add("轻量级Java EE企业应用实战");
                  books.add("疯狂Java讲义");
                  books.add("疯狂Android讲义");
                  //获取books集合对应的迭代器
                  Iterator it=books.iterator();
                  while(it.hasNext())
                  {
                        String book=(String)it.next();
                        System.out.println(book);
                        if (book.equals("疯狂Android讲义"))
                        {
                            //使用Iterator迭代过程中,不可修改集合元素,下面代码引发异常
                            books.remove(book);
                        }
                  }
            }
        }

Iterator迭代器采用的是快速失败(fail-fast)机制,一旦在迭代过程中检测到该集合已经被修改(通常是程序中的其他线程修改),程序立即引发ConcurrentModificationException异常,而不是显示修改后的结果,这样可以避免共享资源而引发的潜在问题

**注意:**上面程序如果改为删除“疯狂Java讲义”字符串,则不会引发异常,这样可能有些读者会“心存侥幸”地想:在迭代时好像也可以删除集合元素啊。实际上这是一种危险的行为:对于HashSet以及后面的ArrayList等,迭代时删除元素都会导致异常——只有在删除集合中的某个特定元素时才不会抛出异常,这是由集合类的实现代码决定的,程序员不应该这么做。

2.2 使用foreach循环遍历集合元素

        public class ForeachTest
        {
            public static void main(String[] args)
            {
                  //创建一个集合
                  Collection books=new HashSet();
                  books.add(new String("轻量级Java EE企业应用实战"));
                  books.add(new String("疯狂Java讲义"));
                  books.add(new String("疯狂Android讲义"));
                  for (Object obj : books)
                  {
                        //此处的book变量也不是集合元素本身
                        String book=(String)obj;
                        System.out.println(book);
                        if (book.equals("疯狂Android讲义"))
                        {
                            //下面代码会引发ConcurrentModificationException异常
                            books.remove(book);    //①
                        }
                  }
                  System.out.println(books);
            }
        }

与使用Iterator接口迭代访问集合元素类似的是,foreach循环中的迭代变量也不是集合元素本身,系统只是依次把集合元素的值赋给迭代变量,因此在foreach循环中修改迭代变量的值也没有任何实际意义。