java的JDK8新特性-Stream流详解

97 阅读12分钟

Stream流

一、概述

Java 8 的版本中,这个版本新增的Stream,配合同版本出现的 Lambda ,给我们操作集合(Collection)提供了极大的便利。

那么什么是Stream?

Stream将要处理的元素集合看作一种流,在流的过程中,借助Stream API对流中的元素进行操作,比如:筛选、排序、聚合等。

Stream可以由数组或集合创建, 对流的操作分为两种:

中间操作:每次返回一个新的流,可以有多个。 终端操作:每个流只能进行一次终端操作,终端操作结束后流无法再次使用。终端操作会产生一个新的集合或值。 另外,Stream有几个特性:

  • stream不存储数据, 而是按照特定的规则对数据进行计算,一般会输出结果。
  • stream不会改变数据源,通常情况下会产生一个新的集合或一个值。
  • stream具有延迟执行特性,只有调用终端操作时,中间操作才会执行。
  • 代码简洁:函数式编程写出的代码简洁且意图明确,使用stream接口让你从此告别for循环。
  • 多核友好: Java函数式编程使得编写并行程序从未如此简单,你需要的全部就是调用一下方法。

111

二、Stream的创建

Stream可以通过数组和集合创建

1、通过 java.util.Collection.stream() 方法用集合创建流

List<String> list = Arrays.asList("a", "b", "c");
// 创建一个顺序流
Stream<String> stream = list.stream();
// 创建一个并行流
Stream<String> parallelStream = list.parallelStream();

2、使用java.util.Arrays.stream(T[] array)方法用数组创建流

int[] array={1,3,5,6,8};
IntStream stream = Arrays.stream(array);

3、使用Stream的静态方法:of()、iterate()、generate()

Stream<Integer> stream = Stream.of(1, 2, 3, 4, 5, 6);
​
Stream<Integer> stream2 = Stream.iterate(0, (x) -> x + 3).limit(4);
stream2.forEach(System.out::println);
​
Stream<Double> stream3 = Stream.generate(Math::random).limit(3);
stream3.forEach(System.out::println);

函数创建 4、iterator

Stream<Integer> iterateStream = Stream.iterate(0, n -> n + 2).limit(5);

iterate方法接受两个参数,第一个为初始化值,第二个为进行的函数操作,因为iterator生成的流为无限流,通过limit方法对流进行了截断,只生成5个偶数

5、generator

Stream<Double> generateStream = Stream.generate(Math::random).limit(5);

generate方法接受一个参数,方法参数类型为Supplier ,由它为流提供值。generate生成的流也是无限流,因此通过limit对流进行了截断

Stream和parallelStream的区分:Stream是顺序流,由主线程按照顺序对流执行操作,而parallelStream是并行流,内部以多线程并行执行的方式对流进行操作,但前提是对流中的数据处理没有顺序要求

如果流中的数据量足够大,并行流可以加快处速度。

除了直接创建并行流,还可以通过parallel()把顺序流转换成并行流:

Optional<Integer> findFirst = list.stream().parallel().filter(x->x>6).findFirst();

三、Stream的使用

1、遍历和匹配

findFirst():匹配第一个

findAny():匹配任意(适用于并行流)

forEach();遍历

anyMatch();是否包含符合特定条件的元素

public static void main(String[] args) {
        List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);    
// 遍历输出符合条件的元素
    list.stream().filter(x -> x > 6).forEach(System.out::println);
    // 匹配第一个
    Optional<Integer> findFirst = list.stream().filter(x -> x > 6).findFirst();
    // 匹配任意(适用于并行流)
    Optional<Integer> findAny = list.parallelStream().filter(x -> x > 6).findAny();
    // 是否包含符合特定条件的元素
    boolean anyMatch = list.stream().anyMatch(x -> x > 6);
    System.out.println("匹配第一个值:" + findFirst.get()); 
    System.out.println("匹配任意一个值:" + findAny.get());
    System.out.println("是否存在大于6的值:" + anyMatch);

2、筛选

filter: 筛选,是按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中的操作

//筛选出Integer集合中大于7的元素,并打印出来
public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(6, 7, 3, 8, 1, 2, 9);
        Stream<Integer> stream = list.stream();
        stream.filter(x -> x > 7).forEach(System.out::println); //8 9
    }
}
​
​
  //筛选员工中工资高于8000的人,并形成新的集合。
        List<Person> personList = new ArrayList<>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
        personList.add(new Person("Anni", 8200, 24, "female", "New York"));
        personList.add(new Person("Owen", 9500, 25, "male", "New York"));
        personList.add(new Person("Alisa", 7900, 26, "female", "New York"));
        List<String> collect = personList.stream().filter(s -> s.getSalary() >= 8000).map(Person::getName).collect(Collectors.toList());
        System.out.println(collect); //[Tom, Anni, Owen]

3、聚合

max: 最大

min: 最小

count: 计算个数

maxmincount这些字眼你一定不陌生,没错,在mysql中我们常用它们进行数据统计。Java stream中也引入了这些概念和用法,极大地方便了我们对集合、数组的数据统计工作。

//获取String集合中最长的元素
        List<String> list = Arrays.asList("adnm", "admmt", "pot", "xbangd", "weoujgsd");
        Optional<String> max = list.stream().max(Comparator.comparing(String::length));
        System.out.println("最长的字符串为:"+max.get()); //最长的字符串为:weoujgsd
​
        //获取Integer集合中的最大值。
        List<Integer> list1 = Arrays.asList(7, 6, 9, 4, 11, 6);
        Optional<Integer> max1 = list1.stream().max((x1, x2) -> x1 - x2);
        System.out.println("最大的数为为:"+max1.get()); //最大的数为为:11
​
        //获取员工薪资最高的人。
        Optional<Person> max2 = personList.stream().max(Comparator.comparing(Person::getSalary));
        System.out.println("员工薪资最高的人是谁:"+max2.get()); //员工薪资最高的人是谁:Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}
​
        //计算Integer集合中大于6的元素的个数。
        List<Integer> list3 = Arrays.asList(7, 6, 4, 8, 2, 11, 9);
        long count = list3.stream().filter(x -> x > 6).count();
        System.out.println("大于6的个数为:"+count);//大于6的个数为:4

4、映射

映射,可以将一个流的元素按照一定的映射规则映射到另一个流中。分为mapflatMap

  • map:接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。
  • flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
//英文字符串数组的元素全部改为大写。整数数组每个元素+3。
String[] strArr = { "abcd", "bcdd", "defde", "fTr" };
List<Integer> intList = Arrays.asList(1, 3, 5, 7, 9, 11);
List<String> collect1 = Arrays.stream(strArr).map(s -> s.toUpperCase()).collect(Collectors.toList());
System.out.println("全部大写为:"+collect1); //全部大写为:[ABCD, BCDD, DEFDE, FTR]
List<Integer> collect2 = intList.stream().map(s -> s + 3).collect(Collectors.toList());
System.out.println("全部数组元素加3为:"+collect2);//全部数组元素加3为:[4, 6, 8, 10, 12, 14]
​
//将两个字符数组合并成一个新的字符数组
List<String> list5 = Arrays.asList("m,k,l,a", "1,3,5,7");
List<String> collect3 = list5.stream().flatMap(s -> {
    //把每一个元素转换为一个流
    String[] split = s.split(",");
    Stream<String> stream1 = Arrays.stream(split);
    return stream1;
}).collect(Collectors.toList());
System.out.println(collect3);//[m, k, l, a, 1, 3, 5, 7]

此外,map系列还有mapToInt、mapToLong、mapToDouble三个函数,它们以一个映射函数为入参,将流中每一个元素处理后生成一个新流。以mapToInt为例,看两个示例:

 // 输出字符串集合中每个字符串的长度
 List<String> stringList = Arrays.asList("mu", "CSDN", "hello", "world", "quickly");
 List<Integer> collect4 = stringList.stream().map(String::length).collect(Collectors.toList());
 System.out.println(collect4); //[2, 4, 5, 5, 7]
 //使用mapTOInt 不可以使用collect进行收集的
stringList.stream().mapToInt(String::length).forEach(System.out::print); //24557

mapToInt三个函数生成的新流,可以进行很多后续操作,比如求最大最小值、求和、求平均值:

//        求最大最小值、求和、求平均值:
        List<Double> doubleList = Arrays.asList(1.0, 2.0, 3.0, 4.0, 2.0);
        double average = doubleList.stream().mapToDouble(Double::doubleValue).average().getAsDouble();
        double sum = doubleList.stream().mapToDouble(Double::doubleValue).sum();
        double max3 = doubleList.stream().mapToDouble(Double::doubleValue).max().getAsDouble();
        System.out.println("平均值"+average);
        System.out.println("和"+sum);
        System.out.println("最大值"+max3);
​

5 、归约(reduce)

归约,也称缩减,顾名思义,是把一个流缩减成一个值,能实现对集合求和、求乘积和求最值操作

List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
        // 求和方式1
        Optional<Integer> sum = list.stream().reduce((x, y) -> x + y);
        // 求和方式2
        Optional<Integer> sum2 = list.stream().reduce(Integer::sum);
        // 求和方式3
        Integer sum3 = list.stream().reduce(0, Integer::sum);
        
        // 求乘积
        Optional<Integer> product = list.stream().reduce((x, y) -> x * y);
​
        // 求最大值方式1
        Optional<Integer> max = list.stream().reduce((x, y) -> x > y ? x : y);
        // 求最大值写法2
        Integer max2 = list.stream().reduce(1, Integer::max);
​
        System.out.println("list求和:" + sum.get() + "," + sum2.get() + "," + sum3);
        System.out.println("list求积:" + product.get());
        System.out.println("list求最大值:" + max.get() + "," + max2);
//list求和:29,29,29
//list求积:2112
//list求最大值:11,11

6、收集

collect,收集,可以说是内容最繁多、功能最丰富的部分了。从字面上去理解,就是把一个流收集起来,最终可以是收集成一个值也可以收集成一个新的集合。

collect主要依赖java.util.stream.Collectors类内置的静态方法

归集(toList/toSet/toMap)

因为流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。toListtoSettoMap比较常用,另外还有toCollectiontoConcurrentMap等复杂一些的用法。

        List<Integer> list = Arrays.asList(1, 6, 3, 4, 6, 7, 9, 6, 20);
        List<Integer> listNew = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());
        Set<Integer> set = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());
​
        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
        personList.add(new Person("Anni", 8200, 24, "female", "New York"));
        
        Map<?, Person> map = personList.stream().filter(p -> p.getSalary() > 8000)
                .collect(Collectors.toMap(Person::getName, p -> p));
        System.out.println("toList:" + listNew);
        System.out.println("toSet:" + set);
        System.out.println("toMap:" + map);

统计(count/averaging)

Collectors提供了一系列用于数据统计的静态方法:

计数:count 平均值:averagingInt、averagingLong、averagingDouble 最值:maxBy、minBy 求和:summingInt、summingLong、summingDouble 统计以上所有:summarizingInt、summarizingLong、summarizingDouble

 //统计员工人数、平均工资、工资总额、最高工资。
        Long collect5 = personList.stream().collect(Collectors.counting());
        System.out.println("员工个数为"+collect5);
​
        Double collect6 = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));
        System.out.println("平均数"+collect6);
​
        Integer collect7 = personList.stream().collect(Collectors.summingInt(Person::getSalary));
        System.out.println("工资和"+collect7);
​
        Optional<Integer> collect8 = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));
        System.out.println("最高工资"+collect8.get());
​
        DoubleSummaryStatistics collect9 = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));
        System.out.println("最高工资"+collect9);
//        员工个数为9
//        平均数8111.111111111111
//        工资和73000
//        最高工资9500
//        最高工资DoubleSummaryStatistics{count=9, sum=73000.000000, min=7000.000000, average=8111.111111, max=9500.000000}

分组(partitioningBy/groupingBy)

  • 分区:将stream按条件分为两个Map,比如员工按薪资是否高于8000分为两部分。
  • 分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组
 //将员工按薪资是否高于8000分为两部分;将员工按性别和地区分组
    Map<Boolean, List<Person>> collect10 = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));
    Map<String, List<Person>> collect11 = personList.stream().collect(Collectors.groupingBy(Person::getSex));
    //将员工先按性别分组,再按地区分组
    Map<String, Map<String, List<Person>>> collect12 = personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));
    System.out.println("员工按薪资是否大于8000分组情况:" + collect10);
    System.out.println("员工按性别分组情况:" + collect11);
    System.out.println("员工按性别、地区:" + collect12);
//员工按薪资是否大于8000分组情况:{false=[Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}], true=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}]}
    //员工按性别分组情况:{female=[Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}], male=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}]}
    //员工按性别、地区:{female={New York=[Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}], Washington=[Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}]}, male={New York=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}], Washington=[Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}]}}
}

接合(joining)

joining可以将stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。

        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
​
        String names = personList.stream().map(p -> p.getName()).collect(Collectors.joining(","));
        System.out.println("所有员工的姓名:" + names);
        List<String> list = Arrays.asList("A", "B", "C");
        String string = list.stream().collect(Collectors.joining("-"));
        System.out.println("拼接后的字符串:" + string);
//所有员工的姓名:Tom,Jack,Lily
//拼接后的字符串:A-B-C

归约(reducing)

Collectors类提供的reducing方法,相比于stream本身的reduce方法,增加了对自定义归约的支持。

        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
​
        // 每个员工减去起征点后的薪资之和
        Integer sum = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
        System.out.println("员工扣税薪资总和:" + sum);
​
        // stream的reduce
        Optional<Integer> sum2 = personList.stream().map(Person::getSalary).reduce(Integer::sum);
        System.out.println("员工薪资总和:" + sum2.get());
//员工扣税薪资总和:8700
//员工薪资总和:23700

7、排序(sorted)

sorted,中间操作。有两种排序:

  • sorted():自然排序,流中元素需实现Comparable接口
  • sorted(Comparator com):Comparator排序器自定义排序
        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Sherry", 9000, 24, "female", "New York"));
        personList.add(new Person("Tom", 8900, 22, "male", "Washington"));
        personList.add(new Person("Jack", 9000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 8800, 26, "male", "New York"));
        personList.add(new Person("Alisa", 9000, 26, "female", "New York"));
​
        // 按工资升序排序(自然排序)
        List<String> newList = personList.stream().sorted(Comparator.comparing(Person::getSalary)).map(Person::getName)
                .collect(Collectors.toList());
        // 按工资倒序排序
        List<String> newList2 = personList.stream().sorted(Comparator.comparing(Person::getSalary).reversed())
                .map(Person::getName).collect(Collectors.toList());
        // 先按工资再按年龄升序排序
        List<String> newList3 = personList.stream()
                .sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge)).map(Person::getName)
                .collect(Collectors.toList());
        // 先按工资再按年龄自定义排序(降序)
        List<String> newList4 = personList.stream().sorted((p1, p2) -> {
            if (p1.getSalary() == p2.getSalary()) {
                return p2.getAge() - p1.getAge();
            } else {
                return p2.getSalary() - p1.getSalary();
            }
        }).map(Person::getName).collect(Collectors.toList());
​
        System.out.println("按工资升序排序:" + newList);
        System.out.println("按工资降序排序:" + newList2);
        System.out.println("先按工资再按年龄升序排序:" + newList3);
        System.out.println("先按工资再按年龄自定义降序排序:" + newList4);

8、 提取/组合

也可以进行合并、去重、限制、跳过等操作

concat:合并

distinct:去重

limit:限制

skip:跳过

​
        String[] arr1 = { "a", "b", "c", "d" };
        String[] arr2 = { "d", "e", "f", "g" };
​
        Stream<String> stream1 = Stream.of(arr1);
        Stream<String> stream2 = Stream.of(arr2);
        // concat:合并两个流 distinct:去重
        List<String> newList = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());
        // limit:限制从流中获得前n个数据
        List<Integer> collect = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());
        // skip:跳过前n个数据
        List<Integer> collect2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());
​
        System.out.println("流合并:" + newList);
        System.out.println("limit:" + collect);
        System.out.println("skip:" + collect2);
//流合并:[a, b, c, d, e, f, g]
//limit:[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
//skip:[3, 5, 7, 9, 11]