Stream流
一、概述
Java 8 的版本中,这个版本新增的Stream,配合同版本出现的 Lambda ,给我们操作集合(Collection)提供了极大的便利。
那么什么是Stream?
Stream将要处理的元素集合看作一种流,在流的过程中,借助Stream API对流中的元素进行操作,比如:筛选、排序、聚合等。
Stream可以由数组或集合创建, 对流的操作分为两种:
中间操作:每次返回一个新的流,可以有多个。 终端操作:每个流只能进行一次终端操作,终端操作结束后流无法再次使用。终端操作会产生一个新的集合或值。 另外,Stream有几个特性:
- stream不存储数据, 而是按照特定的规则对数据进行计算,一般会输出结果。
- stream不会改变数据源,通常情况下会产生一个新的集合或一个值。
- stream具有延迟执行特性,只有调用终端操作时,中间操作才会执行。
- 代码简洁:函数式编程写出的代码简洁且意图明确,使用stream接口让你从此告别for循环。
- 多核友好: Java函数式编程使得编写并行程序从未如此简单,你需要的全部就是调用一下方法。
二、Stream的创建
Stream可以通过数组和集合创建
1、通过 java.util.Collection.stream() 方法用集合创建流
List<String> list = Arrays.asList("a", "b", "c");
// 创建一个顺序流
Stream<String> stream = list.stream();
// 创建一个并行流
Stream<String> parallelStream = list.parallelStream();
2、使用java.util.Arrays.stream(T[] array)方法用数组创建流
int[] array={1,3,5,6,8};
IntStream stream = Arrays.stream(array);
3、使用Stream的静态方法:of()、iterate()、generate()
Stream<Integer> stream = Stream.of(1, 2, 3, 4, 5, 6);
Stream<Integer> stream2 = Stream.iterate(0, (x) -> x + 3).limit(4);
stream2.forEach(System.out::println);
Stream<Double> stream3 = Stream.generate(Math::random).limit(3);
stream3.forEach(System.out::println);
函数创建 4、iterator
Stream<Integer> iterateStream = Stream.iterate(0, n -> n + 2).limit(5);
iterate方法接受两个参数,第一个为初始化值,第二个为进行的函数操作,因为iterator生成的流为无限流,通过limit方法对流进行了截断,只生成5个偶数
5、generator
Stream<Double> generateStream = Stream.generate(Math::random).limit(5);
generate方法接受一个参数,方法参数类型为Supplier ,由它为流提供值。generate生成的流也是无限流,因此通过limit对流进行了截断
Stream和parallelStream的区分:Stream是顺序流,由主线程按照顺序对流执行操作,而parallelStream是并行流,内部以多线程并行执行的方式对流进行操作,但前提是对流中的数据处理没有顺序要求
如果流中的数据量足够大,并行流可以加快处速度。
除了直接创建并行流,还可以通过parallel()把顺序流转换成并行流:
Optional<Integer> findFirst = list.stream().parallel().filter(x->x>6).findFirst();
三、Stream的使用
1、遍历和匹配
findFirst():匹配第一个
findAny():匹配任意(适用于并行流)
forEach();遍历
anyMatch();是否包含符合特定条件的元素
public static void main(String[] args) {
List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);
// 遍历输出符合条件的元素
list.stream().filter(x -> x > 6).forEach(System.out::println);
// 匹配第一个
Optional<Integer> findFirst = list.stream().filter(x -> x > 6).findFirst();
// 匹配任意(适用于并行流)
Optional<Integer> findAny = list.parallelStream().filter(x -> x > 6).findAny();
// 是否包含符合特定条件的元素
boolean anyMatch = list.stream().anyMatch(x -> x > 6);
System.out.println("匹配第一个值:" + findFirst.get());
System.out.println("匹配任意一个值:" + findAny.get());
System.out.println("是否存在大于6的值:" + anyMatch);
2、筛选
filter: 筛选,是按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中的操作。
//筛选出Integer集合中大于7的元素,并打印出来
public class StreamTest {
public static void main(String[] args) {
List<Integer> list = Arrays.asList(6, 7, 3, 8, 1, 2, 9);
Stream<Integer> stream = list.stream();
stream.filter(x -> x > 7).forEach(System.out::println); //8 9
}
}
//筛选员工中工资高于8000的人,并形成新的集合。
List<Person> personList = new ArrayList<>();
personList.add(new Person("Tom", 8900, 23, "male", "New York"));
personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
personList.add(new Person("Anni", 8200, 24, "female", "New York"));
personList.add(new Person("Owen", 9500, 25, "male", "New York"));
personList.add(new Person("Alisa", 7900, 26, "female", "New York"));
List<String> collect = personList.stream().filter(s -> s.getSalary() >= 8000).map(Person::getName).collect(Collectors.toList());
System.out.println(collect); //[Tom, Anni, Owen]
3、聚合
max: 最大
min: 最小
count: 计算个数
max、min、count这些字眼你一定不陌生,没错,在mysql中我们常用它们进行数据统计。Java stream中也引入了这些概念和用法,极大地方便了我们对集合、数组的数据统计工作。
//获取String集合中最长的元素
List<String> list = Arrays.asList("adnm", "admmt", "pot", "xbangd", "weoujgsd");
Optional<String> max = list.stream().max(Comparator.comparing(String::length));
System.out.println("最长的字符串为:"+max.get()); //最长的字符串为:weoujgsd
//获取Integer集合中的最大值。
List<Integer> list1 = Arrays.asList(7, 6, 9, 4, 11, 6);
Optional<Integer> max1 = list1.stream().max((x1, x2) -> x1 - x2);
System.out.println("最大的数为为:"+max1.get()); //最大的数为为:11
//获取员工薪资最高的人。
Optional<Person> max2 = personList.stream().max(Comparator.comparing(Person::getSalary));
System.out.println("员工薪资最高的人是谁:"+max2.get()); //员工薪资最高的人是谁:Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}
//计算Integer集合中大于6的元素的个数。
List<Integer> list3 = Arrays.asList(7, 6, 4, 8, 2, 11, 9);
long count = list3.stream().filter(x -> x > 6).count();
System.out.println("大于6的个数为:"+count);//大于6的个数为:4
4、映射
映射,可以将一个流的元素按照一定的映射规则映射到另一个流中。分为map和flatMap:
map:接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。
//英文字符串数组的元素全部改为大写。整数数组每个元素+3。
String[] strArr = { "abcd", "bcdd", "defde", "fTr" };
List<Integer> intList = Arrays.asList(1, 3, 5, 7, 9, 11);
List<String> collect1 = Arrays.stream(strArr).map(s -> s.toUpperCase()).collect(Collectors.toList());
System.out.println("全部大写为:"+collect1); //全部大写为:[ABCD, BCDD, DEFDE, FTR]
List<Integer> collect2 = intList.stream().map(s -> s + 3).collect(Collectors.toList());
System.out.println("全部数组元素加3为:"+collect2);//全部数组元素加3为:[4, 6, 8, 10, 12, 14]
//将两个字符数组合并成一个新的字符数组
List<String> list5 = Arrays.asList("m,k,l,a", "1,3,5,7");
List<String> collect3 = list5.stream().flatMap(s -> {
//把每一个元素转换为一个流
String[] split = s.split(",");
Stream<String> stream1 = Arrays.stream(split);
return stream1;
}).collect(Collectors.toList());
System.out.println(collect3);//[m, k, l, a, 1, 3, 5, 7]
此外,map系列还有mapToInt、mapToLong、mapToDouble三个函数,它们以一个映射函数为入参,将流中每一个元素处理后生成一个新流。以mapToInt为例,看两个示例:
// 输出字符串集合中每个字符串的长度
List<String> stringList = Arrays.asList("mu", "CSDN", "hello", "world", "quickly");
List<Integer> collect4 = stringList.stream().map(String::length).collect(Collectors.toList());
System.out.println(collect4); //[2, 4, 5, 5, 7]
//使用mapTOInt 不可以使用collect进行收集的
stringList.stream().mapToInt(String::length).forEach(System.out::print); //24557
mapToInt三个函数生成的新流,可以进行很多后续操作,比如求最大最小值、求和、求平均值:
// 求最大最小值、求和、求平均值:
List<Double> doubleList = Arrays.asList(1.0, 2.0, 3.0, 4.0, 2.0);
double average = doubleList.stream().mapToDouble(Double::doubleValue).average().getAsDouble();
double sum = doubleList.stream().mapToDouble(Double::doubleValue).sum();
double max3 = doubleList.stream().mapToDouble(Double::doubleValue).max().getAsDouble();
System.out.println("平均值"+average);
System.out.println("和"+sum);
System.out.println("最大值"+max3);
5 、归约(reduce)
归约,也称缩减,顾名思义,是把一个流缩减成一个值,能实现对集合求和、求乘积和求最值操作。
List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
// 求和方式1
Optional<Integer> sum = list.stream().reduce((x, y) -> x + y);
// 求和方式2
Optional<Integer> sum2 = list.stream().reduce(Integer::sum);
// 求和方式3
Integer sum3 = list.stream().reduce(0, Integer::sum);
// 求乘积
Optional<Integer> product = list.stream().reduce((x, y) -> x * y);
// 求最大值方式1
Optional<Integer> max = list.stream().reduce((x, y) -> x > y ? x : y);
// 求最大值写法2
Integer max2 = list.stream().reduce(1, Integer::max);
System.out.println("list求和:" + sum.get() + "," + sum2.get() + "," + sum3);
System.out.println("list求积:" + product.get());
System.out.println("list求最大值:" + max.get() + "," + max2);
//list求和:29,29,29
//list求积:2112
//list求最大值:11,11
6、收集
collect,收集,可以说是内容最繁多、功能最丰富的部分了。从字面上去理解,就是把一个流收集起来,最终可以是收集成一个值也可以收集成一个新的集合。
collect主要依赖java.util.stream.Collectors类内置的静态方法
归集(toList/toSet/toMap)
因为流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。toList、toSet和toMap比较常用,另外还有toCollection、toConcurrentMap等复杂一些的用法。
List<Integer> list = Arrays.asList(1, 6, 3, 4, 6, 7, 9, 6, 20);
List<Integer> listNew = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());
Set<Integer> set = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());
List<Person> personList = new ArrayList<Person>();
personList.add(new Person("Tom", 8900, 23, "male", "New York"));
personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
personList.add(new Person("Anni", 8200, 24, "female", "New York"));
Map<?, Person> map = personList.stream().filter(p -> p.getSalary() > 8000)
.collect(Collectors.toMap(Person::getName, p -> p));
System.out.println("toList:" + listNew);
System.out.println("toSet:" + set);
System.out.println("toMap:" + map);
统计(count/averaging)
Collectors提供了一系列用于数据统计的静态方法:
计数:count 平均值:averagingInt、averagingLong、averagingDouble 最值:maxBy、minBy 求和:summingInt、summingLong、summingDouble 统计以上所有:summarizingInt、summarizingLong、summarizingDouble
//统计员工人数、平均工资、工资总额、最高工资。
Long collect5 = personList.stream().collect(Collectors.counting());
System.out.println("员工个数为"+collect5);
Double collect6 = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));
System.out.println("平均数"+collect6);
Integer collect7 = personList.stream().collect(Collectors.summingInt(Person::getSalary));
System.out.println("工资和"+collect7);
Optional<Integer> collect8 = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));
System.out.println("最高工资"+collect8.get());
DoubleSummaryStatistics collect9 = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));
System.out.println("最高工资"+collect9);
// 员工个数为9
// 平均数8111.111111111111
// 工资和73000
// 最高工资9500
// 最高工资DoubleSummaryStatistics{count=9, sum=73000.000000, min=7000.000000, average=8111.111111, max=9500.000000}
分组(partitioningBy/groupingBy)
- 分区:将
stream按条件分为两个Map,比如员工按薪资是否高于8000分为两部分。 - 分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组
//将员工按薪资是否高于8000分为两部分;将员工按性别和地区分组
Map<Boolean, List<Person>> collect10 = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));
Map<String, List<Person>> collect11 = personList.stream().collect(Collectors.groupingBy(Person::getSex));
//将员工先按性别分组,再按地区分组
Map<String, Map<String, List<Person>>> collect12 = personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));
System.out.println("员工按薪资是否大于8000分组情况:" + collect10);
System.out.println("员工按性别分组情况:" + collect11);
System.out.println("员工按性别、地区:" + collect12);
//员工按薪资是否大于8000分组情况:{false=[Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}], true=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}]}
//员工按性别分组情况:{female=[Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}], male=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}]}
//员工按性别、地区:{female={New York=[Person{name='Anni', salary=8200, age=24, sex='female', area='New York'}, Person{name='Alisa', salary=7900, age=26, sex='female', area='New York'}], Washington=[Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}, Person{name='Lily', salary=7800, age=21, sex='female', area='Washington'}]}, male={New York=[Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}, Person{name='Owen', salary=9500, age=25, sex='male', area='New York'}, Person{name='Tom', salary=8900, age=23, sex='male', area='New York'}], Washington=[Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}, Person{name='Jack', salary=7000, age=25, sex='male', area='Washington'}]}}
}
接合(joining)
joining可以将stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。
List<Person> personList = new ArrayList<Person>();
personList.add(new Person("Tom", 8900, 23, "male", "New York"));
personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
String names = personList.stream().map(p -> p.getName()).collect(Collectors.joining(","));
System.out.println("所有员工的姓名:" + names);
List<String> list = Arrays.asList("A", "B", "C");
String string = list.stream().collect(Collectors.joining("-"));
System.out.println("拼接后的字符串:" + string);
//所有员工的姓名:Tom,Jack,Lily
//拼接后的字符串:A-B-C
归约(reducing)
Collectors类提供的reducing方法,相比于stream本身的reduce方法,增加了对自定义归约的支持。
List<Person> personList = new ArrayList<Person>();
personList.add(new Person("Tom", 8900, 23, "male", "New York"));
personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
// 每个员工减去起征点后的薪资之和
Integer sum = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
System.out.println("员工扣税薪资总和:" + sum);
// stream的reduce
Optional<Integer> sum2 = personList.stream().map(Person::getSalary).reduce(Integer::sum);
System.out.println("员工薪资总和:" + sum2.get());
//员工扣税薪资总和:8700
//员工薪资总和:23700
7、排序(sorted)
sorted,中间操作。有两种排序:
- sorted():自然排序,流中元素需实现Comparable接口
- sorted(Comparator com):Comparator排序器自定义排序
List<Person> personList = new ArrayList<Person>();
personList.add(new Person("Sherry", 9000, 24, "female", "New York"));
personList.add(new Person("Tom", 8900, 22, "male", "Washington"));
personList.add(new Person("Jack", 9000, 25, "male", "Washington"));
personList.add(new Person("Lily", 8800, 26, "male", "New York"));
personList.add(new Person("Alisa", 9000, 26, "female", "New York"));
// 按工资升序排序(自然排序)
List<String> newList = personList.stream().sorted(Comparator.comparing(Person::getSalary)).map(Person::getName)
.collect(Collectors.toList());
// 按工资倒序排序
List<String> newList2 = personList.stream().sorted(Comparator.comparing(Person::getSalary).reversed())
.map(Person::getName).collect(Collectors.toList());
// 先按工资再按年龄升序排序
List<String> newList3 = personList.stream()
.sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge)).map(Person::getName)
.collect(Collectors.toList());
// 先按工资再按年龄自定义排序(降序)
List<String> newList4 = personList.stream().sorted((p1, p2) -> {
if (p1.getSalary() == p2.getSalary()) {
return p2.getAge() - p1.getAge();
} else {
return p2.getSalary() - p1.getSalary();
}
}).map(Person::getName).collect(Collectors.toList());
System.out.println("按工资升序排序:" + newList);
System.out.println("按工资降序排序:" + newList2);
System.out.println("先按工资再按年龄升序排序:" + newList3);
System.out.println("先按工资再按年龄自定义降序排序:" + newList4);
8、 提取/组合
也可以进行合并、去重、限制、跳过等操作
concat:合并
distinct:去重
limit:限制
skip:跳过
String[] arr1 = { "a", "b", "c", "d" };
String[] arr2 = { "d", "e", "f", "g" };
Stream<String> stream1 = Stream.of(arr1);
Stream<String> stream2 = Stream.of(arr2);
// concat:合并两个流 distinct:去重
List<String> newList = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());
// limit:限制从流中获得前n个数据
List<Integer> collect = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());
// skip:跳过前n个数据
List<Integer> collect2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());
System.out.println("流合并:" + newList);
System.out.println("limit:" + collect);
System.out.println("skip:" + collect2);
//流合并:[a, b, c, d, e, f, g]
//limit:[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
//skip:[3, 5, 7, 9, 11]