简介
Stream(流)是一个来自数据源的元素队列并支持聚合操作
- 元素是特定类型的对象,形成一个队列。 Java中的Stream并不会存储元素,而是按需计算。
- 数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator 等。
- 聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find, match, sorted等。
和以前的Collection操作不同, Stream操作还有两个基础的特征:
- Pipelining: 中间操作都会返回流对象本身。 这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。 这样做可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)。
- 内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式, 通过访问者模式(Visitor)实现。
创建
- 静态数据 Stream.of()
- 容器 collection.stream()
- 动态 Stream.iterate() & Stream.generate ()
- 其他api: Files.lines()…
基本操作
元素流在管道中经过中间操作(intermediate operation)的处理,最后由最终操作(terminal operation)得到前面处理的结果。
forEach 迭代
//使用 forEach 输出10个随机数
Random random = new Random();
random.ints().limit(10).forEach(System.out::println);
map 映射
//使用 map 输出了元素对应的平方数
List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5);
List<Integer> squaresList = numbers.stream().map( i -> i*i).distinct().collect(Collectors.toList());
filter 过滤
//使用 filter 方法过滤出空字符串
List<String>strings = Arrays.asList("abc", "", "bc", "efg", "abcd","", "jkl");
long count = strings.stream().filter(string -> string.isEmpty()).count();// 获取空字符串的数量
limit 限定
//使用 limit 方法打印出 10 条数据
Random random = new Random();
random.ints().limit(10).forEach(System.out::println);
sorted 排序
//使用 sorted 方法对输出的 10 个随机数进行排序
Random random = new Random();
random.ints().limit(10).sorted().forEach(System.out::println);
Stream.collect()
- collect vs reduce?
- reduce 操作不可变数据
- collect 操作可变数据
- collect(Supplier, Accumulator, Combiner)
- collect(Collector)
Collector
Collector 要素
- Supplier: 累积数据构造函数
- Accumulator: 累积函数,同reduce
- Combiner: 合并函数,并行处理场合下用,同reduce
- Finisher: 对累积数据做最终转换
- *Characteristics: 特征(并发/无序/无finisher)
API
- toList/to(Concurrent)Map/toSet/toCollection
- counting/averagingXX/joining/summingXX
- groupBy/partitioningBy
- mapping/reducing
Collectors.groupBy
- groupingBy(Function) – 单纯分key存放成Map,默认使用HashMap
- groupingBy(Function, Collector) - 分key后,对每个key的元素进行后续collect操作
- groupingBy(Function, Suppiler, Collector) - 同上,允许自定义Map创建