Java8中你可能不知道的一些地方之Stream实战一

1,451 阅读10分钟

说起流,我们会想起手机 ,电脑组装流水线,物流仓库商品包装流水线等等。如果把手机 ,电脑,包裹看做最终结果的话,那么加工商品前的各种零部件就可以看做数据源,而中间一系列的加工作业操作,就可以看做流的处理。

流的概念

Java Se中对于流的操作有输入输出IO流,而Java8中引入的Stream 属于Java API中的一个新成员,它允许你以声明性方式处理数据集合,Stream 使用一种类似 SQL 语句从数据库查询数据的直观方式来提供一种对 Java 集合运算和表达的高阶抽象。 注意这里的流操作可以看做是对集合数据的处理。

简单来说,流是一种数据渠道,用于操作数据源(集合、数组、文件等)所生产的元素序列。

  • 源-流会使用一个提供数据的源,如集合、数组或输入|输出资源。

从有序集生成流时会保留原有的顺序。由列表生成的流,其元素顺序与列表一致

  • 元素序列-就像集合一样,流也提供了一个接口,可以访问特定元素类型的一组有序值。
  • 数据处理操作-流的数据处理功能支持类似于数据库的操作(数据筛选、过滤、排序等操作)。
  • 流水线-多个流操作本身会返回一个流,多个操作就可以链接起来,成为数据处理的一道流水线。

流&集合

  • 计算的时期

集合中数据都是计算完毕的数据,例如从数据库中查询用户记录 按用户id 查询 降序排列 然后通过list 接收用户记录,数据的计算已在放入集合前完成。

流中数据按需计算,按照使用者的需要计算数据,例如通过搜索引擎进行搜索,搜索出来的条目并不是全部呈现出来的,而且先显示最符合的前 10 条或者前 20 条,只有在点击 “下一页” 的时候,才会再输出新的 10 条。流的计算也是这样,当用户需要对应数据时,Stream 才会对其进行计算处理。

  • 外部迭代与内部迭代

把集合比作一个工厂的仓库的话,一开始工厂硬件比较落后,要对货物作什么修改,此时工人亲自走进仓库对货物进行处理,有时候还要将处理后的货物转运到另一个仓库中。此时对于开发者来说需要亲自去做迭代,一个个地找到需要的货物,并进行处理,这叫做外部迭代。

当工厂发展起来后,配备了流水线作业,工厂只要根据需求设计出相应的流水线,然后工人只要把货物放到流水线上,就可以等着接收成果了,而且流水线还可以根据要求直接把货物输送到相应的仓库。

这就叫做内部迭代,流水线已经帮你把迭代给完成了,你只需要说要干什么就可以了(即设计出合理的流水线)。相当于 Java8 引入的Stream 对数据的处理实现了”自动化”操作。

流操作过程

整个流操作就是一条流水线,将元素放在流水线上一个个地进行处理。需要注意的是:很多流操作本身就会返回一个流,所以多个操作可以直接连接起来, 如下图这样,操作可以进行链式调用,并且并行流还可以实现数据流并行处理操作。

总的来说,流操作过程分为三个阶段:

  • 创建

借助数据源创建流对象

  • 中间处理

筛选、切片、映射、排序等中间操作

  • 终止流

匹配、汇总、分组等终止操作

流的创建

对流操作首先要创建对应的流,流的创建集中形式如下:

1 集合创建流

在 Java 8 中, 集合接口有两个方法来生成流:

  • stream() − 为集合创建串行流。
  • parallelStream() − 为集合创建并行流。

示例代码如下:

public static void main(String[] args) {
    /**
         * 定义集合l1 并为集合创建串行流
         */
    List<String> l1 = Arrays.asList("周星驰""周杰伦""周星星""周润发");
    // 返回串行流
    l1.stream();
    // 返回并行流
    l1.parallelStream();
}

上述操作得到的流是通过原始数据转换过来的流,除了这种流创建的基本操作外,对于流的创建还有以下几种方式。

2 值创建流

Stream.of(T...) : Stream.of("aa", "bb") 生成流

//值创建流 生成一个字符串流
Stream<String> stream = Stream.of("java8""Spring""SpringCloud");
stream.forEach(System.out::println);

3 数组创建流

根据参数的数组类型创建对应的流。

  • Arrays.stream(T[ ])
  • Arrays.stream(int[ ])
  • Arrays.stream(double[ ])
  • Arrays.stream(long[ ])
 /**
 * 这里以int 为例   long double 不再举例
 */
 Stream stream = Arrays.stream(Arrays.asList(10203040).toArray());
 // 根据数组索引范围创建指定Stream
 stream = Arrays.stream(Arrays.asList(10203040).toArray(), 02);

4 文件生成流

stream = Files.lines(Paths.get("C:\\java\\jdbc.properties"));
System.out.println(stream.collect(Collectors.toList()));
// 指定字符集编码
stream = Files.lines(Paths.get("C:\\java\\jdbc.properties"), Charset.forName("utf-8"));
System.out.println(stream.collect(Collectors.toList()));

5 函数生成流

两个方法:

  • iterate : 依次对每个新生成的值应用函数
  • generate :接受一个函数,生成一个新的值
 // 重100 开始 生成偶数流
 Stream.iterate(100, n -> n + 2);
 // 产生1-100 随机数
 Stream.generate(() ->(int) (Math.random() * 100 + 1));

流中间操作

流的中间操作分为三大类:筛选切片、映射、排序。

筛选切片:类似sql 中where 条件判断的意思,对元素进行筛选操作

映射:对元素结果进行转换 ,优点类似select 字段意思或者对元素内容进行转换处理

排序:比较好理解 ,常用sql 中按字段升序 降序操作

流中间操作数据准备(这里以订单数据处理为例)

@Data
public class Order {
    // 订单id
    private Integer id;
    // 订单用户id
    private Integer userId;
    // 订单编号
    private String orderNo;
    // 订单日期
    private Date orderDate;
    // 收货地址
    private String address;
    // 创建时间
    private Date createDate;
    // 更新时间
    private Date updateDate;
    // 订单状态  0-未支付  1-已支付  2-待发货  3-已发货  4-已接收  5-已完成
    private Integer status;
    // 是否有效  1-有效订单  0-无效订单
    private Integer isValid;
    //订单总金额
    private  Double total;
  }

Order order01 = new Order(110"20190301",
                new Date(), "上海市-浦东区"new Date(), new Date(), 41100.0);
Order order02 = new Order(230"20190302",
                    new Date(), "北京市四惠区"new Date(), new Date(), 112000.0);
Order order03 = new Order(320"20190303",
                    new Date(), "北京市-朝阳区"new Date(), new Date(), 41500.0);
Order order04 = new Order(440"20190304",
                    new Date(), "北京市-大兴区"new Date(), new Date(), 41256.0);
Order order05 = new Order(540"20190304",
                    new Date(), "上海市-松江区"new Date(), new Date(), 411000.0);
ordersList = Arrays.asList(order01, order02, order03, order04, order05);

筛选&切片

  • 筛选有效订单
// 过滤有效订单
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .forEach(System.out::println);
  • 筛选有效订单 取第一页数据(每页2条记录)
 // 过滤有效订单 取第一页数据(每页2条记录) 
 ordersList.stream().filter((order) -> order.getIsValid() == 1)
     .limit(2)
     .forEach(System.out::println);
  • 筛选订单集合有效订单 取最后一条记录
// 过滤订单集合有效订单 取最后一条记录
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .skip(ordersList.size() - 2)  // 跳过前ordersList.size()-2 记录
    .forEach(System.out::println);
  • 筛选有效订单 取第3页数据(每页2条记录)
// 过滤有效订单 取第3页数据(每页2条记录) 并打印到控制台
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .skip((3 - 1) * 2)
    .limit(2)
    .forEach(System.out::println);
  • 筛选无效订单去除重复订单号记录
// 过滤无效订单 去除重复订单号记录  重写Order equals 与 hashCode 方法
ordersList.stream().filter((order) -> order.getIsValid() == 0)
    .distinct()
    .forEach(System.out::println);

映射

  • 过滤有效订单,获取所有订单编号
//过滤有效订单,获取所有订单编号
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .map((order) -> order.getOrderNo())
    .forEach(System.out::println);
  • 过滤有效订单 ,并分离每个订单下收货地址市区信息
ordersList.stream().map(o -> o.getAddress()
    .split("-"))
    .flatMap(Arrays::stream)
    .forEach(System.out::println);

排序

  • 过滤有效订单 根据用户id 进行排序
//过滤有效订单 根据用户id 进行排序
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .sorted((o1, o2) -> o1.getUserId() - o2.getUserId())
    .forEach(System.out::println);  

 //或者等价写法 
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .sorted(Comparator.comparingInt(Order::getUserId))
    .forEach(System.out::println);
  • 过滤有效订单 ,根据订单状态排序 如果订单状态相同根据订单创建时间排序
//过滤有效订单  如果订单状态相同 根据订单创建时间排序 反之根据订单状态排序
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .sorted((o1, o2) -> {
        if (o1.getStatus().equals(o2.getStatus())) {
            return o1.getCreateDate().compareTo(o2.getCreateDate());
        } else {
            return o1.getStatus().compareTo(o2.getStatus());
    }})
    .forEach(System.out::println);


// 等价形式
ordersList.stream().filter((order) -> order.getIsValid() == 1)
    .sorted(Comparator.comparing(Order::getCreateDate)
    .thenComparing(Comparator.comparing(Order::getStatus)))
    .forEach(System.out::println);