使用Guava轻松搞定树结构!无需使用其他工具类!

797 阅读7分钟

使用 Guava 轻松搞定树形结构!无需使用其他工具类!

未经允许禁止转载!

在业务开发中,树形结构(如组织架构树、产品目录树、分类树等)很常见。很多人选择自行实现这些树形结构的操作,但实际上,我们可以使用 Guava 提供的相关类,避免重复造轮子。

Google 的开源库 Guava 提供了一些便捷的方法来处理树形结构。事实上,其主要提供了对于图结构的相关处理方法,同时可以兼容树、森林的处理。本文仅做抛砖引玉,介绍常见的用法。

本文第 3 节分析的工具类方法主要来自《解密阿里大神写的天书般的Tree工具类,轻松搞定树结构!》《我是如何给阿里大神Tree工具类做CodeReview并优化的

1. 使用 Guava 遍历树形结构

Guava 的 Traverser 类是一个非常有用的工具,它可以处理树形结构、图的遍历。通过使用这个类,你可以轻松实现各种树的深度优先搜索(DFS)、广度优先搜索(BFS)操作。

1.1 Traverser 类的使用

实际上,需要遍历树时,只需要指定 父节点 => 子节点集合 的映射方法即可。

record Node(String name, @NonNull List<Node> children) {}

class TreeTraversalDemo {
    public static void main(String[] args) {
        // 构建树
        Node leaf1 = new Node("Leaf1", List.of());
        Node leaf2 = new Node("Leaf2", List.of());
        Node child1 = new Node("Child1", List.of(leaf1));
        Node child2 = new Node("Child2", List.of(leaf2));
        Node root = new Node("Root", List.of(child1, child2));
				
      	// Traverser: Guava 提供的不可变对象,封装了遍历算法
        Traverser<Node> traverser = Traverser.forTree(Node::children);
     		// breadthFirst 方法返回 Iterator 类型
        List<String> bfs = Streams.stream(traverser.breadthFirst(root))
            .map(Node::name)
            .toList();
        System.out.println("bfs = " + bfs);

        List<String> dfsPostOrder = Streams.stream(traverser.depthFirstPostOrder(root))
            .map(Node::name)
            .toList();
        System.out.println("dfsPostOrder = " + dfsPostOrder);

        List<String> dfsPreOrder = Streams.stream(traverser.depthFirstPreOrder(root))
            .map(Node::name)
            .toList();
        System.out.println("dfsPreOrder = " + dfsPreOrder);
    }
}

输入的树为:

​ Root

​ / \

Child1 Child2

​ | |

Leaf1 Leaf2

输出结果为:

bfs = [Root, Child1, Child2, Leaf1, Leaf2]
dfsPostOrder = [Leaf1, Child1, Leaf2, Child2, Root]
dfsPreOrder = [Root, Child1, Leaf1, Child2, Leaf2]

1.2 遍历结果是懒计算的

注意:遍历的结果是懒计算的,Traverser#breadthFirst 等返回返回 Iterator 类型。

  1. 不要在遍历中改变节点间的关系。如果想要改变,选择需要改变的节点,显式指定计算后(如 iterator -> stream -> list, 将遍历结果保存起来)再修改结果。
  2. iterator 可以多次求值,其逻辑相比 stream 只能求解一次来说更违反人的认知逻辑,因为多次求解的结果可能不同。这也是为什么 Stream 只能使用一次的原因之一。
  3. 建议优先不使用懒计算。只有在需要使用懒计算时,再使用懒计算。

1.3 使用流式编程进行后续操作

流式编程可能是函数式编程中流传最广的编程模式,你可以对遍历结果(Iterator)进行各种操作,如 find、filter、peek、map、flatMap、reduce、collect等操作。 有两种编程模式可以选择,Guava 提供了 Iterables 工具类,可以实现流式编程;更推荐转换为 Stream 流,其为官方推荐的编程模式,也便于他人阅读代码和交流,Guava 中可以使用 Streams#stream 方法将 iterator 转换为流。

示例:查找树中的特定节点

// 普通实现
Node targetNode = null;
for (Node node : traverser.preOrderTraversal(rootNode)) {
    if (node.name.equals("目标节点")) {
        targetNode = node;
        break;
    }
}

// 流式实现:更简单易懂
Optional<Node> targetNode = Streams.stream(traverser.depthFirstPreOrder(rootNode))
    .findFirst(node -> "目标节点".equals(node.name));

1.4 树形结构不一定是显式的

实际上,我们不必在每一个节点都维护其子节点,比如Node#getChildren方法。有时候,可以通过外部的 Map, Multimap 实现相同的功能,这样做的好处是无需修改原有的类设计,图(树)和类设计之间解耦,减轻编码负担。

2. 使用 Graph 创建树

Guava 中创建树可以使用 builder 模式进行创建,我们无需关注其底层实现,不管其底层是邻接表还是哈希表,Guava 会尽可能保证底层实现更高效。

Guava支持可变推荐优先使用不可变对象,其有多种好处,如方便理解、便于测试、支持并发、底层实现可以更高效等。

以下是使用 GraphBuilder 创建树形结构的示例:

class OrganizationStructureDemo {

    record OrganizationNode(String name) {}
    public static void main(String[] args) {
        // 创建组织节点
      	// 这里纠结使用 cEO 还是 ceo?有没有人给出自己的理解?
        OrganizationNode cEO = new OrganizationNode("CEO");
        OrganizationNode cTO = new OrganizationNode("CTO");
        OrganizationNode cFO = new OrganizationNode("CFO");
        OrganizationNode devLead = new OrganizationNode("Dev Lead");
        OrganizationNode dev1 = new OrganizationNode("Developer 1");
        OrganizationNode dev2 = new OrganizationNode("Developer 2");
        OrganizationNode financeLead = new OrganizationNode("Finance Lead");
        OrganizationNode accountant1 = new OrganizationNode("Accountant 1");
        OrganizationNode accountant2 = new OrganizationNode("Accountant 2");

        // 使用 GraphBuilder 构建组织架构的下属关系(从上级指向下级)
        ImmutableGraph<OrganizationNode> organizationGraph =
            GraphBuilder.directed()    // 树是有方向的(从上级指向下级)
                .<OrganizationNode>immutable()
                .putEdge(cEO, cTO)          // CEO -> CTO
                .putEdge(cEO, cFO)          // CEO -> CFO
                .putEdge(cTO, devLead)      // CTO -> Dev Lead
                .putEdge(devLead, dev1)     // Dev Lead -> Developer 1
                .putEdge(devLead, dev2)     // Dev Lead -> Developer 2
                .putEdge(cFO, financeLead)  // CFO -> Finance Lead
                .putEdge(financeLead, accountant1)  // Finance Lead -> Accountant 1
                .putEdge(financeLead, accountant2)  // Finance Lead -> Accountant 2
                .build();

        // 遍历和显示节点关系
        System.out.println("Organization Structure (Subordinate Relationships):");
        organizationGraph.nodes()
            .forEach(node -> {
                System.out.println(node + " has subordinates: ");
                organizationGraph.successors(node)
                    .forEach(successor -> System.out.println("  -> " + successor));
            });
    }
}

结果如下:

Organization Structure (Subordinate Relationships):
OrganizationNode[name=CEO] has subordinates: 
  -> OrganizationNode[name=CTO]
  -> OrganizationNode[name=CFO]
OrganizationNode[name=CTO] has subordinates: 
  -> OrganizationNode[name=Dev Lead]
OrganizationNode[name=CFO] has subordinates: 
  -> OrganizationNode[name=Finance Lead]
OrganizationNode[name=Dev Lead] has subordinates: 
  -> OrganizationNode[name=Developer 1]
  -> OrganizationNode[name=Developer 2]
OrganizationNode[name=Developer 1] has subordinates: 
OrganizationNode[name=Developer 2] has subordinates: 
OrganizationNode[name=Finance Lead] has subordinates: 
  -> OrganizationNode[name=Accountant 1]
  -> OrganizationNode[name=Accountant 2]
OrganizationNode[name=Accountant 1] has subordinates: 
OrganizationNode[name=Accountant 2] has subordinates: 

3. 锐评大多数 Tree 工具类

笔者认为:很多工具类的设计看似简化了对树的处理,添加了所谓的便利方法,实际上是在重复造轮子,同时徒增学习成本。不如熟读 Guava 文档,理解 Graph 的使用并结合流式编程、不可变对象实现相应需求。

以下我们来看看一些工具类的实现:

3.1 创建树

public class TreeUtil {
    public static <E> List<E> makeTree(List<E> list, Predicate<E> rootCheck, BiFunction<E, E, Boolean> parentCheck, BiConsumer<E, List<E>> setSubChildren) {
        return list.stream().filter(rootCheck).peek(x -> setSubChildren.accept(x, makeChildren(x, list, parentCheck, setSubChildren))).collect(Collectors.toList());
    }
}

创建树的方法,奇怪的函数接口用法,不明所以,还不如用户手动维护。

Guava 中使用 builder 模式创建树或图,支持多种模式,比如有向图、无向图、权重图等等,请看第 2 节的示例。

3.2 过滤 filter

public static <E> List<E> filter(List<E> tree, Predicate<E> predicate, Function<E, List<E>> getChildren) {
    return tree.stream().filter(item -> {
        if (predicate.test(item)) {
            List<E> children = getChildren.apply(item);
            if (children != null && !children.isEmpty()) {
                filter(children, predicate, getChildren);
            }
            return true;
        }
        return false;
    }).collect(Collectors.toList());
}

//只保留id<5的节点
List<MenuVo> filterMenus =TreeUtil.filter(tree1,x->x.getId()<5,MenuVo::getSubMenus);

执行 Traverser -> Stream -> filter -> list 即可。

Traverser traverser = Traverser.forTree(MenuVo::getSubMenus);
List<MenuVo> menus = Streams.stream(traverser.breadthFirst(root))
  .filter(x -> x.getId() < 5)
  .toList();

3.3 打平 flat

public static <E> List<E> flat(List<E> tree, Function<E, List<E>> getSubChildren, Consumer<E> setSubChildren) {
    List<E> res = new ArrayList<>();
    forPostOrder(tree, item -> {
        setSubChildren.accept(item);
        res.add(item);
    }, getSubChildren);
    return res;
}

// 使用
List<Menu> flat = TreeUtil.flat(tree, Menu::getSubMenus,x->x.setSubMenus(null));
Assert.assertEquals(flat.size(),menuList.size());
flat.forEach(x->{
    Assert.assertTrue(x.getSubMenus()==null);
});

设计工具类的原则:尽量避开副作用。Consumer 大多数情况都是具有副作用的。理想的设计应该是打平后,再使用consumer 进行消费。

打平即遍历,收集每一个节点到 List 中,可以使用 Stream 轻松实现。所以这个方法可以删除掉。

Java 已经提供了 Stream 流式编程的支持,所有的流式编程相关操作及其组合而成的工具方法都不必要了。

3.4 排序 sort

public static <E> List<E> sort(List<E> tree, Comparator<? super E> comparator, Function<E, List<E>> getChildren) {
    for (E item : tree) {
        List<E> childList = getChildren.apply(item);
        if (childList != null && !childList.isEmpty()) {
            sort(childList,comparator,getChildren);
        }
    }
  	// 依然是副作用的设计,需要 List 是可变的
    tree.sort(comparator);
    return tree;
}

实际上,图创建的时候就应该指定好同级节点顺序,Graph 默认是插入顺序,还支持自然排序,根据比较器排序等等,请看 ElementOrder

ImmutableGraph<OrganizationNode> organizationGraph =
    GraphBuilder.directed()
  			// 创建时指定排序即可
        .nodeOrder(ElementOrder.sorted(Comparator.comparing(OrganizationNode::order)))
        .immutable()
        .putEdge(CEO, CTO)          // CEO -> CTO
        .putEdge(CEO, CFO)          // CEO -> CFO
        .putEdge(CTO, DevLead)      // CTO -> Dev Lead
        .putEdge(DevLead, Dev1)     // Dev Lead -> Developer 1
        .putEdge(DevLead, Dev2)     // Dev Lead -> Developer 2
        .putEdge(CFO, FinanceLead)  // CFO -> Finance Lead
        .putEdge(FinanceLead, Accountant1)  // Finance Lead -> Accountant 1
        .putEdge(FinanceLead, Accountant2)  // Finance Lead -> Accountant 2
        .build();

4. 总结

对树形结构遍历是开发中常见的需求,使用 Guava 类库可以轻松实现树的创建和遍历。

以下是使用 Graph、Traverser 时的一些原则:

  1. 使用 builder 模式创建复杂对象
  2. 尽量使用不可变对象
  3. 不必自己在节点中维护关联关系
  4. 仅在需要进行懒计算的时候使用
  5. 优先使用流式编程

工具类库的设计原则:

  1. 应该尽量避免副作用,尽量支持不可变数据结构
  2. 避免重复造轮子
  3. 多使用不可变类型,如 Traverser,ElementOrder