mysql巧妙化解递归查询树形数据 | 纯sql

13,531 阅读4分钟

本文正在参加「技术专题19期 漫谈数据库技术」活动

前言

  • 开发中树形结构应该是很常见的一种数据结构了。而在数据库方面往往也都伴随相应的树形设计。在 mysql 中通过 parent_id 来绑定其上游,从而达到树形结构的存储,但是在查询的过程中就需要我们将 List 列表转成我们理想中的 Tree 树。

构建树

List<Location> locations = this.baseMapper.selectList(queryWrapper);
Map<String, List<Location>> collect = locations.stream().collect(Collectors.groupingBy(Location::getId));
List<QueryLocationDto> resultList = new ArrayList<>();
List<Location> parentLocation = getParentLocation(1, collect, id);
if (CollectionUtils.isNotEmpty(parentLocation)) {
    for (Location location : parentLocation) {
        QueryLocationDto dto = new QueryLocationDto();
        BeanUtils.copyProperties(location, dto);
        resultList.add(dto);
    }
}
private List<Location> getParentLocation(int level, Map<String, List<Location>> collect, String id) {
        List<Location> locationList = new ArrayList<>();
        if (collect.containsKey(id)) {
            Location location = collect.get(id).get(0);
            locationList.add(location);
            String superid = location.getSuperid();
            locationList.addAll(getParentLocation(level + 1, collect, superid));
        }
        return locationList;
    }
  • 相信大部分我们 都是通过 Java 来处理的。 其中 getParentLocation 就是用递归不断的去构建上下级关系。这种方式也是我比较推荐的,因为这样就把职责分的很清楚 Java 负责处理业务 ,数据库 就仅仅用来做数据的持久化,这也方便我们对数据库切换与升级。否则在更换其他数据库时还需要考虑是否支持递归属性。
public <T> List<OperatorTree> getTree(List<T> parentList , Map<?, List<T>> collectMap, OperatorTreeInterface operatorTreeInterface) throws InvocationTargetException, IllegalAccessException, NoSuchMethodException {
        if (org.apache.commons.collections4.CollectionUtils.isEmpty(parentList)) {
            return new ArrayList<>();
        }
        List<OperatorTree> list = new ArrayList<>();
        OperatorMapping operatorMapping = operatorTreeInterface.operatorMapping();
        for (T t : parentList) {
            OperatorTree tree = new OperatorTree();
            tree.setId(BeanUtils.getProperty(t, operatorMapping.getId()));
            tree.setLabel(BeanUtils.getProperty(t, operatorMapping.getLabel()));
            tree.setRealData(t);
            if (collectMap.containsKey(tree.getId())) {
                List<T> ts = collectMap.getOrDefault((tree.getId()), new ArrayList<>());
                tree.setChildren(getTree(ts, collectMap, operatorTreeInterface));
            } else {
                try {
                    List<T> ts = collectMap.getOrDefault(Long.valueOf(tree.getId()), new ArrayList<>());
                    tree.setChildren(getTree(ts, collectMap, operatorTreeInterface));
                } catch (Exception e) {
                    tree.setChildren(getTree(new ArrayList<>(), collectMap, operatorTreeInterface));
                }
            }
            list.add(tree);
        }
        return list;
    }
  • 有的时候为了能够量产化,这里我也针对项目的场景利用泛型进行一次封装。有兴趣可以自己针对自己的项目场景进行封装。这样树形与列表的转换就无须每次冗余了。然而今天我们的重点是如何利用 mysql 来实现递归查询, 虽然这种方式个人不推荐使用,但我们还是需要了解 mysql 的特性的。

image-20221111151153226.png

  • 如图我们先在数据库中创建一张 test 表, 表里构建一棵树出来。 祖父→父亲→孙子

请根据选中节点查询其上游关系

  • 啥意思呢?就是根据你我想找到你家血脉关系。

image-20221111152248057.png

  • 这个业务本身没有难点,我们只需要一步一步的去寻找即可。但是从技术层面上看就有点搞头了。首先我们不确定是多少层,这就无法通过代码堆砌的方法进行实现了。只能动态的去递归查询。
SELECT t2.id, t2.`name`,t1.lvl
FROM
    (
        SELECT 
        @r AS _id,
        (SELECT @r := parent_id FROM test WHERE id = _id) AS parent_id,
        @l := @l + 1 AS lvl
        FROM
        (SELECT @r := 3, @l := 0) vars, test AS h
        WHERE @r <> 0 
    ) t1
JOIN test t2
ON t1._id = t2.Id
order by t1.lvl

image-20221111152741090.png

  • 通过上述代码我们即可完成家族血脉的查询。能够清楚的查出家族的具体支脉。

解析

  • 上面的 sql 虽然能够实现递归,但是好像和我们平时接触的 sql 不大一样。这里我们简单分析下
  • 首先 mysql 是支持我们用户定义对象的。比如下面这个 sql
set @name = '123';
select @name from dual;
  • 执行上面的sql 你会发现查出来的就是 123 。 这就是使用到 mysql 中变量定义功能。 通过 @ 来进行对象的定义以及赋值。

image-20221111153933916.png

  • 首先 mysql的执行顺序是由里及外 。 就是说越在内部越先执行。所以针对上面的 SQL 我们将它整理下顺序能够得出。

image-20221111154225881.png

  • 注意 (SELECT @r := parent_id FROM test WHERE id = _id) AS parent_id, 这段sql 实际上归属于第二层。图示中并没有列出,太占地方了。

第三层

  • 有了上面的两个知识点铺垫,现在我们直接看 SELECT @r := 3, @l := 0 是不是就很容易明白了呢? r、l 就是 mysql 中定义出来的两个变量。分别是3,0 。和我们上面演示案列中 select @name from dual 是一个意思。
  • 至于 (SELECT @r := 3, @l := 0) vars, test AS h这段就更好理解了。test本身就是一张物理表 , 我们定义出来的两个变量也可以理解成一张表。在mysql中查询两种表是为了区分开来正常都是需要各自取别名的。所以我们定义的变量就是 vars 别名 。 test 别名 h

第二层

SELECT 
        @r AS _id,
        (SELECT @r := parent_id FROM test WHERE id = _id) AS parent_id,
        @l := @l + 1 AS lvl
        FROM
        (SELECT @r := 3, @l := 0) vars, test AS h
        WHERE @r <> 0 
  • 第二层可以说是递归的核心 。这里我们需要明白 上述代码为什么会产生递归的效果呢?首先我们知道 mysql 存在 左外连接右外连接内连接 。除了这三种还有一种就是 笛卡尔积连接。什么意思呢?

image-20221111160800485.png

  • 也就是说上面我们的sql FROM (SELECT @r := 3, @l := 0) vars, test AS h 就是为了给我们构建出一个笛卡尔积 ,而我们定义的变量其实就是一张表里的一条数据,所以这里就是将 test 表所有记录都提取出来。

image-20221111161500413.png

image-20221111160800485.png

  • 也就是说我们第二层的sql 就是将 test表全部查出来,然后将其字段进行扩展。说白了这种方式并不是一种真正的递归。但是因为引入了一个变量,所以在扩充的时候和递归一个效果。
  • 但是笛卡尔积查询出来的数据是无法保证两张表的关联性的,所以我们并没有将 h 表相关字段查出来,因为那根本没用。剩下的就是我们一开始说的一步一步的查询扩充字段了

第一层

  • 第一层就简单很多了 ,因为第二层就已经查询出来相关的树形数据了,但是因为第二层使用的笛卡尔积 h 表信息没法使用,仅仅使用了其数量。那么我们的名称这个时候还没有,第一层的作用就是将节点名称扩充出来。

总结

  • 最后我们简单总结下,mysql 的查询递归正常使用存储过程来实现。但是上面提到的方法巧妙的实现了递归的效果。理论上上述方法和存储过程相比存在一个优点就是不会死循环。

本文正在参加「技术专题19期 漫谈数据库技术」活动