羊羊刷题笔记Day24/60 | 第七章 回溯算法P1 | 回溯算法理论基础、77. 组合

157 阅读11分钟

千呼万唤始出来。在二叉树碰过并运用回溯思想不止一遍了~

回溯算法理论基础

题目分类

图片来源:代码随想录

什么是回溯法

回溯法也可以叫做回溯搜索法,它是一种搜索的方式。
其实在二叉树中,已经不止一次,提到了回溯,例如二叉树:以为使用了递归,其实还隐藏着回溯
递归和回溯是你中有我,我中有你的关系。回溯是递归的副产品,只要有递归就会有回溯
所以以下讲解中,回溯函数也就是递归函数,指的都是一个函数

回溯法的效率

回溯法的性能如何呢,这里要和大家说清楚了,
虽然回溯法很难,很不好理解,但是回溯法并不是什么高效的算法
因为回溯的本质是穷举,穷举所有可能,然后选出我们想要的答案。(如果想让回溯法高效一些,可以加一些剪枝的操作,但也改不了回溯法就是穷举的本质)
那么既然回溯法并不高效为什么还要用它呢?
因为没得选,一些问题能暴力搜出来就不错了,撑死了再剪枝一下,没有更高效的解法了。
那么都是什么问题,这么牛逼,只能暴力搜索。

回溯法解决的问题

回溯法,一般可以解决如下几种问题:

  • 组合问题:N个数里面按一定规则找出k个数的集合(12 13 14)
  • 切割问题:一个字符串按一定规则有几种切割方式
  • 子集问题:一个N个数的集合里有多少符合条件的子集(1 12 123)
  • 排列问题:N个数按一定规则全排列,有几种排列方式
  • 棋盘问题:N皇后,解数独等等

相信看着这些之后会发现,每个问题,都不简单!

补充定义:组合是不强调元素顺序的,排列是强调元素顺序。 例如12是组合,而12、21是排列

如何理解回溯法

回溯法解决的问题都可以抽象为树形结构,是的,所有回溯法的问题都可以抽象为树形结构!
因为回溯法解决的都是在集合中递归查找子集,集合的大小就构成了树的宽度,递归的深度,都构成的树的深度
递归就要有终止条件,所以必然是一棵高度有限的树(N叉树)。
(后面的回溯算法解决的所有题目中,都会强调这一点并画图举相应的例子,现在有一个印象就行)

🔴回溯法模板

二叉树的递归遍历中,介绍了递归三部曲,这里给出回溯三部曲

  • 回溯函数模板返回值以及参数

在回溯算法中,方法名起名随意。建议函数名为backtracking
回溯算法中函数返回值一般为void
再来看一下参数,因为回溯算法需要的参数不像二叉树递归的时候那么容易一次性确定下来,所以一般是先写逻辑,然后需要什么参数,就填什么参数。
回溯函数伪代码如下:

public void backtracking(参数)
  • 回溯函数终止条件

既然是树形结构,那么在二叉树的递归遍历的时候,就知道遍历树形结构一定要有终止条件,所以回溯也有终止条件。
什么时候达到了终止条件,树中就可以看出,一般来说搜到叶子节点了,也就找到了满足条件的一条答案,把这个答案存放起来,并结束本层递归。
所以回溯函数终止条件伪代码如下:

if (终止条件) {
    存放结果;
    return;
}
  • 回溯搜索的遍历过程

在上面我们提到了,回溯法一般是在集合中递归搜索,集合的大小构成了树的宽度,递归的深度构成的树的深度
如图:
image.png
回溯函数遍历过程伪代码如下:

for (选择:本层集合中元素(树中节点孩子的数量就是集合的大小)) {
    处理节点;
    backtracking(路径,选择列表); // 递归
    回溯,撤销处理结果
}

for循环就是遍历该层树集合区间,可以理解一个节点有多少个孩子,这个for循环就执行多少次。
backtracking就是自己调用自己,实现递归。
大家可以从图中看出for循环可以理解是横向遍历,backtracking(递归)就是纵向遍历,这样就把这棵树全遍历完了,一般来说,搜索叶子节点就是找的其中一个结果了。
分析完过程,回溯算法模板框架如下:

public void backtracking(参数) {
    if (终止条件) {
        存放结果;
        return;
    }

    for (选择:本层集合中元素(树中节点孩子的数量就是集合的大小)) {
        处理节点;
        backtracking(路径,选择列表); // 递归:每个节点都向下遍历
        回溯,撤销处理结果
    }
}

这份模板很重要,后面做回溯法的题目都靠它了!

总结

本部分讲述了什么是回溯算法,知道了回溯和递归是相辅相成的。
接着提到了回溯法的效率,回溯法其实就是暴力查找,并不是什么高效的算法。
然后列出了回溯法可以解决的几类问题,可以看出每一类问题都不简单。
最后我们讲到回溯法解决的问题都可以抽象为树形结构(N叉树),并给出了回溯法的模板。

77 组合

理论结束,带着模板,开始实战,理解回溯~

思路

本题是回溯法的经典题目。
直接的解法当然是使用for循环,例如示例中k为2,很容易想到 用两个for循环,这样就可以输出 和示例中一样的结果。
代码如下:

int n = 4;
for (int i = 1; i <= n; i++) {
    for (int j = i + 1; j <= n; j++) {
        cout << i << " " << j << endl;
    }
}

输入:n = 100,** k = 3 那么就三层for循环**,代码如下:

int n = 100;
for (int i = 1; i <= n; i++) {
    for (int j = i + 1; j <= n; j++) {
        for (int u = j + 1; u <= n; n++) {
            cout << i << " " << j << " " << u << endl;
        }
    }
}

如果n为100,**k为50呢,那就50层for循环,**是不是开始窒息。
此时就会发现虽然想暴力搜索,但是用for循环嵌套连暴力都写不出来!
因此,回溯搜索法来了,虽然回溯法也是暴力,但至少能写出来,不像for循环嵌套k层让人绝望。


那么回溯法是如何解决for循环的问题去暴力搜呢?
以上面 n为100,k为50的例子,暴力写法需要嵌套50层for循环,那么回溯法就用递归来解决嵌套层数的问题
递归来做层叠嵌套(可以理解是开k层for循环),每一次的递归中嵌套一个for循环,那么递归就可以用于解决多层嵌套循环的问题了
此时递归的层数大家应该知道了,例如:n为100,k为50的情况下,就是递归50层。
如果脑洞模拟回溯搜索的过程,绝对可以让人窒息,所以需要抽象图形结构来进一步理解。
在前面理论基础中说到:
那么我把组合问题抽象为如下树形结构:
image.png
可以看出这棵树,一开始集合是 1,2,3,4, 从左向右取数,取过的数,不再重复取。
第一次取1,集合变为2,3,4 ,因为k为2,我们只需要再取一个数就可以了,分别取2,3,4,得到集合[1,2] [1,3] [1,4],以此类推。
每次从集合中选取元素,可选择的范围随着选择的进行而收缩,调整可选择的范围
图中可以发现
n相当于树的宽度,k相当于树的深度**。
那么如何在这个树上遍历,然后收集到我们要的结果集呢?
图中每次搜索到了叶子节点,我们就找到了一个结果
相当于只需要把达到叶子节点的结果收集起来,就可以求得 n个数中k个数的组合集合。
下面根据回溯法的三部曲写代码

回溯法三部曲

  • 递归函数的返回值以及参数

全局变量:一个用来存放符合条件单一结果(path),一个用来存放符合条件结果的集合(result)。
代码如下:

private List<List<Integer>> result = new ArrayList<>();
private LinkedList<Integer> path = new LinkedList<>(); // 选用LinkedList(可以模拟出栈)

参数:题目中提到的n与k
另外,还需要一个参数,为int型变量startIndex,这个参数用来记录本层递归的中,集合从哪里开始遍历(集合就是[1,...,n] ),防止遍历过的元素重复出现
例如:从下图中红线部分可以看出,在集合[1,2,3,4]取1之后,下一层递归,就要在[2,3,4]中取数了,那么下一层递归如何知道从[2,3,4]中取数呢,靠的就是startIndex。
image.png
代码如下:

private void backtracking(int n, int k, int startIndex) {}
  • 回溯函数终止条件

什么时候到达所谓的叶子节点了呢?
当path数组的大小达到k时,说明找到了一个组合,在图中path存的就是根节点到叶子节点的路径。
如图红色部分:
image.png
此时用result二维数组,把path保存起来,并终止本层递归。
(注意保存时要new一个集合存储结果,而不是直接add变量)
所以终止条件代码如下:

// 终止条件 - 集合大小等于k
if (path.size() == k) {
    // 注意:在集合放集合时注意要另外new一个集合出来,而不是把变量加进去
    result.add(new ArrayList<>(path));
    return;
}
  • 单层搜索的过程

回溯法的搜索过程就是一个树型结构的遍历过程,在如下图中,可以看出for循环用来横向遍历,递归的过程是纵向遍历
image.png
如此我们才遍历完图中的这棵树。
for循环每次从startIndex开始遍历,然后用path保存取到的节点i。
代码如下:

// 单层搜索过程 - 左闭右闭
for (int i = startIndex; i <= n; i++) {
    // 节点处理逻辑
    path.add(i);
    // 回溯
    backtracking(n,k,i + 1);
    // 撤销回溯操作
    path.removeLast();
}

完整代码如下:

class Solution {
    private List<List<Integer>> result = new ArrayList<>();
    private LinkedList<Integer> path = new LinkedList<>(); // 选用LinkedList

    public List<List<Integer>> combine(int n, int k) {
        backtracking(n, k, 1);
        return result;

    }

    private void backtracking(int n, int k, int startIndex) {
        // 终止条件 - 集合大小等于k
        if (path.size() == k) {
            // 注意:在集合放集合时注意要另外new一个集合出来,而不是把变量加进去
            result.add(new ArrayList<>(path));
            return;
        }

        // 单层搜索过程 - 左闭右闭
        // 剪枝操作 - 改变循环结束条件
        for (int i = startIndex; i <= n - (k - path.size()) + 1; i++) {
            // 节点处理逻辑
            path.add(i);
            // 回溯
            backtracking(n,k,i + 1);
            // 撤销回溯操作
            path.removeLast();
        }


    }
}
  • 时间复杂度: O(n * 2^n)
  • 空间复杂度: O(n)

🔴程序递归与for循环详细走向

刚开始学习,如果代码中for循环部分以及backtracking中递归连在一起非常绕的话,好记性不如烂笔头。可以一步一步尝试画出程序的走向,实测会清晰很多:
image.png
根据图中,可以更直观看出来:for循环用来横向遍历,递归的过程是纵向遍历。

对比一下上面给的回溯法模板
如下:

public void backtracking(参数) {
    if (终止条件) {
        存放结果;
        return;
    }

    for (选择:本层集合中元素(树中节点孩子的数量就是集合的大小)) {
        处理节点;
        backtracking(路径,选择列表); // 递归
        回溯,撤销处理结果
    }
}

对比一下刚刚写的代码,不能说十分相似,只能说_________

总结

组合问题是回溯法解决的经典问题,开始的时候列举一个很形象的例子,就是n为100,k为50的话,直接想法就需要50层for循环。
从而引出了回溯法就是解决这种k层for循环嵌套的问题
然后进一步把回溯法的搜索过程抽象为树形结构,可以直观的看出搜索的过程。
接着用回溯法三部曲,逐步分析了函数参数、终止条件和单层搜索的过程。

77 组合 - 剪枝优化

即使是暴力解法,也可以进一步剪枝优化~

我们说过,回溯法虽然是暴力搜索,但也有时候可以有点剪枝优化一下的。
在遍历的过程中有如下代码:

for (int i = startIndex; i <= n; i++) {
    // 节点处理逻辑
    path.add(i);
    // 回溯
    backtracking(n,k,i + 1);
    // 撤销回溯操作
    path.removeLast();
}

这个遍历的范围是可以剪枝优化的,怎么优化呢?
来举一个例子,n = 4,k = 4的话,那么第一层for循环的时候,从元素2开始的遍历都没有意义了。 在第二层for循环,从元素3开始的遍历都没有意义了。
这么说有点抽象,如图所示:
image.png
图中每一个节点(图中为矩形),就代表本层的一个for循环,那么每一层的for循环从第二个数开始遍历的话,都没有意义,都是无效遍历。
所以,可以剪枝的地方就在递归中每一层的for循环所选择的起始位置
如果for循环选择的起始位置之后的元素个数 已经不足 我们需要的元素个数了,那么就没有必要搜索了
注意代码中i,就是for循环里选择的起始位置。

for (int i = startIndex; i <= n; i++) {

接下来看一下优化过程如下:

  1. 已经选择的元素个数:path.size();
  2. 还需要的元素个数为: k - path.size();
  3. 在集合n中至多要从该起始位置 : n - (k - path.size()) + 1,开始遍历

详细如图(这里假设n = 4,k = 3)
image.png
所以优化之后的for循环是:

for (int i = startIndex; i <= n - (k - path.size()) + 1; i++) // i为本次搜索的起始位置

优化后整体代码如下:

class Solution {
    private List<List<Integer>> result = new ArrayList<>();
    private LinkedList<Integer> path = new LinkedList<>(); // 选用LinkedList

    public List<List<Integer>> combine(int n, int k) {
        backtracking(n, k, 1);
        return result;

    }

    private void backtracking(int n, int k, int startIndex) {
        // 终止条件 - 集合大小等于k
        if (path.size() == k) {
            // 注意:在集合放集合时注意要另外new一个集合出来,而不是把变量加进去
            result.add(new ArrayList<>(path));
            return;
        }

        // 单层搜索过程 - 左闭右闭
        // 剪枝操作 - 改变循环结束条件
        for (int i = startIndex; i <= n - (k - path.size()) + 1; i++) {
            // 节点处理逻辑
            path.add(i);
            // 回溯
            backtracking(n,k,i + 1);
            // 撤销回溯操作
            path.removeLast();
        }


    }
}

剪枝总结

对回溯以及回溯优化 - 剪枝,最好理解的方法是一步一步画图,理解程序是如何走的。
例如把整个回溯过程抽象为一棵树形结构,然后可以直观的看出,剪枝究竟是剪的哪里。

学习资料: 回溯算法理论基础 77 组合