阅读 546

动态规划怎么用?

动态规划应该用于最优化问题

最优化问题指的是,解决一个问题可能有多种可行的值来解决问题,但是我们需要一个最优的(最大或者最小)值

动态规划适用于子问题不是独立的情况,即各个子问题之间包含公共的子问题。动态规划对每个子问题只计算一次,保存其计算结果到"一张表",重复利用,从而优化执行。

分治法则是把一个大的问题划分成一些独立的子问题,递归求解子问题的情况;贪心算法则是会先选择当时看起来是最优的选择,然后再求解一个结果的子问题

如何使用动态规划

以斐波那契数列为例。一般的求解方式为递归,运行时间为 \theta(2^{n/2}),空间为O(1)

fib(n):
    if n<=2:f=1;
    else: f= fib(n-1)+fib(n-2);
    return f;
复制代码

可以简要分析下这个执行过程:要去求解 fib(n),首先要知道fib(n-1)和fib(n-2),要计算fib(n-1)则需要知道fib(n-2)和fib(n-3),要计算fib(n-2)则需要知道fib(n-3)和fib(n-4),依此类推。
很明显可以看到:如果计算出了fib(n-1)的子问题和fib(n-2)的子问题存在依赖性,要计算fib(n-1)必然要计算fib(n-2);同时如果复用了fib(n-2)那么当计算fib(n-1)就非常简单,直接相加即可。这也就是复用子问题处理结果

fib(n):
    memo={}
    if n in memo:return memo[n];
    if n<=2:f=1;
    else f=fib(n-1)+fib(n-2);
    memo[n]=f;
    return f;
复制代码

分析可知:memo的存在使得实际产生调用的只有 fib(1) .... fib(n),共n次,其余的直接从memo中获取,使用常量的时间。可得运行时间为\theta(n),空间为O(n)。这种方式仍然可以优化到使用常量的空间,因为实际上只需要记住最初的两个值即可。

int fib(int n){
        if(n<=2){
            return 1;
        }
        int f1=1,f2=1;
        for(int i=3;i<=n;i++){
            int f=f1+f2;
            f1=f2;
            f2=f;
        }
        return f2;
    }
复制代码

它的运行时间为\theta(n),空间O(1);
这种计算方式,它实际上是相当于进行了拓扑排序,即我只有先执行完fib(n-2),再执行fib(n-1),然后才执行fib(n)

斐波那契拓扑排序
分析下来可以发现:

  1. 斐波那契数列求值是可以分解成多个子问题 fib(k),且一共有n个
  2. 子问题之间存在依赖关系:F_k=F_{k-1}+F_{k-2} ,每个子问题的处理时间是O(1)
  3. 每个子问题的处理是按照拓扑排序的顺序进行,它的顺序为 k=1,...,n

最终去解决了原来的问题F_n,总耗时为 子问题个数 * 每个子问题的处理时间=O(n)

拓扑排序

斐波那契数列中的拓扑排序,它本质上类似拓扑排序的DAG最短路径

要获取它的最短路径,过程如下

d_{SS}=0,d_{SA}=1,d_{SB}=2, d_{SC}=3
d_{SD}=min\left(\begin{array}{ccc}
{ d_{SA}+w_{AD} }\\\\
{ d_{SB}+w_{BD} } \\\\
\end{array} \right)=4
d_{SE}=min\left( \begin{array}{ccc}
{ d_{SA}+w_{AE} }  \\\\
{ d_{SB}+w_{BE} }  \\\\
{ d_{SC}+w_{CE} }  \\\\
\end{array} \right) =3
d_{SF}=min\left( \begin{array}{ccc}
{ d_{SB}+w_{BF} }  \\\\
{ d_{SC}+w_{CF} }  \\\\
\end{array} \right) =5
d_{SG}=min\left( \begin{array}{ccc}
{ d_{SD}+w_{DG} }  \\\\
{ d_{SE}+w_{EG} }  \\\\
{ d_{SF}+w_{FG} }  \\\\
{ d_{SC}+w_{CG} }  \\\\
\end{array} \right) =5

每条边都访问了一遍,然后初始化了每个顶点的值,它的运行时间为O(V+E)

计算过程可以看到:

  1. 最短路径会被划分成多个子问题,比如d_{SG}d_{SD}d_{SE}d_{SF}d_{SC}
  2. 子问题之间是存在依赖关系,比如d_{SG}依赖于d_{SD}d_{SE}d_{SF}d_{SC}
  3. 整个处理的过程按照 SABCDEFG的拓扑顺序进行处理

一般的图拓扑排序为

要求s到t的最短路径,那么必定会经过与t相邻的一条边,如图示的u,那么最短路径\delta(s,t)=min_{(u,t)\in E}(\delta(s,u)+w(u,t))

\delta(s,u)就是需要递归调用处理的部分

对于DAG:\delta(s,t)每个子问题的处理时间为 indegree(t)+O(1)

indegree(t):入度数也就是类似(u,t)边的数量,需要去遍历所有t的入边

O(1):判断是不是有入边

总共的执行时间为

\sum_{v\in V}(indegree(v)+O(1))=O(E+V)

当图中有环的时候求最短路径产生的问题

要求s到v的最短路径 \delta(s,v),首选需要去求 \delta(s,a),然后是\delta(s,b),到b节点有两条路径:\delta(s,s)\delta(s,v),此时去memo中查\delta(s,v)是不存在的,又会这回查询,导致了一个死循环

解决图中有环的时候求最短路径的问题

方式是去环,将原来的图一层一层的展开。
假设从s到v需要的路径为k步,那么可以得到 \delta_k(s,v)=min_{(b,v)\in E}(\delta_{k-1}(s,b)+w(b,v)),当k递减到0的时候,其实也就是从s到s本身

所需要的展开层数为:|V|-1 对于求最短路径来讲,最长不能超过|V|-1,否则就是成环,会造成循环的情况(从0开始的计数),这就是为什么Bellman-Ford的外层循环是 |V|-1

每层的节点数为所有的节点。那么总共的节点数为|V'|=|V|(|V|-1)+1=O(V^2),边数是|E'|=|E|(|V|-2)+1=O(VE)。转换后的图是DAG图,那么实际上的时间为O(V'+E')=O(VE)。这也就是从动态规划的角度去看Bellman-Ford算法 节点的数目是1个源点,边的数目是每多一层实际上就多了加了一遍所有的边。

从斐波那契和最短路径的例子看出,要使用最短路径,需要确保子问题之间是互相依赖的,这样能够重复利用子问题产生的结果,而要去重复利用子问题,那首要条件是找到子问题是什么?然后在多个子问题之间选择最优的结果,并按照拓扑排序的顺序进行计算

使用动态规划的一般步骤是什么?

  1. 定义子问题 :一般来讲子可以从输入条件来寻找,如果输入条件少了一项,我解决这个问题的方式会发生改变吗?如果不会,那么它基本就是子问题

计算子问题的数量

  1. 思考:明确要去尝试所有可能方式,选取最好的一个。选取中要思考
  • 获取到的输入项是否应该被选入子问题的结果之中?
  • 有什么途径能够使子问题扩展到原有的问题?
  • 子问题要计算原有的问题,增加了什么变化的因素?

计算选择的数量

  1. 关联所有的子问题:根据思考得到父子问题的关联关系

计算单个子问题所需要处理的时间

  1. 重用子问题结果并记下新的结果

计算总耗时

最终解决原有的问题,它消耗的时间为: 子问题的数量 * 每个子问题处理所需要时间

总的来说就是:尝试所有可能的子问题的结果,将最好的可能子结果存储下来,然后重复利用已经解决的子问题,递归去解决所有的问题(思考+记忆+递归)

一定要用动态规划吗?

给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。比如

输入: [-2,1,-3,4,-1,2,1,-5,4],
输出: 6
解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。
复制代码

乍看之下,要求连续最大和,首先得计算出子串的最大和,才能去计算原始数组的最大和,也就是说

  1. 子问题是:子数组的最大和
  2. 依赖关系:dp(i)=max(i,i+dp(i-1)),增加了一个新的元素扩展子问题,得到原问题,然后从扩展的结果和原有的结果中取获取一个最优解
  3. dp(i-1)是可以重用的
 public int maxSubArray(int[] nums) {
       int max=Integer.MIN_VALUE;
       Map<Integer,Integer> mem=new HashMap<>();
       for(int i=0;i<nums.length;i++){
       //按照一定顺序执行
           int v=dp(i,nums,mem);
           if(v>max){
               max=v;
           }
       }
        return max;
    }
    
    public int dp(int i,int[] nums,Map<Integer,Integer> mem){
        Integer v=mem.get(i);
        if(v!=null){
        //重用子问题的结果
            return v;
        }
        int sum = nums[i];
        if(i==nums.length-1){
            mem.put(i,sum);
            return sum;
        }
        //先计算子问题
       int cSum = dp(i+1,nums,mem);
       int tempV = sum+cSum;
       //明确父子问题之间的关系,存储新的子问题结果
       if(tempV<sum){
           mem.put(i,sum);
           return sum;
       }
        mem.put(i,tempV);
       return tempV;
    }
复制代码

分析可以看到,它的执行为需要遍历一遍整个的数组,然后要去计算的子问题包括 n-1,n-2,..,1,耗时为 O(n+n-1)=O(2n)=O(n),同时需要一个O(n)的空间存储。

  public int maxSubArray(int[] nums) {
       int max=nums[0]; 
        int currMax=nums[0];
        for(int i=1;i<nums.length;i++){
            int temp=nums[i]+currMax;
            if(temp>nums[i]){
                currMax=temp;
            }else{
                currMax=nums[i];
            }
            if(max<currMax){
                max=currMax;
            }
       }
        return max;
    }
复制代码

通过这种方式,使用的空间为O(1),时间就是O(n)。
由此可见动态规划本身只是一种解决问题的思想,并不是说动态规划得到的最优解就是解决问题的最佳方案