清华学霸提灯给你讲解动态规划,听不懂你打我

336 阅读7分钟

最近九章算法和阿里云合办了一场在线编程大赛,根据赛后数据显示,超过70%的选手认为动态规划是最难对付的题型

而自从动态规划出现在算法面试后,同样成为求职者绕不开的“噩梦”。除了Google,TikTok等常面DP的大厂外,现在就连亚麻电面阶段也考DP了,如果没有准备的话,分分钟就可能挂面。

动态规划的一大难点就是题型众多而又没有统一的解法。想要熟练掌握往往需要大量刷题来练习,这么做对于本就不充裕的准备时间来说,性价比太低。

作为清华学霸,全国算法竞赛金牌,ACM全球总决赛选手,FLAG资深面试官,侯卫东老师凭借丰富的刷题和面试经验,总结了一套针对动态规划的“4步解题法”。

今天通过一道经典题,侯老师给大家讲讲如何用4步解题法搞定动态规划题型。

换硬币问题 : 你有三种硬币,分别面值2元,5元和7元,每种硬币都有足够多。买一本书需要27元。如何用最少的硬币组合正好付清,不需要对方找钱?

可以使用动态规划的问题一般都有以下提问方式:

求最大值/最小值 从左上角到右上角路径的最大数字和、最长上升子序列长度 求方案数 有多少种方式走到右下角 有多少种方法选出K个数使得和是Sum 求存在性 取石子游戏,先手是否必胜 能不能选出K个数使得和是Sum

如果你碰到一个问题是以上提问方式,那么有90%的概率是使用动态规划来求解。要重点说明的是,若问题是让你求出“所有的”方案和结果,则肯定不是使用动态规划。

再回到这道题,“最少的硬币组合”,求最值问题,可以用DP来解。

1 第一步:确定状态

状态在动态规划中的作用属于定海神针。解动态规划时需要开一个数组,这里的“状态”就是指数组的每个元素f[i]或f[i][j]代表什么。

确定状态需要两个意识:最后一步和子问题

1.最后一步

这道题中,我们不知道最优策略是什么,但最优策略肯定是K枚硬币a1,a2……aK面值加起来是27。 这里的“最后一步”就是存在最后一枚硬币aK。 除去aK,前面的硬币面值和为27-aK。

这里有两个关键点:

① 我们不关心前面的K-1枚硬币是怎么拼出27-aK的,也不知道aK和K,但是可以确定前面的硬币拼出了27-aK。

② 因为是最优策略,所以拼出的27-ak硬币数一定要最少(否则就不是最优策略)

2.子问题

现在问题变成了:最少用多少枚硬币可以拼出27-aK。也就是将原问题(27)转化成了一个子问题,而且规模更小(27-aK)

这种与原问题内核一致,但是规模更小的问题,就叫子问题。

为了简化定义,我们设状态f(X)=最少用多少枚硬币拼出X。所以问题就从求f(X)变成求f(X-aK)。

我们目前还不知道最后的硬币aK面额多少,但它的面额一定只可能是2/5/7之一。

如果aK是2,f(27)应该是f(27-2) + 1 (加上最后面值2的硬币) 如果aK是5,f(27)应该是f(27-5) + 1 (加上最后面值5的硬币) 如果aK是7,f(27)应该是f(27-7) + 1 (加上最后面值7的硬币)

除此以外,没有其他的可能了。

因为要求最少的硬币数,所以问题的解就可以这样表示:

f(27) = min{f(27-2)+1, f(27-5)+1, f(27-7)+1}

2 第二步:转移方程

设状态f[X]=最少用多少枚硬币拼出X对于任意X,f[X] = min{f[X-2]+1, f[X-5]+1, f[X-7]+1}

实际面试中,如果正确列出转移方程,问题基本就解决一半了。

很多同学基本也可以做到写出状态转移方程,但真正写程序的时候往往会出现很多错误或问题。

这就涉及到在在代码前的两个重要步骤,就是我们4步解题法的第三步和第四步。

3 第三步:初始条件和边界情况

f[X] = min{f[X-2]+1, f[X-5]+1, f[X-7]+1}的边界情况是X-2, X-5或者X-7不能小于0(硬币面值为正)

故对边界情况设定如下:

如果硬币面值不能组合出Y,就定义f[Y]=正无穷例如f[-1]=f[-2]=…=正无穷; f[1] =min{f[-1]+1, f[-4]+1,f[-6]+1}=正无穷,表示拼不出1

**特殊情况:**本题的F[0]对应的情况为F[-2]、F[-5]、F[-7],按照上文的边界情况设定结果是正无穷。

但是实际上F[0]的结果是存在的(即使用0个硬币的情况下),F[0]=0。

这种用转移方程无法计算,但是又实际存在的情况,就必须通过手动定义。

所以这里定义初始条件为:F[0]=0.

而从0之后的数值是没矛盾的,比如F[1]= F[1-2]+1= F[-1]+1=正无穷(正无穷加任何数结果还是正无穷);F[2]= F[2-2]+1= F[0]+1=1……

4 第四步,确定计算顺序

那么开始计算时,是从F[1]、F[2]开始?还是从F[27]、F[26]开始呢?

判断计算顺序正确与否的原则是: 当我们要计算F[X](等式左边,如F[10])的时候,等式右边(f[X-2], f[X-5], f[X-7]等)都是已经得到结果的状态,这个计算顺序就是OK的。

实际就是从小到大的计算方式(偶有例外的情况我们后边再讲)。

例如我们算到F[12]的时候,发现F[11]、F[10]、F[9]都已经算过了,这种算法就是对的; 而开始算F[27]的时候,发现F[26]还没有算,这样的顺序就是错的。

很显然这样的情况下写一个FOR循环就够了。

回到这道题,采用动态规划的算法,每一步只尝试三种硬币,一共进行了27步。算法时间复杂度(即需要进行的步数)为27*3。

**原题练习:**LintCode 669.Coin Change

5 最后总结

动态规划4步解题法

  • 确定状态

    • 研究最优策略的最后一步
    • 转化为子问题
  • 转移方程

    • 根据子问题定义直接得到
  • 初始条件和边界情况

    • 细心,考虑周全
  • 计算顺序

    • 利用之前的计算结果

按照以上4步套路,基本上可以解决绝大多数类型的动态规划题。除了最值型动态规划,想要了解4步法在更多类型动态规划中的运用,可以来听侯卫东老师的《动态规划专题班》。

在《动态规划专题班》试听课中,侯卫东老师毫无保留地详细讲解了4步法具体如何应用。还没搞懂动态规划的同学一定要来听听看哇!

谁来讲

侯卫东 ACM世界总决赛选手

清华大学毕业,全国算法竞赛金牌得主,参加过ACM国际大学生程序设计竞赛全球总决赛。斩获Google,Facebook,Microsoft,Uber, Dropbox等多家offer,拥有丰富的面试和面试官经验。

免费试听内容

  • 什么是动态规划
  • 动态规划和递归的区别
  • 动态规划的解题要领
  • 动态规划三大类
  • 求最值/计数/可行性
  • 常见动态规划类型总结

如何报名免费试听:

戳我即可免费报名,随时试听