01动态规划理论基础

324 阅读2分钟

01动态规划理论基础

1、什么是动态规划:

通常基于一个递推公式及一个或多个初始状态,当前子问题的解将由上一次子问题的解推出。这个方法也称为记录结果再利用的方法。

2、动态规划的原理:

动态规划是一种解决多阶段决策问题的优化方法,把多阶段过程转为一系列单阶段问题,利用各阶段之间的关系逐个求解。

3、什么是状态转移方程:

某一状态以及该状态下的决策与下一状态之间的指标函数之间的关系称为状态转移方程,其中指标函数是衡量对决策过程进行控制的效果的数量的指标,可以是收益、成本或距离等。一般在求最优解时,指标函数对应的是最优指标函数。

4、动态规划问题的解法:

对于有k个阶段的动态规划问题,从第k阶段到第1阶段的求解称为逆序解法,从第1阶段到第k阶段的求解称为顺序求解。

5、采用动态规划求解的问题所具有的3个性质:

(1)最优性原理:如果问题的最优解所包含的子问题的解也是最优的,称该问题具有最优子结构,满足最优性原理。

(2)无后效性:即某个阶段的状态一旦确定,就不受这个状态以后决策的影响。

(3)有重叠子问题:即子问题之间是不独立的,一个子问题在下一个阶段决策中可能多次使用到。

6、动态规划设计步骤:

(1)划分阶段:按照问题的时间或空间特征把问题分为若干个阶段。在划分阶段时注意划分后的阶段一定是有序的或者是可排序的,否则问题无法求解。

(2)确定状态和状态变量:将问题发展到各个阶段时所处的各种客观情况用不同的状态表示。

(3)确定决策并写出状态转移方程:根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。

(4)寻找边界条件:一个递推公式的终止条件或边界条件。

7、动态规划与其他算法的比较:

分治法:子问题独立。

贪心法:决策不可回溯。