动态规划怎么理解?

63 阅读4分钟

所以这个动态规划的基本思路是什么?
首先是数据的初始化,然后是状态转移方程。
举个例子
斐波那契数列:1,1,2,3,5,8,13
代码:

int[] dp = new int[n]; //存放所有数据 dp[n] 就是 第n个数的值  
dp[1] = 1; //初始化数据  
dp[2] = 1; //初始化数据  
for(int i = 2; i < n; i++){ //直接在第三个开始计算  
dp[i] = dp[i-1] + arr[i-2]; //转移方程  
}

然后是01背包问题:
描述:
有N件物品和一个容量为V的背包。第i件物品的体积是v[i],价值是w[i]。求解将哪些物品装入背包可使价值总和最大。
01背包的特点就是:每种物品仅有一件,可以选择放或不放。
如何初始化?
这个一维数组就放不下了,有两个维度,几件物品,多少容量?

int[][] dp = new int[N+1][V+1]; 为什么是N+1,因为代码要处理物品为0的情况。  
dp[0][V] = 0; //意义 一件物品也没有,不管有多少容量 价值为0 代码可以省略,int默认就是0  
dp[N][0] = 0; //意义 没有容量,有多少物品也放不下 价值为0 代码可以省略,int默认就是0  
状态转移  
for(int i = 1; i <= N; i++){ //物品数量递增 直接从1开始 因为 dp[0][V] = 0;  
for(int j = 1; j <= V; j++){ //容量递增 直接从1开始 因为 dp[N][0] = 0;  
if(j > wi){ //容量够  
dp[i][j] = Math.max(dp[i-1][j],dp[i-1][j-vi]+wi); // dp[i-1][j] 这个的意义是不放这件物品的价值。  
// dp[i-1][j-vi]+wi 这个的意义是放这件物品的价值。既然要放肯定要把价值wi加上,  
//而dp[i-1][j-vi],取出该物品占用的空间,放置i-1件物品的最大价值,这个东西在前面已经算过了,直接用。  
//比如我现在是第一个物品体积5,价值6,背包容量有5, 能放,然后放的话价值是6,不放的话价值是0,得放。  
//代码就是 i = 1;v1 = 5;w1 = 6; dp[1][5] = dp[1-1][5] + w1;  
//然后又来一个物品体积6,价值5,背包容量增加到10,10 > 6 也能放,要放的话,得把第一个物品拿掉,价值变成了5,反而小了,怎么着? 不放呗。  
//代码就是 i = 2; v2 =6; w2 = 5; dp[2][10] = dp[2-1][10-6] + w2; 其中 dp[1][10-6] = 0;  
//然后还是这个物品,但是我的背包容量增加到了11, 11 > 6 能放,而且第一个物品还不要拿掉 价值变成了11,得放。  
//代码就是 i = 2; v2 = 6; w2 = 5; dp[2][11] = dp[2-1][11-6] + w2; 其中dp[2-1][11-6] 上面已经算过了是6 。  
}  
}  
}

还有挺多变化的,遇到再整理吧。代码没有编译,不保证能跑,思路没问题,欢迎指正。 再来个写过的吧,牛客网购物单问题:

/**  
* 18 购物单  
* 1000 5  
* 800 2 0  
* 400 5 1  
* 300 5 1  
* 400 3 0  
* 500 2 0  
* @param args  
*/  
public static void main(String[] args) {  
Scanner ac = new Scanner(System.in);  
int N = ac.nextInt() / 10;  
if(N >= 3200){  
return;  
}  
int m = ac.nextInt();  
if(m >= 60){  
return;  
}  
Goods[] goodsArr = new Goods[m+1];  
goodsArr[0] = new Goods(0,0,0); //控制初始化  
for(int i = 1; i <= m; i++){  
int v = ac.nextInt() / 10; //价格  
int p = ac.nextInt(); //重要度  
int q = ac.nextInt(); //标识  
Goods goods = new Goods(v,v*p,q);  
goodsArr[i] = goods;  
}  
for(Goods goods : goodsArr){  
if(goods.q != 0){  
//附件  
if(goodsArr[goods.q].fGoodsArr[0] == null){  
goodsArr[goods.q].fGoodsArr[0] = goods;  
}else{  
goodsArr[goods.q].fGoodsArr[1] = goods;  
}  
}  
}  
  
int[][] dp = new int[m+1][N+1];  
for(int i = 1;i <= m;i++){ //从1 开始 默认 int[0][j] = 0,意义就是一个物品也不放 满意度就是0  
for(int j = 1; j <= N; j++){ //同上,默认int[i][0] = 0,意义就是一分钱也没有,满意度就是0  
Goods curGoods = goodsArr[i];  
if(curGoods.q == 0){ //钱够买第i个物品 并且是主件  
if(j >= curGoods.price){  
//如要买,这是满意度,其中 dp[i-1][j-curGoods.price] 这个的意义是总钱数减去当前物品的钱数,能够购买i-1个物品的最大满意度  
//比如我有1000 快需要再买一个400块的东西,满意度应该是 600块能够购买的最大满意度减伤当前物品的满意度, 动态规划 600的已经算过了 直接拿来用  
int myd = dp[i-1][j-curGoods.price]+curGoods.myd;  
dp[i][j] = Math.max(dp[i-1][j],myd);  
}  
  
if(curGoods.fGoodsArr[0] != null && i >= 2){  
//有附件  
int price = curGoods.price + curGoods.fGoodsArr[0].price;  
if(j >= price){  
dp[i][j] = Math.max(dp[i-1][j],dp[i-2][j-price]+ curGoods.myd+ curGoods.fGoodsArr[0].myd);  
}  
if(curGoods.fGoodsArr[1] != null){  
price = curGoods.price + curGoods.fGoodsArr[1].price;  
if(j >= price){  
dp[i][j] = Math.max(dp[i-1][j],dp[i-2][j-price]+ curGoods.myd+ curGoods.fGoodsArr[1].myd);  
}  
if(i >=3){  
price = curGoods.price + curGoods.fGoodsArr[0].price + curGoods.fGoodsArr[1].price;  
if(j >= price){  
dp[i][j] = Math.max(dp[i-1][j],dp[i-3][j-price]+ curGoods.myd + curGoods.fGoodsArr[0].myd + curGoods.fGoodsArr[1].myd);  
}  
}  
}  
}  
}  
}  
}  
System.out.println(dp[m][N]*10);  
}  
  
static class Goods{  
int price;  
int myd;  
int q;  
Goods[] fGoodsArr = new Goods[2];  
public Goods(int price,int myd,int q){  
this.price = price;  
this.myd = myd;  
this.q = q;  
}  
}

这个是测试过的。