聊聊不太符合常规思维的动态规划算法

摘要：大部分动态规划能解决的问题，都可以通过回溯算法来解决，只不过回溯算法解决起来效率比较低，时间复杂度是指数级的。动态规划算法，在执行效率方面，要高很多。

本文分享自华为云社区《深入浅出动态规划算法》，作者：嵌入式视觉。

一，动态规划概念

动态规划比较适合用来求解最优问题，比如求最大值、最小值等等。它可以非常显著地降低时间复杂度，提高代码的执行效率。

它和递归一样都非常难学，主要学习难点在于求解问题的过程不太符合人类常规的思维方式。

二，0-1 背包问题

对于一组不同重量、不可分割的物品，我们需要选择一些装入背包，在满足背包最大重量限制的前提下，背包中物品总重量的最大值是多少呢？

关于这个 0-1 背包问题，上一节学习了回溯的解决方法，也就是穷举搜索所有可能的装法（时间复杂度指数级），然后找出满足条件的最大值。有没有什么规律，可以有效降低时间复杂度呢？

1，回溯法的求解过程：

直接看代码，规律是不好的，画个求解过程图（递归树）会好看些。假设背包的最大承载重量是 9，有 5 个不同的物品，每个物品的重量分别是 2，2，4，6，3。求解过程的递归树如下图所示。

递归树中的每个节点表示一种状态，我们用（i, cw）来表示。其中，i 表示将要决策第几个物品是否装入背包，cw 表示当前背包中物品的总重量。比如，（2，2）表示我们将要决策第 2 个物品是否装入背包，在决策前，背包中物品的总重量是 2。这里使用回溯算法，从递归树中可以发现其中有些子问题的求解是重复的，且时间复杂度是指数级的。

使用”备忘录”（记忆化递归）的解决方式，记录已经计算好的 f(i, cw)，当再次计算到重复的 f(i, cw) 的时候，可以直接从备忘录中取出来用，就不用再递归计算了，这样就可以避免冗余计算。

 int  maxW =  0  ;
  int  weight[ 6 ] = { 2 , 2 , 4 , 6 , 3 };  //   物品重量 
 int  n =  5 ;  //   物品个数  
 int  w =  9 ;  //   背包承受的最大重量 
 bool  mem[ 5 ][ 10 ];  //   备忘录，默认值false
  //   记忆化递归算法实现 
 class   SolutionBacktracking{
  public  :
   void  f( int  i,  int  cw){  //   i 表示放第 i 个物品，cw 表示当前装进背包的物品的重量和 
  if  (cw == w || i == n) {  //   cw==w表示装满了，i==n表示物品都考察完了 
  if (cw > maxW) maxW =  cw;
   return  ;
 }
   if (mem[i][cw])  return ;  //   重复状态 
        mem[i][cw] =  true ;  //   记录状态 
 f(i+ 1 , cw);  //   不放第 i 个物品 
  if (cw+weight[i] <=  w)
 f(i + 1 , cw+weight[i]);  //   放第 i 个物品 
  }
};

这里依然是基于回溯算法实现的，但是采用了记忆化递归的方法，时间复杂度和空间复杂度都是 O(n∗(w+1)) O ( n ∗( w +1))，n n 为物品个数，w w 表示背包承受的最大重量。

2，动态规划求解过程如下：

把整个求解过程分为 n 个阶段，每个阶段会决策一个物品是否放到背包中。每个物品决策（放入或者不放入背包）完之后，背包中的物品的重量会有多种情况，也就是说，会达到多种不同的状态，对应到递归树中，就是有很多不同的节点。

我们把每一层重复的状态（节点）合并，只记录不同的状态，然后基于上一层的状态集合，来推导下一层的状态集合。我们可以通过合并每一层重复的状态，这样就保证每一层不同状态的个数都不会超过 w 个（w 表示背包的承载重量），也就是例子中的 9。于是，我们就成功避免了每层状态个数的指数级增长。动态规划方法的计算过程如下图：

我们用一个二维数组 states[n][w+1]，来记录每层可以达到的不同状态。0-1 背包问题的动态规划解法的 C++ 代码如下：

 class   SolutionDP1{
  public  :
   //   weight:物品重量，n:物品个数，w:背包可承载重量 
     int  knapsack1( int  weight[],  int  n,  int   w){
        vector <vector< bool > >states(n, vector< bool >(w+ 1 ,  false  ));
   //   初始化 states 第一个阶段的状态 
        states[ 0 ][ 0 ] =  true ;  //   第一个物品不放进背包 
  if (weight[ 0 ] <= w) states[ 0 ][weight[ 0 ]] =  true ;  //   第一个物品放进背包
   //   动态规划-分阶段 
  for ( int  i= 1 ; i<n;i++ ){
   for ( int  j= 0 ; j<w; j++) {  //   第 i 个物品不放进背包{} 
  if (states[i- 1 ][j]) states[i][j] = states[i- 1  ][j];
 }
   for ( int  j= 0 ; j<=w-weight[i];j++){  //   第 i 个物品放入背包 
  if (states[i- 1 ][j]) states[i][j+weight[i]] =  true  ;
 }
 }
   //   在最后一层变量找到最接近 w 的重量并输出结果 
  for ( int  i=w; i> 0 ; i-- ){ 
   if (states[n- 1 ][i])  return   i;
 }
   return   0  ;
 }
};

这就是一种用动态规划解决问题的思路。我们把问题分解为多个阶段，每个阶段对应一个决策。我们记录每一个阶段可达的状态集合（去掉重复的），然后通过当前阶段的状态集合，来推导下一个阶段的状态集合，动态地往前推进。这也是动态规划这个名字的由来，你可以自己体会一下

首先，可以分解为多阶段，其次，状态去重，最后当前阶段可以利用上一个阶段来获取。这是动态规划的关键。

我们知道回溯算法解决这个问题的时间复杂度是 O(2n) O (2 n )、指数级，那动态规划解决方案的时间复杂度是多少呢？来分析一下，这个代码的时间复杂度非常好分析，耗时最多的部分就是代码中的两层 for 循环，所以时间复杂度是 O(n∗w) O ( n ∗ w )。n n 表示物品个数，w w 表示背包可以承载的总重量。

虽然动态规划的时间效率较高，但是空间复杂度为 O(n∗w) O ( n ∗ w )，对空间消耗比较大。我们可以考虑用一个大小为 w+1 w +1 的一维数组代替二维数组，减少内存消耗。代码如下：

 class   SolutionDP2{
  public  :
   //   weight:物品重量，n:物品个数，w:背包可承载重量 
     int  knapsack2( int  weight[],  int  n,  int   w){
        vector < bool > states(w+ 1 ,  false  );
   //   int *states=new int [m+1];   //   动态分配,数组长度为 m 
        states[ 0 ] =  true ;  //   第一个物品不放进背包 
  if (weight[ 0 ] < w) states[weight[ 0 ]] =  true ;  //   第一个物品放进背包
   //   动态规划-分阶段 
  for ( int  i= 1 ; i<n;i++ ){
   for ( int  j=w-weight[i]; j>= 0 ; j--) {  //   第 i 个物品放进背包 
  if (states[j]) states[j+weight[i]] =  true  ;
 }
 }
   //   在最后一层变量找到最接近 w 的重量并输出结果 
  for ( int  i=w;i> 0 ;i-- ){ 
   if (states[i])  return   i;
 }
   return   0  ;
 }
};

程序分析：遍历每个物品，将该物品放入背包时，在不超过最大重量的前提下，再遍历查看之前的放入记录，将之前可能出现的重量的和当前物品的重量相加再记录下来，等所有方案都尝试过后，可能出现的背包重量也都被记录下来了，最后，从中选择一个最大值返回。

三，0-1 背包问题升级版

前面讲的背包问题，只涉及背包重量和物品重量。现在引入物品价值这一变量。对于一组不同重量、不同价值、不可分割的物品，我们选择将某些物品装入背包，在满足背包最大重量限制的前提下，背包中可装入物品的总价值最大是多少呢？

1，这个问题依旧可以先用回溯算法来解决，代码如下：

 //   0-1 背包问题升级版的回溯解法 
 int  maxV =  0 ;  //   结果放到maxV中 
 int  weight[] = { 2 ， 2 ， 4 ， 6 ， 3 };  //   物品的重量 
 int  value[] = { 3 ， 4 ， 8 ， 9 ， 6 };  //   物品的价值 
 int  n =  5 ;  //   物品个数 
 int  w =  9 ;  //   背包承受的最大重量 
 class   Solution{
  public  :
   void  f( int  i,  int  cw,  int  cv) {  //   调用f(0, 0, 0) 
  if  (cw == w || i == n) {  //   cw==w表示装满了，i==n表示物品都考察完了 
  if (cv > maxV) maxV =  cv;
   return  ;
 }
   if (cv > maxV) maxV =  cv;
 f(i + 1 , cw, cv);  //   不放第 i 个物品 
  if (cw+weight[i] <= w) f(i+ 1 , cw+weight[i], cv+value[i])  //   放第 i 个物品 
  }
};

2，使用动态规划解决这个问题更高效。把整个求解过程分为 n n 个阶段，每个阶段会决策一个物品是否放到背包中。每个阶段决策完之后，背包中的物品的总重量以及总价值，会有多种情况，也就是会达到多种不同的状态。我们用一个二维数组 states[n][w+1]，来记录每层可以达到的不同状态。

 class   SolutionDP3{
      int  knapsack3( int  weight[],  int  value[],  int  n,  int   w) {
        vector <vector< int > > states(n, vector< int >(w+ 1 , - 1  ));
        states[  0 ][ 0 ] =  0 ;  //   不放入第 0 个物品 
  if (weight[ 0 ] < w) states[ 0 ][weight[ 0 ]] = value[ 0 ];  //   放入第 0 个物品 
  for ( int  i= 1 ; i<n; i++ ){
   for ( int  j= 0 ; j< w; j++){  //   不放入第 i 个物品 
  if (states[i- 1 ][j])  states[i][j] = states[i- 1  ][j];
 }
   for ( int  j= 0 ; j< w-weight[i]; j++){  //   放入第 i 个物品 
                 int  v = states[i- 1 ][j] +  values;
   if (v > states[i][j+ weight[i]]) 
                    states[i][j +weight[i]] =  v;
 }
 }
          int  maxV = - 1  ;
   for ( int  j = w; j>= 0 ; j-- ){
   if (states[n- 1 ][j] > maxV) maxV = states[n- 1  ][j];
 }
   return   maxV;
 }
}

代码的时间复杂度是 O(n⋅w) O ( n ⋅ w )，空间复杂度也是 O(n⋅w) O ( n ⋅ w )。

四，总结

大部分动态规划能解决的问题，都可以通过回溯算法来解决，只不过回溯算法解决起来效率比较低，时间复杂度是指数级的。动态规划算法，在执行效率方面，要高很多。尽管执行效率提高了，但是动态规划的空间复杂度也提高了，所以，很多时候，我们会说，动态规划是一种空间换时间的算法思想。

五，练习题

5.1，leetcode322 零钱兑换

给你一个整数数组 coins ，表示不同面额的硬币；以及一个整数 amount ，表示总金额。计算并返回可以凑成总金额所需的最少的硬币个数。如果没有任何一种硬币组合能组成总金额，返回 -1 。

你可以认为每种硬币的数量是无限的。

动态规划解法的 C++ 代码如下：

 class   Solution {
  public  :
      int  coinChange(vector< int >& coins,  int   amount) {
          int  Max = amount +  1  ;
        vector < int > dp(amount +  1  , Max);
 dp[  0 ] =  0  ;
   for  ( int  i =  1 ; i <= amount; ++ i) {
   for  ( int  j =  0 ; j < ( int )coins.size(); ++ j) {
   if  (coins[j] <=  i) {
 dp[i]  = min(dp[i], dp[i - coins[j]] +  1  );
 }
 }
 }
   return  dp[amount] > amount ? - 1   : dp[amount];
 }
};

参考资料

初识动态规划：如何巧妙解决“双十一”购物时的凑单问题？

点击关注，第一时间了解华为云新鲜技术~

查看更多关于聊聊不太符合常规思维的动态规划算法的详细内容...

声明：本文来自网络，不代表【好得很程序员自学网】立场，转载请注明出处：http://www.haodehen.cn/did237922

更新时间：2023-05-24 阅读：48次