专题四:前缀和

117 阅读15分钟

1 【模板】⼀维前缀和

1.1 题目链接

DP34 【模板】前缀和

1.2 题目描述

image.png

1.3 解法(前缀和):

算法思路

  • a. 先预处理出来⼀个「前缀和」数组:
    • ⽤ dp[i] 表⽰: [1, i] 区间内所有元素的和,那么 dp[i - 1] ⾥⾯存的就是 [1,i - 1] 区间内所有元素的和,那么:可得递推公式: dp[i] = dp[i - 1] +arr[i] ;
  • b. 使⽤前缀和数组,「快速」求出「某⼀个区间内」所有元素的和:
    • 当询问的区间是 [l, r] 时:区间内所有元素的和为: dp[r] - dp[l - 1] 。

1.4 C++算法代码:

#include <iostream>
#include <vector>
using namespace std;

int main() {
    // 1. 读入数据
    int n, q;
    cin >> n >> q;
    vector<int> arr(n + 1);
    for(int i = 1; i <= n; i++) cin >>  arr[i];

    // 2.预处理出来一个前缀和数组
    vector<long long> dp(n + 1); // 防溢出
    for(int i = 1; i <= n;i++) dp[i] =dp[i - 1] + arr[i];

    // 3.使用前缀和数组
    int l = 0, r = 0;
    while(q--)
    {
        cin >> l >> r;
        cout << dp[r] - dp[l - 1] << endl;
    }
    return 0;
}

2 【模板】⼆维前缀和

2.1 题目链接

DP35 【模板】二维前缀和

2.2 题目描述

image.png

2.3 解法

算法思路

类⽐于⼀维数组的形式,如果我们能处理出来从 [0, 0] 位置到 [i, j] 位置这⽚区域内所有元素的累加和,就可以在 O(1) 的时间内,搞定矩阵内任意区域内所有元素的累加和。因此我们接下来仅需完成两步即可:

第⼀步:搞出来前缀和矩阵

这⾥就要⽤到⼀维数组⾥⾯的拓展知识,我们要在矩阵的最上⾯和最左边添加上⼀⾏和⼀列0,这样我们就可以省去⾮常多的边界条件的处理(同学们可以⾃⾏尝试直接搞出来前缀和矩阵,边界条件的处理会让你崩溃的)。处理后的矩阵就像这样:

image.png

这样,我们填写前缀和矩阵数组的时候,下标直接从 1 开始,能⼤胆使⽤ i - 1 , j - 1 位置的值。

注意 dp 表与原数组 matrix 内的元素的映射关系: i. 从 dp 表到 matrix 矩阵,横纵坐标减⼀; ii. 从 matrix 矩阵到 dp 表,横纵坐标加⼀。

前缀和矩阵中 sum[i][j] 的含义,以及如何递推⼆维前缀和⽅程

a. sum[i][j] 的含义:

sum[i][j] 表⽰,从 [0, 0] 位置到 [i, j] 位置这段区域内,所有元素的累加和。对应下图的红色区域:

image.png

a. 递推⽅程:

其实这个递推⽅程⾮常像我们⼩学做过求图形⾯积的题,我们可以将 [0, 0] 位置到 [i, j]位置这段区域分解成下⾯的部分:

image.png

sum[i][j] = 红 + 蓝 + 绿 + ⻩,分析⼀下这四块区域:

  • i. ⻩⾊部分最简单,它就是数组中的 matrix[i - 1][j - 1] (注意坐标的映射关系)
  • ii. 单独的蓝不好求,因为它不是我们定义的状态表⽰中的区域,同理,单独的绿也是;
  • iii. 但是如果是红 + 蓝,正好是我们 dp 数组中 sum[i - 1][j] 的值,美滋滋;
  • iv. 同理,如果是红 + 绿,正好是我们 dp 数组中 sum[i][j - 1] 的值;
  • v. 如果把上⾯求的三个值加起来,那就是⻩ + 红 + 蓝 + 红 + 绿,发现多算了⼀部分红的⾯积,因此再单独减去红的⾯积即可;
  • vi. 红的⾯积正好也是符合 dp 数组的定义的,即 sum[i - 1][j - 1]

综上所述,我们的递推⽅程就是:

sum[i][j]=sum[i - 1][j] + sum[i][j - 1] - sum[i - 1][j -1]+matrix[i - 1][j - 1]

◦ 第⼆步:使⽤前缀和矩阵

题⽬的接⼝中提供的参数是原始矩阵的下标,为了避免下标映射错误,这⾥直接先把下标映射成 dp 表⾥⾯对应的下标: row1++, col1++, row2++, col2++

接下来分析如何使⽤这个前缀和矩阵,如下图(注意这⾥的 row 和 col 都处理过了,对应的正是 sum 矩阵中的下标):

image.png

对于左上⻆ (row1, col1) 、右下⻆ (row2, col2) 围成的区域,正好是红⾊的部分。因

此我们要求的就是红⾊部分的⾯积,继续分析⼏个区域:

  • i. ⻩⾊,能直接求出来,就是 sum[row1 - 1, col1 - 1] (为什么减⼀?因为要剔除掉 row 这⼀⾏和 col 这⼀列)
  • ii. 绿⾊,直接求不好求,但是和⻩⾊拼起来,正好是 sum 表内 sum[row1 - 1][col2]的数据;
  • iii. 同理,蓝⾊不好求,但是 蓝 + ⻩ = sum[row2][col1 - 1] ;
  • iv. 再看看整个⾯积,好求嘛?⾮常好求,正好是 sum[row2][col2] ;
  • v. 那么,红⾊就 = 整个⾯积 - ⻩ - 绿 - 蓝,但是绿蓝不好求,我们可以这样减:整个⾯积 -(绿 + ⻩ )-(蓝 + ⻩),这样相当于多减去了⼀个⻩,再加上即可

综上所述:红 = 整个⾯积 - (绿 + ⻩)- (蓝 + ⻩)+ ⻩,从⽽可得红⾊区域内的元素总和为:

sum[row2][col2]-sum[row2][col1 - 1]-sum[row1 - 1][col2]+sum[row1 - 1][col1 - 1]

2.4 C++算法代码:

#include <iostream>
#include <vector>
using namespace std;

int main() {
    // 1. 读入数据
    int n = 0, m = 0, q = 0;
    cin >> n >> m >> q;
    vector<vector<int>> arr(n + 1, vector<int> (m + 1));
    for(int i = 1; i <= n; i++)
        for(int j = 1; j <= m; j++)
            cin >> arr[i][j];

    // 2. 预处理前缀和矩阵
    vector<vector<long long>> dp(n + 1, vector<long long> (m + 1));  // 防溢出
    for(int i = 1; i <= n; i++)
        for(int j = 1; j <= m; j++)
            dp[i][j] = dp[i - 1][j] + dp[i][j - 1] + arr[i][j] - dp[i - 1][j - 1];
    
    // 3. 使用前缀和矩阵
    int x1, y1, x2, y2;
    while(q--)
    {
        cin >> x1 >> y1 >> x2 >> y2;
        cout << dp[x2][y2] - dp[x1 - 1][y2] - dp[x2][y1 -1] + dp[x1 - 1][y1 - 1] << endl;
    }
    return 0;
}

3 寻找数组的中心下标

3.1 题目链接

724. 寻找数组的中心下标

3.2 题目描述

给你一个整数数组 nums ,请计算数组的 中心下标

数组 中心下标 ****是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和。

如果中心下标位于数组最左端,那么左侧数之和视为 0 ,因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。

如果数组有多个中心下标,应该返回 最靠近左边 的那一个。如果数组不存在中心下标,返回 -1 。

 

示例 1:

输入: nums = [1, 7, 3, 6, 5, 6]
输出: 3
解释:
中心下标是 3 。
左侧数之和 sum = nums[0] + nums[1] + nums[2] = 1 + 7 + 3 = 11 ,
右侧数之和 sum = nums[4] + nums[5] = 5 + 6 = 11 ,二者相等。

示例 2:

输入: nums = [1, 2, 3]
输出: -1
解释:
数组中不存在满足此条件的中心下标。

示例 3:

输入: nums = [2, 1, -1]
输出: 0
解释:
中心下标是 0 。
左侧数之和 sum = 0 ,(下标 0 左侧不存在元素),
右侧数之和 sum = nums[1] + nums[2] = 1 + -1 = 0

3.3 解法(前缀和):

算法思路

  • 从中⼼下标的定义可知,除中⼼下标的元素外,该元素左边的前缀和等于该元素右边的后缀和
    • 因此,我们可以先预处理出来两个数组,⼀个表⽰前缀和,另⼀个表⽰后缀和。
    • 然后,我们可以⽤⼀个 for 循环枚举可能的中⼼下标,判断每⼀个位置的前缀和以及后缀和,如果⼆者相等,就返回当前下标。

3.4 C++算法代码:

class Solution {
public:
    int pivotIndex(vector<int>& nums) {
        int n = nums.size();
        vector<int> f(n), g(n);

        // 1. 预处理前缀和数组以及后缀和数组
        for(int i = 1; i < n; i++)
            f[i] = f[i - 1] + nums[i - 1];
        for(int i = n - 2; i >= 0; i--)
            g[i] = g[i + 1] + nums[i + 1];

        // 2. 使用
        for(int i = 0; i < n; i++)
        {
            if(f[i] == g[i])
            {
                return i;
            }
        }
        return -1;
    }
};

4 除自身以外数组的乘积

4.1 题目链接

238. 除自身以外数组的乘积

4.2 题目描述

给你一个整数数组 nums,返回 数组 answer ,其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积 。

题目数据 保证 数组 nums之中任意元素的全部前缀元素和后缀的乘积都在  32 位 整数范围内。

请 不要使用除法, 且在 O(n) 时间复杂度内完成此题。

 

示例 1:

输入: nums = [1,2,3,4]
输出: [24,12,8,6]

示例 2:

输入: nums = [-1,1,0,-3,3]
输出: [0,0,9,0,0]

4.3 解法(前缀和数组):

算法思路

注意题⽬的要求,不能使⽤除法,并且要在 O(N) 的时间复杂度内完成该题。那么我们就不能使

⽤暴⼒的解法,以及求出整个数组的乘积,然后除以单个元素的⽅法。

继续分析,根据题意,对于每⼀个位置的最终结果 ret[i] ,它是由两部分组成的:

  • i. nums[0] * nums[1] * nums[2] * ... * nums[i - 1]
  • ii. nums[i + 1] * nums[i + 2] * ... * nums[n - 1]

于是,我们可以利⽤前缀和的思想,使⽤两个数组 post 和 suf,分别处理出来两个信息:

  • i. post 表⽰:i 位置之前的所有元素,即 [0, i - 1] 区间内所有元素的前缀乘积,
  • ii. suf 表⽰: i 位置之后的所有元素,即 [i + 1, n - 1] 区间内所有元素的后缀乘积

然后再处理最终结果。

4.4 C++算法代码:

class Solution {
public:
    vector<int> productExceptSelf(vector<int>& nums) {
        int n = nums.size();
        vector<int> f(n), g(n);

        // 1. 预处理一下前缀积数组以及后缀积数组
        f[0] = g[n - 1] = 1;  // 细节问题
        for(int i = 1; i < n; i++)
            f[i] = f[i - 1] * nums[i - 1];
        for(int i = n - 2; i >= 0; i--)
            g[i] = g[i + 1] * nums[i + 1];
        
        // 2. 使用
        vector<int> ret (n);
        for(int i = 0; i < n; i++)
            ret[i] = f[i] * g[i];
        
        return ret;
    }
};

5 和为 K 的子数组

5.1 题目链接

560. 和为 K 的子数组

5.2 题目描述

给你一个整数数组 nums 和一个整数 k ,请你统计并返回 *该数组中和为 k ***的子数组的个数

子数组是数组中元素的连续非空序列。

 

示例 1:

输入: nums = [1,1,1], k = 2
输出: 2

示例 2:

输入: nums = [1,2,3], k = 3
输出: 2

5.3 解法(将前缀和存在哈希表中):

算法思路

image.png

设 i 为数组中的任意位置,⽤ sum[i] 表⽰ [0, i] 区间内所有元素的和。

想知道有多少个「以 i 为结尾的和为 k 的⼦数组」,就要找到有多少个起始位置为 x1, x2, x3... 使得 [x, i] 区间内的所有元素的和为 k 。那么 [0, x] 区间内的和是不是就是sum[i] - k 了。于是问题就变成:

  • 找到在 [0, i - 1] 区间内,有多少前缀和等于 sum[i] - k 的即可。

我们不⽤真的初始化⼀个前缀和数组,因为我们只关⼼在 i 位置之前,有多少个前缀和等于sum[i] - k 。因此,我们仅需⽤⼀个哈希表,⼀边求当前位置的前缀和,⼀边存下之前每⼀种前缀和出现的次数。

5.4 C++算法代码:

class Solution {
public:
    int subarraySum(vector<int>& nums, int k) {
        unordered_map <int, int> hash;  // 统计前缀和出现的次数
        hash[0] = 1 ;

        int sum = 0, ret = 0;
        for(auto e : nums)
        {
            sum += e;  // 计算当前位置的前缀和
            if(hash.count(sum - k)) ret += hash[sum - k];  // 统计个数
            hash[sum]++;
        }
        return ret;
    }
};

6 和可被 K 整除的子数组

6.1 题目链接

974. 和可被 K 整除的子数组

6.2 题目描述

给定一个整数数组 nums 和一个整数 k ,返回其中元素之和可被 k 整除的非空 子数组 的数目。

子数组 是数组中 连续 的部分。

 

示例 1:

输入: nums = [4,5,0,-2,-3,1], k = 5
输出: 7
解释: 有 7 个子数组满足其元素之和可被 k = 5 整除:
[4, 5, 0, -2, -3, 1], [5], [5, 0], [5, 0, -2, -3], [0], [0, -2, -3], [-2, -3]

示例 2:

输入: nums = [5], k = 9
输出: 0

6.3 解法(前缀和在哈希表中):

本题需要的前置知识:

  • 同余定理
    • 如果 (a - b) % n == 0 ,那么我们可以得到⼀个结论: a % n == b % n 。⽤⽂字叙述就是,如果两个数相减的差能被 n 整除,那么这两个数对 n 取模的结果相同。
      • 例如: (26 - 2) % 12 == 0 ,那么 26 % 12 == 2 % 12 == 2 。
  • c++ 中负数取模的结果,以及如何修正「负数取模」的结果
    • a. c++ 中关于负数的取模运算,结果是「把负数当成正数,取模之后的结果加上⼀个负号」。
      • 例如: -1 % 3 = -(1 % 3) = -1
    • b. 因为有负数,为了防⽌发⽣「出现负数」的结果,以 (a % n + n) % n 的形式输出保证为正。
      • 例如: -1 % 3 = (-1 % 3 + 3) % 3 = 2

算法思路

思路与 560. 和为 K 的⼦数组 这道题的思路相似。

image.png

设 i 为数组中的任意位置,⽤ sum[i] 表⽰ [0, i] 区间内所有元素的和。

  • 想知道有多少个「以 i 为结尾的可被 k 整除的⼦数组」,就要找到有多少个起始位置为 x1, x2, x3... 使得 [x, i] 区间内的所有元素的和可被 k 整除。
  • 设 [0, x - 1] 区间内所有元素之和等于 a , [0, i] 区间内所有元素的和等于 b ,可得(b - a) % k == 0 。
  • 由同余定理可得, [0, x - 1] 区间与 [0, i] 区间内的前缀和同余。于是问题就变成:
    • 找到在 [0, i - 1] 区间内,有多少前缀和的余数等于 sum[i] % k 的即可。

我们不⽤真的初始化⼀个前缀和数组,因为我们只关⼼在 i 位置之前,有多少个前缀和等于sum[i] - k 。因此,我们仅需⽤⼀个哈希表,⼀边求当前位置的前缀和,⼀边存下之前每⼀种前缀和出现的次数。

6.4 C++算法代码:

class Solution {
public:
    int subarraysDivByK(vector<int>& nums, int k) {
        unordered_map<int, int> hash{{0, 1}};
        //空子数组(即不包含任何元素的子数组)的和为 0,余数也为 0,这样的子数组有 1 个。
        int sum = 0, ret = 0;
        for(auto e : nums)
        {
            sum += e;  // 算出当前位置的前缀和
            int r = (sum % k + k) % k;  // 修正后的余数
            if(hash.count(r)) ret += hash[r];  // 统计结果
            hash[r]++;
        }
        return ret;
    }
};

7 连续数组

7.1 题目链接

525. 连续数组

7.2 题目描述

给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组,并返回该子数组的长度。

 

示例 1:

输入: nums = [0,1]
输出: 2
说明: [0, 1] 是具有相同数量 0 和 1 的最长连续子数组。

示例 2:

输入: nums = [0,1,0]
输出: 2
说明: [0, 1] (或 [1, 0]) 是具有相同数量0和1的最长连续子数组。

7.3 解法(前缀和在哈希表中):

算法思路

稍微转化⼀下题⽬,就会变成我们熟悉的题:

  • 本题让我们找出⼀段连续的区间, 0 和 1 出现的次数相同。
  • 如果将 0 记为 -1 , 1 记为 1 ,问题就变成了找出⼀段区间,这段区间的和等于 0 。
  • 于是,就和 560. 和为 K 的⼦数组 这道题的思路⼀样

image.png

设 i 为数组中的任意位置,⽤ sum[i] 表⽰ [0, i] 区间内所有元素的和。

想知道最⼤的「以 i 为结尾的和为 0 的⼦数组」,就要找到从左往右第⼀个 x1 使得 [x1, i]区间内的所有元素的和为 0 。那么 [0, x1 - 1] 区间内的和是不是就是 sum[i] 了。于是问题就变成:

  • 找到在 [0, i - 1] 区间内,第⼀次出现 sum[i] 的位置即可。

我们不⽤真的初始化⼀个前缀和数组,因为我们只关⼼在 i 位置之前,第⼀个前缀和等于 sum[i]的位置。因此,我们仅需⽤⼀个哈希表,⼀边求当前位置的前缀和,⼀边记录第⼀次出现该前缀和的位置。

7.4 C++算法代码:

class Solution {
public:
    int findMaxLength(vector<int>& nums) {
        unordered_map<int, int> hash;
        hash[0] = -1;  // 默认有一个前缀和为 0 的情况

        int sum = 0, ret = 0;
        for(int i = 0; i < nums.size(); i++)
        {
            sum += nums[i] == 0 ? -1 : 1;  // 计算当前位置的前缀和
            if(hash.count(sum)) ret = max(ret, i - hash[sum]);
            else hash[sum] = i; 
        }
        return ret;
    }
};

8 矩阵区域和

8.1 题目链接

1314. 矩阵区域和

8.2 题目描述

给你一个 m x n 的矩阵 mat 和一个整数 k ,请你返回一个矩阵 answer ,其中每个 answer[i][j] 是所有满足下述条件的元素 mat[r][c] 的和: 

  • i - k <= r <= i + k,
  • j - k <= c <= j + k 且
  • (r, c) 在矩阵内。

 

示例 1:

输入: mat = [[1,2,3],[4,5,6],[7,8,9]], k = 1
输出: [[12,21,16],[27,45,33],[24,39,28]]

示例 2:

输入: mat = [[1,2,3],[4,5,6],[7,8,9]], k = 2
输出: [[45,45,45],[45,45,45],[45,45,45]]

8.3 解法

算法思路

⼆维前缀和的简单应⽤题,关键就是我们在填写结果矩阵的时候,要找到原矩阵对应区域的左上⻆以及右下⻆的坐标(推荐⼤家画图)

左上⻆坐标: x1 = i - k,y1 = j - k ,但是由于会「超过矩阵」的范围,因此需要对 0 取⼀个 max 。因此修正后的坐标为: x1 = max(0, i - k), y1 = max(0, j - k) ;

右下⻆坐标: x1 = i + k,y1 = j + k ,但是由于会「超过矩阵」的范围,因此需要对 m - 1 ,以及 n - 1 取⼀个 min 。因此修正后的坐标为: x2 = min(m - 1, i + k),y2 = min(n - 1, j + k) 。

然后将求出来的坐标代⼊到⼆维前缀和矩阵的计算公式上即可~(但是要注意下标的映射关系)

8.4 C++算法代码:

class Solution {
public:
    vector<vector<int>> matrixBlockSum(vector<vector<int>>& mat, int k) {
        int m = mat.size(), n = mat[0].size();
        // 1. 预处理一个前缀和矩阵
        vector<vector<int>> dp(m + 1, vector<int>(n + 1));
        for( int i = 1; i <= m; i++)
            for(int j = 1; j <= n; j++)
                dp[i][j] = dp[i - 1][j] + dp[i][j - 1] - dp[i -1][j - 1] + mat [i - 1][j - 1];


        // 2. 使用
        vector<vector<int>> ret(m ,vector<int>(n));
        for(int i = 0; i < m; i++)
        {
            for(int j = 0; j < n; j++)
            {
                int x1 = max(0, i - k) + 1, y1 = max(0,j - k) + 1;
                int x2 = min(m - 1, i + k) + 1, y2 = min(n - 1, j + k) + 1;
                ret[i][j] = dp[x2][y2] - dp[x1 - 1][y2] - dp[x2][y1 - 1] + dp[x1 - 1][y1 - 1];
            }
        }
        return ret;
    }
};