动态规划

208 阅读4分钟

动态规划

最重要的是找到状态和状态转移方式 #例子 给定一个字符串 (s) 和一个字符模式 (p)。实现支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符。 '*' 匹配零个或多个前面的元素。 匹配应该覆盖整个字符串 (s) ,而不是部分字符串。

说明:

s 可能为空,且只包含从 a-z 的小写字母。 p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 。 ##示例 1: 输入: s = "aa" p = "a" 输出: false 解释: "a" 无法匹配 "aa" 整个字符串。 ##示例 2: 输入: s = "aa" p = "a" 输出: true 解释: '' 代表可匹配零个或多个前面的元素, 即可以匹配 'a' 。因此, 重复 'a' 一次, 字符串可变为 "aa"。 ##示例 3: 输入: s = "ab" p = "." 输出: true 解释: "." 表示可匹配零个或多个('')任意字符('.')。 ##示例 4: 输入: s = "aab" p = "cab" 输出: true 解释: 'c' 可以不被重复, 'a' 可以被重复一次。因此可以匹配字符串 "aab"。 ##示例 5: 输入: s = "mississippi" p = "misisp*." 输出: false

#题目分析 这里采用动态规划,动态规划最重要的是找到问题的状态,以及如何通过状态转移方式转移到下一个状态。

应该很容易想到定义d[i][j] 来表示字符串长度为i是否匹配pattern长度为j的状态。 然后问题就变成了当我们知道了d[i-1][j-1]的时候,如何获得d[i][j]的状态,比如 d[i][j] 是否为true,如何通过前面的状态来通过数学表达式表示出来。

这里采用自低向上的方法来推导,观察一个例子 string: abc pattern: a*bc

1,首先建立二维数组 d[string.length() + 1][pattern.length() + 1] | 字符数/匹配字符数 | 0 | 1 | 2 | 3 | 4 | | -------- | -----: | :----: | :----: | :----: | :----: | | 0 | | | | | | | 1 | | | | | | | 2 | | | | | | | 3 | | | | | | 2, 初始化二维数组d, 当pattern为空,有0个匹配字符的时候,可以很容易得到下列数组 | 字符数/匹配字符数 | 0 | 1 | 2 | 3 | 4 | | -------- | -----: | :----: | :----: | :----: | :----: | | 0 | true | | | | | | 1 | false | | | | | | 2 | false | | | | | | 3 | false | | | | | 当string为空,有0个匹配字符的时候,可以很容易得到下列数组 | 字符数/匹配字符数 | 0 | 1 | 2 | 3 | 4 | | -------- | -----: | :----: | :----: | :----: | :----: | | 0 | true | flase | true | false | false | | 1 | false | | | | | | 2 | false | | | | | | 3 | false | | | | |

因为当string为空的时候,这里的pattern是a*bc, a. 当取pattern的1个时候,pattern就是a,所以对应上面表格的d[0][1] = false b. 当取pattern的2个时候,pattern就是a*,所以对应上面表格的d[0][2] = true c. 当取pattern的3个时候,pattern就是a*b,所以对应上面表格的d[0][3] = false d. 当取pattern的4个时候,pattern就是a*bc,所以对应上面表格的d[0][4] = false

现在基本的低已经都有了,然后就是分析如何通过这些基本的状态低,来获取更高的状态。 比如d[1][1]如何通过这些基本的低来表示 先看例子 string当取1个字符的时候,string 是a, a. 当取pattern的1个时候,pattern就是a,很明显d[1][1] = true b. 当取pattern的2个时候,pattern就是a*, d[1][1] = true c. 当取pattern的3个时候,pattern就是a*b,d[1][3] = false d. 当取pattern的4个时候,pattern就是a*bc,d[1][4] = false

如下表格 | 字符数/匹配字符数 | 0 | 1 | 2 | 3 | 4 | | -------- | -----: | :----: | :----: | :----: | :----: | | 0 | true | flase | true | false | false | | 1 | false | true | true | false | false | | 2 | false | | | | | | 3 | false | | | | |

同理计算出当string字符取2个时候的表格

| 字符数/匹配字符数 | 0 | 1 | 2 | 3 | 4 | | -------- | -----: | :----: | :----: | :----: | :----: | | 0 | true | flase | true | false | false | | 1 | false | true | true | false | false | | 2 | false | false | false | true | false | | 3 | false | | | | |

可以看到当计算d[i][j]的时候, 当patter[j -1] == '*'的时候, a: *匹配了0个字符的时候,d[i][j] = d[i][j-2] 比如 b 和 ba*匹配的时候 b:*匹配了1个字符的时候, d[i][j] = d[i][j-1] 比如b 和b*匹配的时候 c: *匹配了多个字符的时候, d[i][j] = d[i-1][j] 且(s[i-1] === p[j-2] || p[j-2] === '.')

当patter[j -1] 不等于 '*'的时候 a:d[i][j] = d[i-1][j-1] 且 s[i-1] === p[j-1] || p[j-1] === '.'

所以状态转移方程就找到了

bool isMatch(char* s, char* p) {
    int length_str = (int) strlen(s);
    int length_pattern = (int) strlen(p);

    bool dp[length_str + 1][length_pattern + 1];
    // 初始化边界条件,也就是第0列,第1行
    int i;
    dp[0][0] = true;
    for (i = 1; i < length_str + 1; i++) {
        dp[i][0] = false;
    }

    for (i = 1; i < length_pattern + 1; i++) {
        // 奇数个是不能匹配到0个字符的,因此为假
        if (i % 2) {
            dp[0][i] = false;
        }
            // 当为偶数个的时候,判断隔着一个字符的那个位置,能不能匹配到,如果能,就能
        else if (p[i - 1] == '*') {
            dp[0][i] = dp[0][i - 2];
        } else {
            dp[0][i] = false;
        }
    }

    // 接下来填充数组
    for (i = 1; i < length_str + 1; i++) {
        for (int j = 1; j < length_pattern + 1; ++j) {
            if (p[j - 1] == '*') {
                dp[i][j] = dp[i][j - 2] || dp[i][j - 1] || (dp[i - 1][j] && (s[i - 1] == p[j - 2] || p[j - 2] == '.'));
            } else {
                dp[i][j] = dp[i - 1][j - 1] && (s[i - 1] == p[j - 1] || p[j - 1] == '.');
            }
        }
    }


    for (i = 0; i < length_str + 1; i++) {
        for (int j = 0; j < length_pattern + 1; ++j) {
            printf("%s\t", dp[i][j] ? "true" : "false");
        }
        printf("\n");
    }

    return dp[length_str][length_pattern];
}

#参考 github.com/zhishengqia…