10. 正则表达式匹配

513 阅读3分钟

小知识,大挑战!本文正在参与“程序员必备小知识”创作活动

10. 正则表达式匹配

给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。

'.' 匹配任意单个字符 '*' 匹配零个或多个前面的那一个元素 所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。

示例 1:

输入:s = "aa" p = "a" 输出:false 解释:"a" 无法匹配 "aa" 整个字符串。 示例 2:

输入:s = "aa" p = "a*" 输出:true 解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。 示例 3:

输入:s = "ab" p = "." 输出:true 解释:"." 表示可匹配零个或多个('*')任意字符('.')。 示例 4:

输入:s = "aab" p = "cab" 输出:true 解释:因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。 示例 5:

输入:s = "mississippi" p = "misisp*." 输出:false

提示:

  • 0 <= s.length <= 20
  • 0 <= p.length <= 30
  • s 可能为空,且只包含从 a-z 的小写字母。
  • p 可能为空,且只包含从 a-z 的小写字母,以及字符 . 和 *。
  • 保证每次出现字符 * 时,前面都匹配到有效的字符

数组定义

dp[i][j]代表s的前i个字符和p的前j个字符能否匹配

初始化

注意:

  • "a*"可以产生一个空字符串(即*可以用于删除前一个字符),或者若干个a的字符串 因此在初始化的时候
  • dp[0][i]代表s为空字符串时,p的匹配情况。只有a * a* a * a *这样的特殊情况,才能产生空字符串,所以我们只需要遍历偶数位是否为连续的 *,就能判断出空字符串匹配的长度了

状态转移

  • p.charAt(j-1)=='.'||p.charAt(j-1)==s.charAt(i-1) 说明当前两个字符可以直接匹配,所以直接由前面字符串的匹配情况转移而来dp[i][j]=dp[i-1][j-1];
  • p.charAt(j-1)=='*'
  1. dp[i][j-2] 因为*有删除前一个字符的功能,因此我们尝试删除前一个字符,观察能否匹配
  2. p.charAt(j-2)==s.charAt(i-1)||p.charAt(j-2)=='.' 因为*能够产生若干个与 *前字符相同的字符,因此如果我们当前s的字符与 *前的字符相同的话,说明在dp[i-1][j]这种情况可以匹配的情况下,多产生一个字符来匹配当前s的字符

代码

class Solution {
    public boolean isMatch(String s, String p) {

        int n=s.length(),m=p.length();
        boolean[][] dp=new boolean[n+1][m+1];
        dp[0][0]=true;
        for(int i=2;i<=m;i+=2)
        {
            if(p.charAt(i-1)=='*')
            {
                dp[0][i]=dp[0][i-2];
            }
         }
        for(int i=1;i<=n;i++)
            for(int j=1;j<=m;j++)
            {
                if(p.charAt(j-1)=='.'||p.charAt(j-1)==s.charAt(i-1))
                dp[i][j]=dp[i-1][j-1];
                else if(p.charAt(j-1)=='*')
                {
                    if(dp[i][j-2])
                       dp[i][j]=true;
                    else if(p.charAt(j-2)==s.charAt(i-1)||p.charAt(j-2)=='.')
                    {
                        dp[i][j]=dp[i-1][j];
                    }
                     
                    
                }
            }
        return dp[n][m];
          
    }
}