力扣热门100题 - 10. 正则表达式匹配
题目链接:10. 正则表达式匹配
题目描述:
给你一个字符串 s 和一个字符规律 p,请你来实现一个支持 '.' 和 '*' 的正则表达式匹配。
'.' 匹配任意单个字符
'*' 匹配零个或多个前面的那一个元素
所谓匹配,是要涵盖 整个 字符串 s的,而不是部分字符串。
示例:
输入:s = "aa", p = "a"
输出:false
解释:"a" 无法匹配 "aa" 整个字符串。
输入:s = "aa", p = "a*"
输出:true
解释:因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
输入:s = "ab", p = ".*"
输出:true
解释:".*" 表示可匹配零个或多个('*')任意字符('.')。
提示:
1 <= s.length <= 20
1 <= p.length <= 20
s 只包含从 a-z 的小写字母。
p 只包含从 a-z 的小写字母,以及字符 . 和 *。
保证每次出现字符 * 时,前面都匹配到有效的字符
解题思路(动态规划):
动态规划数组的定义: 我们使用一个二维数组 dp,其中 dp[i][j] 表示 s 的前 i 个字符和 p 的前 j 个字符是否匹配。
初始化: 首先,dp[0][0] 表示空字符串和空正则表达式是匹配的,因此 dp[0][0] = true。
处理 '*' 的情况: 对于每个正则表达式中的 '*',我们需要考虑两种情况:
'*' 匹配零个前面的元素:dp[i][j] = dp[i][j - 2]。
'*' 匹配一个或多个前面的元素:dp[i][j] = dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.')。
处理 '.' 和普通字符的情况: 如果当前字符匹配,即 p.charAt(j - 1) == '.' 或者 p.charAt(j - 1) == s.charAt(i - 1),则 dp[i][j] = dp[i - 1][j - 1]。
填充动态规划数组: 使用两层嵌套循环遍历字符串 s 和正则表达式 p,根据上述规则填充动态规划数组。
返回结果: 最终结果为 dp[m][n],其中 m 和 n 分别是字符串 s 和正则表达式 p 的长度。
时间复杂度:O(m * n)
代码:
public boolean isMatch(String s, String p) {
int m = s.length();
int n = p.length();
// 创建动态规划数组,dp[i][j] 表示 s 的前 i 个字符和 p 的前 j 个字符是否匹配
boolean[][] dp = new boolean[m + 1][n + 1];
// 初始化,空字符串和空正则表达式是匹配的
dp[0][0] = true;
// 处理正则表达式中的 '*',初始化第一行
for (int j = 1; j <= n; j++) {
if (p.charAt(j - 1) == '*') {
// '*' 匹配零个前面的元素
dp[0][j] = dp[0][j - 2];
}
}
// 填充动态规划数组
for (int i = 1; i <= m; i++) {
for (int j = 1; j <= n; j++) {
char sc = s.charAt(i - 1);
char pc = p.charAt(j - 1);
// 如果当前字符匹配,即 '.' 或者与当前字符相同
if (pc == '.' || pc == sc) {
dp[i][j] = dp[i - 1][j - 1];
} else if (pc == '*') {
/* 处理 '*' 的情况,分为匹配零个和匹配一个或多个
dp[i][j - 2]: 表示 '*' 匹配零个前面的元素,也就是忽略掉 '*' 和它前面的那个字符。
(dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.')):这部分表示 '*' 匹配一个或多个前面的元素。具体分解如下:
dp[i - 1][j]:检查 s 的前 i - 1 个字符和 p 的前 j 个字符是否匹配。
(s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.'):检查 s 的第 i 个字符和 p 的前 j - 2 个字符是否匹配。*/
dp[i][j] = dp[i][j - 2] || (dp[i - 1][j] && (s.charAt(i - 1) == p.charAt(j - 2) || p.charAt(j - 2) == '.'));
}
}
}
// 最终结果为 dp[m][n]
return dp[m][n];
}