题目
请实现一个函数用来匹配包含'. '
和'*'
的正则表达式。模式中的字符'.'
表示任意一个字符,而'*'
表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串"aaa"
与模式"a.a"
和"ab*ac*a"
匹配,但与"aa.a"
和"ab*a"
均不匹配。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
s
可能为空,且只包含从a-z
的小写字母。p
可能为空,且只包含从a-z
的小写字母以及字符.
和*
,无连续的'*'
。
解题思路
1.对于此我们我们应该选取动态规划来解决,首先我们假设主串为 A,模式串为 B从最后一步出发(也就是从两个字符串的最后一个字符进行匹配),需要关注最后进来的字符。假设 A的长度为 n , 的长度为 m ,关注正则表达式 B 的最后一个字符是谁,它有三种可能,正常字符、∗ 和 .(点),那针对这三种情况讨论即可,如下:
①如果 B 的最后一个字符是正常字符,那就是看 A[n−1] 是否等于 B[m−1],相等则看 A(0..n−2)与 B(0..m−2),相当于两个字符数组的最后一位均是正常字符且相等,我们就需要去判断除之前的元素是否匹配。若不等则是不能匹配,这就是子问题。
②如果 B 的最后一个字符是 . (点),它能匹配任意字符,直接看 A(0..n−2) 与B(0..m−2)
③如果 BBB 的最后一个字符是 * 它代表 B[m−2]=c 可以重复0次或多次,它们是一个整体 c*我们依旧要分情况进行讨论。
情况一:A[n−1] 是 0 个 c,那么 B 最后两个字符废了(就是当 * 之前的元素与A字符串对应的位置不相等时我们就让 * 为0,直接将 * 与 * 之前的元素都删除了),能否匹配取决于 A(0..n−1) 和B(0..m−3)是否匹配
情况二:A[n−1] 是多个 c 中的最后一个(这种情况必须 A[n−1]=c 或者 c=′.′ ),所以 A 匹配完往前挪一个,B 继续匹配,因为可以匹配多个,继续看 A(0..n−2) 和 B(0..m−1)是否匹配。
转移方程
f[i][j] 代表 A 的前 i 个和 B 的前 j 个能否匹配
- 对于前面两个情况,可以合并成一种情况(①和②) f[i][j]=f[i−1][j−1]
- 对于第三种情况,对于 c* 分为看和不看两种情况
不看:直接砍掉正则串的后面两个, f[i][j]=f[i][j−2]
看:正则串不动,主串前移一个,f[i][j]=f[i−1][j]
初始条件
特判:需要考虑空串空正则
- 空串和空正则是匹配的,f[0][0]=true
- 空串和非空正则,不能直接定义 true 和 false,必须要计算出来。(比如A= '' '' ,B=a∗b∗c∗)
- 非空串和空正则必不匹配,f[1][0]=...=f[n][0]=false
- 非空串和非空正则,那肯定是需要计算的了。
大体上可以分为空正则和非空正则两种,空正则也是比较好处理的,对非空正则我们肯定需要计算,非空正则的三种情况,前面两种可以合并到一起讨论,第三种情况是单独一种,那么也就是分为当前位置是 ∗ 和不是 ∗ 两种情况了。
结果
我们开数组要开 n+1 ,这样对于空串的处理十分方便。结果就是 f[n][m]
代码实现
class Solution {
public boolean isMatch(String s, String p) {
if(s == null || p == null){
return true;
}
int n = s.length();
int m = p.length();
boolean[][] dp = new boolean[n+1][m+1];
dp[0][0] = true;
for(int j = 2; j <= m; j++){
if(p.charAt(j-1) == '*'){
dp[0][j] = dp[0][j-2];
}
}
for(int i = 1; i <= n; i++){
for(int j = 1; j <= m; j++){
//当j不为*时
if(p.charAt(j - 1) != '*'){
if(p.charAt(j-1) == '.' || p.charAt(j-1) == s.charAt(i-1)){
dp[i][j] = dp[i-1][j-1];
}
}else{
//第j-1个字符不匹配
if(p.charAt(j-2) != s.charAt(i-1) && p.charAt(j-2) != '.'){
dp[i][j] = dp[i][j-2];
}else{
dp[i][j] = dp[i][j-2] || dp[i][j-1] || dp[i-1][j];
}
}
}
}
return dp[n][m];
}
}