优质博文:IT-BLOG-CN
一、题目
给你一个字符串s
和一个字符串列表wordDict
作为字典。如果可以利用字典中出现的一个或多个单词拼接出s
则返回true
。
注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。
示例 1:
输入: s = "leetcode", wordDict = ["leet", "code"]
输出: true
解释: 返回true
因为"leetcode"
可以由"leet"
和"code"
拼接成。
示例 2:
输入: s = "applepenapple", wordDict = ["apple", "pen"]
输出: true
解释: 返回true
因为"applepenapple"
可以由"apple" "pen" "apple"
拼接成。
注意,你可以重复使用字典中的单词。
示例 3:
输入: s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]
输出: false
提示:
1 <= s.length <= 300
1 <= wordDict.length <= 1000
1 <= wordDict[i].length <= 20
s
和wordDict[i]
仅由小写英文字母组成
wordDict
中的所有字符串 互不相同
二、代码
方法一:动态规划
思路和算法:我们定义 dp[i] 表示字符串 s 前 i 个字符组成的字符串 s[0…i−1] 是否能被空格拆分成若干个字典中出现的单词。从前往后计算考虑转移方程,每次转移的时候我们需要枚举包含位置 i−1 的最后一个单词,看它是否出现在字典中以及除去这部分的字符串是否合法即可。公式化来说,我们需要枚举 s[0…i−1] 中的分割点 j ,看 s[0…j−1] 组成的字符串 s1(默认 j=0 时 s1为空串)和 s[j…i−1] 组成的字符串 s2是否都合法,如果两个字符串均合法,那么按照定义 s1和 s2拼接成的字符串也同样合法。由于计算到 dp[i] 时我们已经计算出了 dp[0…i−1] 的值,因此字符串 s1是否合法可以直接由 dp[j] 得知,剩下的我们只需要看 s2是否合法即可,因此我们可以得出如下转移方程:
dp[i]=dp[j] && check(s[j..i−1])
其中 check(s[j…i−1]) 表示子串 s[j…i−1] 是否出现在字典中。
对于检查一个字符串是否出现在给定的字符串列表里一般可以考虑哈希表来快速判断,同时也可以做一些简单的剪枝,枚举分割点的时候倒着枚举,如果分割点 j 到 i 的长度已经大于字典列表里最长的单词的长度,那么就结束枚举,但是需要注意的是下面的代码给出的是不带剪枝的写法。
对于边界条件,我们定义 dp[0]=true 表示空串且合法。
有能力的读者也可以考虑怎么结合字典树 Trie 来实现,这里不再展开。
public class Solution {
public boolean wordBreak(String s, List<String> wordDict) {
Set<String> wordDictSet = new HashSet(wordDict);
boolean[] dp = new boolean[s.length() + 1];
dp[0] = true;
for (int i = 1; i <= s.length(); i++) {
for (int j = 0; j < i; j++) {
if (dp[j] && wordDictSet.contains(s.substring(j, i))) {
dp[i] = true;
break;
}
}
}
return dp[s.length()];
}
}
时间复杂度: O(n^2) ,其中 n 为字符串 s 的长度。我们一共有 O(n) 个状态需要计算,每次计算需要枚举 O(n) 个分割点,哈希表判断一个字符串是否出现在给定的字符串列表需要 O(1) 的时间,因此总时间复杂度为 O(n^2)。
空间复杂度: O(n) ,其中 n 为字符串 s 的长度。我们需要 O(n) 的空间存放 dp 值以及哈希表亦需要 O(n) 的空间复杂度,因此总空间复杂度为 O(n)。
初始思路:我想的很简单,字符串从头开始遍历子字符串,遇到字典内有的单词则直接从字符串内删掉,最后看看是否整个字符串都能删完即可。代码如下:
public class Solution {
public boolean wordBreak(String s, List<String> wordDict) {
if(wordDict.contains(s))
return true;
while(true){
for(int i = 1; i <= s.length(); i++){
if(wordDict.contains(s.substring(0, i))){
s = s.substring(i, s.length());
break;
}
if(i==s.length())
return false;
}
if(wordDict.contains(s))
return true;
}
}
}
但是这么简单显然是错误的,没有考虑到如下的情况: s =“goalspecial” wordDict =[“go”,“goal”,“goals”,“special”] 当字符串中的一个子字符串包含有多个字典中的词,则需要考虑究竟要使用哪个词了。 研究了官方的题解后才理解了,官方使用dp[i]=true来表示s[i]之前的字符串可被字典完全替换。
if (dp[j] && wordDictSet.contains(s.substring(j, i))) {
dp[i] = true;
break;
}
关于以上这段代码,条件dp[j] 的意思是s[0, j-1]的子字符串可被字典完全替换,而wordDictSet.contains(s.substring(j, i))的意思是字典内包含有字符串s[j, i-1]的词。 因此结合一下就是题解中说的如果前 0 到 j - 1 的子字符串合法,后面的 j 到 i - 1的子字符串也合法,那么加起来的[ 0 , i - 1 ]自然也合法。所以将dp[i]设为了true。 代码中不易理解的部分可能就是各种 i 和 j 的取值。外层for循环中的
for (int i = 1; i <= s.length(); i++)
是由于dp数组要得到最终的结果就要遍历完整个字符串,而dp[0]代表空串,所以自然要从1开始遍历到i==s.length(),而内层for循环中的
for (int j = 0; j < i; j++)
是为了不断寻找是否存在那么一个分割点j使得[0,j-1]的子字符串合法的同时s[ j , i - 1 ] 也合法,如果存在才将dp[i]设为true。