二分查找
直观思考,本题可以将 w o r d s words words 中每个单词 w o r d word word 依次和目标字符串 s s s 比较,检查是否为子串。时间复杂度 n × ∑ i = 0 m − 1 w o r d s i n\times \sum_{i=0}^{m-1}words_i n×∑i=0m−1wordsi n n n 是 s s s 的长度, m m m 是 w o r d s words words 的长度,问题规模 1 0 11 10^{11} 1011 , T L E TLE TLE 。
注意到, s s s 中只有 26 26 26 个字母 , 类比哈希思想分桶,但是桶内键值对不唯一,就可以二分优化了。 a l p h a [ i ] alpha[i] alpha[i] 存储 i i i对应字母 的所有下标,那么 a l p h a alpha alpha 就存储了 26 26 26 个字母对应 s s s 的下标。只需一次遍历 s s s ,即可得到 a l p h a alpha alpha 。
二分如下:遍历所有单词 w o r d word word ,遍历单词的字母 c c c ,记录位置 p p p ,表示 c c c 在目标串 s s s 中的位置,二分查找桶中第一个大于 p p p 的位置 i t it it , 如果找到,则令 p p p 等于这个位置,可以继续匹配 ; 如果查找越界,说明桶中没有足够字母,可行解- -,提前 b r e a k break break。
代码展示
class Solution {
public:
int numMatchingSubseq(string s, vector<string>& words) {
vector<vector<int>> alpha(26);
for(int i = 0;i<s.size();i++) alpha[s[i]-'a'].emplace_back(i);//存所有s字母的下标//分了26个桶
int ans = words.size();//初始认为所有word符合条件
for(auto &word:words){//遍历words
if(word.size()>s.size()){//剪枝
ans--;
continue;
}
int p = -1;//初始小于所有数//找第一个字符
for(auto &c:word){
auto &pos = alpha[c-'a'];//桶
auto it = upper_bound(pos.begin(),pos.end(),p);//桶中第一个大于p的位置
if(pos.end()==it){//查无此字母
ans--;
break;//剪枝
}
p = it[0];//下标更新
}
}
return ans;
}
};
博主致语
理解思路很重要!
欢迎读者在评论区留言,作为日更博主,看到就会回复的。
AC
复杂度分析
- 时间复杂度: O ( l o g n × ∑ i = 0 m − 1 w o r d s i ) O(logn\times \sum_{i=0}^{m-1}words_i) O(logn×∑i=0m−1wordsi), n n n 是 s s s 的长度, m m m 是 w o r d s words words 的长度。
- 空间复杂度: O ( n ) O(n) O(n), a l p h a alpha alpha 保存了 s s s 所有字母的下标, a l p h a alpha alpha 的空间复杂度 O ( n ) O(n) O(n) 。