二分查找
直观思考,本题可以将 w o r d s words words 中每个单词 w o r d word word 依次和目标字符串 s s s 比较,检查是否为子串。时间复杂度 n × ∑ i = 0 m − 1 w o r d s i n\times \sum_{i=0}^{m-1}words_i n×∑i=0m−1wordsi n n n 是 s s s 的长度, m m m 是 w o r d s words words 的长度,问题规模 1 0 11 10^{11} 1011 , T L E TLE TLE 。
注意到, s s s 中只有 26 26 26 个字母 , 类比哈希思想分桶,但是桶内键值对不唯一,就可以二分优化了。 a l p h a [ i ] alpha[i] alpha[i] 存储 i i i对应字母 的所有下标,那么 a l p h a alpha alpha 就存储了 26 26 26 个字母对应 s s s 的下标。只需一次遍历 s s s ,即可得到 a l p h a alpha alpha 。
二分如下:遍历所有单词 w o r d word word ,遍历单词的字母 c c c ,记录位置 p p p ,表示 c c c 在目标串 s s s 中的位置,二分查找桶中第一个大于 p p p 的位置 i t it it , 如果找到,则令 p p p 等于这个位置,可以继续匹配 ; 如果查找越界,说明桶中没有足够字母,可行解- -,提前 b r e a k break break。
代码展示
class Solution {
public:
    int numMatchingSubseq(string s, vector<string>& words) {
        vector<vector<int>> alpha(26);
        for(int i = 0;i<s.size();i++) alpha[s[i]-'a'].emplace_back(i);//存所有s字母的下标//分了26个桶
        int ans = words.size();//初始认为所有word符合条件
        for(auto &word:words){//遍历words
            if(word.size()>s.size()){//剪枝
                ans--;
                continue;
            }
            int p = -1;//初始小于所有数//找第一个字符
            for(auto &c:word){
                auto &pos = alpha[c-'a'];//桶
                auto it = upper_bound(pos.begin(),pos.end(),p);//桶中第一个大于p的位置
                if(pos.end()==it){//查无此字母
                    ans--;
                    break;//剪枝
                }
                p = it[0];//下标更新
            }
        }
        return ans;
    }
};
博主致语
理解思路很重要!
 欢迎读者在评论区留言,作为日更博主,看到就会回复的。
AC

复杂度分析
- 时间复杂度: O ( l o g n × ∑ i = 0 m − 1 w o r d s i ) O(logn\times \sum_{i=0}^{m-1}words_i) O(logn×∑i=0m−1wordsi), n n n 是 s s s 的长度, m m m 是 w o r d s words words 的长度。
- 空间复杂度: O ( n ) O(n) O(n), a l p h a alpha alpha 保存了 s s s 所有字母的下标, a l p h a alpha alpha 的空间复杂度 O ( n ) O(n) O(n) 。


![[hadoop全分布部署]虚拟机Hadoop集群配置/etc/hosts、配置无密码登录(SSH)](https://img-blog.csdnimg.cn/8e97f2ac585d4b73875659ddc3ac4de4.png)
















