1653. 使字符串平衡的最少删除次数
题目描述
给你一个字符串 s ,它仅包含字符 ‘a’ 和 'b’ 。
你可以删除 s 中任意数目的字符,使得 s 平衡 。当不存在下标对 (i,j) 满足 i < j ,且 s[i] = ‘b’ 的同时 s[j]= ‘a’ ,此时认为 s 是 平衡 的。
请你返回使 s 平衡 的 最少 删除次数。
示例 1
输入:s = “aababbab”
输出:2
解释:你可以选择以下任意一种方案:
下标从 0 开始,删除第 2 和第 6 个字符(“aababbab” -> “aaabbb”),
下标从 0 开始,删除第 3 和第 6 个字符(“aababbab” -> “aabbbb”)。
示例 2
输入:s = “bbaaaaabb”
输出:2
解释:唯一的最优解是删除最前面两个字符。
提示
- 1 <= s.length <= 105
- s[i] 要么是 ‘a’ 要么是 'b’ 。
算法一:前后缀分解,两次遍历
思路
- 第一次遍历:首先统计 s 中 a 的出现个数,也就是枚举分割线的第一种情况;
- 第二次遍历:依次访问 s 中的每个字符,每遍历依次字符就是枚举一种分割线情况。如果是 ‘a’ ,那么删除次数 -1 ,如果遇到 ‘b’ ,就 +1。
收获
-
把
if-else
写成del += (c - 'a') * 2 - 1;
,效率会提升很多。CPU 在遇到分支(条件跳转指令)时会预测代码要执行哪个分支,如果预测正确,CPU 就会继续按照预测的路径执行程序。但如果预测失败,CPU 就需要回滚之前的指令并加载正确的指令,以确保程序执行的正确性。
对于本题的数据,字符‘a’ 和 ‘b’ 可以认为是随机出现的,在这种情况下分支预测就会有 50% 的概率失败。失败导致的回滚和加载操作需要消耗额外的 CPU 周期,如果能用较小的代价去掉分支,对于本题的情况必然可以带来效率上的提升。
注意:这种优化方法往往会降低可读性,最好不要在业务代码中使用。
算法情况
-
时间复杂度:O(n), 其中 n 为 s 的长度;
-
空间复杂度:O(1)。
代码
class Solution {
public:
int minimumDeletions(string s) {
int del = 0; // 要删除的字符数
for(char c : s){
// del 统计字符 a 的个数
del += ('b' - c);
}
int ans = del;
for(char c : s){
// a:-1 b:+1
del += (c - 'a') * 2 - 1;
ans = min(ans, del);
}
return ans;
}
};
算法二:动态规划,一次遍历
思路
收获
- 太久没用线性规划解题了,复习一下。
- 另外,方法二虽然只进行了一次遍历,但是时间复杂度并不低,因为这里用到了 if - else 的判断语句,原因在方法一介绍了。
算法情况
- 时间复杂度:O(n), 其中 n 为 s 的长度;
- 空间复杂度:O(1)。
代码
class Solution {
public:
int minimumDeletions(string s) {
int n = s.size();
int cnt_b = 0;
int ans = 0;
for(int i=1; i<=s.size(); ++i){
if(s[i-1] == 'b'){
cnt_b ++;
}
else{
ans = min(cnt_b, ans + 1);
}
}
return ans;
}
};
参考题解
- 方法一
- 方法二:动态压缩