- 去除重复字母
给你一个字符串 s ,请你去除字符串中重复的字母,使得每个字母只出现一次。需保证 返回结果的
字典序最小(要求不能打乱其他字符的相对位置)。
字典序最小:
考虑字符串 a 与 字符串 b,如果字符串 a 在 a 与 b 相异的第一处的字符在字母表上先于对应 b 在此处的字符出现,则称字符串 a 字典序小于 b。
如果 a 或 b 其中较短的字符串为另一个字符串的前半部分,则较短的字符串字典序小于另一个字符串。
示例 1:
输入: s = “bcabc”
输出: “abc”
示例 2:
输入: s = “cbacdcbc”
输出: “acdb”
提示:
1 <= s.length <= 10^4 s由小写英文字母组成
相似题目:该题与1081 https://leetcode-cn.com/problems/smallest-subsequence-of-distinct-characters 相同
思路:
对于s=cbacdcbc,从左到右遍历其中的字母。
1.s[0]=c。由于只遍历了一个字母,目前已知字典序最小的字符串是c。
2.s[1]=b。如果右边没有字母c,那么s0]=c必须保留;实际上右边还有字母c,我们可以
去掉c,改用b当作目前字典序最小的字符串。
3.s[2]=a。同样的,由于右边还有字母b,我们可以去掉b,改用a当作目前字典序最小的字
符串(下面记作am.s)。
4.s[3]=c。由于c比a大,可以接在a后面,目前ans=ac。
5.s[4]=d。由于d比c大,可以接在c后面,目前ans=acd。
6.s[5]=c。由于acd里面已经有c了,直接跳过。目前ans=acd。
7.s[6]=b。我们发现b比d小,能不能像上面s[1]和s2那样,去掉d替换成b呢?这是不
行的,因为后面没有d了,我们只能老老实实地接在d后面,目前ams=acdb。
8.s[7]=c。由于acdb里面已经有c了,直接跳过。
遍历完毕,我们得到了答案ans=acdb。
你可能会问,怎么知首右边是否还有某个字母x?我们可以在遍历s之前,先统计出每个字母的出
现次数,记到一个哈希表或者数组left中。在遍历s时,减少s[i]的出现次数,也就是把left[s[i]]
减一。如果发现left[x]=0就说明右边没有x了。
具体算法如下:
1.统计每个字母的出现次数,记到一个哈希表或者数组lfet中。
2.遍历s,先把left[s[i]]减一。
3.如果s[i]在ans中,直接continue。为了快速判断s[i]是否在ams中,可以创建一个哈希
表或者布尔数组inAns。
4.如果s[i]不在ans中,那么判断s[i]是否小于ans的最后一个字母(记作x),如果s[i]<
x且left [x]>0,那么可以把x从ans中去掉,同时标记inAns [x]=false。
5.反复执行第4步,直到ans为空,或者s[i]>x,或者left[x]=0。
6.把s[i]加到ans未尾,同时标记nAns[s[i]]=true。然后继续遍历s的下一个字母。
7.遍历完s后,返回ans。
题解:
public class Solustion{
public String removeDuplicateLetters(String S) {
//特殊判断
if(null == S){
return "";
}
char [] arr = S.toCharArray();
//计算每个字母中出现的次数
int [] left = new int[26];
for(char c :arr){
left[c-'a']++;
}
StringBuilder ans = new StringBuilder(26);
//记录某个字母是否出现过
boolean[] inAns = new boolean[26];
for(char c : arr){
//将次数减少
left[c-'a']--;
//如果字母已经出现过了则继续
if(inAns[c - 'a']){
continue;
}
// 设 x = ans.charAt(ans.length() - 1),
// 如果 c < x,且右边还有 x,那么可以把 x 去掉,因为后面可以重新把 x 加到 ans 中
while (!ans.isEmpty() && c < ans.charAt(ans.length() - 1) && left[ans.charAt(ans.length() - 1) - 'a'] > 0) {
// 标记 x 不在 ans 中
inAns[ans.charAt(ans.length() - 1) - 'a'] = false;
ans.deleteCharAt(ans.length() - 1);
}
}
return ans.toString();
}
}