字符串是由若干字符组成的有限序列,也可以理解为一个字符数组
344. 反转字符串
344. 反转字符串
思路:双指针法。定义两个指针(即索引下标),一个从字符串前面,一个从字符串后面,两个指针同时向中间移动,并交换元素
- 反转链表和反转字符串都是双指针法,但字符串也是一种数组,故元素在内存中是连续分布的(跟链表不同)
class Solution:
def reverseString(self, s: List[str]) -> None:
"""
Do not return anything, modify s in-place instead.
"""
i, j = 0, len(s)-1
for i in range(len(s)):
if i < j:
s[i], s[j] = s[j], s[i]
i += 1
j -= 1
return s
541. 反转字符串II
541. 反转字符串 II
题意简单概括:对于字符串s,每次遍历其2k的长度,反转2k长度里的前k个;若最后一组的长度不足2k但大于k,只反转这k个;若不足k,全部反转
首先,这题可以调用 344题反转字符串 中的函数,但要注意的是,344题的输入是一个字符组成的列表,而这题是字符串
- 对字符串str 转 字符列表 list,用 list() 即可
- 字符列表res 拼接回 字符串,用 "".join(res)
其次,分析本题哪些部分需要反转。注意,对于字符串s,是2k个长度去遍历的。对于2k个长度中的前k个进行反转
- 使用 range(start, end, step) 来确定需要调换的初始位置
- 对于字符串s = 'abc',如果使用s[0:999] ===> 'abc'。字符串末尾如果超过最大长度,则会返回至字符串最后一个值,这个特性可以避免一些边界条件的处理
- 用切片整体替换,而不是一个个替换
class Solution:
def reverseStr(self, s: str, k: int) -> str:
# 先定义一个反转函数
def reverse(s): # List[str]
i, j = 0, len(s)-1
for i in range(len(s)):
if i < j:
s[i], s[j] = s[j], s[i]
i += 1
j -= 1
return s
res = list(s) # str —> list
for i in range(0, len(s), 2*k): # 每次跳2k步
res[i: i+k] = reverse(res[i: i+k]) # 切片是左闭右开
return ''.join(res)
剑指offer 05. 替换空格
剑指 Offer 05. 替换空格
因为Python中字符串是不可变类型,所以操作字符串需要将其转换为列表,因此空间复杂度不可能为O(1)
法1:比较直观的一种方法。添加空列表,添加匹配的结果
class Solution:
def replaceSpace(self, s: str) -> str:
res = []
for i in range(len(s)):
if s[i] != ' ': # 注意引号中间要打一个空格
res.append(s[i])
else:
res.append('%20')
return "".join(res)
法2:双指针。首先扩充数组到每个空格替换成 %20 之后的大小,然后从后向前替换空格(为什么是从后向前?因为从前向后填充的话,每次添加元素都要将添加元素之后的所有元素向后移动)
很多数组填充类的问题,都可以预先给数组扩容成填充后的大小,然后再从后向前进行操作
class Solution:
def replaceSpace(self, s: str) -> str:
cnt = s.count(' ') # 统计字符串s里有多少个空格
res = list(s) # str —> list
res.extend([' ']*2*cnt) # 每个空格都要换成%20,长度+2
# left遍历s,若遇到空格,则替换为%20;否则直接赋给right
left, right = len(s)-1, len(res)-1 # 从后向前遍历
while left >= 0:
if res[left] != ' ':
res[right] = res[left]
right -= 1
else:
res[right-2: right+1] = '%20' # 左闭右开 [right-2, right)
right -= 3
left -= 1
return "".join(res)
151. 反转字符串中的单词
151. 反转字符串中的单词
思路:移除多余空格(双指针法) —> 将整个字符串反转 —> 将每个单词反转(先整体反转再局部反转)
class Solution:
def reverseWords(self, s: str) -> str:
s = s.strip() # 先去除字符串前后的空格
s = s[::-1] # 反转整个字符串
s = ' '.join(word[::-1] for word in s.split()) # 将每个单词反转
return s
若不借助 strip() 和 split() 函数,写起来很麻烦,代码如下:
class Solution:
# 反转s[i: j]
def reverse(self, s, i, j): # s是一个list
while i < j:
s[i], s[j] = s[j], s[i]
i += 1
j -= 1
def reverseWords(self, s: str) -> str:
s = list(s)
# strip()
start, end = 0, len(s) - 1
n = len(s)
while start < n and s[start] == ' ':
start += 1
while end >= 0 and s[end] == ' ':
end -= 1
if start > end:
return ''
# 去除中间多余的空格, 并且把字符串挪到最前面
i, j = 0, start
while j <= end:
if s[j] == ' ':
if s[j - 1] == ' ': # 多个空格
j += 1
else:
s[i] = s[j] # 只有1个空格
i += 1
j += 1
else: # 字母
s[i] = s[j]
i += 1
j += 1
n = i # 有效字符串的长度
self.reverse(s, 0, n - 1)
i = 0
while i < n:
j = i # 找到i开始的整个单词
while j < n and s[j] != ' ':
j += 1
# 此时, j指向单词的最后一个字母后的空格或者字符串结束处
self.reverse(s, i, j - 1)
i = j + 1 # 跳到下个单词的第一个
return ''.join(s[:n]) # n是有效字符串的长度
剑指Offer58-II.左旋转字符串
剑指 Offer 58 - II. 左旋转字符串
使用整体反转+局部反转就可以实现反转单词顺序的目的
思路:先局部反转再整体反转
class Solution:
def reverse(self, s: list, start, end):
while start < end:
s[start], s[end] = s[end], s[start]
start += 1
end -= 1
def reverseLeftWords(self, s: str, n: int) -> str:
# 先反转前n个
res = list(s)
self.reverse(res, 0, n-1)
# 再反转n+1到末尾
self.reverse(res, n, len(res)-1)
# 再整个反转
self.reverse(res, 0, len(res)-1)
return "".join(res)
28. 找出字符串中第一个匹配项的下标
28. 找出字符串中第一个匹配项的下标
(一)KMP
KMP主要应用在字符串匹配的场景中,其思想是当出现字符串不匹配的情况时,可以知道一部分之前已经匹配的文本内容,利用这些信息避免从头再去做匹配
如:文本串aabaabaaf(长度为n),模式串aabaaf(长度为m),要在文本串里匹配模式串
- 暴力:两层for循环,遍历两个字符串,挨个匹配。时间复杂度O(m*n)
- KMP:匹配过程O(n),单独生成next数组是O(m)。时间复杂度O(m+n)
next数组是一个前缀表,用来回退,记录了模式串与文本串不匹配时,模式串应该从哪里开始重新匹配。定义前缀表为:记录下标i(包括i)之前的字符串中有多长的相同前后缀
- 前缀:包含首字母,不包含尾字母的所有连续子串
- 后缀:包含尾字母,不包含首字母的所有连续子串
求得最长相同前后缀的长度就是对应前缀表的元素。找到了最长相等的前后缀,匹配失败的位置是后缀子字符串的后一个字符,找到与其相同的前缀,从后面重新匹配即可
关键:寻找匹配失败位置的前一位在前缀表中的元素,即为要跳转到的重新匹配的下标位置
(二)代码
class Solution:
# 构造next数组,即前缀表(将前缀表直接作为next数组)
def getNext(self, next: List[int], s: str): # s为模式串
# step1:初始化next数组
j = 0 # j为前缀末尾位置
next[0] = 0 # 只有一个字符的字符串相同前后缀的最大长度是0
for i in range(1, len(s)): # i为后缀末尾位置
# step2:若前缀和后缀对应的字符不相同
while s[i] != s[j] and j>0: # 是while而不是if,因为若不相同要连续回退
j = next[j-1] # j要回退到前一位next数组的值的下标位置
# step3:若前缀和后缀对应的字符相同
if s[i] == s[j]:
j += 1 # j还代表着i包括i之前子串的最长相等前后缀长度
next[i] = j
# 在haystack(文本串)里匹配needle(模式串)
def strStr(self, haystack: str, needle: str) -> int:
next = [0]*len(needle)
self.getNext(next, needle)
j = 0 # j为模式串起始位置
for i in range(len(haystack)): # i为文本串起始位置
while haystack[i] != needle[j] and j>0:
j = next[j-1] # j就要从next数组中寻找下一个匹配的位置
if haystack[i] == needle[j]:
j += 1 # 若相同, i和j同时向后移动
if j == len(needle): # 若j指向了模式串的末尾,说明模式串完全匹配文本串的某个子串了
return i-len(needle)+1 # 返回模式串在文本串中匹配时的第一个字符的位置
return -1
459. 重复的子字符串
459. 重复的子字符串
复习KMP:
- 适用场景:给你一个字符串,判断另一个字符串是不是在这个字符串里出现过
- KMP算法在查找过程中遇到不匹配的地方,直接跳到上一次匹配的地方继续匹配(因为有计算好的next数组)
- next数组:以各个字符串为结尾的子串的最长相等前后缀的集合
若一个字符串是由重复子串组成的,那么它的最小重复单位就是它的最长相等前后缀不包含的那个子串。如:字符串 abababab,最长相等前后缀为 ababab,故不包含的就是ab
数组长度 - 最长相等前后缀的长度,相当于第一个重复子串的长度,也就是一个重复周期的长度。如果这个周期可以被整除,说明整个数组就是这个周期的循环
class Solution:
# KMP求next数组(记录的就是最长相等前后缀的长度)
def getNext(self, next: List[int], s: str):
j = 0
next[0] = 0
for i in range(1, len(s)):
while s[i] != s[j] and j>0:
j = next[j-1]
if s[i] == s[j]:
j += 1
next[i] = j
def repeatedSubstringPattern(self, s: str) -> bool:
next = [0]*len(s)
self.getNext(next, s) # "ababab" [0,0,1,2,3,4]
# next[-1] != 0说明字符串有相同的前后缀
# next[-1] 就是最长相等前后缀的长度
# len(s)-next[-1] 就是重复子串的长度
if next[-1] != 0 and len(s) % (len(s)-next[-1]) == 0:
return True
else:
return False
总结:使用KMP可以解决两类经典问题,匹配问题(28题)和重复子串问题(459题)