Python进阶语法之字符串
当我们处理文本数据时,字符串是不可避免的数据类型。Python 提供了很多字符串方法,它们可以帮助我们更方便地操作和处理字符串。在本篇博客中,我们将深入探讨 Python 字符串。
字符串的基本操作
在深入了解字符串方法之前,我们首先要了解一些基本的字符串操作,例如索引、切片和拼接。
- 索引:我们可以通过索引来访问字符串中的单个字符。
s = 'hello'
print(s[1]) # 输出: 'e'
- 切片:我们可以使用切片来获取字符串的子串。
s = 'hello'
print(s[1:3]) # 输出: 'el'
- 拼接:我们可以使用
+
操作符来拼接两个字符串。
s1 = 'hello'
s2 = 'world'
print(s1 + s2) # 输出: 'helloworld'
字符串的方法
在 Python 中,字符串是一个不可变对象。这意味着一旦我们定义了一个字符串,就不能直接修改它的值。但是,我们可以使用字符串方法来对字符串进行各种操作,例如查找子字符串、替换子字符串、拼接字符串等等。下面是一些常用的字符串方法:
-
str.capitalize()
:把字符串的第一个字符转换为大写字母。 -
str.casefold()
:把字符串中所有字符转换为小写字母,并返回转换后的字符串。该方法比str.lower()
更强大,因为它可以正确处理某些特殊字符(例如德语中的 eszett)。 -
str.center(width[, fillchar])
:返回一个指定宽度的居中对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。 -
str.count(sub[, start[, end]])
:返回字符串中子字符串 sub 出现的次数,可选参数 start 和 end 指定查找范围。 -
str.encode([encoding[, errors]])
:返回字符串的字节串表示。如果指定了编码方式(例如 ‘utf-8’),则按照该编码方式进行编码。可选参数 errors 指定编码错误处理方式。 -
str.endswith(suffix[, start[, end]])
:检查字符串是否以指定的后缀 suffix 结束。可选参数 start 和 end 指定查找范围。 -
str.expandtabs([tabsize])
:把字符串中的制表符(‘\t’)替换为指定数量的空格,默认为 8。 -
str.find(sub[, start[, end]])
:在字符串中查找子字符串 sub,返回它在字符串中第一次出现的位置。如果未找到,则返回 -1。可选参数 start 和 end 指定查找范围。 -
str.format(*args, **kwargs)
:使用传递给它的参数格式化字符串(类似于 printf() 函数)。 -
str.index(sub[, start[, end]])
:在字符串中查找子字符串 sub,返回它在字符串中第一次出现的位置。如果未找到,则引发 ValueError 异常。可选参数 start 和 end 指定查找范围。 -
str.isalnum()
:检查字符串是否只包含字母和数字。 -
str.isalpha()
:检查字符串是否只包含字母。 -
str.isdecimal()
:检查字符串是否只包含十进制数字。 -
str.isdigit()
:检查字符串是否只包含数字字符。 -
str.isidentifier()
:检查字符串是否是一个有效的 Python 标识符。 -
str.islower()
:检查字符串中所有字母是否都是小写字母。 -
str.isnumeric()
:检查字符串是否只包含数字字符。 -
str.isprintable()
:检查字符串中的所有字符是否都是可打印字符,例如空格、标点符号、字母和数字等。 -
str.isspace()
:检查字符串是否只包含空格字符。 -
str.istitle()
:检查字符串中所有单词的首字母是否都是大写字母。 -
str.isupper()
:检查字符串中所有字母是否都是大写字母。 -
str.join(iterable)
:把可迭代对象 iterable 中的元素连接成一个字符串,并返回结果。例如,','.join(['a','b','c'])
返回 ‘a,b,c’。 -
str.ljust(width[, fillchar])
:返回一个指定宽度的左对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。 -
str.lower()
:返回字符串中所有字母的小写形式。str.lstrip([chars])
:返回一个去掉字符串开头指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。 -
str.partition(sep)
:在字符串中查找分隔符 sep,返回一个以分隔符为界的左侧子字符串、分隔符本身和右侧子字符串的元组。如果未找到分隔符,则返回包含原始字符串和两个空字符串的元组。 -
str.replace(old, new[, count])
:返回一个把字符串中所有旧子字符串 old 替换为新子字符串 new 的字符串。可选参数 count 指定替换次数。 -
str.rfind(sub[, start[, end]])
:与str.find()
方法类似,但是从字符串末尾开始查找。 -
str.rindex(sub[, start[, end]])
:与str.index()
方法类似,但是从字符串末尾开始查找。 -
str.rjust(width[, fillchar])
:返回一个指定宽度的右对齐的字符串,如果指定的宽度小于字符串长度,则返回原字符串。 -
str.rpartition(sep)
:与str.partition()
方法类似,但是从右侧开始查找分隔符。 -
str.rsplit([sep[, maxsplit]])
:返回一个把字符串按照指定分隔符(sep)进行分割的列表。如果未指定分隔符,则默认使用空白字符作为分隔符。可选参数 maxsplit 指定最大分割次数。 -
str.rstrip([chars])
:返回一个去掉字符串末尾指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。 -
str.split([sep[, maxsplit]])
:返回一个把字符串按照指定分隔符(sep)进行分割的列表。如果未指定分隔符,则默认使用空白字符作为分隔符。可选参数 maxsplit 指定最大分割次数。 -
str.splitlines([keepends])
:返回一个把字符串按照行分隔符(‘\n’)进行分割的列表。如果 keepends 参数为 True,则保留行分隔符。 -
str.startswith(prefix[, start[, end]])
:检查字符串是否以指定的前缀 prefix 开头。可选参数 start 和 end 指定查找范围。 -
str.strip([chars])
:返回一个去掉字符串开头和末尾指定字符(chars)的字符串。如果未指定字符,则默认去掉空格字符。 -
str.swapcase()
:返回一个将字符串中所有小写字母转换为大写字母,所有大写字母转换为小写字母的字符串。 -
str.title()
:返回一个把字符串中每个单词的首字母转换为大写字母的字符串。 -
str.translate(table)
:返回一个根据给定转换表(table)进行转换后的字符串。转换表可以通过str.maketrans()
方法创建。 -
str.upper()
:返回字符串中所有字母的大写形式。 -
str.zfill(width)
:返回一个指定宽度的右对齐的字符串,左侧用 ‘0’ 填充。如果指定的宽度小于字符串长度,则返回原字符串。字符串方法的举例说明
capitalize()
:把字符串第一个字符大写。
str = "hello world" print(str.capitalize()) # 输出:Hello world
lower()
:把字符串所有字符转换为小写。
str = "Hello World" print(str.lower()) # 输出:hello world
upper()
:把字符串所有字符转换为大写。
str = "hello world" print(str.upper()) # 输出:HELLO WORLD
title()
:把字符串每个单词首字母都变成大写。
str = "this is an example" print(str.title()) # 输出:This Is An Example
strip()
:去除字符串前后的空格。
str = " hello world " print(str.strip()) # 输出:hello world
replace()
:替换字符串中指定的子串。
str = "hello world" print(str.replace("world", "Python")) # 输出:hello Python
split()
:把字符串按照指定分隔符分割成列表。
str = "apple,banana,orange,grape" print(str.split(",")) # 输出:['apple', 'banana', 'orange', 'grape']
join()
:把列表中的字符串使用指定分隔符连接起来。
lst = ['apple', 'banana', 'orange', 'grape'] sep = "," print(sep.join(lst)) # 输出:apple,banana,orange,grape
startswith()
:判断字符串是否以指定子串开头。
str = "hello world" print(str.startswith("hello")) # 输出:True
endswith()
:判断字符串是否以指定子串结尾。
str = "hello world" print(str.endswith("world")) # 输出:True
find()
:查找指定子串在字符串中第一次出现的位置。
str = "hello world" print(str.find("world")) # 输出:6
count()
:统计指定子串在字符串中出现的次数。
str = "hello world" print(str.count("l")) # 输出:3
isdigit()
:判断字符串是否只包含数字字符。
str = "12345" print(str.isdigit()) # 输出:True
isalpha()
:判断字符串是否只包含字母字符。
str = "hello" print(str.isalpha()) # 输出:True
isalnum()
:判断字符串是否只包含字母和数字字符。
str = "hello123" print(str.isalnum()) # 输出:True
islower()
:判断字符串是否只包含小写字母。
str = "hello" print(str.islower()) # 输出:True
isupper()
:判断字符串是否只包含大写字母。
str = "HELLO" print(str.isupper()) # 输出:True
isspace()
:判断字符串是否只包含空格字符。
str = " " print(str.isspace()) # 输出:True
startswith()
:判断字符串是否以指定子串开头。
str = "hello world" print(str.startswith("hello")) # 输出:True
endswith()
:判断字符串是否以指定子串结尾。
str = "hello world" print(str.endswith("world")) # 输出:True
encode()
:将字符串编码为指定格式的字节序列。
str = "你好世界" print(str.encode("utf-8")) # 输出:b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c'
decode()
:将指定格式的字节序列解码为字符串。
bytes = b'\xe4\xbd\xa0\xe5\xa5\xbd\xe4\xb8\x96\xe7\x95\x8c' print(bytes.decode("utf-8")) # 输出:你好世界
format()
:根据指定格式输出字符串。
name = "Tom" age = 18 print("My name is {0} and I'm {1} years old".format(name, age)) # 输出:My name is Tom and I'm 18 years old
isnumeric()
:判断字符串是否只包含数字字符。
str = "12345" print(str.isnumeric()) # 输出:True
isdecimal()
:判断字符串是否只包含十进制数字字符。
str = "12345" print(str.isdecimal()) # 输出:True
总结
- 字符串的定义:使用单引号、双引号或三重引号来定义一个字符串,例如:‘hello’、“world”、‘’‘This is a multiline string.’‘’
- 字符串的连接(拼接):使用加号(+)或逗号(,)将两个字符串连接在一起。
- 字符串的重复:使用乘号(*)将一个字符串重复多次。
- 获取字符串长度:使用len()函数获取一个字符串的长度。
- 获取字符串中的字符:使用索引可以获取字符串中某个位置上的字符,注意字符串是从0开始索引的。例如:s = “hello”,s[0]为’h’。
- 字符串切片:使用[start🔚step]语法可以获取字符串的一个子串。start表示子串的起始位置,end表示子串的结束位置(不包含该位置处的字符),step表示步长,默认为1。例如:s = “hello”,s[1:4]为"ell"。
- 字符串的分割:使用split()方法可以将一个字符串按照指定的分隔符进行分割成多个子串,并返回一个列表。例如:s = “hello world”,s.split(’ ')将返回[‘hello’, ‘world’]。
- 字符串的替换:使用replace()方法可以将一个字符串中的某个子串替换成另一个字符串。例如:s = “hello world”,s.replace(‘world’, ‘python’)将返回"hello python"。
- 字符串的查找:使用find()或index()方法可以查找一个字符串中某个子串的位置。find()方法返回子串第一次出现的位置,如果未找到则返回-1;index()方法也返回子串第一次出现的位置,但如果未找到会抛出异常。
- 字符串的大小写转换:使用lower()、upper()、capitalize()等方法可以将一个字符串全部转换成小写、大写、首字母大写等形式。
- 去除字符串两端的空格:使用strip()方法可以去除一个字符串两端的空格,lstrip()和rstrip()方法分别去除左侧和右侧的空格。
- 字符串的格式化:使用format()方法可以将一些变量的值插入到一个格式化的字符串中。例如:“My name is {0}, I am {1} years old.”.format(“Tom”, 18)。
- 判断字符串是否以指定的前缀或后缀开始/结束:使用startswith()和endswith()方法可以判断一个字符串是否以指定的前缀或后缀开始/结束。
- 判断字符串是否由数字或字母构成:使用isdigit()和isalpha()方法可以判断一个字符串是否只由数字或字母构成。
在本篇博客中,我们深入探讨了 Python 字符串方法,并提供了丰富的示例。掌握这些字符串方法可以使我们更方便地操作和处理字符串。