目录
一、用法精讲
341、pandas.Series.str.startswith方法
341-1、语法
341-2、参数
341-3、功能
341-4、返回值
341-5、说明
341-6、用法
341-6-1、数据准备
341-6-2、代码示例
341-6-3、结果输出
342、pandas.Series.str.strip方法
342-1、语法
342-2、参数
342-3、功能
342-4、返回值
342-5、说明
342-6、用法
342-6-1、数据准备
342-6-2、代码示例
342-6-3、结果输出
343、pandas.Series.str.swapcase方法
343-1、语法
343-2、参数
343-3、功能
343-4、返回值
343-5、说明
343-6、用法
343-6-1、数据准备
343-6-2、代码示例
343-6-3、结果输出
344、pandas.Series.str.title方法
344-1、语法
344-2、参数
344-3、功能
344-4、返回值
344-5、说明
344-6、用法
344-6-1、数据准备
344-6-2、代码示例
344-6-3、结果输出
345、pandas.Series.str.translate方法
345-1、语法
345-2、参数
345-3、功能
345-4、返回值
345-5、说明
345-6、用法
345-6-1、数据准备
345-6-2、代码示例
345-6-3、结果输出
一、用法精讲
341、pandas.Series.str.startswith方法
341-1、语法
# 341、pandas.Series.str.startswith方法
pandas.Series.str.startswith(pat, na=None)
Test if the start of each string element matches a pattern.
Equivalent to str.startswith().
Parameters:
pat
str or tuple[str, …]
Character sequence or tuple of strings. Regular expressions are not accepted.
na
object, default NaN
Object shown if element tested is not a string. The default depends on dtype of the array. For object-dtype, numpy.nan is used. For StringDtype, pandas.NA is used.
Returns:
Series or Index of bool
A Series of booleans indicating whether the given pattern matches the start of each string element.
341-2、参数
341-2-1、pat(必须):字符串或元组,指定用于匹配字符串开头的模式,如果传入的是字符串,则检查每个字符串是否以该字符串开头;如果传入的是元组,则检查每个字符串是否以元组中的任意一个字符串开头。
341-2-2、na(可选,默认值为None):布尔值或None,处理缺失值(NaN)的策略。如果为True,则将缺失值视为匹配成功;如果为False,则视为匹配失败;如果为None(默认值),缺失值会保留为NaN。
341-3、功能
用于检查Series中每个字符串是否以给定的模式开头,该方法常用于文本数据的筛选或条件判断。
341-4、返回值
返回一个pandas.Series对象,包含布尔值(True或False),表示每个字符串是否匹配指定模式,如果na参数设置为None,则Series中的缺失值会保留为NaN。
341-5、说明
无
341-6、用法
341-6-1、数据准备
无
341-6-2、代码示例
# 341、pandas.Series.str.startswith方法
import pandas as pd
# 示例数据
data = pd.Series(['apple', 'banana', 'cherry', None, 'apricot'])
# 检查是否以 "ap" 开头
result1 = data.str.startswith("ap")
# 检查是否以 "ba" 开头,并将 NaN 视为 False
result2 = data.str.startswith("ba", na=False)
# 检查是否以 "ap" 或 "ch" 开头
result3 = data.str.startswith(("ap", "ch"))
print("Result1 (startswith 'ap'):")
print(result1)
print("\nResult2 (startswith 'ba', na=False):")
print(result2)
print("\nResult3 (startswith 'ap' or 'ch'):")
print(result3)
341-6-3、结果输出
# 341、pandas.Series.str.startswith方法
# Result1 (startswith 'ap'):
# 0 True
# 1 False
# 2 False
# 3 None
# 4 True
# dtype: object
#
# Result2 (startswith 'ba', na=False):
# 0 False
# 1 True
# 2 False
# 3 False
# 4 False
# dtype: bool
#
# Result3 (startswith 'ap' or 'ch'):
# 0 True
# 1 False
# 2 True
# 3 None
# 4 True
# dtype: object
342、pandas.Series.str.strip方法
342-1、语法
# 342、pandas.Series.str.strip方法
pandas.Series.str.strip(to_strip=None)
Remove leading and trailing characters.
Strip whitespaces (including newlines) or a set of specified characters from each string in the Series/Index from left and right sides. Replaces any non-strings in Series with NaNs. Equivalent to str.strip().
Parameters:
to_strip
str or None, default None
Specifying the set of characters to be removed. All combinations of this set of characters will be stripped. If None then whitespaces are removed.
Returns:
Series or Index of object.
342-2、参数
342-2-1、to_strip(可选,默认值为None):字符串或None,指定需要移除的字符,如果没有指定(即为None),则默认移除空白字符(包括空格、换行符\n和制表符\t),如果传入一个字符串,那么该字符串中所有的字符都会被移除。
342-3、功能
用于删除Series中每个字符串开头和结尾的指定字符,默认情况下,它会删除空白字符。
342-4、返回值
返回一个pandas.Series对象,其中包含已移除指定字符的字符串。
342-5、说明
无
342-6、用法
342-6-1、数据准备
无
342-6-2、代码示例
# 342、pandas.Series.str.strip方法
import pandas as pd
# 示例数据
data = pd.Series([' apple ', 'banana\n', '\tcherry\t', ' apricot ', 'mango'])
# 默认移除空白字符
result1 = data.str.strip()
# 移除指定字符'a', 'b'
result2 = data.str.strip("ab")
# 移除换行符'\n'和制表符'\t'
result3 = data.str.strip("\n\t")
print("Result1 (default strip):")
print(result1)
print("\nResult2 (strip 'a' and 'b'):")
print(result2)
print("\nResult3 (strip '\\n' and '\\t'):")
print(result3)
342-6-3、结果输出
# 342、pandas.Series.str.strip方法
# Result1 (default strip):
# 0 apple
# 1 banana
# 2 cherry
# 3 apricot
# 4 mango
# dtype: object
#
# Result2 (strip 'a' and 'b'):
# 0 apple
# 1 nana\n
# 2 \tcherry\t
# 3 apricot
# 4 mango
# dtype: object
#
# Result3 (strip '\n' and '\t'):
# 0 apple
# 1 banana
# 2 cherry
# 3 apricot
# 4 mango
# dtype: object
343、pandas.Series.str.swapcase方法
343-1、语法
# 343、pandas.Series.str.swapcase方法
pandas.Series.str.swapcase()
Convert strings in the Series/Index to be swapcased.
Equivalent to str.swapcase().
Returns:
Series or Index of object.
343-2、参数
无
343-3、功能
将Series中每个字符串的大小写互换,也就是说,大写字母变成小写,小写字母变成大写。
343-4、返回值
返回一个pandas.Series对象,其中包含已进行大小写互换的字符串。
343-5、说明
无
343-6、用法
343-6-1、数据准备
无
343-6-2、代码示例
# 343、pandas.Series.str.swapcase方法
import pandas as pd
# 示例数据
data = pd.Series(['Apple', 'bAnAnA', 'ChErry', 'apricot', 'MANGO'])
# 大小写互换
result = data.str.swapcase()
print("Result (swapcase):")
print(result)
343-6-3、结果输出
# 343、pandas.Series.str.swapcase方法
# Result (swapcase):
# 0 aPPLE
# 1 BaNaNa
# 2 cHeRRY
# 3 APRICOT
# 4 mango
# dtype: object
344、pandas.Series.str.title方法
344-1、语法
# 344、pandas.Series.str.title方法
pandas.Series.str.title()
Convert strings in the Series/Index to titlecase.
Equivalent to str.title().
Returns:
Series or Index of object.
344-2、参数
无
344-3、功能
将Series中每个字符串中的每个单词的首字母转换为大写,而其他字母则转换为小写。
344-4、返回值
返回一个pandas.Series对象,其中包含已转换为标题格式的字符串。
344-5、说明
无
344-6、用法
344-6-1、数据准备
无
344-6-2、代码示例
# 344、pandas.Series.str.title方法
import pandas as pd
# 示例数据
data = pd.Series(['apple pie', 'BaNana Split', 'cherry tart', 'apricot jam', 'MANGO salad'])
# 转换为标题格式
result = data.str.title()
print("Result (title):")
print(result)
344-6-3、结果输出
# 344、pandas.Series.str.title方法
# Result (title):
# 0 Apple Pie
# 1 Banana Split
# 2 Cherry Tart
# 3 Apricot Jam
# 4 Mango Salad
# dtype: object
345、pandas.Series.str.translate方法
345-1、语法
# 345、pandas.Series.str.translate方法
pandas.Series.str.translate(table)
Map all characters in the string through the given mapping table.
Equivalent to standard str.translate().
Parameters:
table
dict
Table is a mapping of Unicode ordinals to Unicode ordinals, strings, or None. Unmapped characters are left untouched. Characters mapped to None are deleted. str.maketrans() is a helper function for making translation tables.
Returns:
Series or Index.
345-2、参数
345-2-1、table(必须):一个翻译表,用于定义字符的替换规则,可以使用该方法创建一个翻译表。
345-3、功能
根据给定的转换表,将Series中的每个字符串的字符按照表中的映射进行替换,如果转换表将某些字符映射为None,那么这些字符会在结果字符串中被删除。
345-4、返回值
返回一个pandas.Series对象,其中包含了根据翻译表进行字符替换后的字符串。
345-5、说明
无
345-6、用法
345-6-1、数据准备
无
345-6-2、代码示例
# 345、pandas.Series.str.translate方法
import pandas as pd
# 示例数据
data = pd.Series(['hello world', 'goodbye moon', '123456'])
# 创建翻译表:将 'h' 替换为 'H',将 'o' 替换为 '0',删除 'e'
translation_table = str.maketrans({'h': 'H', 'o': '0', 'e': None})
# 使用translate进行字符替换
result = data.str.translate(translation_table)
print("Result (translate):")
print(result)
345-6-3、结果输出
# 345、pandas.Series.str.translate方法
# Result (translate):
# 0 Hll0 w0rld
# 1 g00dby m00n
# 2 123456
# dtype: object