业务中有这样一个场景,国家列表中的数据格式是这样: ' 中国 +86' ,其中的 "中国" 前面有3个空格,需要从中提取出 "中国",有哪些方法呢?
方法 1:使用 strip() 和 split()
strip() 方法可以去掉字符串前后的空白字符(包括空格、换行符等),然后可以使用 split() 来分割字符串。
s = ' 中国 +86'
country = s.strip().split()[0] # 去除前后的空格,再分割并获取第一个部分
print(country)
说明:
strip() 去除字符串前后所有的空白字符(包括空格)。
split() 默认按空格分割字符串,返回一个列表,split()[0] 获取第一个部分,即 "中国"。
方法 2:使用正则表达式
正则表达式可以灵活地匹配字符串中的目标部分,无论前面是否有空格。
import re
s = ' 中国 +86'
match = re.match(r'^\s*([\u4e00-\u9fa5]+)', s) # 匹配字符串开始的空格并提取中文部分
if match:
country = match.group(1)
print(country)
说明:
正则表达式 r'^\s*([\u4e00-\u9fa5]+)' 解释:
^\s* 匹配字符串开始部分的零个或多个空格。
([\u4e00-\u9fa5]+) 匹配连续的中文字符,并将其提取出来。
group(1) 获取第一个括号中匹配的内容,即 "中国"。
【总结】
方法 1:如果你的字符串只是简单的有空格,并且不需要特别复杂的匹配,strip() 和 split() 方法已经足够。
方法 2:如果字符串格式更复杂,或者你希望通过更灵活的方式匹配特定字符,正则表达式是更强大的选择。