一段文字如下:
你发现没,杭州亚运会首个比赛日上午,中国体育代表团竟然狂揽11金!这一壮丽景象背后,是中国体育事业的坚实基础和精湛训练的见证。
标点符号都是中文状态下的。现在要替换成英文标点符号。参考了文章:
python基础之将中文标点符号转为英文标点符号_python 中文符号转英文符号_Xahoo!的博客-CSDN博客
全部替换成英文标点符号后,就可以更顺利的将标点符号全部替换成想要的字符,比如回车符。
整个代码如下(运行环境:win10 64位,python3.10.4):
import string
chs_str='你发现没,杭州亚运会首个比赛日上午,中国体育代表团竟然狂揽11金!这一壮丽景象背后,是中国体育事业的坚实基础和精湛训练的见证。'
print(chs_str)
#将中文标点符号转换成英文标点符号
# In Python3, use str.maketrans instead(皆可)
# table里对应写出你需要转换成的转台 比如:()==> ()
table = {ord(f):ord(t) for f,t in zip(
',。!?【】()%#@&1234567890',
',.!?[]()%#@&1234567890')}
eng_str = chs_str.translate(table)
print(eng_str)
#将所有的英文标点符号替换成\n
punctuation = string.punctuation
for char in punctuation:
eng_str = eng_str.replace(char, '\n')
print(eng_str)
运行结果如下图:
如果想换行的每句结束都有一个中文的逗号,可以这样写代码:
punctuation = string.punctuation
for char in punctuation:
eng_str = eng_str.replace(char, ','+'\n')
print(eng_str)
运行结果:
最后一句(结尾)也是中文逗号,有些瑕疵,要改成句号才完美。于是,删除最后的中文逗号(一个中文逗号占两个字符),添加上一个中文句号。
eng_str=eng_str[:-2]+'。'
print(eng_str)