Python 标准库中的
textwrap
模块可以把长文本按照指定的宽度进行换行。这个模块提供了一些高级的文本处理功能,例如按照指定的宽度进行自动换行,保留段首缩进等。
python textwrap 模块
- python textwrap 模块主要函数
- textwrap.wrap(text, width=70, \*\*kwargs)
- textwrap 模块高级的文本处理功能
python textwrap 模块主要函数
textwrap.wrap(text, width=70, **kwargs)
: 返回一个列表,该列表包含了将文本按照指定宽度进行换行之后的各行文本;textwrap.fill(text, width=70, **kwargs)
:返回一个字符串,该字符串包含了将文本按照指定宽度进行换行之后的所有文本;textwrap.dedent(text)
: 去除文本中的缩进;textwrap.indent(text, prefix, predicate=None)
: 在文本中每一行前面加上前缀。
其中 width
参数默认值是 70。
接下来我们通过一段话进行函数演示。
import textwrap
text = "她长发飘飘,眼如秋水,面容娇嫩,身段优雅,如一朵含苞待放的花儿,让人爱不释手。"
wrapped_text = textwrap.wrap(text, width=20)
print(wrapped_text)
# 输出 ['她长发飘飘,眼如秋水,面容娇嫩,身段优雅', ',如一朵含苞待放的花儿,让人爱不释手。']
filled_text = textwrap.fill(text, width=20)
print(filled_text)
# 输出
# 她长发飘飘,眼如秋水,面容娇嫩,身段优雅
# ,如一朵含苞待放的花儿,让人爱不释手。
可以测试一下代码效果,这里的 width 每一个都等于一个汉字。
textwrap.wrap(text, width=70, **kwargs)
除了必选参数外,还有很多其他参数可以选择,详单如下:
expand_tabs
:将制表符转换为空格,默认为 False;replace_whitespace
: 将文本中的连续空格转换为单个空格,默认为 True;fix_sentence_endings
:保留句末标点符号,默认为 False;break_long_words
: 是否允许超过宽度限制的单词被断开,默认为 True;initial_indent
:段首缩进,默认为空字符串;subsequent_indent
: 段首之后的缩进,默认为空字符串。
import textwrap
text = "她长发飘飘,眼如秋水,面容娇嫩,身段优雅,如一朵含苞待放的花儿,让人爱不释手。"
wrapped_text = textwrap.fill(text, width=20, initial_indent=' ')
print(wrapped_text)
输出结果会出现首行缩进效果。
textwrap 模块高级的文本处理功能
textwrap.shorten(text, width, **kwargs)
返回一个字符串,该字符串包含了将文本按照指定宽度进行换行之后的部分文本。
由于上述两个函数都会按照单词进行文本截取,所以对中文适配效果不好,如果希望处理中文,建议使用 jieba
、thulac
等分词工具对中文文本进行分词。
示例代码如下所示:
import textwrap
text = "Her long hair is fluttering, her eyes are like autumn water, her face is delicate, and her figure is elegant, like a flower in bud, which makes people love her."
shortened_text = textwrap.shorten(text, width=50, placeholder='...')
print(shortened_text)
📢📢📢📢📢📢
💗 你正在阅读 【梦想橡皮擦】 的博客
👍 阅读完毕,可以点点小手赞一下
🌻 发现错误,直接评论区中指正吧
📆 橡皮擦的第 836 篇原创博客
从订购之日起,案例 5 年内保证更新
- ⭐️ Python 爬虫 120,点击订购 ⭐️
- ⭐️ 爬虫 100 例教程,点击订购 ⭐️