缘由:
在线阅读小说有时候因为网络等因素,造成章节不能及时刷新出来,因此经过一番百度,把小说章节下载了下来,但是 章节是错乱的,且参杂很多网站水印,阅读起来挺难受的,因此 优化一下吧。
首先放图:
调整前:
调整后:
嗯~ 看起来顺眼多了
首先打开原始小说,查找要调整的地方,依据小说文本的规则进行调整 即可
首先看原始txt
1. 每个章节 都是阿拉伯数字 + 顿号 + 章节标题 组成
2. 每个章节 结尾都包含两行网站水印
3. 经过全局搜索 部分内容 参杂 xxx.com 内容
经过判断解决以上问题 即可
操作步骤:
1. 读取 按行读取原始内容
2. 替换
2.1 替换章节
2.1.1 判断以阿拉伯数字开头 且 包含 顿号 且 包含 (xxx.com) 的行内容
2.1.2 替换 (xxx.com) 为空
2.1.3 写一个阿拉伯数字 转 一二三的函数
2.1.4 组合 第 + 一二三 + 章 + 章节标题 + 换行符
2.2 替换章节结尾水印
2.2.1 判断行内容 大致包含结尾水印内容 替换为空
2.3 替换部分html 内容
2.3.1 判断行内容 大致包含xxx.html 替换为空
3. 写入
3.1 创建新的txt, 按行写入即可,数据量大的可以使用 缓存或者分批操作