关于我用python下载两千四百四十四章保存txt这件事。。。

news2024/11/24 1:04:51

前言

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章

女同事最近迷上了一本书

但她又不想下载软件,就想要我给你下载成txt慢慢看

一看章节,两千四百四十四章,这我能答应嘛?

、

面对美女小姐姐的请求,我当场表示:锻炼技术嘛~这事我熟,马上就给你下载下来

开发环境:

  • python 3.8 运行代码

  • pycharm 2022.3 辅助敲代码

  • requests 发送请求模块

代码实现:

  1. 发送请求

  2. 获取数据

  3. 解析数据

  4. 保存数据

代码展示

import requests     # 发送请求的模块 第三方的模块 需要额外安装
import re

url = 'https://****/book_2700/1556861.html'
# 1. 发送请求
response = requests.get(url)
# 2. 获取数据
html_data = response.text
# 3. 解析数据 提取数据内容
#   结构化数据   json数据
#   非结构化数据 网页源代码
#       css/xpath/re
# https://.*html
# <br><br>.*?</div>
text = re.findall('<br><br>(.*?)</div>', html_data)[0]
text = text.replace('<br />', '\n')
text = text.replace('&nbsp;', ' ')
# 4. 保存数据
open("第二章.txt", mode='w', encoding='utf-8').write(text)

更多精彩请点击文末名片解锁噢~

括展小知识

什么是re(正则表达式).*?

搜索功能的 更高级的一个用法

在正则里面 . 可以去代表一个字符

*: 匹配前面表达式 0次或者多次

.*: 需要匹配 一个字符 n次 贪婪匹配

?: 非贪婪匹配符

尾语 💝

好了,今天的分享就差不多到这里了!

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

对下一篇大家想看什么,可在评论区留言哦!看到我会更新哒(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

最后,宣传一下呀~👇👇👇更多源码、资料、素材、解答、交流皆点击下方名片获取呀👇👇👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/559132.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

看ChatGPT是如何教我爬取上千家上市公司的股票代码

现在有一个这样的需求&#xff0c;要爬取雪球网上A股的股票名称、代码和总市值这些信息并把它保存到execl表格中。对于一个新手想学习爬虫&#xff0c;如何通过chatGPT来完成这个任务呢&#xff1f; 首先&#xff0c;我们把自己的需求详细的描述向ChatGPT提问&#xff0c;问题…

数据库可视化神器,你在用哪一款呢

唠嗑部分 在我们日常开发中&#xff0c;作为开发者&#xff0c;与数据库是肯定要打交道的&#xff0c;比如MySQL&#xff0c;Oracle、sqlserver… 那么数据库可视化工具&#xff0c;你用什么呢&#xff1f;小白今天将常用地几款工具列一下&#xff0c;各位小伙伴如有喜欢的自…

亚马逊开放个人卖家验证入口?亚马逊卖家验证到底怎么搞?

亚马逊卖家账户的安全对于所有卖家来说都非常重要。如果卖家想要在亚马逊上长期稳定地发展&#xff0c;赚取更多的钱并推出更多热卖产品&#xff0c;就必须确保他们的亚马逊卖家账户安全&#xff0c;特别是一直存在的亚马逊账户验证问题。 近期&#xff0c;根据亚马逊官方披露的…

【VPX302】基于3U VPX总线架构的高性能数据预处理平台/XCKU115

板卡概述 VPX302是一款基于3U VPX总线架构的高性能数据预处理FMC载板&#xff0c;板卡具有1个FMC&#xff08;HPC&#xff09;接口&#xff0c;1个X8 GTH背板互联接口&#xff0c;可以实现1路PCIe x8&#xff1b;具有4路SRIO X4。板卡采用Xilinx的高性能Kintex UltraScale系列F…

简单实现远程访问Linux SVN服务

文章目录 前言1. Ubuntu安装SVN服务2. 修改配置文件2.1 修改svnserve.conf文件2.2 修改passwd文件2.3 修改authz文件 3. 启动svn服务4. 内网穿透4.1 安装cpolar内网穿透4.2 创建隧道映射本地端口 5. 测试公网访问6. 配置固定公网TCP端口地址6.1 保留一个固定的公网TCP端口地址6…

以太网、工业以太网和Profinet之间的区别

总的来说&#xff0c;以太网是一种局域网规范&#xff0c;工业以太网是应用于工业控制领域的以太网技术&#xff0c;Profinet是一种在工业以太网上运行的实时技术规范。 下面&#xff0c;我们来详细说说这三者的区别。 1.以太网 以太网是当今现有局域网采用的最通用的通信协议…

数据可视化-CSS3

CSS3 数据可视化 数据可视化是将数据转换为图形或图表的过程&#xff0c;以便更好地理解和分析数据。它是数据分析和数据科学中的重要组成部分&#xff0c;可以帮助人们更好地理解数据中的模式和趋势。 更好地理解数据&#xff1a;通过可视化数据&#xff0c;人们可以更好地…

告别腾讯企业邮箱:探寻多种可替代方案

腾讯企业邮箱凭借其直观的界面、qq和微信带来的大量基础用户以及作为常规腾讯企业邮箱帐户附加的各种免费生产力工具&#xff0c;在企业邮箱市场占据主导地位。但是&#xff0c;人们对腾讯如何使用您的电子邮件存在严重担忧&#xff0c;而且并不是每个人都喜欢腾讯企业邮箱界面…

ngrok实现内网穿透,vue项目invalid host header报错

目的&#xff1a;使自己的本地的vue项目可以在外网上访问。 本地访问&#xff1a;http://localhost:8080/ 外网访问&#xff1a;通过ngrok生成一个链接&#xff0c;这个链接在其他网络环境下都可以访问。 windows下安装 1.注册并下载ngrok&#xff0c;注册的时候需要验证码&am…

动手学习卷积神经网络(CNN)(一)---卷积运算

卷积神经网络可以直接从原始数据中学习其特征表示并完成最终任务&#xff0c;可以说卷积网络是“端”到“端”的思想&#xff0c;在整个学习流程中并进行认为的子问题划分&#xff0c;而是交给深度学习模型直接学得从原始输入到期望输出得映射。 卷积神经网络是包含卷积层&…

一个BLIP2加两个ChatGPT就能造一个机器人?KAUST提出具身智能框架LLM-Brain

最近&#xff0c;来自阿卜杜拉国王科技大学&#xff08;KAUST&#xff09;的研究团队开发了一种基于现有LLMs的机器人交互框架LLM-Brain&#xff0c;LLM-Brain可以直接将LLM作为机器人的大脑&#xff0c;并以此来构建一个以自我为中心的记忆和控制框架。 论文链接&#xff1a; …

【笔试强训选择题】Day18.习题(错题)解析

作者简介&#xff1a;大家好&#xff0c;我是未央&#xff1b; 博客首页&#xff1a;未央.303 系列专栏&#xff1a;笔试强训选择题 每日一句&#xff1a;人的一生&#xff0c;可以有所作为的时机只有一次&#xff0c;那就是现在&#xff01;&#xff01;&#xff01; 文章目录…

红队工具合集

一个 Red Team 攻击的生命周期&#xff0c;整个生命周期包括&#xff1a; 信息收集、攻击尝试获得权限、持久性控制、权限提升、网络信息收集、横向移动、数据分析&#xff08;在这个基础上再做持久化控制&#xff09;、在所有攻击结束之后清理并退出战场。 相资 信息搜集 http…

自信裸辞:一晃 ,失业都3个月了.....

最近&#xff0c;找了很多软测行业的朋友聊天、吃饭 &#xff0c;了解了一些很意外的现状 。 我一直觉得他们技术非常不错&#xff0c;也走的测开/管理的路径&#xff1b;二三月份裸辞的&#xff0c;然后一直在找工作&#xff0c;现在还没找到工作 。 经过我的分析&#xff0…

OpenVINO 2022.3实战三:POT API实现图像分类模型 INT8 量化

OpenVINO 2022.3实战三&#xff1a;POT API实现图像分类模型 INT8 量化 1 准备需要量化的模型 这里使用我其他项目里面&#xff0c;使用 hymenoptera 数据集训练好的 MobileNetV2 模型&#xff0c;加载pytorch模型&#xff0c;并转换为onnx。 import os from pathlib import…

鸿蒙Hi3861学习十八-DevEco Device Tool环境搭建

一、简介 在之前的文章中&#xff0c;我们是通过在windows下烧录&#xff0c;在ubuntu下编译的方式进行开发。今天我们同样是采用windowsubuntu混合环境进行开发。为什么要采用这种方式呢&#xff1f;因为就目前而言&#xff0c;大部分的开发板还不支持在Windows环境下进行编译…

典型的高可用设计(二):MySQL

一、高可用模式 MySQL数据库提供了数据库建的复制能力&#xff0c;做到了多个数据库同时拥有同一个数据副本&#xff0c;保证了数据的安全性&#xff0c;一台数据库服务器出现问题&#xff0c;其他数据库可以做到数据不丢失。MySQL的服务高可用设计也是以数据库复制能力为基础&…

云计算专业怎么样,大学应届生学的话难不难?

云计算专业学起来挺难的&#xff0c;一般人建议不要轻易尝试&#xff01;&#xff01;&#xff01; 虽然IT行业一直以来发展前景、技术更新、新领域的开发或者新概念的提出等各方面都还不错&#xff0c;云计算也是当下非常火的一个就业方向&#xff0c;很多人也非常想进入云计…

IT系统方案大纲模版,以智慧工地系统为例

# 咖米智慧工地解决方案 ## 第1章 智慧工地系统概述 ### 1.1应用背景 ### 1.2需求分析 ### 1.3总体目标 ## 第2章 系统总体设计 ### 2.1设计理念 ### 2.2设计依据 ### 2.3设计架构 ### 2.4系统描述 ### 2.5系统特点 ## 第3章 详细设计 ### 3.1工地远程监控子系统 #### 3.1.1需求…

一分钟了解乐观锁、悲观锁、共享锁、排它锁、行锁、表锁以及使用场景

大家好&#xff0c;我是冰点&#xff0c;今天给大家带来&#xff0c;关于MySQL中的锁的使用。 我首先提个问题&#xff0c;大家知道什么是 乐观锁、悲观锁、共享锁&#xff0c;、排它锁、行锁、表锁&#xff0c;以及每种锁的使用场景吗&#xff1f; !! 背景&#xff1a;最近在各…