走心Python实战应用:【requests+re 模块】快速下载原shen图片

news2025/1/16 17:45:21

人生苦短,我用python

这次给大家带来的是模块+实战

以便大家理解学习

觉得写的好的话,可以给我多多点赞鸭~

走心Python实战应用:【requests+re 模块】快速下载原shen图片

    • 一、理解Python requests 模块
    • 二、requests 方法
    • 三、ruqusets 模块实战案例
      • ❤部分代码展示
        • 导入模块
        • 发送请求
        • 获取数据
        • 获取章节ID
        • 保存数据
      • ❤效果展示
        • 💢碎碎念预警:

在这里插入图片描述


一、理解Python requests 模块

Python 内置了 requests 模块,
该模块主要用来发 送 HTTP 请求,
requests 模块比 urllib 模块更简洁。

实例

# 导入 requests 包
import requests

# 发送请求
x = requests.get('这里放网址')

# 返回网页内容
print(x.text)

每次调用 requests 请求之后,
会返回一个 response 对象,
该对象包含了具体的响应信息。

实例

import requests
print(x.status_code)
print(x.reason)
print(x.apparent_encoding)

输出结果如下:

200
OK
utf-8

请求 json 数据文件,
返回 json 内容:

实例

import requests
x = requests.get('https://网站网址/try/ajax/json_demo.json')
print(x.json())

二、requests 方法

requests 方法如下表:

在这里插入图片描述

使用 requests.request() 发送 get 请求:

实例

import requests
x = requests.request('get', 'https://网址/')
print(x.status_code)

输出结果如下:

200

设置请求头:

实例

import requests

 
kw = {'s':'python 教程'}

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
 
response = requests.get("这里放网址", params = kw, headers = headers)

print (response.status_code)
print (response.encoding)
print (response.url)
print(response.text)

输出结果如下:

200
UTF-8
这里是网址?s=python+%E6%95%99%E7%A8%8B

... 其他内容...

三、ruqusets 模块实战案例

纸上得来终觉浅,绝知此事要躬行

接下来就来案例实战吧

这次的网站如下图:

在这里插入图片描述

本次采集的目标是:

将这个网站的官方漫画采集下来

在这里插入图片描述

为什么要打码呢?

因为不打码就过不辽审核…

❤部分代码展示

导入模块

import requests
import re

发送请求

def get_response(html_url):
    headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari'
    }
    response = requests.get(url=html_url, headers=headers)
    return response

获取数据

def get_chapter(html_url):
    html_data = get_response(html_url).text
    chapter_list = re.findall('"(\d+)","第.*?话', html_data)
    return chapter_list

获取章节ID

def get_img_info(chapter_id):
    link = f'F12开发者工具获取'
    chapter_text = get_response(html_url=link).text
    img_list = re.findall('<img .*?src="(.*?)"', chapter_text)
    title = re.findall('false,"(.*?)"', chapter_text)[0]
    return img_list, title

保存数据

def save(img, file):
    img_content = get_response(img).content
    with open(file, mode='wb') as f:
        f.write(img_content)
    print(img)

❤效果展示

夹带私货,截取一下海哥全脸哈哈哈

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

💢碎碎念预警:

可能会有人问我为什么不直接去官网上一章章看…

首先,这是一个锻炼项目,

目的是自己对requests模块的熟练程度进行加深;

其次,我真的很懒,

一次性全下载下来就很方便

万一想用手机看,

想看就马上看了鸭,

就没那么麻烦了(懒)

最后,是自己看,自己用,公开数据

总有那么些人总要杠我一下,

一次性说清楚用法用途,真的不理解意思就算了。

不管你是想磨练自己的技术还是想赚外包,
别触犯法律、别伤害他人就行。


在这里插入图片描述

👇问题解答 · 源码获取 · 技术交流 · 抱团学习请联系👇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435443.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第15章_File类与IO流

第15章_File类与IO流 讲师&#xff1a;尚硅谷-宋红康&#xff08;江湖人称&#xff1a;康师傅&#xff09; 官网&#xff1a;http://www.atguigu.com 本章专题与脉络 1. java.io.File类的使用 1.1 概述 File类及本章下的各种流&#xff0c;都定义在java.io包下。 一个File对…

渗透测试成功的8个关键,98%的人都理解错了

01 知道为什么要测试 执行渗透测试的目的是什么&#xff1f;是满足审计要求&#xff1f;是你需要知道某个新应用在现实世界中表现如何&#xff1f;你最近换了安全基础设施中某个重要组件而需要知道它是否有效&#xff1f;或者渗透测试根本就是作为你定期检查防御健康的一项例行…

最新版本 Stable Diffusion 开源 AI 绘画工具之中文自动提词篇

✨ 目录 &#x1f388; 标签生成器&#x1f388; 提示词自动补全 &#x1f388; 标签生成器 由于输入正向提示词 prompt 和反向提示词 negative prompt 都是使用英文&#xff0c;所以对学习母语的我们非常不友好使用网址&#xff1a;https://tinygeeker.github.io/p/ai-prompt…

第05讲:OpenTracing 简介,先有标准后有天

自从 Google Dapper 的论文发布之后&#xff0c;各大互联网公司和开源社区开发的分布式链路追踪产品百花齐放&#xff0c;同时也给使用者带来了一个问题&#xff0c;各个分布式链路追踪产品的 API 并不兼容&#xff0c;如果用户在各个产品之间进行切换&#xff0c;成本非常高。…

Sprinboot聚合项目归夷

1、前言 在创建springboot项目时&#xff0c;都会有一个Main方法。如果将Springboot项目设计成聚合项目时&#xff0c;我们是不是要把所有的子项目都按照Springboot的方式创建呢&#xff1f;如果是会出现什么问题&#xff0c;以及我们怎么解决呢&#xff1f; 如果我们使用maven…

在线画图网站Graph Editor的使用

网站链接 链接 网站介绍 CS Academy是一个在线的算法学习和竞赛的网站&#xff0c;打开网站左侧导航栏中的App目录下有一个可以在线画图的应用Graph Editor&#xff0c;用来画图&#xff08;有向、无向&#xff09;非常好用。 网站使用 网站的界面如下&#xff1a; 左侧为…

Golang每日一练(leetDay0037) 二叉树专题(6)

目录 109. 有序链表转换二叉搜索树 Convert-sorted-list-to-binary-search-tree &#x1f31f;&#x1f31f; 110. 平衡二叉树 Balanced Binary Tree &#x1f31f; 111. 二叉树的最小深度 Minimum Depth of Binary Tree &#x1f31f; &#x1f31f; 每日一练刷题专栏 …

代码随想录算法训练营第五十七天 | 647. 回文子串、516.最长回文子序列

打卡第57天。 今日任务 ● 647. 回文子串 ● 516.最长回文子序列 647. 回文子串 给你一个字符串 s &#xff0c;请你统计并返回这个字符串中 回文子串 的数目。 回文字符串 是正着读和倒过来读一样的字符串。 子字符串 是字符串中的由连续字符组成的一个序列。 具有不同开…

【云原生进阶之容器】第六章容器网络6.6.1--Cilium网络方案概述

《云原生进阶之容器》专题索引: 第一章Docker核心技术1.1节——Docker综述第一章Docker核心技术1.2节——Linux容器LXC第一章Docker核心技术1.3节——命名空间Namespace第一章Docker核心技术1.4节——chroot技术第一章Docker核心技术1.5.1节——cgroup综述

从入门到精通:带你掌握Python Requests库的全部技能

目录 引言 安装 启动用户管理项目 requests响应 Session请求 为什么Session类可以保持会话 封装requests 引言 Python Requests库是Python语言中最为流行的HTTP客户端库之一。它提供了简单易用的API&#xff0c;让发送HTTP/1.1请求变得异常容易&#xff0c;支持常见的H…

TiDB实战篇-数据导出工具Dumpling

简介 简要使用数据导出工具。 介绍 特点 适用场景 部署 下载 TiDB 社区版 | PingCAP 安装 #解压下载好的安装包 tar -zxvf tidb-community-toolkit-v6.5.0-linux-amd64.tar.gz #进入到文件夹以后解压出dumpling cd tidb-community-toolkit-v6.5.0-linux-amd64 tar -zxvf d…

MySQL中的索引index(超详细)

概念&#xff1a; 在MySQL中&#xff0c;索引&#xff08;index&#xff09;是一种特殊的数据结构&#xff0c;它能够加快数据库中数据的检索速度。索引可以看做是一本书的目录&#xff0c;它提供了一种快速查找数据的方式。 MySQL中的索引是建立在一张表的一列或多列上的&…

开发者社区项目开发流程

项目流程&#xff1a; 项目创建 首先创建一个文件夹&#xff0c;然后找到要创建项目的文件夹 输入CMD 进入小黑窗 输入“vue create 项目名” 创建我们这个项目(其中细节Ctrl左键点击链接见个人博客(99条消息) 创建Vue项目流程_啊唯11的博客-CSDN博客) 2.删除项认文件&#x…

C++命名空间域namespace与域作用限制符: :,cin,cout输入输出简单介绍

TIPS C是在C的基础之上&#xff0c;容纳进去了面向对象编程思想&#xff0c;并增加了许多有用的库&#xff0c;以及编程范式等C总计63个关键字&#xff0c;C语言32个关键字&#xff0c;具体没有必要先不去管它 域&#xff0c;命名空间域与namespace关键字 cpp需要解决的第一…

Java后端面试题 重难点和被问到没答上来的点(包括java基础、关系型数据库、Redis、计算机网络、Spring、Java多线程、vue等)

以下是我记录的一些重点问题和面试中被问到没答上来的问题&#xff0c;包括java基础、关系型数据库、Redis、计算机网络、Spring、Java多线程、vue 问题目录 1.fail-safe和fail-fast2.四引用3.explain字段重要内容4.maven三大生命周期5.MYSQL 创建修改表6.数据库三范式7.Strin…

华科超算用户手册的学习笔记

1. 资源计费 1.1 费用记账 日期费用&#xff08;上限3000元&#xff09;2023.04.171002023.04.18200总计300 1.2 创建实例时显示项目的余额不足 这是因为项目账户之中目前还没有足够的卡时&#xff1b; Note 这里是因为上次充值的卡时还在田老师的个人账户中&#xff0c;还需…

vue el-table 单机行选中高亮并获取行数据,再次单击取消行选中

1. 效果展示 当没有行被选中时&#xff0c;按钮是不可用的 当有行被选中时&#xff0c;该行高亮&#xff0c;同时按钮可用 再次点击该行&#xff0c;取消高亮&#xff0c;按钮不可用 2. 代码 2.1 组件代码 table设置了highlight-current-row&#xff0c;可以在选中某个数据行…

List集合和Set集合的区别

Collection集合总结 在进行Java开发的时候经常会用到集合&#xff0c;而集合又主要分为两种&#xff1a;Collection单列集合和Map集合。这里主要介绍一下Collection的一些常用子接口的区别。 Collection集合&#x1f62e; 指单列集合&#xff0c;存储的一组对象。 List&#x…

4大方法,教你如何做好项目管理

作为一个项目经理&#xff0c;项目管理是我们日常工作最核心的一项职能。无论是公司的业务开发还是重大项目的推进&#xff0c;都离不开项目管理。然而对于很多初入职场的人来说&#xff0c;项目管理还是一个相当新颖、陌生的领域&#xff0c;因此我今天就来分享一些我在项目管…

【安全与风险】密码安全和用户认证

密码安全和用户认证 基本问题证明你是谁为什么要验证还需要什么基于口令的身份认证常用使用模式常用使用模式可惜的是社会工程悉尼大学 (绿化96)尴尬和记忆关于密码使用的3个主要问题UNIX形式的密码密码散列字典式攻击影子密码其他密码问题生物计量学多模式生物识别系统定义为什…