一个自动下载网页图片的python小程序

news2025/1/9 15:47:22

文章目录

  • 1.一些杂七杂八的引入
  • 2.实现
    • 2.1 安装所需python包
      • 2.1.1 requests包
      • 2.1.1 BeautifulSoup包
  • 3.源码分享
  • 4.效果展示

1.一些杂七杂八的引入

最近是端午节,本人碰巧又刚考完试(数学砸了,估分115,别的还行)
于是……
于是……

我又开始整活啦~

as we all know,一个网页,它是由html写成的,其中必然有许多图片,比如……
在这里插入图片描述
没错,这些都是图片,不信你看……
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述
当然还有很多,比如……
在这里插入图片描述
什么,你问我这些图片是哪里来的?

好吧,其实是……
在这里插入图片描述
你不会连这个图标都不认识吧?在这里插入图片描述

在这里插入图片描述

2.实现

好吧,其实这个类似爬虫的东西用python其实很简单(bushi)

2.1 安装所需python包

2.1.1 requests包

requests用于发送HTTP请求,所以本程序用到了这个库,必须要装,因为……

import requests

我相信稍微了解python的同志们都懂了罒ω罒
安装步骤:
1.按下Win+R,打开“运行”对话框
在这里插入图片描述
2.输入“cmd”
在这里插入图片描述
3.单击“确定”,进入cmd命令提示符,输入以下内容:

pip3 install requests#这个是python版本是3点几的同学
pip install requests#这个是python版本是其他的同学

在这里插入图片描述

2.1.1 BeautifulSoup包

requests用于解析HTML,所以本程序用到了这个库,必须要装,因为……

from bs4 import BeautifulSoup

我相信稍微了解python的同志们又懂了罒ω罒
安装步骤:
1.按下Win+R,打开“运行”对话框
在这里插入图片描述
2.输入“cmd”
在这里插入图片描述
3.单击“确定”,进入cmd命令提示符,输入以下内容:

pip3 install beautifulsoup4#这个是python版本是3点几的同学
pip install beautifulsoup4#这个是python版本是其他的同学

在这里插入图片描述

3.源码分享

直接上源码:

import requests
from bs4 import BeautifulSoup
import os

def download_images(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    image_tags = soup.find_all('img')

    if not os.path.exists('downloaded_images'):
        os.makedirs('downloaded_images')

    for tag in image_tags:
        try:
            image_url = tag['src']
            if image_url.startswith('http'):
                response = requests.get(image_url)
            else:
                response = requests.get(url + image_url, stream=True)
            
            file_name = os.path.join('downloaded_images', image_url.split('/')[-1])

            with open(file_name, 'wb') as f:
                f.write(response.content)

            print("下载完成:", file_name)
        
        except Exception as e:
            print("下载失败:", str(e))

url = input("请输入网址:(By CSDN@喜欢电脑的平某人)")
download_images(url)

4.效果展示

一个自动下载网页图片的python小程序的演示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/690962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Oracle 查询优化改写(第六章)

第六章 使用数字 1 常用聚集函数(空值处理) 2 生成累计和 --公司为了查看用人成本,需要对员工的工资进行累加, --以便查看员工人数与工资支出之间的对应关系。 SELECT Empno,Ename,Sal,SUM(Sal) Over(ORDER BY Empno) AS 成本累…

绿色能源外交:国际间合作促进可再生能源全球普及

随着全球气候变化的威胁日益凸显,减少碳排放和转向可持续能源已经成为国际社会的共同目标。在这个背景下,绿色能源外交应运而生。绿色能源外交是指国际间合作,通过技术转让、政策协调和资金支持等手段,推动可再生能源在全球范围内…

文字PDF转换为图片格式的PDF

在我们的日常工作和生活中,有时候我们需要对PDF文件进行一些特殊处理。有时候,我们希望将PDF的每一页提取出来作为图片,方便在其他场景中使用;而有时候,我们则需要将PDF内的内容转换为图片格式,以防止他人对…

docker 操作手册

名词解释 images:封装了应用程序的镜像 tag:镜像的标记,一个镜像可以创建多个标记 container:装载镜像并运行 常用命令 查看容器 docker ps -a //查看全部镜像 启动容器 docker start mysql //启动mysql容器 停止容器 doc…

Python篇——数据结构与算法(第七部分:树)

目录 1.树与二叉树 2.树的实例:模拟文件系统 3.二叉树 4.二叉树的遍历 5.二叉搜索树 5.1插入 5.2查询 5.3删除 1.树与二叉树 2.树的实例:模拟文件系统 # 树的实例 class Node:def __init__(self, name, typedir):self.name nameself.type typ…

springboot集成mybatisPlus

1、添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-jdbc</artifactId></dependency><dependency><groupId>mysql</groupId><artifactId>mysql-connector-jav…

Mysql快速生成Java实体类

需求缘由 在使用MybatisPlus过程中&#xff0c;就肯定会创建实体类&#xff0c;虽然 MybatisPlus 也为我们提供了代码生成器&#xff0c;但是我感觉功能有点多了&#xff0c;我只需要创建实体的方法即可&#xff0c;假如我想快速将上述表转为如下的Bean对象&#xff0c;该怎么搞…

arcgis api for JavaScript4.2x 在vue中白膜图层的加载、(分类、分段)渲染

这篇文章是对有webgis前端开发经验的人 1、假设之前的三维视图均已成功加载&#xff0c;获取到了三维视图&#xff0c;这里的三维视图变量定义的名字是mapView。&#xff08;PS&#xff1a;三维视图mapview在项目初始化已经设置了&#xff0c;本示例中会直接使用调用结果&…

CentOS 8安装Oracle 19c rpm包

一、环境 centos 8 oracle 19c rpm安装 二、安装前准备 1、创建用户组 groupadd oinstall groupadd dba useradd -g oinstall -G dba oracle passwd oracle2、安装依赖包 如果yum找不到安装包&#xff0c;可以去下载 https://centos.pkgs.org/ 点击跳转 缺少的依赖包可…

Salesforce流程自动化Flow_Pause功能揭秘!

通过自动化&#xff0c;帮助团队提升效率&#xff0c;将员工从那些重复、枯燥、耗时的工作中解放出来&#xff0c;转而从事更具创造性、更有价值的工作&#xff0c;是很多企业数字化转型朴素而又迫切的需求&#xff0c;也是世界No.1 CRM——Salesforce的一大领先优势。 Flow B…

Java集合框架:优先级队列、PriorityQueue详解

目录 一、优先级队列介绍 1. 什么是大根堆&#xff08;大堆&#xff09;和小根堆&#xff08;小堆&#xff09; 2. 堆的性质 二、堆的创建 1. 向下调整建堆 向下调整算法代码实现&#xff1a; 2. 创建大根堆 三、堆的插入和删除&#xff08;向上调整算法&#xff09; …

Linux性能瓶颈分析之TOP指标分析

Linux性能瓶颈分析之TOP指标分析 文章目录 Linux性能瓶颈分析之TOP指标分析一、查看CPU二、监控CPU总结 一、查看CPU 1.查看cpu基础信息 lscpu2.查看cpu详细信息 cat /proc/cpuinfo3.统计cpu信息 cat /proc/cpuinfo |grep "physical id" |sort |uniq |wc -l 查看…

骨传导耳机可以长期佩戴吗,分享几款舒适度极高的骨传导耳机

近几年有一种新型传播方式的耳机&#xff0c;将声音转化为振动&#xff0c;从而让我们的听觉神经感知到。这种声音传播方式叫做"骨传导"&#xff0c;所以叫做骨传导耳机。因为它不需要通过耳膜进行传播声音&#xff0c;所以可以让耳朵在不接触外界的情况下听到声音。…

B051-cms06-退出 回车登录 登录拦截 记住我 SVN

目录 注销功能实现1.找到退出按钮修改请求路径2.后端删除Session并跳转到登录页面 回车登录功能登陆拦截1.编写登录拦截器2.配置拦截器 记住我后端实现页面实现 取消记住我后端实现页面实现 注销功能实现 1.找到退出按钮修改请求路径 header.jsp <% page language"j…

翻过那座山——Jenkins编译发布web程序(.net framework web application)

&#x1f4e2;欢迎点赞 &#xff1a;&#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff0c;赐人玫瑰&#xff0c;手留余香&#xff01;&#x1f4e2;本文作者&#xff1a;由webmote 原创&#x1f4e2;作者格言&#xff1a;新的征程&#xff0c;我们面对的不是…

无法登录github解决方法

140.82.113.4 github.com 199.232.69.194 github.global.ssl.fastly.net 185.199.108.153 assets-cdn.github.com 185.199.109.153 assets-cdn.github.com 185.199.110.153 assets-cdn.github.com 185.199.111.153 assets-cdn.github.com 注意以管理员方式运行notepad才能保存 …

Github上标星40K的Java面试笔记,解决95%以上的Java面试

该文档在Github上收获40Kstar的Java面试神技&#xff08;这赞数&#xff0c;质量多高就不用我多说了吧&#xff09;非常全面&#xff0c;包涵Java基础、Java集合、JavaWeb、Java异常、OOP、IO与NIO、反射、注解、多线程、JVM、MySQL、MongoDB、Spring全家桶、计算机网络、分布式…

集成学习(ensemble learning)应如何入门?

集成学习算法之间的主要区别在于以下3个方面: 提供给个体学习器的训练数据不同; 产生个体学习器的过程不同; 学习结果的组合方式不同&#xff0c;从这三个方面去学。 多样性 数据样本多样性&#xff1a;产生数据多样性的方法主要有3种: 输入样本扰动; 输入属性扰动; 输出表示…

掌握Python的常用模块pandas

Pandas 简介 Pandas 是 Python 的核心数据分析支持库&#xff0c;提供了快速、灵活、明确的数据结构&#xff0c;旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具&#xff0c;其长远目标是成为最强大、最灵活、可以支持…

10 编码转换问题

文章目录 字符编码问题编码转换问题ANSI转UnicodeUnicode转ANSIUtf8转 ANSIutf8 转UnicodeANSI 转UTF-8Unicode 转 UTF-8 全部代码 字符编码问题 Windows API 函数 MessageBoxA:MessageBox 内部实现&#xff0c;字符串编码(ANSI)转换成了Unicode,在调用MessageboxW MessageBox:…