Python 爬虫之下载视频(三)

news2025/2/4 2:16:24

批量下载某B主视频


文章目录

  • 批量下载某B主视频
  • 前言
  • 一、基本思路
  • 二、确定遍历循环结构
  • 三、基本思路中第12步
  • 三、基本思路中第345步
  • 总结


前言

上一篇讲了如何去获取标题和视频链接。这篇就跟大家讲一下如何去下载这些视频。本篇会以标题和 视频链接 为突破口,来寻找 视频的下载链接 藏在哪里。

注意:分上下两篇来写,请先看Python 爬虫之下载视频(二)。


一、基本思路

  • 第一步:根据上篇找到的视频链接,打开它,会转到一个新的页面。
  • 第二步:新页面刚打开,会弹出登陆窗口,关闭它。
  • 第三步:使用 find 方法查找到视频下载链接的位置。
  • 第四步:使用request.get() 方法去下载该视频。
  • 第五步:用爬到的标题给它们命名保存。

二、确定遍历循环结构

这里要意识到,我们需要将视频的标题和视频链接一一对应起来。这样才能达到理想的效果。

代码如下:

# 遍历地址和标题,让其一一对应起来
i = 0
while i < len(right_url_list):

    # 视频链接
    all_url = url_list[i]
    
    # 视频标题
    dirty_name = title_list[i]
    
    i += 1

这里我采用的是while循环结构,简单通俗易懂,便于后面的进一步处理。

注意:后面的所有代码都是在while循环结构下写的


三、基本思路中第12步

代码如下:

    # 再一次爬取
    driver.get(all_url)
    
    # 等待网页打开
    time.sleep(8)

    # 页面打开会弹出一个登录窗口
    close = driver.find_element(by=By.CSS_SELECTOR, value='.dy-account-close')
    
    # 等登录窗口弹出来
    time.sleep(5)
    
    # 关闭弹出的登录窗口
    close.click()
    # 等待网页加载完
    time.sleep(5)

这里就不多解释了,上一篇有相似的内容。


三、基本思路中第345步

代码如下:

    # 获取视频的下载地址
    dirty_downloaded_url = driver.find_element(by=By.CSS_SELECTOR, value='video source:nth-child(3)').get_attribute(
        'src')

    # 下载视频
    response = requests.get(dirty_downloaded_url, stream=True)
    total_downloaded = 0
    chunk_size = 1024
    with open(f'{dirty_name}.mp4', 'wb') as f:
        for chunk in response.iter_content(chunk_size=chunk_size):
            f.write(chunk)
    print(f'下载完了!!{dirty_name}.mp4')

此处有两个知识点需要大家去学习一下(学完再看上面那几行代码轻轻松松):

一是 driver.find_element(by 相关的知识点。
二是 下载和保存视频的方式的相关的知识点。


总结

此程序是在Python 3.11.6 版本的环境下编写的,注意哦要不然程序可能运行不起来。

运行完上面的程序,就会得到下面的东西。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1328624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SAP系统标准表之间的关联关系对应

SAP系统标准表之间的关联关系对应

VPN理论入门及GRE、L2TP、IPsec(HCIP)

一、VPN概述 IPsec-VPN&#xff1a; 1、应用范围&#xff1a;用于分公司和总部之间。 2、作用&#xff1a;机密性、证书&#xff08;身份认证&#xff09; VPN概述 VPN概述&#xff1a;VPN&#xff08;Virtual Private Network&#xff09;是指依靠Internet服务提供商ISP&a…

jetson nano系列安装nomachine

引言&#xff1a;项目需要实现远程控制和可视化&#xff0c;在实现了4G通信的基础上&#xff0c;使用namochine实现远程的可视化和操作 1、硬件&#xff1a;jetson orin nano 8G 2、环境&#xff1a;ubuntu20.04ros-noetic 注意&#xff1a;项目主要是为了方便客户端连接到这…

Zookeeper集群搭建,四字命令监控,Leader选举原理以及数据如何同步

Java学习面试指南&#xff1a;https://javaxiaobear.cn 1、集群角色 Leader&#xff1a; 领导者。 事务请求&#xff08;写操作&#xff09;的唯一调度者和处理者&#xff0c;保证集群事务处理的顺序性&#xff1b;集群内部各个服务器的调度者。对于create、setData、delete…

集合论:二元关系(1)

集合论这一章内容很多&#xff0c;重点是二元关系中关系矩阵&#xff0c;关系图和关系性质:自反、反自反、对称、反对称、传递以及关系闭包的运算&#xff0c;等价关系&#xff0c;偏序关系&#xff0c;哈斯图&#xff0c;真吓人&#xff01; 1.笛卡儿积 由两个元素x和y按照一…

RTP/RTCP/RTSP/SIP/SDP/RTMP对比

RTP&#xff08;Real-time Transport Protocol&#xff09;是一种用于实时传输音频和视频数据的协议。它位于传输层和应用层之间&#xff0c;主要负责对媒体数据进行分包、传输和定时。 RTCP&#xff08;Real-Time Control Protocol&#xff09;是 RTP 的控制协议&#xff0c;…

Keepalived 高可用群集

目录 一、Keepalived概述 二、一个台格的集群应该具备的特性 三、Keepalived实现原理剖析 四、LVSKeepalived高可用部署 1、配置负载调度器 2、配置节点服务器 3、浏览器测试 五、keepalived的抢占与非抢占模式 六、keepalived的脑裂故障 七、NginxKeepalived高可用部…

FCIS 2023网络安全创新大会-核心PPT资料下载

一、峰会简介 本次会议的主题是“AI大模型、人工智能与智能制造安全、攻击面管理与供应链安全”。 1、AI大模型 会议首先探讨了AI大模型在网络安全领域的应用。AI大模型是一种基于深度学习的模型&#xff0c;具有强大的特征提取和分类能力&#xff0c;可以用于检测和防御各种…

自媒体人福音,正版实用的视频素材网站~

大家平时在创作视频的时候&#xff0c;有没有苦恼过找不到合适的素材呢&#xff1f;网上能找到的大部分素材都是有版权的&#xff0c;不能随便乱用。今天我就来给大家推荐一些用于视频创作的正版素材网站&#xff0c;快快收藏吧! 1.制片帮素材 链接&#xff1a;stock.zhipianb…

Kubernetes 学习总结(40)—— Kubernetes 之 自动伸缩 HPA、VPA、CA和CPA详解

前言 Kubernetes 提供了多种自动伸缩机制&#xff0c;例如 HPA&#xff08;Horizontal Pod Autoscaling&#xff09;&#xff0c;可以根据不同情况动态调整 Pod 副本数量。此功能使 Pod 能够有效地处理当前流量&#xff0c;而无需管理员不断干预来调整副本数量。除了 HPA 之外…

esp32-s3训练自己的数据进行目标检测、图像分类

esp32-s3训练自己的数据进行目标检测、图像分类 一、下载项目二、环境三、训练和导出模型四、部署模型五、存在的问题 esp-idf的安装参考我前面的文章&#xff1a; esp32cam和esp32-s3烧录human_face_detect实现人脸识别 一、下载项目 训练、转换模型&#xff1a;ModelAssist…

sql-labs服务器结构

双层服务器结构 一个是tomcat的jsp服务器&#xff0c;一个是apache的php服务器&#xff0c;提供服务的是php服务器&#xff0c;只是tomcat向php服务器请求数据&#xff0c;php服务器返回数据给tomcat。 此处的29-32关都是这个结构&#xff0c;不是用docker拉取的镜像要搭建一下…

为什么越来越多公司开始用低代码开发?

时代洪流的走向&#xff0c;我们无法左右&#xff0c;能够把握的&#xff0c;只有做好自己。如何在寒冬来之不易的机会中&#xff0c;生存并且壮大。 不知道大家有没有发现&#xff0c;今年的低代码赛道异常火热&#xff0c;但火热的背后才值得思考&#xff0c;市场需求持续被挖…

国图公考:专业选岗指南,哪些专业考公考编有优势?

在公务员考试和编制招聘中&#xff0c;选择合适的专业是非常重要的。以下这些专业的毕业生在考公考编时会具有一些优势&#xff1a; 一、法律类专业 首先&#xff0c;法律专业的知识体系严谨&#xff0c;对法律法规有深入的理解和掌握&#xff0c;这对于公务员工作中处理各类…

k8s中Helm工具实践

k8s中Helm工具实践 1&#xff09;安装redis-cluster 先搭建一个NFS的SC&#xff08;只需要SC&#xff0c;不需要pvc&#xff09;&#xff0c;具体步骤此文档不再提供&#xff0c;请参考前面相关章节。 下载redis-cluster的chart包 helm pull bitnami/redis-cluster --untar…

虾皮广告怎么做:如何在虾皮平台上进行广告投放

在虾皮&#xff08;Shopee&#xff09;平台上进行广告投放可以帮助您提高产品的曝光度和销量。通过有针对性的广告&#xff0c;您可以在虾皮平台上吸引更多的潜在买家&#xff0c;提高产品的可见度并增加销售机会。本文将为您介绍在虾皮平台上创建和管理广告的一些建议&#xf…

22 3GPP在SHF频段基于中继的5G高速列车场景中的标准化

文章目录 信道模型实验μ参考信号初始接入方法波形比较 RRH&#xff1a;remote radio head 远程无线头 HTS&#xff1a;high speed train 高速移动列车 信道模型 考虑搭配RRH和车载中继站之间的LOS路径以及各种环境&#xff08;开放或峡谷&#xff09;&#xff0c;在本次实验场…

Peter算法小课堂—贪心与二分

太戈编程655题 题目描述&#xff1a; 有n辆车大甩卖&#xff0c;第i辆车售价a[i]元。有m个人带着现金来申请购买&#xff0c;第i个到现场的人带的现金为b[i]元&#xff0c;只能买价格不超过其现金额的车子。你是大卖场总经理&#xff0c;希望将车和买家尽量多地进行一对一配对…

20 Vue3中使用v-for遍历普通数组

概述 使用v-for遍历普通数组在真实开发中还是比较常见的。 基本用法 我们创建src/components/Demo20.vue&#xff0c;代码如下&#xff1a; <script setup> const tags ["JavaScript", "Vue3", "前端"] </script> <template…