【小白必看】使用Python爬取喜马拉雅音频并保存的示例代码

news2024/9/22 15:45:42

文章目录

  • 前言
  • 运行效果截图
  • 导入requests库
  • 获取集数音频ID的链接
  • 提取音频ID和名称
  • 循环处理每个音频
  • 完整代码
    • 分点讲解
  • 结束语

在这里插入图片描述

前言

本文介绍了如何使用Python中的requests库来获取音频文件并保存到本地。在这个例子中,我们使用了喜马拉雅平台上的一个API接口来获取音频ID和名称,并使用这些信息构造音频地址,然后通过发送HTTP请求将音频内容下载保存到本地。

运行效果截图

在这里插入图片描述

导入requests库

在这里插入图片描述

import requests

这行代码导入了requests库,它是一个常用的HTTP请求库,用于发送HTTP请求和处理响应。

获取集数音频ID的链接

在这里插入图片描述

url_list = 'https://www.ximalaya.com/revision/play/v1/show?id=67641798&sort=0&size=30&ptype=1'
url_list_resp = requests.get(url_list,headers=headers)

这两行代码分别定义了一个获取音频ID列表的链接url_list,并使用requests.get()方法发送GET请求获取响应。headers变量用于设置请求头信息,其中User-Agent字段指定了发送请求的浏览器标识。

提取音频ID和名称

在这里插入图片描述

track_list = [(tack.get('trackId'),tack.get('trackName')) for tack in url_list_resp.json().get('data').get('tracksAudioPlay')]

这行代码通过解析响应的JSON数据,提取了音频的ID和名称,并将其存储在列表对象track_list中。

循环处理每个音频

在这里插入图片描述

for id, name in track_list:
    # 获取音频地址的链接
    audio_src= f'https://www.ximalaya.com/revision/play/v1/audio?id={id}&ptype=1'
    src = requests.get(audio_src,headers=headers)

    audio_url = src.json().get('data').get('src')
    # audio_url = 'https://aod.cos.tx.xmcdn.com/group39/M07/34/82/wKgJnlqChT2jRXU8AEn2S2TpSzo586.m4a'
    # 发送请求
    resp = requests.get(audio_url,headers=headers)
    print(f'正在保存{name}音频')
    # 保存数据 w写文件  b字节流
    with open(f'audio/{name}.mp3','wb') as f:
        # resp.text  文本  resp.content 内容   resp.json()
        f.write(resp.content)

这部分代码中使用了一个for循环来遍历track_list列表中的每个音频。首先,它构造了获取音频地址的链接audio_src,然后发送GET请求获取响应并解析出音频地址audio_url。接下来,它再次发送GET请求获取音频的内容,并将其保存到以音频名称命名的文件中。

注意:代码中注释的部分表示了一些其他可能的音频链接和文件保存方式。具体选择哪种方式取决于你的需求和实际情况。

完整代码

import requests
# 导入requests库,用于发送HTTP请求和处理响应
# pip install requests

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36'}
# 设置请求头信息,其中User-Agent字段指定了发送请求的浏览器标识

url_list = 'https://www.ximalaya.com/revision/play/v1/show?id=67641798&sort=0&size=30&ptype=1'
# 定义了一个获取音频ID列表的链接

url_list_resp = requests.get(url_list, headers=headers)
# 发送GET请求获取响应

track_list = [(track.get('trackId'), track.get('trackName')) for track in url_list_resp.json().get('data').get('tracksAudioPlay')]
# 提取音频ID和名称

for id, name in track_list:
    # 循环处理每个音频
    audio_src = f'https://www.ximalaya.com/revision/play/v1/audio?id={id}&ptype=1'
    # 构造获取音频地址的链接
    src = requests.get(audio_src, headers=headers)
    # 发送GET请求获取音频地址的响应

    audio_url = src.json().get('data').get('src')
    # 从响应的JSON数据中提取音频地址

    resp = requests.get(audio_url, headers=headers)
    # 发送GET请求获取音频文件内容

    print(f'正在保存{name}音频')
    # 打印正在保存的音频名称

    with open(f'audio/{name}.mp3', 'wb') as f:
        # 打开一个文件,并以二进制写入模式写入文件中
        f.write(resp.content)
        # 将音频文件内容写入文件中

分点讲解

import requests

这行代码导入了requests库,用于发送HTTP请求和处理响应。

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36'}

这行代码定义了一个字典 headers,用于设置请求头信息。在这个例子中,我们设置了一个User-Agent字段,模拟浏览器的标识。

url_list = 'https://www.ximalaya.com/revision/play/v1/show?id=67641798&sort=0&size=30&ptype=1'

这行代码定义了一个字符串变量 url_list,它是用来获取音频ID列表的链接。在这个例子中,链接是喜马拉雅平台提供的一个API接口。

url_list_resp = requests.get(url_list, headers=headers)

这行代码发送一个GET请求去获取响应。使用 requests.get() 方法发送GET请求,并将响应保存到变量 url_list_resp 中。

track_list = [(track.get('trackId'), track.get('trackName')) for track in url_list_resp.json().get('data').get('tracksAudioPlay')]

这行代码提取音频ID和名称。通过解析JSON格式的响应数据,我们从中提取出音频的ID和名称,并将它们存储在一个列表对象 track_list 中。这里使用了列表推导式,遍历了 tracksAudioPlay 字段中的每个元素,提取出 trackIdtrackName 字段的值。

for id, name in track_list:

这行代码开始循环处理每个音频。我们从 track_list 列表中依次取出音频的ID和名称,赋值给变量 idname

audio_src = f'https://www.ximalaya.com/revision/play/v1/audio?id={id}&ptype=1'

这行代码构造了获取音频地址的链接。我们通过字符串格式化将音频的ID插入到链接中,创建一个完整的URL,以便获取音频的地址。

src = requests.get(audio_src, headers=headers)

这行代码发送一个GET请求去获取音频地址的响应。我们使用 requests.get() 方法再次发送GET请求,获取音频地址的响应,并将其保存到变量 src 中。

audio_url = src.json().get('data').get('src')

这行代码从响应的JSON数据中提取出音频地址。我们解析JSON格式的响应数据,并从中获取 data 字段的值,然后再从 data 字段中获取 src 字段的值,即音频的地址。

resp = requests.get(audio_url, headers=headers)

这行代码发送一个GET请求去获取音频文件的内容。我们使用 requests.get() 方法发送GET请求,获取音频文件的内容,并将其保存到变量 resp 中。

print(f'正在保存{name}音频')

这行代码打印正在保存的音频名称。我们使用 print() 函数输出保存当前音频的名称。

with open(f'audio/{name}.mp3', 'wb') as f:
    f.write(resp.content)

这行代码使用文件操作来保存音频文件。我们以二进制写入模式打开一个文件,根据音频名称创建对应的文件,并将音频文件的内容写入到文件中。

结束语

通过本文,我们学习了如何使用Python中的requests库来处理HTTP请求,并结合喜马拉雅平台的API接口完成了音频文件的下载和保存。当然,这只是一个简单的示例,实际应用中可能还涉及到其他更复杂的操作和处理方式。希望本文对你理解和使用requests库有所帮助,并能够在实际项目中发挥作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/799237.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

保存Windows锁屏壁纸

原链接 1. 点击爱心 我保存过了,所以没有爱心了. 2. 打开本地文件夹 用户改成自己的 C:\Users\86186\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets 3. 复制这些文件到其他目录 我这个不知道咋的,操作完文件夹过1会就被…

Leetcode——404 左叶子之和

404. 左叶子之和 难度简单(虽然简单 但是我用递归做时 还是有点坑的) 给定二叉树的根节点 root ,返回所有左叶子之和。 示例 1: 输入: root [3,9,20,null,null,15,7] 输出: 24 解释: 在这个二叉树中,有两个左叶子…

【第一阶段】varval类型推断

Val 可读不可改 代码示例: 不可改: fun main() {//val可读不可改val name:String"kotlin"//不可改 此时会报错 报错打印信息:Val cannot be reassignedname"java" }可读: fun main() {//val可读不可改val…

QT第三讲

蜡笔小新闹钟 需求&#xff1a; 实现 widget.h #ifndef WIDGET_H #define WIDGET_H#include <QWidget> #include<QTime> //时间类 #include<QTimerEvent> //事件处理类 #include<QtTextToSpeech> //文本转语音类 #include<QMessageBox> /…

Evol-Instruct:让LLM将指令改写的更复杂

Evol-Instruct方法出自论文 WizardLM: Empowering Large Language Models to Follow Complex Instructions &#xff0c;也是利用大模型生成指令的方法&#xff0c;它可以生成相对复杂和多样的指令数据集。 对应的github&#xff0c;但是目前只开源LLM部分的代码&#xff0c;如…

如何直接关闭使用3306端口的进程

要直接关闭使用3306端口的进程&#xff0c;你可以按照以下步骤进行操作(以关闭占领3306端口MySQL服务为例)&#xff1a; 获取占用3306端口的进程ID&#xff08;PID&#xff09;。在终端中执行以下命令&#xff1a; sudo lsof -i :3306查找输出中的进程ID&#xff08;PID&…

MyBatis-Plus自动填充

文章目录 一、前言二、MyBatis-Plus自动填充功能实现2.1、实体类上增加注解2.2、自定义填充类编写 一、前言 我们在建表的时候&#xff0c;所有的表都会有create_id&#xff08;创建人id&#xff09;、create_time&#xff08;创建时间&#xff09;、update_id&#xff08;更新…

2022.09.17【读书笔记】丨生物信息学与功能基因组学(第十三章 蛋白质结构预测 下)

目录 蛋白质结构预测三种方法同源建模(比较建模)穿线法从头预测&#xff08;ab initio&#xff09;基于假设推荐策略 精度与方法选择Alphafold2相关信息 蛋白质结构预测 三种方法 同源建模(比较建模) 建模4步骤 1.模板选择和确定折叠构象 通过blast或delta-blast搜索同源蛋白…

8 个线程池最佳实践和坑!使用不当直接生产事故!!

这篇文章我会简单总结一下我了解的使用线程池的时候应该注意的坑以及一些优秀的实践。拿来即用&#xff0c;美滋滋&#xff01; 1、正确声明线程池 线程池必须手动通过 ThreadPoolExecutor 的构造函数来声明&#xff0c;避免使用Executors 类创建线程池&#xff0c;会有 OOM …

华为鸿蒙HarmonyOS4发布即巅峰,车机系统、多模态交互等实现突破

7 月 27 日最新消息&#xff0c;华为将于8月4日推出全新鸿蒙HarmonyOS 4.0&#xff0c;届时华为开发者大会也一并举行。 根据证券日报的报道&#xff0c;华为有关负责人在7月27日向媒体确认了以下消息。华为鸿蒙4.0将在汽车娱乐系统、多模态交互等领域实现重大突破&#xff0c;…

@Conditional

Conditional Conditional 是 spring framework 中提供的一个条件注解&#xff0c;&#xff0c;满足条件就注入&#xff0c;不满足就不注入ioc Condtional 需要和 Condition接口 一起用&#xff1a; 返回true注入&#xff0c;返回false不注入&#xff0c;&#xff0c; 里面有一…

灵雀云Alauda MLOps 现已支持 Meta LLaMA 2 全系列模型

在人工智能和机器学习领域&#xff0c;语言模型的发展一直是企业关注的焦点。然而&#xff0c;由于硬件成本和资源需求的挑战&#xff0c;许多企业在应用大模型时仍然面临着一定的困难。为了帮助企业更好地应对上述挑战&#xff0c;灵雀云于近日宣布&#xff0c;企业可通过Alau…

《吐血整理》保姆级系列教程-玩转Fiddler抓包教程(7)-Fiddler状态面板-QuickExec命令行

1.简介 Fiddler成了网页调试必备的工具&#xff0c;抓包看数据。Fiddler自带命令行控制&#xff0c;并提供以下用法。Fiddler的快捷命令框让你快速的输入脚本命令。 除了输入默认命令&#xff0c;也可以自定义命令&#xff0c;你可以通过编辑 FiddlerScript 来增加新命令&…

mysql(四)数据备份

目录 前言 一、概述 二、备份的类型 &#xff08;一&#xff09;物理与逻辑角度 &#xff08;二&#xff09;数据库备份策略角度 三、常见的备份方法 四、完整备份 &#xff08;一&#xff09;打包数据库文件备份 &#xff08;二&#xff09;备份工具备份 五、增量备份 六、操…

文旅数字化营销系统怎么做?文旅营销系统有什么优势?

文旅行业和数字经济的融合&#xff0c;让数字化文旅成为推动行业升级迭代、赋能行业增速的重要推手。如何顺应数字化时代下新的发展趋势&#xff0c;结合数字化文旅数字化营销系统扩大行业影响力&#xff0c;从而推动文旅行业商业营销落地模式的更新和变化&#xff1f; 开利网络…

自动化运维工具—Ansible概述

Ansible是什么&#xff1f; Ansible是一个基于Python开发的配置管理和应用部署工具&#xff0c;现在也在自动化管理领域大放异彩。它融合了众多老牌运维工具的优点&#xff0c;Pubbet和Saltstack能实现的功能&#xff0c;Ansible基本上都可以实现。 Ansible能批量配置、部署、…

智慧园区变电所运维云平台解决方案

1、概述 变电所运维云平台可以看做是电力监控系统的网络应用延伸&#xff0c;变电所运维云平台通过互联网&#xff0c;电力运维人员通过手机可以随时随地了解园区配电系统的运行情况&#xff0c;做到无人值守或者少人值守&#xff0c;同时可以监测用能状况、漏电、线缆异常发热…

手把手一起使用WPF MVVM制作USB调试助手Demo

1、USB调试助手Demo 该Demo使用WPF框架&#xff0c;基于MVVM设计模式&#xff0c;实现USB调试助手&#xff0c;效果如图所示&#xff1a; 实现功能&#xff1a;上位机(USB调试助手)与下位机(ZYNQ)通过USB通信&#xff0c;实现收发数据 实验环境&#xff1a;Visual Studio 2022…

在线帮助文档——帮助客户快速了解您的产品如何使用

当新接触到一个产品或者软件&#xff0c;在使用上遇到问题时&#xff0c;以往第一件事就是给咨询客服人员或者打电话等形式&#xff0c;每天客服人员都需要回答很多同样的问题&#xff0c;长期下去&#xff0c;客服人员压力大&#xff0c;离职率高&#xff0c;并且人工客服在这…

瓴羊Quick BI:可视化大屏界面设计满足企业个性需求

大数据技术成为现阶段企业缩短与竞争对手之间差距的重要抓手&#xff0c;依托以瓴羊Quick BI为代表的工具开展内部数据处理分析工作&#xff0c;也成为诸多企业持续获取竞争优势的必由之路。早年间国内企业倾向于使用进口BI工具&#xff0c;但随着瓴羊Quick BI等一众国内数据处…