用Python实战，畅享音乐海洋，一键采集你喜爱的音乐！

news2026/3/18 21:29:25

前言

嗨喽，大家好呀~这里是爱看美女的茜茜呐

环境使用:

Python 3.8 解释器
Pycharm 编辑器

模块使用:

requests >>> pip install requests
re

第三方模块安装方法：

win + R 输入cmd 输入安装命令 pip install 模块名

(如果你觉得安装速度比较慢, 你可以切换国内镜像源)

实现案例流程: 采集数据有权限

一. 数据来源分析

明确需求
- 明确采集网站以及数据
  
  网址:
  
  数据: 歌曲内容 / 歌曲标题
抓包分析

通过开发者工具进行抓包<数据包>分析
- 打开开发者工具: F12 / 右键点击检查选择network <网络面板>
- 刷新网页: 让网页数据内容重新加载一遍
- 找歌曲播放链接: 点击media 可以找到歌曲链接
- 继续分析咱们歌曲链接是从哪里生成出来的 <歌曲信息数据包>
  
  搜索关键字找对应数据包

二. 代码实现步骤

发送请求, 模拟浏览器对于url地址发送请求
获取数据, 获取服务器返回响应数据

开发者工具: response
解析数据, 提取我们需要的数据内容

歌曲标题 / 歌曲链接
保存数据, 获取歌曲数据内容,进行保存

url --> 唯一资源定位符 <网址>

代码展示

# 导入数据请求模块 第三方模块 需要安装 pip install requests
import requests
# 导入正则表达式模块
import re
# 模拟浏览器 <本节课案例一个ua就可以了>
headers = {
    # 用户代理 表示浏览器基本身份信息
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36'
}
# 榜单链接
link = 'https://***m/yy/rank/home/1-8888.html?from=rank'
# 发送请求 获取响应数据
html_data = requests.get(url=link, headers=headers).text
"""
re.findall('数据', '数据源') --> 找到所有我们需要的数据内容
    从什么地方, 匹配什么数据
"""
music_id_list = re.findall('data-index="\d+" data-eid="(.*?)">', html_data)
for music_id in music_id_list:
    # 请求链接 歌曲信息链接
    源码、解答、教程、资料加V：qian97378免费领
    url = f'https://****/yy/index.php?r=play/getdata&dfid=08x5QL1nm3BC0EQQGl47oq2K&appid=1014&mid=c66d4af5f46463ab9559a65a35821df7&platid=4&encode_album_audio_id={music_id}&_=1690200743580'
    # 发送请求
    response = requests.get(url=url, headers=headers)
    # 歌名
    audio_name = response.json()['data']['audio_name']
    # 歌曲链接
    play_url = response.json()['data']['play_url']
    # 获取二进制数据
    content = requests.get(url=play_url, headers=headers).content
    with open('music\\' + audio_name + '.mp3', mode='wb') as f:
        f.write(content)
    print(audio_name, play_url)