导语
哈喽!大家好。我是木木子吖~今天给大家带来爬虫的内容哈。
所有文章完整的素材+源码都在👇👇
粉丝白嫖源码福利,请移步至CSDN社区或文末公众hao即可免费。
今天教大家Python爬虫实战一键采集大家喜欢的DJ舞曲哦!
DJ舞曲——美女热舞——好歌曲下载,还在等什么,赶紧来学习一下吧!
Ps——
XXDJ音乐是一款非常劲爆的摇滚节奏音乐软件,这里有着丰富的节奏音乐资源,各种各样的
DJ、舞曲、摇滚音乐都应有尽有,绝对能够更满足各位摇滚音乐爱好者们的喜好,让更多人学
习欣赏音乐、体验更刺激的音乐风格。
支持下载保存,让你可以免费收听,不需要使用数据流量也可以收听歌曲
陪你度过了很多无聊的时光,听歌让我们心情愉悦,随着歌摇摆吧;
所有你想听的DJ歌曲在这里,你可以在任何时候听到好的歌曲,听歌曲。快让我们马上行动起
来吧~采集某网站DJ舞曲!
正文
一、环境准备
1)运行环境
开发环境:Python3、Pycharm社区版、requests,部分自带的模块安装Python即可使用。
相对应的安装包/安装教程/激活码/使用教程/学习资料/工具插件 可以直接找我厚台获取 。
2)模块安装
第三方库的安装方式如下:
一般安装:pip install +模块名
镜像源安装:pip install -i https://pypi.douban.com/simple/+模块名
(还有很多国内镜像源,这里是豆瓣的用习惯了,其他镜像源可以去看下之前文章都有的)
模块安装问题可以详细的找我给大家讲一下的哈,之前其实也有的文章写了几个点的。
二、思路流程
1)确定采集XX某网站👇
2)headers头文件
三、代码展示
1)主程序
import requests
url = 'http://www.36dj.com/xc/'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
id_list = re.findall('><a href="/play/(\d+)/" title=', response.text)
for index in id_list:
link = f'http://www.36dj.com/play/{index}/'
response_1 = requests.get(url=link, headers=headers)
response_1.encoding = response_1.apparent_encoding
mp3_info = re.findall('var music_name = "(.*?)"; var info = \{ "playurl": "(.*?)"', response_1.text)
title = mp3_info[0][0]
# http://tn1.72djapp.cn:8399/2022/3606/23t/16394.m4a
mp3_url = 'http://tn1.72djapp.cn:8399/' + mp3_info[0][1]
mp3_content = requests.get(url=mp3_url, headers=headers).content
with open('mp3\\' + title + '.mp3', mode='wb') as f:
f.write(mp3_content)
print(title, mp3_url)
2)效果展示
总结
今日分享到此结束!别忘了“三连”哦!咱们下期不见不散!
🎯完整的免费源码领取处:找我吖!文末公众hao可自行领取,滴滴我也可!
🔨推荐往期文章——
项目1.8 Wifi破解免费
Python编程零基础如何逆袭成为爬虫实战高手之《WIFI破解》(甩万能钥匙十条街)爆赞爆赞~
项目1.9 爬虫+数据分析实战:全球疫情最新消息、淘宝爬虫、秒杀脚本
【Python合集系列】爬虫有什么用,网友纷纷给出自己的答案,王老师,我..我想学那个..爬虫。可以嘛?“(代码免费分享)
项目2.0 Python爬虫合集系列
【Python爬虫系列】为什么我喜欢python?来看看这些让人爱不释手的原因吧,购物网站大盘点,看过这些python做的项目,我立马入坑了…(神奇 | 爱了,爱了)
🎄文章汇总——
汇总合集 Python—2022 |已有文章汇总 | 持续更新,直接看这篇就够了
(更多内容+源码都在✨文章汇总哦!!欢迎阅读喜欢的文章🎉~