前言
王者荣耀是一款备受欢迎的手机游戏,拥有众多精美的英雄皮肤。如果你想获取这些皮肤的图片或者其他相关信息,可以利用Python编写一个简单的爬虫来实现。
安装第三方库
首先,我们需要安装Python的requests和BeautifulSoup库。可以使用以下命令来安装它们:
pip install requests
pip install beautifulsoup4
pip install lxml
源码
接下来,我们将使用requests库来发送HTTP请求,并使用BeautifulSoup库来解析HTML页面。具体代码如下:
# 发送请求的模块
# pip install requests
# pip install lxml
import requests
from lxml import etree
import os
from time import sleep
import random
# 伪装请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.5359.125 Safari/537.36'
}
# 获取英雄列表的URL
hero_list_url = 'https://pvp.qq.com/web201605/js/herolist.json'
# 发送HTTP请求获取英雄列表数据
hero_list_json = requests.get(hero_list_url, headers=headers).json()
# 遍历英雄列表数据
for h in hero_list_json:
# 获取英雄的ID和中文名
ename = h.get('ename')
cname = h.get('cname')
# 如果英雄目录不存在,则创建
if not os.path.exists(cname):
os.makedirs(cname)
# 访问英雄主页
hero_detail_url = f'https://pvp.qq.com/web201605/herodetail/{ename}.shtml'
hero_detail_resp = requests.get(hero_detail_url, headers=headers)
hero_detail_resp.encoding = 'gbk'
e = etree.HTML(hero_detail_resp.text)
# 提取皮肤名称
names = e.xpath('//ul[@class="pic-pf-list pic-pf-list3"]/@data-imgname')[0]
names = [name[0:name.index('&')] for name in names.split('|')]
# 遍历每个皮肤名称
for i, n in enumerate(names):
# 构建皮肤图片的URL
resp = requests.get(f'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/{ename}/{ename}-bigskin-{i + 1}.jpg',headers=headers)
# 保存皮肤图片
with open(f'{cname}/{n}.jpg', 'wb') as f:
f.write(resp.content)
# 打印已下载的皮肤信息
print(f'{n} 皮肤已下载成功!')
# 随机休息一下
sleep(random.randint(1,5))
在上面的代码中,我们先从 https://pvp.qq.com/web201605/js/herolist.json 获取英雄信息,它会返回一个json数据。然后,我们遍历json数据,获取英雄id和中文名。接下来,我们创建一个文件夹,以英雄名命名。
然后,我们使用lxml库来解析HTML页面。我们使用xpath
方法来查找所有具有特定class属性的<ul>
标签,这些标签包含皮肤的信息。
最后,我们根据英雄皮肤的名称,构造url,获取皮肤图片的下载地址,使用requests请求地址并保存图片到对应的文件夹下。
运行以上代码,你将会得到所有皮肤图片信息。
这只是一个简单的示例,你可以根据需要修改代码来获取其他英雄的皮肤信息。你还可以将这些英雄的技能、介绍等信息下载到本地,或者将它们存储到数据库中以供后续使用。
源码地址
链接:https://pan.baidu.com/s/1SFp6IBTrsIW8AJtjrpYlNg?pwd=daxt