今天继续给大家介绍Python 爬虫相关知识,本文主要内容是Python爬虫爬取某电影排行榜图片实例。
一、要求分析
在上文Python爬虫爬取某电影排行实例中,我们已经能够使用Python程序爬取某电影排行榜中的电影名称。今天,我们来尝试以下下载电影排行榜中的图片。
要想实现这一需求,就必须在上文代码的基础上,即先获得排行榜电影信息,然后提取出电影封面图片的URL,最后将图片下载到本地。
首先,我们可以将Ajax请求中的Json返回结果进行简单的解析,结果如下所示:
注意在返回字典中存在一个cover_id的变量,这个变量经过检查可以发现就是电影封面图片,如下所示:
因此,我们只需要提取上述代码中字典的cover_id值,然后再发起URL请求下载该图片即可。
二、代码实现
接下来,我们就编写代码实现这一需求。编写好的代码如下所示:
import requests
import os
if not os.path.exists("./img"):
os.mkdir('./img')
url="https://movie.douban.com/j/chart/top_list"
get_param={
"type":"22","interval_id":"100:90","action":"","start":"0","limit":"10"
}
UA={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
response=requests.get(url=url,params=get_param,headers=UA)
out_put=response.json()
for out in out_put:
img_url=out["cover_url"]
img_name="./img/"+out["title"]+".jpg"
img_data=requests.get(url=img_url,headers=UA).content
with open(img_name,"wb") as fp:
fp.write(img_data)
print("The picture has been downloaded!")
在上述代码中,我们涉及到了图片的下载操作。如果我们在使用requests方法下载的内容是一张图片,那么我们可以用它的content属性来表示这张图片,然后将其写入文件中即可。
上述代码执行后结果如下所示:
原创不易,转载请说明出处:https://blog.csdn.net/weixin_40228200