python-(6-3-3)爬虫---requests入门(对参数封装)

news2024/11/26 0:36:09

文章目录

  • 一 需求
  • 二 分析
  • 三 代码
  • 四 补充说明

一 需求

爬取豆瓣电影的“纪录片”的电影信息数据

二 分析

老规矩,先在网页的“检查”中提取我们需要的信息

如下图所示。在“纪录片”那一页面,选择"network"----“XHR”----“preview”。
我们需要在3个文件中选择,罗列出如图页面电影数据的那个文件。

在这里插入图片描述
通过点开1-19数字前面的三角形,我们可以查看到每部电影的具体信息,这就是我们要爬取的数据内容。

然后从“preview"切换到”headers",可以得到URL与访问网站请求的方式get,于是明白了在下面的代码中应该是requests.get()

在这里插入图片描述

不难发现,在代码中赋值给URL变量的内容显得十分冗长(问号后面的内容都是参数),一方面笔者希望将其缩短;
另一方面,由于把网页下拉,会出现新的电影信息,我们为了获取更多更新的电影数据,也需要通过修改参数的方式,从而爬取新的数据。

所以我们将页面下拉,找到其他代码编写时需要的信息。

在这里插入图片描述

提前剧透一下,由于网站设立了反爬机制,所以我们需要User-Agent进行伪装。

而最下面的一系列参数就是我们需要的信息。

另外,这些参数会以字典的形式体现,因此需要将其全部加上双引号括起来,所以要在pycharm中如下图设置。将圈中的内容打勾后(意思是,单引号或双引号会悬浮环绕在周围),我们将某一段字符选中,直接打出双引号或者单引号符号,就可以为该段字符加上单引号或双引号。

在这里插入图片描述

三 代码

import requests

# 找到的url
url = "https://movie.douban.com/j/chart/top_list"

# 要封装的参数
# 原本url的问号后面的都是参数,我们将这部分内容封装成下面的参数
param = {
    "type": "1",
    "interval_id": "100:90",
    "action": "",
    "start": "0",
    "limit": "20"
}

# 伪装成正常浏览器用户访问
headers = {
    "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Mobile Safari/537.36"
}

# 发送的get请求,封装参数,并伪装成浏览器
response = requests.get(url=url,params=param,headers=headers)

# 将服务器返回的数据直接返回成json格式
print(response.json())

# 关闭访问的链接,防止以后访问其他网页报错
response.close()

四 补充说明

当我们把网页内容往下拉取,希望看到更多的电影资源时,我们代码中封装的参数会发生改变。经过对比,只有start变化。所以如果想看到更多的电影信息,只需要改变start后面的值即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/4430.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【附源码】Python计算机毕业设计面向社区的购物平台系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

java计算机毕业设计ssm+vue网络考试信息网站

项目介绍 对网络考试系统进行了介绍,包括研究的现状,还有涉及的开发背景,然后还对系统的设计目标进行了论述,还有系统的需求,以及整个的设计方案,对系统的设计以及实现,也都论述的比较细致&…

五大模型看深度学习用于时序预测的最新进展

引言 在以往的时序预测中,大部分使用的是基于统计和机器学习的一些方法。然而,由于深度学习在时间序列的预测中表现并不是很好,且部分论文表述,在训练时间方面,用 Transformer、Informer 、Logtrace 等模型来做时间序…

ESP32 入门笔记06: FreeRTOS+《两只老虎》 (ESP32 for Arduino IDE)

ESP32FreeRTOS Esp32 模块中已经提供了 FreeRTOS(实时操作系统)固件。 FreeRTOS有助于提高系统性能和管理模块的资源。FreeRTOS允许用户处理多项任务,如测量传感器读数,发出网络请求,控制电机速度等,所有…

旅游推荐系统

摘要 随着社会的发展,人们生活水平的提高,旅游逐渐成为人们生活中的重要活动,2019年国内旅游人数超过60亿人次。并且,旅游业已经成为了我国经济发展的一个重要支柱,近年来我国旅游业对GDP贡献值呈上升趋势。2019年&am…

【附源码】计算机毕业设计java装修服务分析系统设计与实现

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

【数据结构】链表OJ特别篇 —— 面试情景带你深度剖析 环形链表系列问题 复制带随机指针的链表

文章目录0. 前言1. 环形链表2. 环形链表延伸问题3. 环形链表 II4. 复制带随机指针的链表5. 结语0. 前言 Hello,大家好,我是anduin。这期的内容依然是链表OJ。但与前两期不同的是,这次我会模拟面试的情景,由浅入深,以生…

冶金行业数字化供应链管理系统:赋能企业端到端供应链优化,推动行业数字化变革

作为国之重器,冶金行业在国家大基建战略的支持下,迎来了新一轮的发展良机,然而冶金行业整体产能过剩、对于产业链下游依赖严重等情况依然突出,机遇与挑战并存,在此环境下,如何在激烈的竞争中提升企业自身竞…

多对一和一对多的处理P21,P22

多对一: 按照查询嵌套处理: StudentMapper:(接口很简单需要返回一个List) package com.Li.dao;import com.Li.pojo.Student; import org.apache.ibatis.annotations.Select;import java.util.List;public interface …

无人机和热成像

当它变得可见时,看不见的世界是一个令人惊叹的景象。 热成像就是这样,透过使用专门的摄影机和技术,使看不见的红外光谱可见。 我们周围那个无形的世界隐藏着什么,这是一个完整的隐藏世界。 图片来源:Keith Davis/热成像…

腾讯面试真题 | 没在我八股文列表里。。。

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…

零基础自学javase黑马课程第十天

零基础自学javase黑马课程第十天 ✨欢迎关注🖱点赞🎀收藏⭐留言✒ 🔮本文由京与旧铺原创,csdn首发! 😘系列专栏:java学习 💻首发时间:🎞2022年11月1日&#x…

【MySQL】深入理解MySQL索引优化器工作原理

本文导读 本文将解读MySQL数据库查询优化器(CBO)的工作原理。简单介绍了MySQL Server的组成,MySQL优化器选择索引额原理以及SQL成本分析,最后通过 select 查询总结整个查询过程。 一、MySQL 优化器是如何选择索引的 下面我们来…

2022年最新浙江建筑特种工(施工升降机)真题题库及答案

百分百题库提供特种工(施工升降机)考试试题、特种工(施工升降机)考试预测题、特种工(施工升降机)考试真题、特种工(施工升降机)证考试题库等,提供在线做题刷题,在线模拟考…

web前端期末大作业——基于html+css+javascript学生宿舍管理系统网站

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

双十一到了,当我用Python采集了电商平台所有商品后发现....

Python采集电商平台写在前面环境及模块案例实现思路代码展示效果展示最后写在前面 这不是双十一快到了,为了以最优惠的价格买到自己想买的商品,我不惜用Python把ya ma xun 所有商品撸了一遍。 环境及模块 使用环境 python 3.8 pycharm 2021 模块及安…

重磅发布 | 更快、更强的 .NET 7

.NET Conf 2022在11⽉8⽇11点正式开始了,为期三天的会议(11⽉8-10⽇),围绕 .NET 7 展开。相信各位⼩伙伴都已经开始安装 .NET 7 正式版本以及相关的开发⼯具。这次 .NET 7 围绕传统的 C#,ASP.NET Core, Blazor, .NET M…

如何用python给女神写一封照片情书?亲测表白率100%~

嗨害大家好鸭!我是小熊猫❤ 咳咳…大家都问我 是怎么追到我女神的, 斗胆来分享一下俺的小教程💨 实现步骤 想要实现把情书写在像素中, 那么我们就需要用到pillow这个神器。 众所周知,图片是由无数个像素所组成的&…

【Spring Boot项目】个人在线音乐播放器

文章目录项目简介数据库表的设计拦截器及返回数据格式注册功能登陆功能音乐列表相关业务查询功能上传音乐播放音乐收藏音乐删除功能删除单个音乐批量删除音乐收藏列表查询收藏的音乐取消收藏注销功能项目简介 本项目主要是实现了在线播放音乐的功能,用户可以随时登…

[RCTF 2019]Nextphp

知识点;利用 FFI 绕过 disable_functionFFI 介绍与利用 首先 FFI 肯定要开,且 PHP 版本肯定要早 7.4 以上 简介: FFI ,可以让我们直接在PHP脚本中调用C语言写的库中的函数。 FFI 的安全性问题 FFI虽然给了我们很大的灵活性&am…