【Python_Scrapy学习笔记(十一)】基于Scrapy框架的下载器中间件添加Cookie参数

news2024/11/15 17:29:46

基于Scrapy框架的下载器中间件添加Cookie参数

前言

本文中介绍 如何基于 Scrapy 框架的下载器中间件添加 Cookie 参数。

正文

1、添加中间件的流程

  1. 在 middlewares.py 中新建 Cookie参数 中间件类
  2. 在 settings.py 中添加此下载器中间件,设置优先级并开启

2、基于Scrapy框架的下载器中间件添加Cookie参数的流程

  1. 在 middlewares.py 中新建 Cookie参数 中间件类

    # 中间件3:Cookie
    class BaiduCookieDownloaderMiddleware(object):
        def process_request(self, request, spider):
            # 1、先抓包得到cookie
            cookie_dict = self.get_cookie()
            request.cookies = cookie_dict
            print(cookie_dict)
    
        def get_cookie(self):
            cookie_string = 'xxx:xxx'
            cookie_dict = {}
            for kv in cookie_string.split(";"):
                k = kv.split('=')[0]
                v = kv.split('=')[1]
                cookie_dict[k] = v
            return cookie_dict
    

    注意1:Cookies 参数需要通过 F12 抓包得到;
    注意2:要写一个函数,将 Cookies 字符串格式 处理为字典格式。

        def get_cookie(self):
            cookie_string = ''
            cookie_dict = {}
            for kv in cookie_string.split(";"):
                k = kv.split('=')[0]
                v = kv.split('=')[1]
                cookie_dict[k] = v
            return cookie_dict
    
  2. 在 settings.py 中添加此下载器中间件,设置优先级并开启

    # Enable or disable downloader middlewares
    # See https://docs.scrapy.org/en/latest/topics/downloader-middleware.html
    # 开启中间件
    DOWNLOADER_MIDDLEWARES = {
        "BaiduMiddle.middlewares.BaidumiddleDownloaderMiddleware": 543,
        "BaiduMiddle.middlewares.BaiduCookieDownloaderMiddleware": 400
    }
    
  3. 运行效果
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/442915.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++初阶】命名空间 namespace

一.前言 在正式进入C前,我们需要先了解了解C。顾名思义,C是基于C的一种编程语言,相较于C,C写出来的代码更简洁,有时候C需要几百行代码,而C只需要几十行就可以解决,C也很好的解决了C中存在的一些…

【夜莺监控搭建】

夜莺监控搭建V6版本 v6版本系统架构安装部署安装时序数据库安装mysql、redis和n9e(夜莺主程序)安装categraf 登录平台如何修改密码添加数据源 官网: https://flashcat.cloud/ GitHub项目地址: https://github.com/ccfos/nightin…

Mongo集群化部署+高可用架构

数据库开发系列 文章目录 数据库开发系列前言一、MongoDB存储引擎二、MongoDB 复制(副本集)三、为什么需要分片集群架构四、高可用分片集群架构(复制集)总结 前言 数据库的演进 随着计算机的发展,越来越多的数据需要被…

python+vue 服装穿搭信息管理系统

本系统采用自上往下的方法开发,基本定位如下功能: 本课题要求实现一套服装信息管理系统的设计与实现,系统主要包括管理员模块和用户模块功能模块。 由于本系统需要在不同设备上都能运行,而且电脑配置要求也要越低越好&#xff0c…

SpringMVC框架详解(学习总结)

目录 什么是MVC SpringMVC概述 SpringMVC常见开发方式 SpringMVC执行流程 SpringMVC核心组件介绍 快速构建Spring MVC程序 SpringMVC参数绑定 SpringMVC跳转方式 SpringMVC处理json请求和响应 SpringMVC静态资源处理 SpringMVC操作session和cookie SpringMVC拦截器 …

基于nuxt3的语雀文档批量导出

语雀文档批量导出 快速访问 Github Blog 项目由来 语雀是一个不错的笔记与文档知识库,但是最近发现他开始割韭菜了, 知识库的公开开始收费,就想着把内容都导出自己来部署,发现并没有批量操作,amazing,…

美国运营商PTCRB认证PTCRB认证怎么做PTCRB认证是什么?

大家好,今天我想和大家分享一下什么是PTCRB认证! PTCRB是指个人通信服务型号认证评估委员会,由北美移动运营商于1997年成立。目前的运营商已经不仅限于北美,而是涵括全球范围内的移动运营商成员。其目的是为包括Cellular GERAN&a…

Session使用和原理分析图与实现原理-- 代码演示说明 Session 的生命周期和读取的机制代码分析

目录 Web 开发会话技术 -Session —session 技术 session 基本原理 Session 可以做什么 如何理解 Session Session 的基本使用 session 底层实现机制 原理分析图 代码演示 CreateSession.java 测试 Session 创的机制, 注意抓包分析​编辑 ReadSession.j…

C盘文件删除怎么做?3个方法教你清理C盘!

案例:C盘文件怎么删除? 【我的电脑使用了一年多了,现在C盘已经快满了,想知道C盘里的文件哪些可以进行删除?感谢!】 C盘是计算机系统盘,存储了操作系统和应用程序等重要文件,因此&a…

机器视觉助力锂电行业升级转型—章鱼博士视控一体化解决方案

摘要: 机器视觉在工业领域中充当了模拟人眼的作用,通过其高效的感知能力、精确的检测准确性、可定制性和较低的人工成本等特点,已逐渐成为工业智能化转型的核心功能。在锂电池领域,机器视觉扮演着许多重要的角色,包括生…

使用Docker部署wikitten个人知识库

使用Docker部署wikitten个人知识库 一、wikitten介绍1.wikitten简介2.wikitten特点 二、本地实践环境介绍三、本地环境检查1.检查Docker服务状态2.检查Docker版本 四、部署wikitten个人知识库1.创建数据目录2.下载wikitten镜像3.创建wikitten容器4.查看wikitten容器状态5.检查w…

【unity实战】随机地下城生成4——小地图的制作(2d,3d通用)(含源码)

原理: 新建一个摄像机,用来查看小地图,我们分个图层只能新建的摄像机才可以拍摄到 如果对摄像机和渲染纹理还不理解的,强烈推荐先看完我的另一篇文章 【Unity游戏开发教程】零基础带你从小白到超神14——灯光、摄像机、天空盒、镜子的制作 新建一个摄像机,记得删除Audio …

关于使用el-input-number设置不让删除为空,让强制为最小值1,以及从1删除,但是发现输入框还是没有最小值的问题

哈喽,大家好啊,最近用到了element的el-input-number 计数器 但是有个问题一直困扰我,就是我发现竟然可以删除输入的值,也不会强制改成最小值 但是因为业务这里不允许数量为空的情况,所以我找了很久,终于实…

JavaSE学习进阶day07_01 Stream流

第二章 Stream流 在Java 8中,得益于Lambda所带来的函数式编程,引入了一个全新的Stream概念,用于解决已有集合类库既有的弊端。 2.1 引言 传统集合的多步遍历代码 几乎所有的集合(如Collection接口或Map接口等)都支…

SpringBoot学习

什么是springBoot 使用了特定的方式来进行配置,从而使开发人员不再需要定义样板化的配置。简而言之,Spring Boot通过提供默认配置的方式整合了所有的框架,让我们可以更加简单、快速、方便地构建应用程序。 并不是对spring的功能增强&#xf…

基于AT89C52单片机的温湿度检测设计

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/87704704 源码获取 主要内容: 设计一套基于51单片机的温湿度Protus仿真监控系统,采用SHT11、DHT11或DS189B20等传感器模块,用LC…

【分享】集简云 x 微步在线丨零代码连接钉钉宜搭与用友U8,让企业数字化升级更轻松

微步在线 • 介绍 微步成立于2015年,是数字时代网络安全技术创新型企业,专注于精准、高效、智能的网络威胁发现和响应,开创并引领中国威胁情报行业的发展,提供“云流量端点”全方位威胁发现和响应产品及服务,帮助客户…

第八章 网络安全基础

网络安全概述 基本概念 网络安全通信的基本属性: 机密性;只有发送方与预定接收方能够理解报文内容消息完整性;发送方和接收方希望确保信息未被篡改,或发生篡改一定会被检测到可访问性与可用性;可访问与可用性是网络信…

mybatis02-核心配置文件、返回主键值、SQL片段、事务处理、动态SQL

Mybatis02 一、mybatis核心配置文件 在主配置config.xml中,定义了很多标签&#xff0c;现在只是使用了一部分标签&#xff0c;主配置文件中可以出现的标签 用dtd文 件进行约束。 1、标签的配置规范&#xff0c;查看dtd规范文件 <?xml version"1.0" encoding&…

centos7.6部署ELK集群(二)之kibana7.7.0集群部署

32.4. 部署kibana7.7.0&#xff08;在主节点上操作&#xff09; 32.3.13. 下载kibana curl -L -O https://artifacts.elastic.co/downloads/kibana/kibana-7.7.0-linux-x86_64.tar.gz 32.3.14. 解压至安装目录 tar –xvf kibana-7.7.0-linux-x86_64.tar.gz -C /vmdata/ 32.…