在Python中防止某些字段被Pickle序列化

news2025/1/24 8:43:52

在Python中,如果你想防止某些字段被pickle序列化,可以使用__reduce__()方法来自定义pickle行为。__reduce__()方法允许你返回一个元组,其中包含要在对象被pickle时调用的函数以及传递给该函数的参数。下面就是我遇到的问题以及最终解决方案。

在这里插入图片描述

1、问题背景

在使用 Python 的 Pickle 模块对对象进行序列化时,我们有时希望排除某些字段,以防止其被序列化。这可能是由于这些字段包含敏感信息,或者只是因为它们是临时变量,不应被持久化。

2、解决方案

有几种方法可以防止某些字段被 Pickle 序列化。

  1. 使用 __getstate____setstate__ 方法

__getstate____setstate__ 是 Python 内置的特殊方法,可以让我们自定义对象的序列化和反序列化行为。我们可以通过重写这些方法来控制哪些字段被序列化。

class Something(object):
    def __init__(self):
        self._thing_id = 0
        self._cached_thing = None

    def __getstate__(self):
        # 只序列化 `_thing_id` 字段
        return {'_thing_id': self._thing_id}

    def __setstate__(self, state):
        # 从 `state` 中恢复 `_thing_id` 字段
        self._thing_id = state['_thing_id']
  1. 使用 __getnewargs____getnewargs_ex__ 方法

__getnewargs____getnewargs_ex__ 是 Python 内置的特殊方法,可以让我们在序列化对象时传递自定义参数。我们可以通过重写这些方法来控制哪些字段被序列化。

class Something(object):
    def __init__(self, thing_id):
        self._thing_id = thing_id
        self._cached_thing = None

    def __getnewargs__(self):
        # 只传递 `_thing_id` 参数
        return (self._thing_id,)

    def __getnewargs_ex__(self):
        # 只传递 `_thing_id` 参数
        return (self._thing_id,), {}
  1. 使用 __reduce__ 方法

__reduce__ 是 Python 内置的特殊方法,可以让我们自定义对象的序列化行为。我们可以通过重写这个方法来控制哪些字段被序列化。

class Something(object):
    def __init__(self, thing_id):
        self._thing_id = thing_id
        self._cached_thing = None

    def __reduce__(self):
        # 只返回 `_thing_id` 参数
        return (self.__class__, (self._thing_id,), {})
  1. 使用 _blacklist 变量

我们可以使用 _blacklist 变量来指定哪些字段不应被序列化。在 __getstate__ 方法中,我们可以使用这个变量来过滤掉不需要序列化的字段。

class Something(object):
    def __init__(self, thing_id):
        self._thing_id = thing_id
        self._cached_thing = None

    # 黑名单
    _blacklist = ['_cached_thing']

    def __getstate__(self):
        # 只序列化除 `_blacklist` 中的字段以外的所有字段
        return {k: v for k, v in self.__dict__.items() if k not in self._blacklist}
  1. 使用命名约定

为了避免在每个类中都指定 _blacklist 变量,我们可以使用命名约定来标记哪些字段不应被序列化。例如,我们可以将不应被序列化的字段命名为 _cached_xxx。这样,我们在 __getstate__ 方法中就可以直接过滤掉所有以 _cached_xxx 开头的字段。

class Something(object):
    def __init__(self, thing_id):
        self._thing_id = thing_id
        self._cached_thing = None

    def __getstate__(self):
        # 只序列化除了以下列 "_cached_" 开头的字段之外的所有字段
        return {k: v for k, v in self.__dict__.items() if not k.startswith('_cached_')}

在这个示例中,MyClass类有两个字段:sensitive_datanon_sensitive_data。我们通过定义__reduce__()方法来指定pickle时应该调用的函数。在这个函数中,我们只传递了non_sensitive_data字段,而忽略了self.sensitive_data字段,从而防止了敏感数据被pickle序列化。

我们可以根据实际需求自定义__reduce__()方法来选择哪些字段需要被pickle序列化,哪些字段不需要。

如果有任何问题可以留言讨论交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1681267.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

银行风险系统的全面解析:功能作用与系统间的互联互通

银行风险管理系统是银行为控制风险而建立的一套重要系统,主要用于评估、监测和控制银行面临的各种风险,包括信用风险、市场风险、操作风险等。 一、主要功能 风险识别:系统首先识别在业务开展中可能会面临的各种风险。这通常涉及对客户信息、…

JSP+SQL学生成绩管理系统

Java版本:1.8 数据库:MySQL 框架:Spring Spring MVC MyBatis 服务器:Tomcat 前端解析框架:Thymeleaf 开发工具:Idea 2017 版本管理工具:Maven 版本控制工具:GitHub 经过对系统的需…

STM32HAL库-中断篇

中断 中断简介 中断是一种事件处理机制,可以暂停主程序的运行,转而处理特定事件程序。 中断的作用和意义: 实时控制 在确定事件内对响应事件做出相应 故障处理 检测到故障需要第一时间处理 数据传输 如串口通信,不确定数…

基于springboot+vue+Mysql的交流互动系统

开发语言:Java框架:springbootJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包:…

程序员的实用神器之——通义灵码

通义灵码介绍 “通义灵码”是一款基于阿里云通义代码大模型打造的智能编码助手,产品于2023年10月31日云栖大会上,正式对外发布。新手亦能驾轻,老手恒常运,唯手熟尔。 通义灵码产品介绍_智能编码助手_AI编程_云效(Apsara Devops)…

测试图像中的环与透镜效果。

我做了三张图片,发现我之前提出的环与带居然都存在。 这个图片的环不明显,需要放大才能看得出来,但是透镜效果,这里只能称之为带了。 这张图的环比较清晰,因为我做了更小的缩放。 制作环和带的过程是需要抗干扰&#…

Spring Boot 自动配置-响应式编程-022

🤗 ApiHug {Postman|Swagger|Api...} = 快↑ 准√ 省↓ GitHub - apihug/apihug.com: All abou the Apihug apihug.com: 有爱,有温度,有质量,有信任ApiHug - API design Copilot - IntelliJ IDEs Plugin | Marketplace The Next Generation API Development Platform…

【Unity-Timeline进度条显示与拖动】

利用Unity 自带的Timeline 可轻松实现场景的巡检漫游效果, 基本使用参考以下链接: Unity中的Timeline Unity学习笔记——TimeLine的简单使用方法(一) 这里主要介绍如何通过滑动条控制播放的进度,效果图附上。 话不多说&#xff…

上海亚商投顾:沪指低开低走 两市成交额跌破8000亿

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 市场全天震荡走低,三大股指尾盘均跌近1%。地产股逆势走强,光大嘉宝、天地源、云南城投…

数据库-索引(高级篇)

文章目录 索引概念?索引演示?索引的优劣?为什么使用索引就快?本篇小结 更多相关内容可查看 索引概念? 索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统…

分布式与一致性协议之PBFT算法(一)

PBFT算法 概述 前面提到了拜占庭将军问题之后,有人可能会感到困惑:口信消息型拜占庭问题直接在实际项目中是如何落地的呢?事实上,它很难在实际项目中落地,因为口信消息型拜占庭问题之解是一个非常理论化的算法,没有与…

宝塔助手是以宝塔Linux面板提供的API开发的一款可以随时随地管理服务器的APP

【软件介绍】手机操控云服务器的神器软件,本人亲测在用,好用极了! 【软件名称】宝塔助手 【软件包名】com.lensyn.zsbt 【软件版本】1.4.1 【软件大小】29.00M 【适用系统】安卓 【软件特色】宝塔助手是以宝塔Linux面板提供的API开发的一款可…

Unity 2021 升级至团结引擎

UnityWebRequest 报错 InvalidOperationException: Insecure connection not allowed 解决方法 不兼容jdk 8 需要安装 JDK11 64bit 必须JDK 11,高版本也不行 安卓环境hub 未给我安装完全。 Data\PlaybackEngines\AndroidPlayer 并没有NDK,SDK。但是 HUB 显示已经…

Maven 依赖排查

先从项目去看显而易见,假如我们有一个项目,父工程中包含一些子工程,如下: 我们想看一下samples-account中的依赖关系,那么我们可以打开 samples-account的pom文件,查看其maven依赖关系图。 我们可以看到此项…

【算法】基础算法005之位运算

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》《算法》 🌝每一个不曾起舞的日子,都是对生命的辜负 1.基础位运算 &:…

计算机丢失concrt140.dl是什么意思,concrt140.dll丢失的8个修复方法

concrt140.dll是一个核心的系统文件,属于Microsoft Visual C 2015 Redistributable组件集的一部分,其全称为并发运行时库(Concurrency Runtime)。此动态链接库(DLL)文件在Windows操作系统中扮演着至关重要的…

iOS plist文件增删改查

一. plist简介 plist文件,即属性列表文件,全名是Property List,这种文件的扩展名为.plist,因此,通常被叫做plist文件。它是一种用来存储串行化后的对象的文件,在iOS开发中通常用来存储用户设置&#xff0c…

【Mac】Dreamweaver 2021 for mac v21.3 Rid中文版安装教程

软件介绍 Dreamweaver是Adobe公司开发的一款专业网页设计与前端开发软件。它集成了所见即所得(WYSIWYG)编辑器和代码编辑器,可以帮助开发者快速创建和编辑网页。Dreamweaver提供了丰富的功能和工具,包括代码提示、语法高亮、代码…

win编写bat脚本启动java服务

新建txt,编写,前台启动,出现cmd黑窗口 echo off start java -jar zhoao1.jar start java -jar zhoao2.jar pause完成后,重命名.bat 1、后台启动,不出现cmd黑窗口,app是窗口名称 echo off start "名…

视觉叙事的艺术:StoryDiffusion打造一致性图像/视频故事创作

论文:https://arxiv.org/pdf/2405.01434 主页:StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation 一、摘要总结 本文提出了一种名为StoryDiffusion的新方法,用于生成一系列内容一致的图像和视频&#…