Python复合型数据避坑指南

news2024/9/21 4:29:45

目录

前言

列表(Lists)

 1. 修改可变对象

 2. 浅拷贝和深拷贝

元组(Tuples)

集合(Sets)

字典(Dictionaries)

 1. 键值唯一性

 2. 键的类型

实际应用场景

 1. 数据分析与清洗

 2. 网络爬虫与数据提取

 3. 软件开发与数据结构设计

 4. 数据库操作与ORM框架

总结


前言

在Python中,复合型数据(例如列表、元组、集合和字典)是非常常用的数据类型,它们可以以结构化的方式组织和操作数据。然而,由于其灵活性和特性,使用复合型数据时常常容易出现一些陷阱和问题。本指南将深入探讨Python复合型数据的常见陷阱,并提供一些避免这些问题的实用建议和技巧,以帮助更好地利用Python的复合型数据。

列表(Lists)

 1. 修改可变对象

列表是可变的数据类型,因此在对列表中的可变对象(如列表、字典等)进行操作时要格外小心。在修改列表中的可变对象时,很容易影响到原始列表。

# 修改可变对象会影响原始列表
original_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
modified_list = original_list
modified_list[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

 2. 浅拷贝和深拷贝

当需要复制列表时,应该了解浅拷贝和深拷贝的区别。浅拷贝只会复制列表的顶层元素,而深拷贝会递归复制所有嵌套的对象。

import copy

original_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

# 浅拷贝
shallow_copy = copy.copy(original_list)
shallow_copy[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

# 深拷贝
deep_copy = copy.deepcopy(original_list)
deep_copy[0][0] = 1000
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

元组(Tuples)

元组是不可变的数据类型,因此不能对其进行修改。但需要注意,如果元组中包含可变对象,则可变对象的内容是可以被修改的。

# 元组中包含可变对象
tuple_with_list = ([1, 2, 3], [4, 5, 6])
tuple_with_list[0][0] = 100
print(tuple_with_list)  # 输出: ([100, 2, 3], [4, 5, 6])

集合(Sets)

集合是一种无序且不重复的数据类型,常用于去重和集合运算。然而,由于其不可索引的特性,有时可能会导致意外的结果。

# 集合不支持索引
my_set = {1, 2, 3}
print(my_set[0])  # 报错: 'set' object is not subscriptable

字典(Dictionaries)

 1. 键值唯一性

字典的键必须是唯一的,如果尝试使用相同的键来添加新的键值对,则会覆盖原有的键值对。

my_dict = {'a': 1, 'b': 2}
my_dict['a'] = 100
print(my_dict)  # 输出: {'a': 100, 'b': 2}

 2. 键的类型

字典的键可以是不可变的数据类型,如字符串、整数、元组等,但不能是可变的数据类型,如列表、集合、字典等。

# 字典的键不能是列表
my_dict = {[1, 2]: 'value'}  # 报错: unhashable type: 'list'

实际应用场景

复合型数据在Python中有着广泛的应用,从数据分析到软件开发,都可以见到它们的身影。通过一些实际的应用场景来进一步了解如何在实践中避免坑并正确地使用复合型数据。

 1. 数据分析与清洗

在数据分析中,经常需要处理来自各种数据源的复合型数据,比如JSON格式的数据、嵌套的字典和列表等。

下面是一个简单的示例,演示了如何从JSON文件中读取数据,并进行清洗和处理。

import json

# 读取JSON文件
with open('data.json', 'r') as f:
    data = json.load(f)

# 提取数据并清洗
cleaned_data = []
for item in data:
    if 'name' in item and 'age' in item:
        cleaned_data.append({'name': item['name'], 'age': item['age']})

# 打印清洗后的数据
print(cleaned_data)

在这个示例中,首先读取了一个JSON文件,然后遍历数据并进行了清洗,只保留了包含'name'和'age'字段的数据。

 2. 网络爬虫与数据提取

在网络爬虫开发中,经常需要处理HTML页面中的复合型数据,比如提取表格数据、链接和文本内容等。

看一个示例,演示如何使用BeautifulSoup库从网页中提取表格数据。

from bs4 import BeautifulSoup
import requests

# 发送HTTP请求获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')

# 提取表格数据
table = soup.find('table')
if table:
    rows = table.find_all('tr')
    data = []
    for row in rows:
        cells = row.find_all('td')
        if cells:
            row_data = [cell.text.strip() for cell in cells]
            data.append(row_data)

# 打印提取的表格数据
print(data)

在这个示例中,使用了requests库发送HTTP请求获取网页内容,然后使用BeautifulSoup库解析HTML内容,并提取了表格数据。

 3. 软件开发与数据结构设计

在软件开发中,合理设计和使用复合型数据结构可以提高代码的可读性、可维护性和性能。

看一个示例,演示如何设计一个简单的数据结构来表示学生信息。

class Student:
    def __init__(self, name, age, courses):
        self.name = name
        self.age = age
        self.courses = courses

    def __repr__(self):
        return f"Student(name={self.name}, age={self.age}, courses={self.courses})"

# 创建学生对象
student1 = Student('Alice', 20, ['Math', 'Physics', 'Chemistry'])
student2 = Student('Bob', 22, ['History', 'Literature', 'Geography'])

# 打印学生信息
print(student1)
print(student2)

在这个示例中,定义了一个Student类来表示学生信息,包括姓名、年龄和所修课程。然后,创建了两个学生对象,并打印它们的信息。

 4. 数据库操作与ORM框架

在数据库操作和使用ORM(对象关系映射)框架时,也经常需要处理复合型数据,比如查询结果集、模型对象和关联数据等。

下面是一个简单的示例,演示了如何使用SQLAlchemy ORM框架来定义模型和查询数据。

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

# 创建数据库引擎和会话
engine = create_engine('sqlite:///:memory:')
Base = declarative_base()
Session = sessionmaker(bind=engine)
session = Session()

# 定义模型类
class Product(Base):
    __tablename__ = 'products'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    price = Column(Integer)

# 创建数据表
Base.metadata.create_all(engine)

# 创建产品对象并插入数据
product1 = Product(name='Product 1', price=100)
product2 = Product(name='Product 2', price=200)
session.add(product1)
session.add(product2)
session.commit()

# 查询数据
products = session.query(Product).all()

# 打印查询结果
for product in products:
    print(product.name, product.price)

在这个示例中,使用了SQLAlchemy ORM框架来定义一个简单的产品模型,然后创建了两个产品对象并插入数据,最后查询了所有产品数据并打印出来。

总结

本文介绍了在使用Python复合型数据时常见的陷阱和问题,并提供了一些避免这些问题的实用建议和技巧。通过深入了解列表、元组、集合和字典的特性,以及如何正确地使用它们,可以更好地利用Python的复合型数据,编写出更加健壮和高效的代码。希望本文能够帮助大家避免在使用复合型数据时遇到的常见问题,并提高Python编程的水平和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1481805.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信小程序云开发教程——墨刀原型工具入门(安装以及基础使用教程)

引言 作为一个小白,小北要怎么在短时间内快速学会微信小程序原型设计? “时间紧,任务重”,这意味着学习时必须把握微信小程序原型设计中的重点、难点,而非面面俱到。 要在短时间内理解、掌握一个工具的使用&#xf…

Hgame题解(第二星期)

Hgame题解(第二星期) Web Select More Courses 打开靶机发现是一个登陆页面,根据题目提示下载弱密码字典,通过BP爆破获得用户密码为qwert123 登陆后进入下一个页面,由于学分已满无法选课,所以需要先进行…

仿牛客网项目---显示评论和添加评论功能的实现

这篇文章,我来介绍一下我的项目中的另外一个功能:显示评论和添加评论。 其实这两个功能都不怎么重要,我感觉最重要的应该是用户注册登录功能,这个也了解一下,知道这么一回事儿就好。 首先设计DAO层。 Mapper public …

【刷题】Leetcode 1609.奇偶树

Leetcode 1609.奇偶树 题目描述广度优先搜索(BFS)深度优先算法(DFS) 思路一(BFS)思路二(DFS)Thanks♪(・ω・)ノ谢谢阅读!!&a…

配置之道:深入研究Netty中的Option选项

欢迎来到我的博客,代码的世界里,每一行都是一个故事 配置之道:深入研究Netty中的Option选项 前言Option的基础概念ChannelOption与Bootstrap Option常见的ChannelOption类型ChannelConfig的使用Option的生命周期不同传输协议的Option 前言 在…

【MySQL】MySQL复合查询--多表查询自连接子查询 - 副本

文章目录 1.基本查询回顾2.多表查询3.自连接4.子查询 4.1单行子查询4.2多行子查询4.3多列子查询4.4在from子句中使用子查询4.5合并查询 4.5.1 union4.5.2 union all 1.基本查询回顾 表的内容如下: mysql> select * from emp; ----------------------------…

Java——建造者模式(Builder)

建造者模式(Builder) 1、建造者模式的定义 将一个复杂对象的构建与它的表示分离,使得同样的构建过程可以创建不同的表示。 Builder模式是一步一步创建一个复杂对象的创建型模式,它允许使用者在不知道内部建造细节的情况下&…

vue3的router

需求 路由组件一般放在&#xff0c;pages或views文件夹, 一般组件通常放在component文件夹 路由的2中写法 子路由 其实就是在News组件里面&#xff0c;再定义一个router-view组件 他的子组件&#xff0c;机会渲染在router-view区域 路由传参 <RouterLink :to"/news…

Charles抓包 - 安装、激活、证书配置

最近刚好又遇到了抓包的需求&#xff0c;之前一直使用 Fiddler 抓包&#xff0c;这几年一直听大家都在用 Charles 抓包&#xff0c;正好一起了解下&#xff08;一般建议掌握一种抓包方式即可&#xff0c;都可以解决同种需求场景&#xff09; 抓包 Fiddler抓包 Charles 下载、安…

Day08:基础入门-算法分析传输加密数据格式密文存储代码混淆逆向保护

目录 传输数据-编码型&加密型等 传输格式-常规&JSON&XML等 密码存储-Web&系统&三方应用 代码混淆-源代码加密&逆向保护 思维导图 章节知识点&#xff1a; 应用架构&#xff1a;Web/APP/云应用/三方服务/负载均衡等 安全产品&#xff1a;CDN/WAF/I…

HotFix原理学习

原文链接&#xff1a;Unity 游戏用XLua的HotFix实现热更原理揭秘-CSDN博客 本文通过对XLua的HoxFix使用原理的研究揭示出来这样的一套方法。这个方法的 第一步&#xff1a;通过对C#的类与函数设置Hotfix标签。来标识需要支持热更的类和函数。第二步&#xff1a;生成函数连接器…

94. 递归实现排列型枚举 刷题笔记

思路 依次枚举 每个位置用哪个数字 要求按照字典序最小来输出 而每次搜索下一层时i都是从1开始 也就是说 如果有小的数可以填上 那么该方案会填上这个数字 例如 当n等于3 第一次搜索 1 2 3输出后返回 返回后此时i3 第二个位置填3 1 3 2 输出后返回 此时返回到第一层…

tkinterFrame框架+标签框架LabelFrame+Toplevel窗口的使用

1.在tkinter中&#xff0c;Frame是一个容器小部件用于组织和管理其他小部件。它可以作为一个独立的可见区域&#xff0c;也可以作为其他小部件的父容器。 import tkinter as tk import tkinter.ttk as ttk import tkinter.messagebox as mbm tk.Tk() m.title("tkinter L…

C 嵌入式系统设计模式 16:循环执行模式

本书的原著为&#xff1a;《Design Patterns for Embedded Systems in C ——An Embedded Software Engineering Toolkit 》&#xff0c;讲解的是嵌入式系统设计模式&#xff0c;是一本不可多得的好书。 本系列描述我对书中内容的理解。本文章描述嵌入式并发和资源管理模式之二…

Linux进程管理:(二)进程调度原语

文章说明&#xff1a; Linux内核版本&#xff1a;5.0 架构&#xff1a;ARM64 参考资料及图片来源&#xff1a;《奔跑吧Linux内核》 Linux 5.0内核源码注释仓库地址&#xff1a; zhangzihengya/LinuxSourceCode_v5.0_study (github.com) 进程调度的概念比较简单&#xff0c…

倒模专用制作耳机壳UV树脂:改性丙烯酸树脂

倒模专用制作耳机壳的UV树脂是经过改性的丙烯酸树脂&#xff0c;具有高透明度、高粘度、快速固化的特点。这种树脂可以通过紫外线光固化&#xff0c;快速形成坚硬的表面&#xff0c;并且具有较高的硬度和耐磨性&#xff0c;因此非常适合用于制作耳机壳。 此外&#xff0c;改性丙…

面试经典 150 题 ---- 轮转数组

面试经典 150 题 ---- 轮转数组 轮转数组方法一&#xff1a;使用额外的数组方法二&#xff1a;数组翻转 轮转数组 方法一&#xff1a;使用额外的数组 我们可以使用额外的数组来将每个元素放至正确的位置。用 n 表示数组的长度&#xff0c;我们遍历原数组&#xff0c;将原数组…

Java SE:多线程(Thread)

1. 线程两个基本概念 并发&#xff1a;即线程交替运行多个指令并行&#xff1a;即多个线程同时运行指令 并发并行不矛盾&#xff0c;两者可同时发生&#xff0c;即多个线程交替运行指令 2. 多线程3种实现方式 2.1 直接创建线程对象 /*** 方式1&#xff1a;* 1. 创建thread类的…

MySQL表分区技术介绍

目录 1. 分区概述 1.1 表分区 1.2 表分区与分表的区别 1.3 表分区的好处 1.4 分区表的限制因素 2. 如何判断当前MySQL是否支持分区&#xff1f; 3. 分区类型详解 3.1 MySQL支持分区类型 3.2 RANGE分区 3.2.1 根据数值范围分区 3.2.2 根据TIMESTAMP范围分区 3.2.3 根…

鸿蒙Harmony应用开发—ArkTS声明式开发(点击事件)

组件被点击时触发的事件。 说明&#xff1a; 从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。 onClick onClick(event: (event: ClickEvent) > void) 点击动作触发该回调。 卡片能力&#xff1a; 从API version 9开始…