【Python】第七弹---Python基础进阶:深入字典操作与文件处理技巧

news2025/2/3 5:58:41

个人主页: 熬夜学编程的小林

💗系列专栏: 【C语言详解】 【数据结构详解】【C++详解】【Linux系统编程】【MySQL】【Python】

目录

1、字典

1.1、字典是什么

 1.2、创建字典

1.3、查找 key

1.4、新增/修改元素

1.5、删除元素

1.6、遍历字典元素

1.7、取出所有 key 和 value

1.8、合法的 key 类型

1.9、小结

2、文件

2.1、文件是什么

2.2、文件路径

2.3、文件操作

2.3.1、打开文件

2.3.2、关闭文件

2.3.3、写文件

2.3.4、读文件

 2.4、关于中文的处理

2.5、使用上下文管理器


1、字典

1.1、字典是什么

字典是一种存储 键值对 的结构.

啥是键值对? 这是计算机/生活中一个非常广泛使用的概念.

键(key) 和 值(value) 进行一个一对一的映射, 然后就可以根据键, 快速找到值.

  • 举个栗子, 学校的每个同学, 都会有一个唯一的学号.
  • 知道了学号, 就能确定这个同学.
  • 此处 "学号" 就是 "键", 这个 "同学" 就是 "值".

 
1.2、创建字典

创建一个空的字典. 1、使用 { } 表示字典.  2、使用dict()函数创建字典,适用动态创建情况。

a = {} # 创建一个空字典
b = dict() # 使用函数创建字典
print(type(a))
print(type(b))

  • 也可以在创建的同时指定初始值
  • 键值对之间使用 , 分割, 键和值之间使用 : 分割. (冒号后面推荐加一个空格).
  • 使用 print 来打印字典内容 
student = {'id': 1,'name': 'zhangsan'} # 创建字典并初始化
print(student) # 打印字典数据

  • 为了代码更规范美观, 在创建字典的时候往往会把多个键值对, 分成多行来书写
student = {
    'id': 1,
    'name': 'zhangsan'
} # 创建字典并分行初始化
print(student) # 打印字典数据
  • 最后一个键值对, 后面可以写 , 也可以不写.
student = {
    'id': 1,
    'name': 'zhangsan', # 最后一个键值对加,
} # 创建字典并分行初始化
print(student) # 打印字典数据

1.3、查找 key

使用 in 可以判定 key 是否在 字典 中存在. 返回布尔值.

student = {
    'id': 1,
    'name': 'zhangsan',
}
print('id' in student)    # 判断key值id是否存在
print('score' in student) # 判断key值score是否存在

使用 [ ] 通过类似于取下标的方式, 获取到元素的值. 只不过此处的 "下标" 是 key. (可能是整数, 也可能是字符串等其他类型). 

student = {
    'id': 1,
    'name': 'zhangsan',
}
print(student['id'])   # key值id对应的值
print(student['name']) # key值name对应的值

如果 key 在字典中不存在, 则会抛出异常

student = {
    'id': 1,
    'name': 'zhangsan',
}
print(student['score'])   # key值score对应的值,不存在则抛异常

1.4、新增/修改元素

使用 [ ] 可以根据 key 来新增/修改 value.
如果 key 不存在, 对取下标操作赋值, 即为新增键值对 

student = {
    'id': 1,
    'name': 'zhangsan'
}

print(student)
student['score'] = 90 #key值score不存在则新增键值对
print(student)

如果 key 已经存在, 对取下标操作赋值, 即为修改键值对的值

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

print(student)
student['score'] = 90 # key值已经存在,即对键值对值进行修改
print(student)

1.5、删除元素

使用 pop 方法根据 key 删除对应的键值对

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

print(student)
student.pop('score') # 删除key值为score的键值对
print(student)

1.6、遍历字典元素

直接使用 for 循环能够获取到字典中的所有的 key, 进一步的就可以取出每个值了. 

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

for key in student:
    print(key,student[key])

1.7、取出所有 key 和 value

使用 keys 方法可以获取到字典中的所有的 key 

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

print(student.keys()) # 使用keys获取所有key值

  • 此处 dict_keys 是一个特殊的类型, 专门用来表示字典的所有 key. 大部分元组支持的操作对于dict_keys 同样适用. 

使用 values 方法可以获取到字典中的所有 value

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

print(student.values()) # 使用values获取所有value值

  • 此处 dict_values 也是一个特殊的类型, 和 dict_keys 类似.

 使用 items 方法可以获取到字典中所有的键值对

student = {
    'id': 1,
    'name': 'zhangsan',
    'score': 80
}

print(student.items()) # 使用items获取所有键值对

1.8、合法的 key 类型

不是所有的类型都可以作为字典的 key.
字典本质上是一个 哈希表, 哈希表的 key 要求是 "可哈希的", 也就是可以计算出一个哈希值.

  •  可以使用 hash 函数计算某个对象的哈希值.
  • 但凡能够计算出哈希值的类型, 都可以作为字典的 key. 
print(hash(0)) # 计算hash值
print(hash(3.14))
print(hash('hello'))
print(hash(True))
print(hash(()))

列表无法计算哈希值. 

print(hash([1,2,3])) # 列表不能计算hash值

字典也无法计算哈希值 

print(hash({'id': 1})) # 字典不能计算hash值

1.9、小结

字典也是一个常用的结构. 字典的所有操作都是围绕 key 来展开的.
需要表示 "键值对映射" 这种场景时就可以考虑使用字典. 

2、文件

2.1、文件是什么

变量是把数据保存到内存中. 如果程序重启/主机重启, 内存中的数据就会丢失.
要想能让数据被持久化存储, 就可以把数据存储到硬盘中. 也就是在 文件 中保存.

在 Windows "此电脑" 中, 看到的内容都是 文件.

通过文件的后缀名, 可以看到文件的类型. 常见的文件的类型如下:

  • 文本文件 (txt)
  • 可执行文件 (exe, dll)
  • 图片文件 (jpg, gif)
  • 视频文件 (mp4, mov)
  • office 文件 (.ppt, docx)
  • ......

 我们主要研究最简单的文本文件

2.2、文件路径

一个机器上, 会存在很多文件, 为了让这些文件更方面的被组织, 往往会使用很多的 "文件夹"(也叫做目录)来整理文件.
实际一个文件往往是放在一系列的目录结构之中的.
为了方便确定一个文件所在的位置, 使用 文件路径 来进行描述.

例如, 上述截图中的 QQ.exe 这个文件, 描述这个文件的位置, 就可以使用路径D:\program\qq\Bin\QQ.exe 来表示.

  • D: 表示 盘符. 不区分大小写.
  • 每一个 \ 表示一级目录. 当前 QQ.exe 就是放在 "D 盘下的 program 目录下的 qq 目录下的 Bin 目录中" .
  • 目录之间的分隔符, 可以使用 \ 也可以使用 / . 一般在编写代码的时候使用 / 更方便.

上述以 盘符 开头的路径, 我们也称为 绝对路径.
除了绝对路径之外, 还有一种常见的表示方式是 相对路径. 相对路径需要先指定一个基准目录, 然后
以基准目录为参照点, 间接的找到目标文件. 咱们课堂上暂时不详细介绍.
描述一个文件的位置, 使用 绝对路径相对路径 都是可以的. 对于新手来说, 使用 绝对路径 更简
单更好理解, 也不容易出错.


2.3、文件操作

使用文件, 主要是通过文件来保存数据, 并且在后续把保存的数据读取出来.
但是要想读写文件, 需要先 "打开文件", 读写完毕之后还要 "关闭文件".

2.3.1、打开文件

使用内建函数 open 打开一个文件.

f = open('d:/test.txt', 'r')  # 以读的方式打开文件
  • 第一个参数是一个字符串, 表示要打开的文件路径
  • 第二个参数是一个字符串, 表示打开方式. 其中 r 表示按照读方式打开. w 表示按照写方式打开. a表示追加写方式打开.
  • 如果打开文件成功, 返回一个文件对象. 后续的读写文件操作都是围绕这个文件对象展开.
  • 如果打开文件失败(比如路径指定的文件不存在), 就会抛出异常

2.3.2、关闭文件

使用 close 方法关闭已经打开的文件.

f.close() # 关闭文件
  • 使用完毕的文件要记得及时关闭!

 一个程序能同时打开的文件个数, 是存在上限的.

flist = []
count = 0
while True:
    f = open('d:/test.txt', 'r') # 需要现在d盘路径下创建一个test.txt文件
    flist.append(f) # 尾插文件对象
    count += 1
    print(f'count = {count}')

  • 如上面代码所示, 如果一直循环的打开文件, 而不去关闭的话, 就会出现上述报错.
  • 当一个程序打开的文件个数超过上限, 就会抛出异常.

注意: 上述代码中, 使用一个列表来保存了所有的文件对象. 如果不进行保存, 那么 Python 内置的垃
圾回收机制, 会在文件对象销毁的时候自动关闭文件.
但是由于垃圾回收操作不一定及时, 所以我们写代码仍然要考虑手动关闭, 尽量避免依赖自动关闭.


2.3.3、写文件

文件打开之后, 就可以写文件了.

  • 写文件, 要使用写方式打开, open 第二个参数设为 'w'
  • 使用 write 方法写入文件. 
f = open('d:/test.txt', 'w')  # 以写的方式打开文件
f.write('hello')  # 向文件中写入hello字符串
f.close()  # 关闭文件

  • 用记事本打开文件, 即可看到文件修改后的内容.

 如果是使用 'r' 方式打开文件, 则写入时会抛出异常. 

f = open('d:/test.txt', 'r')  # 以读的方式打开文件
f.write('hello')  # 向文件中写入hello字符串
f.close()  # 关闭文件

使用 'w' 一旦打开文件成功, 就会清空文件原有的数据.
使用 'a' 实现 "追加写", 此时原有内容不变, 写入的内容会存在于之前文件内容的末尾. 

f = open('d:/test.txt', 'w')  # 以写的方式打开文件
f.write('hello')  # 向文件中写入hello字符串
f.close()   # 关闭文件

f = open('d:/test.txt', 'a')  # 以追加的方式打开文件
f.write(' world')   # 向文件中追加写入 world
f.close()  # 关闭文件

针对已经关闭的文件对象进行写操作, 也会抛出异常. 

f = open('d:/test.txt', 'w')
f.write('hello')  # 向文件写入hello字符串
f.close()  # 关闭文件
f.write('world')  # 文件关闭之后写入文件内容抛异常

2.3.4、读文件

读文件内容需要使用 'r' 的方式打开文件
使用 read 方法完成读操作. 参数表示 "读取几个字符" 

  • 注意:读文件之前需要先有该文件

f = open('d:/test.txt', 'r')  # 以读的方式打开文件
result = f.read(2)  # 读取两个字符
print(result)
f.close()   # 关闭文件

  • 如果文件是多行文本, 可以使用 for 循环一次读取一行. 

先构造一个多行文件. 

f = open('d:/test.txt', 'r')
for line in f:
    print(f'line = {line}')  # 以行读取文件
f.close()

注意: 由于文件里每一行末尾都自带换行符, print 打印一行的时候又会默认加上一个换行符, 因此
打印结果看起来之间存在空行.
使用 print(f'line = {line}', end='') 手动把 print 自带的换行符去掉.

f = open('d:/test.txt', 'r')
for line in f:
    print(f'line = {line}', end='')  # 以行读取文件,并手动去掉换行
f.close()

使用 readlines 直接把文件整个内容读取出来, 返回一个列表. 每个元素即为一行. 

f = open('d:/test.txt', 'r')
lines = f.readlines()  # 读取整个文件内容
print(lines)
f.close()

  • 此处的 \n 即为换行符.

 
2.4、关于中文的处理

当文件内容存在中文的时候, 读取文件内容不一定就顺利.
同样上述代码, 有的uu执行时可能会出现异常 

也有的uu可能出现乱码. 

计算机表示中文的时候, 会采取一定的编码方式, 我们称为 "字符集"

  • 所谓 "编码方式" , 本质上就是使用数字表示汉字.
  • 我们知道, 计算机只能表示二进制数据. 要想表示英文字母, 或者汉字, 或者其他文字符号, 就都要通过编码.
  • 最简单的字符编码就是 ascii. 使用一个简单的整数就可以表示英文字母和阿拉伯数字.
  • 但是要想表示汉字, 就需要一个更大的码表.
  • 一般常用的汉字编码方式, 主要是 GBKUTF-8

 
必须要保证文件本身的编码方式, 和 Python 代码中读取文件使用的编码方式匹配, 才能避免出现上述问题.

  • Python3 中默认打开文件的字符集跟随系统, 而 Windows 简体中文版的字符集采用了 GBK, 所以如果文件本身是 GBK 的编码, 直接就能正确处理.
  • 如果文件本身是其他编码(比如 UTF-8), 那么直接打开就可能出现上述问题 

使用记事本打开文本文件, 在 "菜单栏" -> "文件" -> "另存为" 窗口中, 可以看到当前文件的编码方式.

  • 如果此处的编码为 ANSI , 则表示 GBK 编码.
  • 如果此处为 UTF-8  , 则表示 UTF-8 编码. 

此时修改打开文件的代码, 给 open 方法加上 encoding 参数, 显式的指定为和文本相同的字符集, 问题即可解决.

f = open('d:/test.txt', 'r', encoding='utf8')
  • PS: 字符编码问题, 是编程中一类比较常见, 又比较棘手的问题. 需要对于字符编码有一定的理解, 才能从容应对.
  • uu们可以参考腾讯官方账号发表的帖子, 详细介绍了里面的细节.程序员必备:彻底弄懂常见的7种中文字符编码

2.5、使用上下文管理器

打开文件之后, 是容易忘记关闭的. Python 提供了 上下文管理器 , 来帮助程序猿自动关闭文件.

  • 使用 with 语句打开文件.
  • 当 with 内部的代码块执行完毕后, 就会自动调用关闭方法.
with open('d:/test.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    print(lines)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2291115.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在实际开发中,如何正确使用 INT(1) 和 INT(10)

在实际开发中,如何正确使用 INT(1) 和 INT(10) 前言 在数据库设计和开发过程中,数据类型的选择至关重要。 最近,我在工作中遇到了一个关于MySQL中INT类型的误解问题,这让我意识到很多开发者对INT类型的理解存在误区。 本文将深…

像接口契约文档 这种工件,在需求 分析 设计 工作流里面 属于哪一个工作流

οゞ浪漫心情ゞο(20***328) 2016/2/18 10:26:47 请教一下,像接口契约文档 这种工件,在需求 分析 设计 工作流里面 属于哪一个工作流? 潘加宇(35***47) 17:17:28 你这相当于问用例图、序列图属于哪个工作流,看内容。 如果你的&quo…

GAMES101学习笔记(六):Geometry 几何(基本表示方法、曲线与曲面、网格处理)

文章目录 几何的表示方法隐式几何 Implicit Geometry代数曲面(Algebraic surface)构造实体几何CSG(Constructive Solid Geometry)距离函数(Distance Function)水平集方法(Level Set Methods)分型几何(Fractal) 显式几何 Explicit Geometry点云(Point Cloud)多边形网格(Polygon …

【Numpy核心编程攻略:Python数据处理、分析详解与科学计算】1.24 随机宇宙:生成现实世界数据的艺术

1.24 随机宇宙:生成现实世界数据的艺术 目录 #mermaid-svg-vN1An9qZ6t4JUcGa {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-vN1An9qZ6t4JUcGa .error-icon{fill:#552222;}#mermaid-svg-vN1An9qZ6t4JUc…

爬虫基础(三)Session和Cookie讲解

目录 一、前备知识点 (1)静态网页 (2)动态网页 (3)无状态HTTP 二、Session和Cookie 三、Session 四、Cookie (1)维持过程 (2)结构 正式开始说 Sessi…

HTMLCSS :下雪了

这段代码创建了一个动态的雪花飘落加载动画,通过 CSS 技术实现了雪花的下落和消失效果,为页面添加了视觉吸引力和动态感。 大家复制代码时,可能会因格式转换出现错乱,导致样式失效。建议先少量复制代码进行测试,若未能…

【Windows Server实战】生产环境云和NPS快速搭建

前置条件 本文假定你已达成以下前提条件: 有域控DC。有证书服务器(AD CS)。已使用Microsoft Intune或者GPO为客户机申请证书。服务器上至少有两张网卡(如果用虚拟机做的测试环境,可以用一张HostOnly网卡做测试&#…

RHCSA——搭建FTP文件共享服务器

一、实验目的 1、掌握vsftpd服务器的配置方法 2、熟悉FTP客户端工具的使用 3、掌握常见的FTP服务器的故障排除 二、实验项目背景 某企业像架构一台FTP服务器,为企业局域网中的计算机提供文件传送的任务,为财务部门、销售部门和OA系统提供异地数据备…

IM 即时通讯系统-50-[特殊字符]cim(cross IM) 适用于开发者的分布式即时通讯系统

IM 开源系列 IM 即时通讯系统-41-开源 野火IM 专注于即时通讯实时音视频技术,提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…

Python在线编辑器

from flask import Flask, render_template, request, jsonify import sys from io import StringIO import contextlib import subprocess import importlib import threading import time import ast import reapp Flask(__name__)RESTRICTED_PACKAGES {tkinter: 抱歉&…

ZZNUOJ(C/C++)基础练习1041——1050(详解版)

1041 : 数列求和2 题目描述 输入一个整数n&#xff0c;输出数列1-1/31/5-……前n项的和。 输入 输入只有一个整数n。 输出 结果保留2为小数,单独占一行。 样例输入 3 样例输出 0.87注意sum 1相当于sumsum1 注意sum * 1相当于sumsum*1 C语言版 #include<stdio.h> // 包含…

浅析DDOS攻击及防御策略

DDoS&#xff08;分布式拒绝服务&#xff09;攻击是一种通过大量计算机或网络僵尸主机对目标服务器发起大量无效或高流量请求&#xff0c;耗尽其资源&#xff0c;从而导致服务中断的网络攻击方式。这种攻击方式利用了分布式系统的特性&#xff0c;使攻击规模更大、影响范围更广…

深度学习 Pytorch 神经网络的学习

本节将从梯度下降法向外拓展&#xff0c;介绍更常用的优化算法&#xff0c;实现神经网络的学习和迭代。在本节课结束将完整实现一个神经网络训练的全流程。 对于像神经网络这样的复杂模型&#xff0c;可能会有数百个 w w w的存在&#xff0c;同时如果我们使用的是像交叉熵这样…

【回溯】目标和 字母大小全排列

文章目录 494. 目标和解题思路&#xff1a;回溯784. 字母大小写全排列解题思路&#xff1a;回溯 494. 目标和 494. 目标和 给你一个非负整数数组 nums 和一个整数 target 。 向数组中的每个整数前添加 或 - &#xff0c;然后串联起所有整数&#xff0c;可以构造一个 表达式…

Linux系统上安装与配置 MySQL( CentOS 7 )

目录 1. 下载并安装 MySQL 官方 Yum Repository 2. 启动 MySQL 并查看运行状态 3. 找到 root 用户的初始密码 4. 修改 root 用户密码 5. 设置允许远程登录 6. 在云服务器配置 MySQL 端口 7. 关闭防火墙 8. 解决密码错误的问题 前言 在 Linux 服务器上安装并配置 MySQL …

记录一次,PyQT的报错,多线程Udp失效,使用工具如netstat来检查端口使用情况。

1.问题 报错Exception in thread Thread-1: Traceback (most recent call last): File "threading.py", line 932, in _bootstrap_inner File "threading.py", line 870, in run File "main.py", line 456, in udp_recv IndexError: list…

群晖NAS安卓Calibre 个人图书馆

docker 下载镜像johngong/calibre-web&#xff0c;安装之 我是本地的/docker/xxx/metadata目录 映射到 /usr/local/calibre-web/app/cps/metadata_provider CALIBREDB_OTHER_OPTION 删除 CALIBRE_SERVER_USER calibre_server_user 缺省用户名口令 admin admin123 另外有个N…

android主题设置为..DarkActionBar.Bridge时自定义DatePicker选中日期颜色

安卓自定义DatePicker选中日期颜色 背景&#xff1a;解决方案&#xff1a;方案一&#xff1a;方案二&#xff1a;实践效果&#xff1a; 背景&#xff1a; 最近在尝试用原生安卓实现仿element-ui表单校验功能&#xff0c;其中的的选择日期涉及到安卓DatePicker组件的使用&#…

彩色控制台,自动换行...学习个新概念:流操控器![more cpp--11]

孩子们&#xff0c;我回来了。先看看今天我又学了什么CPP的没啥用新特性。彩色的控制台&#xff01; 还有很多的新花样&#xff01; 事情要从去年八月讲起&#xff0c;我那个时候在研究流函数&#xff0c;写了一些比较愚笨的代码。 为什么要研究这个呢&#xff1f;虽然我们的C…

基于单片机的盲人智能水杯系统(论文+源码)

1 总体方案设计 本次基于单片机的盲人智能水杯设计&#xff0c;采用的是DS18B20实现杯中水温的检测&#xff0c;采用HX711及应力片实现杯中水里的检测&#xff0c;采用DS1302实现时钟计时功能&#xff0c;采用TTS语音模块实现语音播报的功能&#xff0c;并结合STC89C52单片机作…