用Python操作字节流中的Excel文档

news2025/1/5 8:55:22

Python能够轻松地从字节流中加载文件,在不依赖于外部存储的情况下直接对其进行读取、修改等复杂操作,并最终将更改后的文档保存回字节串中。这种能力不仅极大地提高了数据处理的灵活性,还确保了数据的安全性和完整性,尤其是在网络传输或内存中处理敏感信息时。本文将介绍如何使用Python创建和保存Excel文件到字节流,以及读取和修改字节流中的Excel文件

文章目录

    • Python创建Excel文件并保存到字节流
    • Python直接读取字节流中的Excel文件
    • Python编辑字节流中的Excel文件

本文所使用的方法需要用到Spire.XLS for Python,PyPI:pip install spire.xls

Python创建Excel文件并保存到字节流

我们可以通过创建一个Workbook实例从而创建一个Excel工作簿,然后向其中添加数据并设置好格式,最后使用Workbook.SaveToStream()方法将其保存到指定的bytesbytearray中。以下是操作步骤示例:

  1. 导入所需模块。
  2. 创建Workbook对象从而新建一个Excel工作簿,新建的工作簿中会有三个默认工作表。
  3. 使用Workbook.Worksheets.get_Item()方法获取一个工作表。
  4. 定义数据列表,或从其他地方导入数据。
  5. 通过Worksheet.Range.get_Item().Value.NumberValue属性写入数据到工作表中。
  6. 通过CellRange.Style中的属性设置单元格格式。
  7. 使用Worksheet.AutoFitColumn()方法自动调整列宽。
  8. 创建Stream对象。
  9. 使用Workbook.SaveToStream()方法将Excel工作簿保存到Stream对象。
  10. Stream对象转换为bytesbytearray,或写入已有的bytearray中。
  11. 释放资源。

代码示例

from spire.xls import Workbook, FileFormat, Stream, Color, HorizontalAlignType

# 创建一个工作簿实例
workbook = Workbook()

# 获取第一个工作表
sheet = workbook.Worksheets.get_Item(0)

# 创建或读取一个二维数据列表
data = [
    ["书名", "作者", "出版年份", "类型", "价格 (人民币)"],
    ["了不起的盖茨比", "F. Scott Fitzgerald", 1925, "小说", 10.99],
    ["杀死一只知更鸟", "Harper Lee", 1960, "小说", 8.99],
    ["1984", "George Orwell", 1949, "反乌托邦", 7.99],
    ["傲慢与偏见", "Jane Austen", 1813, "浪漫", 6.99],
    ["麦田里的守望者", "J.D. Salinger", 1951, "小说", 9.99],
    ["美丽新世界", "Aldous Huxley", 1932, "反乌托邦", 8.49],
    ["霍比特人", "J.R.R. Tolkien", 1937, "奇幻", 12.99],
    ["动物庄园", "George Orwell", 1945, "寓言", 5.99],
    ["指环王", "J.R.R. Tolkien", 1954, "奇幻", 14.99],
    ["白鲸", "Herman Melville", 1851, "冒险", 11.99]
]

# 将数据插入到工作表中
for i, row in enumerate(data):
    for j, value in enumerate(row):
        if isinstance(value, str):
            sheet.Range.get_Item(i + 1, j + 1).Value = value
        else:
            sheet.Range.get_Item(i + 1, j + 1).NumberValue = value

# 格式化标题行
headerRow = sheet.AllocatedRange.Rows.get_Item(0)
headerRow.Style.Color = Color.FromRgb(77, 189, 155)
headerRow.Style.Font.FontName = "宋体"
headerRow.Style.Font.Size = 14
headerRow.Style.Font.IsBold = True
headerRow.Style.HorizontalAlignment = HorizontalAlignType.Center

# 格式化数据行
for i in range(1, sheet.AllocatedRange.Rows.Count):
    row = sheet.AllocatedRange.Rows.get_Item(i)
    row.Style.Font.FontName = "宋体"
    row.Style.Font.Size = 12
    row.Style.HorizontalAlignment = HorizontalAlignType.Left
    row.Style.Color = Color.FromRgb(255, 253, 208)
    if i % 2 == 0:
        row.Style.Color = Color.FromRgb(255, 248, 183)

# 自动调整列宽
for i in range(sheet.AllocatedRange.Columns.Count):
    sheet.AutoFitColumn(i + 1)

# 创建一个流对象
stream = Stream()

# 将工作簿保存到流中
workbook.SaveToStream(stream, FileFormat.Version2016)

# 将流转换为字节
bytes_data = stream.ToArray()

# 将字节写入文件或按需要使用
with open("output/CreateExcelByStream.xlsx", "wb") as file:
    file.write(bytes_data)

运行结果
Python创建Excel工作簿保存为字节流

Python直接读取字节流中的Excel文件

我们可以使用Workbook.LoadFromStream(Stream(bytes))方法直接从字节流中加载PDF文档,然后遍历工作表中已使用的单元格的行和列,通过Worksheet.AllocatedRange.get_Item().Value属性直接读取单元格数据。以下是操作步骤示例:

  1. 导入所需模块。
  2. 创建Workbook对象。
  3. 使用Workbook.LoadFromStream(Stream(bytes))方法从字节流中加载Excel文件。
  4. 使用Workbook.Worksheets.get_Item()方法获取指定工作表。
  5. 遍历工作表中已使用的行和列,使用Worksheet.AllocatedRange.get_Item().Value属性获取单元格数据。
  6. 输出单元格数据或用于其他操作。
  7. 释放资源。

代码示例

from spire.xls import Workbook, Stream

# 创建一个字节对象或使用现有的字节对象
with open("output/CreateExcelByStream.xlsx", "rb") as file:
    bytes_data = file.read()

# 创建一个工作簿实例
workbook = Workbook()

# 从字节流加载Excel文件
workbook.LoadFromStream(Stream(bytes_data))

# 获取第一个工作表
sheet = workbook.Worksheets.get_Item(0)

# 从工作表读取数据
# 创建一个列表来存储数据
data = []
for i in range(sheet.AllocatedRange.Rows.Count):
    # 获取一行数据
    row = sheet.AllocatedRange.Rows.get_Item(i)
    # 创建一个列表来存储该行的数据
    row_data = []
    for j in range(row.Cells.Count):
        # 获取单元格的值
        cellValue = sheet.AllocatedRange.get_Item(i + 1, j + 1).Value
        row_data.append(cellValue)
    data.append(row_data)

# 打印数据或按需使用
for row in data:
    print(row)

# 释放资源
workbook.Dispose()

运行结果
Python读取字节流中的Excel文件的数据

Python编辑字节流中的Excel文件

同样,我们也可以使用Workbook.LoadFromStream(Stream(bytes))方法直接从bytesbytearray中加载PDF文档,并对其进行修改编辑,然后使用Workbook.SaveToStream()方法将其保存回字节流中,从而实现编辑字节流中的Excel文件。以下是操作步骤示例:

  1. 导入所需模块。
  2. 创建Workbook对象。
  3. 使用字节流创建Stream对象。
  4. 使用Workbook.LoadFromStream()方法从Stream对象加载Excel文件。
  5. 使用Workbook.Worksheets.get_Item()方法获取指定工作表。
  6. 根据需要修改格式。
  7. 使用Workbook.SaveToStream()方法将Excel工作簿保存回Stream对象。
  8. Stream对象转换为bytesbytearray
  9. 将字节流写入文件或用于其他用途。
  10. 释放资源。

代码示例

from spire.xls import Workbook, Stream, HorizontalAlignType, Color, FileFormat

# 创建一个字节对象或使用现有的字节对象
with open("output/CreateExcelByStream.xlsx", "rb") as file:
    bytes_data = file.read()

# 创建一个工作簿实例
workbook = Workbook()

# 从字节流加载Excel文件
stream = Stream(bytes_data)
workbook.LoadFromStream(stream)
stream.Close()

# 删除多余的工作表
#for i in range(1, workbook.Worksheets.Count):
#    workbook.Worksheets.Remove(workbook.Worksheets.get_Item(i))

# 获取第一个工作表
sheet = workbook.Worksheets.get_Item(0)

# 修改标题行的样式
headerRow = sheet.AllocatedRange.Rows.get_Item(0)
headerRow.Style.Font.Bold = False
headerRow.Style.Font.FontName = "Calibri"
headerRow.Style.Font.Size = 12
headerRow.Style.HorizontalAlignment = HorizontalAlignType.Left
headerRow.Style.Color = Color.FromRgb(92, 64, 131)

# 修改数据行的样式
for i in range(1, sheet.AllocatedRange.Rows.Count):
    row = sheet.AllocatedRange.Rows.get_Item(i)
    row.Style.Font.FontName = "Calibri"
    row.Style.Font.Size = 11
    row.Style.Color = Color.FromRgb(255, 237, 206)
    if i % 2 == 0:
        row.Style.Color = Color.FromRgb(255, 228, 181)

# 自动调整列宽
for i in range(sheet.AllocatedRange.Columns.Count):
    sheet.AutoFitColumn(i + 1)

# 保存修改后的Excel文件
streamTemp = Stream()
workbook.SaveToStream(streamTemp, FileFormat.Version2016)

# 将流转换回字节
bytes_data = streamTemp.ToArray()

# 将字节写入文件或按需使用
with open("output/ModifiedExcel.xlsx", "wb") as file:
    file.write(bytes_data)

运行结果
Python修改字节流中的Excel工作簿

本文演示了如何用Python创建Excel工作簿保存到字节流,以及读取和修改字节流中的Excel工作簿。

申请免费License

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2269562.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【LeetCode】928、尽量减少恶意软件的传播 II

【LeetCode】928、尽量减少恶意软件的传播 II 文章目录 一、并查集1.1 并查集 二、多语言解法 一、并查集 1.1 并查集 先把普通点, build 并查集遍历每个源头点, 找源头点附近的点所在的集合, 传染该集合拯救节点 3.1 若该节点 所在集合, 从未被感染过, 则开始感染 3.2 若该节…

(NDSS2024)论文阅读——仅低质量的训练数据?用于检测加密恶意网络流量的稳健框架

文章基本信息 作者:Yuqi Qing et al. (清华大学李琦团队) 代码 文章 摘要 存在问题:收集包含足够数量的带有正确标签的加密恶意数据的训练数据集是具有挑战性的,当使用低质量的训练数据训练机器学习模型时&#xff…

如何将CSDN文章 导出为 PDF文件

一、首先,打开我们想要导出为 PDF格式的 CSDN文章,以下图为例。 二、按 F12 调出浏览器调式模式后,选择 控制台 三、在控制台处粘贴代码 代码: (function(){ use strict;var articleBox $("div.article_content"…

YApi接口管理平台本地搭建方法介绍

YApi是一个免费开源的API管理平台,开发人员可用它来管理、调试接口,并且提供了API文档管理和测试功能,具有友好的UI页面,本文介绍Linux环境如何安装部署YApi接口管理平台。 目录 1 环境准备2 安装部署2.1 安装nodejs2.2 安装 Mong…

案例分析-采样率对模拟链路的带宽的影响

目录 问题来源: 情况分析: 总结 问题来源: 在进行模拟带宽调整时,发现设计值 与实测值,不一样,就这一问题,进行详细分析。 情况分析: 在本项目中,采用巴特沃兹四阶滤波器,设计带宽350M,改滤波器设计可以采用fiter solution工具进行设计,实测值仅仅260M,因此针…

Huggingface Trending!可控人物图像生成统一框架Leffa,可精确控制虚拟试穿和姿势转换!

今天给大家介绍一个Huggingface上虚拟试穿的热门项目Leffa,Leffa是一个可控人物图像生成的统一框架,可以精确操纵外观(即虚拟试穿)和姿势(即姿势转换)。从效果看生成效果很不错! 相关链接 论文&…

memcached的基本使用

memcached是一种基于键值对的内存数据库,一般应用于缓存数据,提高数据访问速度,减轻后端数据库压力。 安装 这里以Ubuntu为例,其他系统安装方法请看官方文档。 sudo apt-get update sudo apt-get install memcached启动 memca…

ROS话题通信

1 .理论模型 话题通信实现模型是比较复杂的,该模型如下图所示,该模型中涉及到三个角色: ROS Master (管理者)Talker (发布者)Listener (订阅者) ROS Master 负责保管 Talker 和 Listener 注册的信息,并匹配话题相同的 Talker 与 Listener,…

经验证:将数据从索尼传输到Android的 4 种方法

概括 像Android Galaxy S20 这样的新型Android智能手机很酷,但除了将数据从索尼传输到Android之外。众所周知,旧的索尼手机上存储着大量的文件,因此将数据从旧的索尼手机传输到新的Android手机非常重要。为了解决这个问题,我们做…

VITUREMEIG | AR眼镜 算力增程

根据IDC发布的《2024年第三季度美国AR/VR市场报告》显示,美国市场AR/VR总出货量增长10.3%。其中,成立于2021年的VITURE增长速度令人惊艳,同比暴涨452.6%,成为历史上增长最快的AR/VR品牌。并在美国AR领域占据了超过50%的市场份额&a…

JavaSpring AI与阿里云通义大模型的集成使用Java Data Science Library(JDSL)进行数据处理

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默, 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……) 2、学会Oracle数据库入门到入土用法(创作中……) 3、手把…

git reset --hard(重置到当前提交,所有未提交的更改都会被永久丢弃)

git reset --hard 是一个强大的命令,它会将你的工作目录、暂存区和当前分支的 HEAD 指针重置到指定的提交状态,所有未提交的更改都会被永久丢弃。因此,使用这个命令时需要非常小心。 基本用法 重置到当前提交(丢弃所有未提交的更…

基于单片机智能水产养殖系统设计(论文+源码)

1 系统方案设计 根据系统设计需求,对智能水产养殖系统总体方案展开详细设计。如图2.1所示为系统设计总框架,系统以STM32单片机作为主控制器,通过DS18B20温度传感器、水位传感器、TSW-30浊度传感器、光照传感器实现水产养殖环境中水温、水位、…

基于微信小程序的校园点餐平台的设计与实现(源码+SQL+LW+部署讲解)

文章目录 摘 要1. 第1章 选题背景及研究意义1.1 选题背景1.2 研究意义1.3 论文结构安排 2. 第2章 相关开发技术2.1 前端技术2.2 后端技术2.3 数据库技术 3. 第3章 可行性及需求分析3.1 可行性分析3.2 系统需求分析 4. 第4章 系统概要设计4.1 系统功能模块设计4.2 数据库设计 5.…

Mysql学习笔记之约束

1.简介 MySQL中的约束用于定义表中数据的规则,以确保数据的准确性和完整性。以保证数据表中数据的有效性、正确性和完整性。 2.约束分类 在mysql中约束分类如下: 约束说明关键字主键约束每个表只能有一个主键;主键的值必须唯一&#xff0…

LabVIEW 实现自动对焦的开发

自动对焦(Autofocus, AF)技术是通过分析图像或传感器信号,动态调整焦点位置以实现清晰成像或高精度定位的过程。在LabVIEW中,可以通过集成信号采集、数据处理、控制算法和硬件接口模块,实现多种自动对焦方法&#xff0…

2024年第52周ETF周报

ETF 第52 周 ( 2024-12-23 至 2024-12-29 )周报 核心观点 ETF 业绩表现 股票型ETF周度收益率中位数为1.0731%宽基ETF中,科创创业50涨跌幅中位数为1.5625%,跌幅最小。按板块划分,金融涨跌幅中位数为1.9334%&#xff…

[Qt] 万字详解Qt入门~ Qt Creator | 对象树 | 控件布局

目录 1. Qt Creator 概览 2. 使用 Qt Creator 新建项目 3. 认识 Qt Creator 界面 4. Qt Hello World 程序 1. 使用 “按钮” 实现 2. 使用 “标签” 实现 3. 使用 “编辑框” 实现 5. 项目文件解析 1. 命名空间声明与作用 2. class Widget : public QWidget 6. Qt 编…

远程命令执行之基本介绍

一.远程命令执行漏洞 1.命令执行 命令执行是指计算机程序接受用户输入的命令,并按照命令的要求执行相应的操作。命令可以执行各种操作,例如读取文件、创建文件、修改文件、运行程序、删除文件等。 命令执行通常是通过一个命令行界面或终端窗口进行的。在…

【数据结构-单调队列】力扣2762. 不间断子数组

给你一个下标从 0 开始的整数数组 nums 。nums 的一个子数组如果满足以下条件&#xff0c;那么它是 不间断 的&#xff1a; i&#xff0c;i 1 &#xff0c;…&#xff0c;j 表示子数组中的下标。对于所有满足 i < i1, i2 < j 的下标对&#xff0c;都有 0 < |nums[i1…