如何用Python操作PDF制作数据报告?

news2024/10/2 8:20:07

大家好,你是否会发现 Python 操作PDF文档内容,主要围绕PDF文档的内容提取、合并与拆分、加密与解密、添加水印以及不同文档格式相互转换来展开。

但大家会发现,其中并没有有太多直接操作PDF并向其写入的内容。这是因为我们更推荐大家Python自动操作word,然后加一步格式转换,而非直接想PDF写入内容。

不过,肯定还是有一部分人是有类似需求的,所以今天给大家分享一个案例:如何用Python操作PDF制作数据报告?

FPDF模块

Python操作PDF的库有很多,比如PyPDF2、pdfplumber、PyMuPDF等等。不过我们今天要用的是FPDF模块,它是用于在 Python 中生成 PDF 的最通用、最自由、最直观的库之一。为啥说它自由呢,看它的首字母F就知道了。Python中所用到的FPDF是基于PHP版本的FPDF。

FPDF 官方网址:http://www.fpdf.org/

pip install FPDF  

FPDF模块使用逻辑非常简单,直接用几个小例子学习一下。

1、创建PDF,并添加单行文字

我们可以创建一个单元格cell(),然后将文本放入其中,这种方法更适合对齐或居中变量或动态文本。

from fpdf import FPDF  
  
pdf = FPDF()  
pdf.add_page()  
pdf.set_font('Arial', 'B', 16)  
pdf.cell(40, 10,'Hello, World!')  
pdf.output('test_01.pdf', 'F')  

输出结果:

2、其他操作

pdf.set_font('SIMYOU',size=10)  # 设置字体,字体,加粗,字号  
pdf.set_text_color(120,120,120) # 设置颜色,采用RGB方式  
  
pdf.text(x, y, txt) # 插入文本的另一种方式  
  
pdf.add_page() # 增加一页  
  
pdf.ln() # 插入新行  
  
pdf.multi_cell(0,5,"插入多行") # 插入多行  
  
pdf.image('01.jpg', 100, 50, 40) # 插入图片,100,50表示图片左上角的XY坐标,40表示图片的大小  

3、实现字体的中文支持

FPDF库自带的字体非常少,想使用中文就需要导入支持中文的字体,可以使用add_font()方法。

pdf.add_font('幼圆字体','',r'C:\Windows\Fonts\SIMYOU.TTF',True)  
pdf.set_font('幼圆字体', '', 14) # 设置字体为标准幼圆,size为14  

注意,上面代码中的字体文件路径要根据自己的电脑实际存放位置更改。

在这里插入图片描述

此外,使用中文会有报错warnings.warn,直接无视就好。如果想解决[1],也可以参考博文:https://blog.csdn.net/luckyeveryyear/article/details/127189115

操作PDF制作数据报告

下面,直接展开案例:如何用Python操作PDF制作数据报告[2]?

由于我们这个小案例涉及绘制图形+写入图表,所以使用了seabornpandas模块。懒得自己打字,所以又使用了Faker模块,干脆模拟生成一些“假”的文字段落,方便直接插入到PDF文档中。

在交互式环境中输入如下命令(部分代码,完整代码下载见文末):

pdf.cell(w=30, h=ch, txt="Date: ", ln=0)  
pdf.cell(w=30, h=ch, txt="01/10/2022", ln=1)  
pdf.cell(w=30, h=ch, txt="Author: ", ln=0)  
pdf.cell(w=30, h=ch, txt="公众号:XXXXXX", ln=1)  
  
pdf.ln(ch)  
pdf.cell(0, 5,'听我说谢谢你') # 单行文字  
pdf.ln(ch)  
# 随机生成文字段落  
pdf.multi_cell(w=0, h=10, txt=fake.sentence(nb_words=50))  
pdf.ln(ch)  
pdf.image('./example_chart.png', x = 10, y = None, w = 100, h = 0, type = 'PNG', link = '')  
pdf.ln(ch)  
pdf.multi_cell(w=0, h=5, txt=fake.sentence(nb_words=50))  
pdf.ln(ch)  
  
# 表格 Header  
pdf.cell(40, ch, 'Feature 1', 1, 0, 'C')  
pdf.cell(40, ch, 'Feature 2', 1, 1, 'C')  
  
# 表格内容  
for i in range(0, len(df)):  
    pdf.cell(40, ch, df['feature 1'].iloc[i], 1, 0, 'C')     
    pdf.cell(40, ch, df['feature 2'].iloc[i].astype(str), 1, 1, 'C')  

打开导出的PDF文档,如下图所示。

在这里插入图片描述

这样我们就实现用Python操作PDF制作了一张“伪”数据报告,而我们在实际使用中则可以根据需求向其中插入文本、数字、图表等等内容。除了本文介绍的FPDF模块基本操作,在案例中实际还设置了页眉/页脚等,大家可以下载完整代码查看。

技术提升

本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/95459.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言练习之计算一个数的每位之和(递归实现)

目录 前言 一、思路 二、源代码以及运行截图 源代码: 运行截图: 总结 前言 写一个递归函数DigitSum(n),输入一个非负整数,返回组成它的数字之和 例如,调用DigitSum(1729),则应该返回1 7 2 9&#…

LeetCode HOT 100 —— 297.二叉树的序列化与反序列化

题目 序列化是将一个数据结构或者对象转换为连续的比特位的操作,进而可以将转换后的数据存储在一个文件或者内存中,同时也可以通过网络传输到另一个计算机环境,采取相反方式重构得到原数据。 请设计一个算法来实现二叉树的序列化与反序列化。…

你还以为格子衫头发的就是程序员?这些特征都没有别说你是程序员

周一写几百个bug,周二到周四拼命改bug,周五总结bug,总结的好有周末,总结的不好周末无休! 咳咳,这样的周末我可以不休息! 有很多想要学习Python却找不到途径的朋友,我这里整理了一…

.NET Framework杂记

这篇博客主要记录在用C#编写上位机时,不会的知识点,随时更新,方便查阅。 C#语法操作杂记c#中让textbox选中不选中C#无法使用实例引用来访问成员解决方法针对不同定义情况的引用解释C# 字符串分割用字符串分割用多个字符串分割用单字符分割C#中…

【DevOps实战系列】第二章:详解Gitlab环境及搭建

个人亲自录制全套DevOps系列实战教程 :手把手教你玩转DevOps全栈技术 gitlab就不多说了,这个东西现在大多数公司内部都在使用,它分为社区和企业版本,社区版本ce是免费的,当然也可以选择gitee或github,但由于…

非零基础自学Golang 第8章 包管理 8.6 包的命名 8.7 依赖包管理

非零基础自学Golang 文章目录非零基础自学Golang第8章 包管理8.6 包的命名8.7 依赖包管理第8章 包管理 8.6 包的命名 每个包都有一个包名,包名一般是短小的名字,在包的声明处指定。 通常来说,默认的包名就是包导入路径名的最后一段&#x…

AD20和立创EDA设计(5)立创EDA导出3D模型放入AD20使用

(1)本文主要介绍如何将从立创EDA导出的3D模型,并且对3D模型进行处理。 (2)需提前观看:AD20和立创EDA设计(4)PCB设计; (3)本文需要使用到Fusion 36…

基于6自由度飞行器的EKF和INS融合算法的MATLAB仿真

目录 1.算法描述 2.仿真效果预览 3.MATLAB核心程序 4.完整MATLAB 1.算法描述 六自由度四轴飞行器,包括由四根杆组成的正四面体,所述正四面体的中心位置设有一个空心圆球,空心圆球上设有四根支杆分别与正四面体的四个顶点相连,所述空心圆球内设有电池和控制系统, INS/GPS的松…

nodejs+vue041家政管理系统

基本要求:要求此系统能较完善的实现服务人员及客户信息的管理等功能。 主界面:分为用户登陆和管理员登陆,用户登陆包含客户登录和服务人员登陆。 用户注册:注册时可选择身份(客户或者服务人员)。 后台管…

目前免费用可用的天气api接口及失效接口

网上关于免费天气api接口很多,本人总结了一下目前还可用的免费api接口和已失效的接口如下: 目前可用接口: 1、讯飞语音识别内置的墨迹天气API。链接: http://autodev.openspeech.cn/csp/api/v2.1/weather?openIdaiuicus&c…

【Javaweb-前端】CSS

1. Syntax Selector − A selector is an HTML tag at which a style will be applied. This could be any tag like or etc.Property − A property is a type of attribute of HTML tag. Put simply, all the HTML attributes are converted into CSS properties. They coul…

散热材料产业SWOT分析:5G建设带动市场需求 多元化散热方案将成行业主流

传统散热材料以石墨片和导热凝胶等TIM材料(导热界面材料)为主,石墨片存在导热系数相对较低、厚度相对较大等问题。目前热管和VC(均热板)开始从电脑、服务器等领域渗透到智能手机终端,石墨烯材料也开始应用。…

Docker笔记--容器转换为镜像、Dockerfile的使用

目录 1--使用 docker commit 将容器转换为镜像 1-1--容器转换为镜像 1-2--实例代码 1-3--注意事项: 2--Dockerfile的使用 2-1--常用关键字 2-2--利用 dockerfile 搭建 Centos:7 镜像 1--使用 docker commit 将容器转换为镜像 1-1--容器转换为镜像 # 将容器…

家电产品出口指南,RoHs法规详解

【家电产品出口指南,RoHs法规详解】 受疫情影响,我国家电出口创新高,据海关总署发布的数据统计,2021年,中国家用电器出口额987.2亿美元,同比增长22.3%,出口规模远超历史同期水平,创近…

新款Macbook Pro可以升级固态硬盘吗?

不知道有多少用户因为预算不足而选购了256GB固态硬盘版本的Mac呢?在购买Mac之前,总觉得“省省总会有的”。实际上,还是很多256G的用户都在后悔:“为什么当初没有加钱升级固态硬盘啊!”小编在此也提醒大家,如…

让人恶心的多线程代码,性能怎么优化!

Java 中最烦人的,就是多线程,一不小心,代码写的比单线程还慢,这就让人非常尴尬。 通常情况下,我们会使用 ThreadLocal 实现线程封闭,比如避免 SimpleDateFormat 在并发环境下所引起的一些不一致情况。其实…

Java+MySQL校园网络超市系统的设计与实现 开题 论文

随着我国教育模式的改革,我国的大学生数量在逐步的增加,虽然每个高校的附近都有便利店但是很是时候这些便利店不能够满足学生的日常生活和学习的需求,尤其是便利店因为成本的原因货物不全 ,而大学生很多时候更希望通过网络购买自己所需的物品,所以通过校园网络超市系统来购买自…

基于java+springmvc+mybatis+vue+mysql的大学校医院信息管理系统

项目介绍 本系统采用java语言开发,后端采用ssm框架,前端采用vue技术,数据库采用mysql进行数据存储。 前台: 首页、校医、药品信息、疫情公告、个人中心、后台管理 后台: 首页、个人中心、在线问诊管理、问诊回复管理…

计算机毕设Python+Vue校园新闻广播系统(程序+LW+部署)

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

[附源码]Node.js计算机毕业设计个人人际关系管理软件Express

项目运行 环境配置: Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术: Express框架 Node.js Vue 等等组成,B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境:最好是Nodejs最新版,我…