Python 调整PDF文件的页面大小

news2025/1/11 14:05:41

在处理PDF文件时,我们可能会遇到这样的情况:原始PDF文档不符合我们的阅读习惯,或者需要适配不同显示设备等。这时,我们就需要及时调整PDF文档中的页面尺寸,以满足不同应用场景的需求。

利用Python语言的高效性和灵活性,再结合Spire.PDF for Python 库的强大功能,我们可以通过Python代码轻松实现对PDF页面的批量调整。在这篇文章中,我们将介绍两种调整PDF页面大小的方法:

目录

1. 将PDF页面尺寸调整为常见标准尺寸

2. 将PDF页面尺寸调整为自定义尺寸


首先,需要先将Spire.PDF for Python库安装到项目中。pip命令:

pip install Spire.PDF

使用Python 调整PDF页面大小的步骤

Spire.PDF for Python 库提供的调整PDF页面大小的方式是将原PDF文档的内容复制到指定尺寸的新的PDF文档的页面上。主要实现步骤为:

  1. 加载原始PDF文档,然后创建一个新的PDF文档;
  2. 循环遍历原始PDF文档中的每一页;
  3. 使用方法在新的PDF文档中添加指定大小的页面;
  4. 基于原始PDF文档中页面的内容来创建模板;
  5. 将模板绘制到新 PDF 文档的页面上;
  6. 保存新PDF文档。

Spire.PDF for Python 支持A1, A2, A3, A4, B1, B2, B3, B4等标准页面尺寸,也支持自定义页面尺寸。下面将提供示例代码分别介绍:

1. 将PDF页面尺寸调整为常见标准尺寸

from spire.pdf.common import *
from spire.pdf import *

# 加载原始PDF文档
originalPdf = PdfDocument()
originalPdf.LoadFromFile("报告.pdf")

# 创建新PDF文档
newPdf = PdfDocument()

# 遍历原始PDF文档中的页面
for i in range(originalPdf.Pages.Count):
    page = originalPdf.Pages.get_Item(i)

    # 在新PDF文档中添加A4大小的页面
    newPage = newPdf.Pages.Add(PdfPageSize.A4(), PdfMargins(0.0))

    # 创建PdfTextLayout实例
    layout = PdfTextLayout()

    # 将文本布局设置为单页,以确保内容能够正确适应页面大小
    layout.Layout = PdfLayoutType.OnePage

    # 基于原始PDF页面创建模板
    template = page.CreateTemplate()

    # 将模板绘制到新PDF文档的页面上
    template.Draw(newPage, PointF.Empty(), layout)

# 保存新PDF文档
newPdf.SaveToFile("调整PDF页面为A4大小.pdf")
newPdf.Close()

生成文件(A4纸规格为210mm×297mm):

2. 将PDF页面尺寸调整为自定义尺寸

from spire.pdf.common import *
from spire.pdf import *

# 加载原始PDF文档
originalPdf = PdfDocument()
originalPdf.LoadFromFile("报告.pdf")

# 创建新PDF文档
newPdf = PdfDocument()

#创建PdfUnitConvertor类的对象,用于转换不同的测量单位
unitCvtr = PdfUnitConvertor()

# 将自定义尺寸的单位由毫米转换为点数(磅)
width = unitCvtr.ConvertUnits(180, PdfGraphicsUnit.Millimeter, PdfGraphicsUnit.Point)
height = unitCvtr.ConvertUnits(225, PdfGraphicsUnit.Millimeter, PdfGraphicsUnit.Point)

# 创建一个自定义宽度和高度的SizeF对象
size = SizeF(width, height)

# 遍历原始PDF中的页面
for i in range(originalPdf.Pages.Count):
    page = originalPdf.Pages.get_Item(i)

    # 在新PDF文档中添加自定义尺寸(180*225mm)的页面
    newPage = newPdf.Pages.Add(size, PdfMargins(0.0))

    # 创建PdfTextLayout实例
    layout = PdfTextLayout()

    # 将文本布局设置为单页,以确保内容能够正确适应页面大小
    layout.Layout = PdfLayoutType.OnePage

    # 基于原始PDF页面创建模板
    template = page.CreateTemplate()

    # 将模板绘制到新PDF文档的页面上
    template.Draw(newPage, PointF.Empty(), layout)

# 保存新PDF文档
newPdf.SaveToFile("自定义PDF页面大小.pdf")
newPdf.Close()

生成文件(此处自定义尺寸为180mm×225mm):


通过以上两段示例代码,我们可以根据需求将PDF页面调整为想要的尺寸。除此之外,Spire.PDF for Python库还支持调整PDF页边距、纸张方向等。使用过程中遇到任何问题,都可以前往论坛交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1687838.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SOLIDWORKS二次开发服务商 慧德敏学

SOLIDWORKS是一套三维设计软件, 采用特征建模、变量化驱动可方便地实现三维建模、装配和生成工程图。SOLIDWORKS软件本身所具有的交互方式, 可以使用户对已生成模型的尺寸、几何轮廓和相互约束关系随时进行修改, 而不需要编程。但要实现设计意义上的变量化绘图和系列化设计, 需…

89.网络游戏逆向分析与漏洞攻防-游戏技能系统分析-游戏中使用的哈希算法逆向分析

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 如果看不懂、不知道现在做的什么,那就跟着做完看效果,代码看不懂是正常的,只要会抄就行,抄着抄着就能懂了 内容…

4K高刷显示器 - 10大产品对比

4K高刷显示器 - 蚂蚁电竞 N27U 显示屏评测报告 一、产品品牌知名度 蚂蚁电竞,作为一家专注于电竞领域的品牌,近年来在市场上逐渐崭露头角。虽然相较于一些老牌显示器品牌,蚂蚁电竞的知名度还有待提高,但其在电竞领域的表现却不容…

C++数据结构——哈希表

前言:本篇文章将继续进行C数据结构的讲解——哈希表。 目录 一.哈希表概念 二.哈希函数 1.除留取余法 三.哈希冲突 1.闭散列 线性探测 (1)插入 (2)删除 2. 开散列 开散列概念 四.闭散列哈希表 1.基本框架 …

Excel实现将A列和B列的内容组合到一个新的列(例如C列)中,其中A列的每个值都与B列的所有值组合。

利用Excel中vba代码宏实现 原始数据: 自动生成后数据: vba实现代码: Sub CombineColumns()Dim ws As WorksheetDim lastRowA As Long, lastRowB As Long, i As Long, j As LongDim MyIndex As IntegerDim strCombine As String, strColA As…

Vue 3 组件基础与模板语法详解

title: Vue 3 组件基础与模板语法详解 date: 2024/5/24 16:31:13 updated: 2024/5/24 16:31:13 categories: 前端开发 tags: Vue3特性CompositionAPITeleportSuspenseVue3安装组件基础模板语法 Vue 3 简介 1. Vue 3 的新特性 Vue 3引入了许多新的特性,以提高框…

【计算机视觉(3)】

基于Python的OpenCV基础入门——图形与文字的绘制 图形与文字的绘制:画线画矩形画圆画多边形加文字 图形与文字绘制的代码实现: 图形与文字的绘制: 画线 img cv2.line(img, pt1, pt2, color, thickness) 参数: img:…

瑞芯微RV1126——ffmpeg环境搭建

本篇文章来介绍一下,在ubuntu上搭建一个比较完整的ffmpeg环境需要的步骤以及流程。为后期将我们开发的应用程序移植到RV1126开发板上做准备。 在安装ffmpeg之前,为了方便后续的操作,我们可以先搭建好samba服务器。所以本节将分为两个部分&am…

ThingML的学习——在ecplise里面配置maven

前置工作: 1.在ecplise里面配置maven之前,首先需要在windows里面下载maven。 2.配置环境变量 3.修改maven配置文件(最好改为阿里云) 1.配置Java环境,需要jdk版的(jar不行) 以上不在这里面详细介…

ACM实训第十七天

Is It A Tree? 问题 考试时应该做不出来,果断放弃 树是一种众所周知的数据结构,它要么是空的(null, void, nothing),要么是一个或的集合满足以下属性的节点之间有向边连接的节点较多。 •只有一个节点,称为根节点,它…

探索生态农业,守护绿色家园

在繁忙的都市生活中,我们往往忽略了与自然和谐相处的重要性。而生态农业,正是让我们重拾与大自然亲密关系的桥梁。通过采用生态友好的耕作方式,生态农业不仅能够提供健康、营养的农产品,还能够保护生态环境,实现人与自…

登录安全分析报告:创蓝云智注册

前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…

ubuntu使用记录——如何使用wireshark网络抓包工具进行检测速腾激光雷达的ip和端口号

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言wireshark网络抓包工具1.wireshark的安装2.wireshark的使用3.更改雷达ip 总结 前言 Wireshark是一款备受赞誉的开源网络协议分析软件,其功能之强大…

在做题中学习(61):连续数组

525. 连续数组 - 力扣(LeetCode) 思路:前缀和 哈希表 转化:将 0 ——> -1 转变为:找到和为0的最长子数组 细节: 1.哈希表存什么 前缀和 , 长度 2.什么时候存入哈希表 先处理前一个&…

【LeetCode】【4】寻找两个正序数组的中位数(2105字)

文章目录 [toc]题目描述样例输入输出与解释样例1样例2 提示Python实现二分查找划分数组 个人主页:丷从心 系列专栏:LeetCode 刷题指南:LeetCode刷题指南 题目描述 给定两个大小分别为m和n的正序(从小到大)数组nums1…

基于Pytorch框架的卷积神经网络MNIST手写数字识别

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 一、项目背景与意义 MNIST手写数字数据集是机器学习领域中的一个经典数据集,它包含了大量的手写数字图…

Pytorch深度学习实践笔记2

🎬个人简介:一个全栈工程师的升级之路! 📋个人专栏:pytorch深度学习 🎀CSDN主页 发狂的小花 🌄人生秘诀:学习的本质就是极致重复! 《PyTorch深度学习实践》完结合集_哔哩哔哩_bilibi…

正则表达式(知识总结篇)

本篇文章主要是针对初学者,对正则表达式的理解、作用和应用 正则表达式🌟 一、🍉正则表达式的概述二、🍉正则表达式的语法和使用三、 🍉正则表达式的常用操作符四、🍉re库主要功能函数 一、🍉正…

【设计模式】JAVA Design Patterns——Balking(止步模式)

🔍目的 止步模式用于防止对象在不完整或不合适的状态下执行某些代码。 🔍解释 真实世界例子 洗衣机中有一个开始按钮,用于启动衣物洗涤。当洗衣机处于非活动状态时,按钮将按预期工作,但是如果已经在洗涤,则…