Python实现图片与PDF互相转换

news2024/12/25 9:30:21

目录

    • 图片转PDF
      • 文件夹所有图片转为1个PDF
      • 文件夹指定图片转为1个PDF
      • 文件夹所有图片分别转为PDF
      • 举例
    • PDF转图片
      • 指定PDF转为图片
      • 文件夹所有PDF转为图片
      • 举例

图片转PDF

之前的一篇博客《Python合并拼接图片》,可对图片进行合并拼接
使用前需要安装PyMuPDF库,以下代码使用的PyMuPDF(1.23.6),以及自然排序库natsort(8.4.0)

文件夹所有图片转为1个PDF

import fitz
from glob import glob
from natsort import natsorted

def img2pdf_1(img_path, pdf_path, pdf_name):
    """
    将文件夹中所有格式图片全部转换为一个指定名称的pdf文件,并保存至指定文件夹
    :param str img_path: 待转换图片所在文件夹
    :param str pdf_path: 转换后PDF保存文件夹
    :param str pdf_name: 转换后PDF文件名,不含扩展名
    """
    doc = fitz.open()
    filepath = []
    for x in [r'\*.jpg', r'\*.png']:  # 获取所有格式的图片
        filepath.extend(glob(img_path + x))  # 将列表元素追加到列表中

    for img in natsorted(filepath):  # 读取图片,确保按文件名按自然排序
        imgdoc = fitz.open(img)                 # 打开图片
        pdfbytes = imgdoc.convert_to_pdf()      # 使用图片创建单页的 PDF
        imgpdf = fitz.open('pdf', pdfbytes)
        doc.insert_pdf(imgpdf)                  # 将当前页插入文档
    doc.save(pdf_path + '\\' + pdf_name + '.pdf')  # 保存pdf文件
    doc.close()
    print('转换完成')

文件夹指定图片转为1个PDF

import fitz
from natsort import natsorted

def img2pdf_2(img_path, pdf_path, img_list, pdf_name):
    """
    将文件夹中指定1个或多个图片转换为1个指定名称的pdf文件,并保存至指定文件夹
    :param str img_path: 待转换图片所在文件夹
    :param str pdf_path: 转换后PDF保存文件夹
    :param str img_list: 指定的图片文件名,含扩展名
    :param str pdf_name: 转换后PDF文件名,不含扩展名
    """
    doc = fitz.open()
    pic_list = [img_path + '\\' + i for i in img_list]
    
    for img in natsorted(pic_list):  # 读取图片列表,确保按文件名排序
        imgdoc = fitz.open(img)
        pdfbytes = imgdoc.convert_to_pdf()
        imgpdf = fitz.open('pdf', pdfbytes)
        doc.insert_pdf(imgpdf)
    doc.save(pdf_path + '\\' + pdf_name + '.pdf')
    doc.close()
    print('转换完成')

文件夹所有图片分别转为PDF

import fitz
from glob import glob
from natsort import natsorted
import os.path

def img2pdf_3(img_path, pdf_path):
    """
    将文件夹中所有jpg图片分别转换为同一名称的pdf文件,并保存至指定文件夹
    :param str img_path: 待转换图片所在文件夹
    :param str pdf_path: 转换后PDF保存文件夹
    """
    filepath = []
    for x in [r'\*.jpg', r'\*.png']:  # 获取所有格式的图片
        filepath.extend(glob(img_path + x))  # 将列表元素追加到列表中
    
    for img in filepath:  # 读取图片
        img_type = os.path.splitext(img)[1]  # 获取图片格式,splitext分割文件路径名和扩展名
        file_name = os.path.basename(img).replace(img_type, '.pdf')  # 获取不含路径文件名,替换为pdf后缀名
        doc = fitz.open()
        imgdoc = fitz.open(img)
        pdfbytes = imgdoc.convert_to_pdf()
        imgpdf = fitz.open('pdf', pdfbytes)
        doc.insert_pdf(imgpdf)
        doc.save(pdf_path + '\\' + file_name)
        doc.close()
    print('转换完成')

举例

if __name__ == '__main__':
    img_path = r'E:\测试\jpg\五共'
    pdf_path = r'E:\测试\jpg\五共'
    img_list = ['青瓦台是黑社会老巢吗.jpg', '天无二日,只有总统一个太阳.jpg']
    img2pdf_1(img_path, pdf_path, '全部图片')
    img2pdf_2(img_path, pdf_path, img_list, '2张图片')
    img2pdf_3(img_path, pdf_path)

对《Python合并拼接图片》中同样的18张图片进行转换,转换前
在这里插入图片描述
img2pdf_1转换结果
在这里插入图片描述

img2pdf_2转换结果
在这里插入图片描述
img2pdf_3转换结果,以及前2个的转换结果(选中)
在这里插入图片描述

PDF转图片

使用前需要安装PyMuPDF库,以下代码使用的PyMuPDF(1.23.6)

指定PDF转为图片

import fitz
import os.path

def pdf2png1(filename, outpath, zoom_x=1.25, zoom_y=1.25):
    """
    指定PDF文件转换为图片,并保存至指定文件夹
    :param str filename: 待转换的PDF文件,文件名含路径
    :param str outpath: 转换后图片保存文件夹
    :param int zoom_x: 图片横向缩放比例
    :param int zoom_y: 图片纵向缩放比例
    """
    save_name = os.path.basename(filename).replace('.pdf', '')  # 获取不含路径文件名
    save_name = outpath + '\\' + save_name
    doc = fitz.open(filename)  # 打开PDF文件,生成一个对象
    rotate = int(0)  # 设置图片的旋转角度,顺时针度数
    trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
    for pg in range(doc.page_count):
        page = doc[pg]
        pm = page.get_pixmap(matrix=trans, alpha=False)
        if doc.page_count == 1:
            pm.save(f'{save_name}.png')
        else:
            pm.save('{}-{:04d}.png'.format(save_name, pg))
    doc.close()
    print('转换完成')

文件夹所有PDF转为图片

import fitz
from glob import glob
import os.path

def pdf2png2(filepath, outpath, zoom_x=1.25, zoom_y=1.25):
    """
    指定文件夹中所有PDF文件转换为图片,并保存至指定文件夹
    :param str filepath: 待转换的PDF所在文件夹
    :param str outpath: 转换后图片保存文件夹
    :param int zoom_x: 图片横向缩放比例
    :param int zoom_y: 图片纵向缩放比例
    """
    pdf_list = glob(filepath + r'\*.pdf')
    for f in pdf_list:
        save_name = os.path.basename(f).replace('.pdf', '')  # 获取不含路径文件名
        save_name = outpath + '\\' + save_name
        doc = fitz.open(f)
        rotate = int(0)  # 设置图片的旋转角度
        trans = fitz.Matrix(zoom_x, zoom_y).prerotate(rotate)
        for pg in range(doc.page_count):
            page = doc[pg]
            pm = page.get_pixmap(matrix=trans, alpha=False)
            if doc.page_count == 1:
                pm.save(f'{save_name}.png')
            else:
                pm.save('{}-{:04d}.png'.format(save_name, pg))
        doc.close()
    print('转换完成')

举例

对上面图片转PDF举例中,图片转换为PDF文件,缩放系数zoom_x和zoom_y设为1.25转换为图片后,分辨率与原始图片差不多

if __name__ == '__main__':
    filename = r'E:\测试\jpg\五共1\2张图片.pdf'
    filepath = r'E:\测试\jpg\五共1'
    #pdf2png1(filename, filepath)
    pdf2png2(filepath, filepath)

转换前
在这里插入图片描述
转换后
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1185115.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

lua脚本实现redis分布式锁(脚本解析)

文章目录 lua介绍lua基本语法redis执行lua脚本 - EVAL指令使用lua保证删除原子性 lua介绍 Lua 是一种轻量小巧的脚本语言,用标准C语言编写并以源代码形式开放, 其设计目的是为了嵌入应用程序中,从而为应用程序提供灵活的扩展和定制功能。 设…

最适合后端程序员要学的前端基本知识js版本

本文章适合有后端基础,也对前端知识有所了解的同学,简单而精准的了解后端程序员要了解的前端知识。让自己能看懂前端js,html和css版本后续写出。。。。 自定义对象 在对象中创建对象的行为时若是要调用对象属性,要加this 列如&a…

kubernetes 认证授权

目录 一、kubernetes API访问控制 二、pod绑定sa 三、认证 四、授权 一、kubernetes API访问控制 Authentication(认证)认证方式现共有8种,可以启用一种或多种认证方式,只要有一种认证方式通过,就不再进行其它方式…

【Axure高保真原型】树切换动态面板案例

今天和大家分享树切换动态面板的原型模板,点击树的箭头可以打开或者收起子节点,点击最后一级人物节点,可以切换右侧面板的状态到对应的页面,左侧的树是通过中继器制作的,使用简单,只需要按要求填写中继器表…

人大金仓三大兼容:SQL Server迁移无忧

SQL Server在数据库领域一直占据着重要地位。作为一款成熟稳定的关系型数据库管理系统,SQL Server在国内有着广泛的用户群体,医疗、海关、政务等行业的核心业务系统多采用SQL Server数据库。随着政策与市场的双重驱动,信息技术应用创新产业的…

【快速使用ShardingJDBC的哈希分片策略进行分表】

文章目录 🔊博主介绍🥤本文内容🍊1.引入maven依赖🍊2.启动类上添加注解MapperScan🍊3.添加application.properties配置🍊4.普通的自定义实体类🍊5.写个测试类验证一下🍊6.控制台打印…

竞赛 目标检测-行人车辆检测流量计数

文章目录 前言1\. 目标检测概况1.1 什么是目标检测?1.2 发展阶段 2\. 行人检测2.1 行人检测简介2.2 行人检测技术难点2.3 行人检测实现效果2.4 关键代码-训练过程 最后 前言 🔥 优质竞赛项目系列,今天要分享的是 行人车辆目标检测计数系统 …

Linux之make/maakefile

access不是实时更新的。 printf打印并不是直接给屏幕而是先放到缓冲区。 可以通过fflush(stdout)强制刷新缓冲区。 换行是指直接到同一位置的下一行,回车是回到开头。

【MySQL数据库】 七

本文主要介绍了Java的JDBC编程的过程. 超详细 !!! 一.JDBC JDBC就是通过Java代码,来操作数据库 由于我们在实际开发中,绝大部分都是用代码来操作数据库的 , 因此一个成熟的数据库,都会提供一些API让程序员来使用. 常见的数据库比如mysql / oracl / sqlserver / SQLite 都会提…

Python类与对象:类的定义、实例化、方法、属性、构造函数

文章目录 类的定义类的实例化方法属性构造函数Python 类和对象是面向对象编程的基础。在 Python 中,几乎所有东西都是对象,拥有属性和方法。类是创建对象的蓝图或模板。让我们一步步来探索类的定义、实例化、方法、属性以及构造函数,并提供详细的代码示例。 类的定义 在 P…

SQL注入漏洞 其他注入

文章目录 宽字节注入案例 HTTP头部注入Cookie注入base64User-Agent注入Referer 注入 SQL注入读写文件条件1.是否拥有读写权限2.文件路径3.secure_file_priv 读取文件写入文件 SQLMap安装sqlmapkail 源安装仓库克隆 参数简介快速入门;SQLmap(常规&#xf…

【Docker】设置容器系统字符集zh_CN.UTF-8退出失效:关于Docker容器配置环境变量,再次进入失效问题

设置容器系统字符集zh_CN.UTF-8退出失效:关于Docker容器配置环境变量,再次进入失效问题 修改正在运行的Docker容器内的字符集: 先进入Docker容器:docker exec -it 容器ID /bin/bash查看是否支持中文字符集:locale -a | grep zh&a…

B站双11,联手天猫暴涨2亿消费新势力

一直以来,手持高活跃、高粘性用户群体的B站是行业用来观察年轻人消费习惯的重要平台。以至于用户群体的不断壮大带动了B站的商业价值。如今B站的商业舞台越来越大,不断地向外界招手,欢迎更多品牌积极加入到这个千万年轻人聚集的内容社区。 2…

如何有效防爬虫?教你打造安全堡垒

企业拥抱数字化技术的过程中,网络犯罪分子的“战术”也更难以觉察,并且这些攻击越来越自动化和复杂,也更加难以觉察。在众多攻击手段总,网络爬虫是企业面临的主要安全挑战,对于企业所造成的经济损失是难以计量的。那么…

设备密集型单位如何提升效率?智能巡检软件哪个好?

在设备密集型单位,如钢铁、化工、电力、烟草、日用品等行业以及运维商,日常工作中面临着设备巡检这一重要且繁琐的任务。传统的巡检方式往往依靠纸质记录,数据难以进行统计或分析,巡检人员需要手动记录各种数据,不仅效…

visual studio 启用DPI识别功能

在开发widow程序时,有时必须将电脑 设置-->显示-->缩放与布局-->更改文本、应用项目的大小-->100%后,程序的画面才能正确运行,居说这是锁定了dpi的原因,需要启dpi识别功能。设置方法如下: 或者

unity - Blend Shape - 变形器 - 实践

文章目录 目的Blend Shape 逐顶点 多个混合思路Blender3Ds maxUnity 中使用Project 目的 拾遗,备份 Blend Shape 逐顶点 多个混合思路 blend shape 基于: vertex number, vertex sn 相同,才能正常混合、播放 也就是 vertex buffer 的顶点数…

CocosCreator让一个物体跟随鼠标移动(两种方式 本地坐标系和世界坐标系)

在 Cocos Creator 3.x 游戏运行时显示的画布大小就是屏幕区域,屏幕坐标是从画布的左下角为原点开始计算 在 Creator 3.x 里,屏幕和 UI 是完全区分开的,用户可以在没有 UI 的情况下点击屏幕获取触点信息。因此,获取屏幕触点&#…

Jmeter工具二次开发

一、JMeter 二次开发方向 1、函数开发,主要为JMeter 函数库 2、插件开发,一般主要做取样器开发 3、基于执行引擎开发,有效解决单独开发的测试平台或工具中,底层执行引擎开发相对复杂、周期长的问题,利用 JMeter 执行…

分享vmware和Oracle VM VirtualBox虚拟机的区别,简述哪一个更适合我?

VMware和Oracle VM VirtualBox虚拟机的区别主要体现在以下几个方面: 首先两种软件的安装使用教程如下: 1:VMware ESXI 安装使用教程 2:Oracle VM VirtualBox安装使用教程 商业模式:VMware是一家商业公司,而…