Stirling-PDF:一款优秀的开源PDF处理工具

news2024/10/5 18:25:29

最近我的朋友大雄需要将一个PDF转换为Word文档。于是他在网上尝试了多个PDF转换的在线工具,但要么需要会员,要么需要登录等繁琐操作,而且我们的文件也存在泄漏等安全隐患。因此,他向我咨询是否有可私有化部署且易于使用的PDF在线工具。大雄平时也喜欢制作PPT,每当有灵感时就会创建超过60多页的ppt演示文稿。

最近我在GitHub上闲逛时,恰好发现了一个名为Stirling-PDF的项目,该项目已经获得了3.3k的星标,完全符合他的所有需求。从此,他便可以放心地转换自己的那些超长私密的PPT了。今天,我们就来分享一下这个项目,并介绍如何使用Docker Compose进行私有化部署。

storlingpdf.jpg

Stirling-PDF项目介绍

github地址: https://github.com/Frooodle/Stirling-PDF

_20231014225022.jpg

Stirling-PDF是一个基于spring-boot开发的开源项目,旨在提供一个功能强大的基于Docker的本地托管PDF操作工具。它使您能够对PDF文件进行多种操作,包括拆分、合并、转换、重新组织、添加图片、旋转、压缩等。该本地托管应用最初由ChatGPT完全开发,并已发展成一个功能齐全的工具,可满足您的各种PDF需求。

Stirling-PDF不会进行任何外部调用来进行记录或跟踪。

所有文件和PDF要么完全在客户端处理,要么在任务执行期间仅存在于服务器内存中,要么仅在任务执行期间存在于临时文件中。任何用户下载的文件在这个时候都已从服务器上删除。

项目功能:基本涵盖了我们常用的对pdf的所有操作

_20231014231217.jpg

_20231014231236.jpg

docker-compose 私有化部署

我们此处使用的镜像是作者给我们提供好的,如果家人们需要最新代码镜像的话可以根据作者在项目中给我们提供好的Dockerfile文件自行构建。

首相我们要创建docker-compose.yml文件

version: '3.3'
services:
  stirling-pdf:
    image: frooodle/s-pdf:latest
    ports:
      - 8070:8080
    volumes:
      - ./trainingData:/usr/share/tesseract-ocr/4.00/tessdata
      #Required for extra OCR languages
      - ./extraConfigs:/configs
      - ./customFiles:/customFiles/
    environment:
      - DOCKER_ENABLE_SECURITY=false

创建好之后我们只需要在docker-compose.yml的同级目录下执行如下启动命令

docker-compose up -d 

启动之后查看日志

docker-compose logs -f 

_20231014230034.jpg

如此我们的项目则启动成功了

Stirling-PDF 项目访问

部署成功之后我们在浏览器中输入地址访问 http://192.168.10.105:8070

_20231014230545.jpg

我们可以修改语言为简体中文

_20231014230742.jpg

项目也提供了api

_20231014230942.jpg

_20231014230954.jpg

我们也使用了其中的一些功能,因为功能比较多,我们此处给只列举两个示例,其余功能家人们可自行使用

  • pdf 转word

_20231014231744.jpg

_20231014231927.jpg

转换好之后它会自动在浏览器中下载转换之后的文件,转换之后的文件如下:

_20231014232300.jpg

  • 添加水印

_20231014232426.jpg

_20231014232517.jpg

添加之后的效果:

_20231014232648.jpg

总结

总的来说,Stirling-PDF是一个基于Spring Boot开发的开源项目,为用户提供了强大的基于Docker的本地托管PDF处理工具。不论是拆分、合并、转换、重新组织、添加图片、旋转还是压缩等操作,Stirling-PDF都能轻松应对。该项目最初由ChatGPT全权开发,目前已发展成为一个功能完善且广泛应用的工具,满足用户的各种PDF处理需求。

值得一提的是,Stirling-PDF非常重视用户隐私和文件安全。它不会进行任何外部调用来记录或跟踪用户操作。所有文件和PDF要么完全在客户端处理,要么在任务执行期间仅存在于服务器内存中,要么仅在任务执行期间存在于临时文件中。这保证了用户在使用过程中的安全性和隐私保护。

借助Stirling-PDF,用户可以高效处理PDF文档,享受简单、快捷、安全的操作体验。尽管该项目在某些PDF处理方面存在一些小问题,但其持续更新和完善,我们期待着它能变得更加完善。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1093509.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

字符函数和字符串函数2(C语言进阶)

字符函数和字符串函数2 三.长度受限制的字符串函数介绍1.strncpy2.strncat3.strncmp 四.字符串查找1.strstr2.strtok 五.错误信息报告1.strerror 六.字符操作七.内存操作函数1.memcpy2.memmove3.memset4.memcmp 三.长度受限制的字符串函数介绍 1.strncpy char * strncpy ( ch…

8.简易无线通信

预备知识 Zigbee无线通信,需要高频的载波来提供发射效率,Zigbee模块之间要可以正常的收发,接收模块必须把接收频率设置和发射模块的载波频率一致。Zigbee有27个载波可以进行通信,载波叫做信道(无线通信的通道&#xf…

UE4 EQS环境查询 学习笔记

EQS环境查询对应Actor的范围 EQS环境查询查询对应的类 查询到即有一个蓝色的球在Actor上,里面有位置信息等等 在行为树运行EQS,按键(‘)可以看到Player的位置已经被标记 运行对应的EQS在这里放如EQS就可以了 Generated Point&…

2023年中国分布式光纤传感产量、需求量及行业市场规模分析[图]

分布式光纤传感器中的光纤能够集传感、传输功能于一体,能够完成在整条光纤长度上环境参量的空间、时间多维连续测量,具有结构简单、易于布设、性价比高、易实现长距离等独特优点,常用的分布式光纤传感器有光时域反射仪、布里渊分析仪、喇曼反…

【AI视野·今日Robot 机器人论文速览 第五十四期】Fri, 13 Oct 2023

AI视野今日CS.Robotics 机器人学论文速览 Fri, 13 Oct 2023 Totally 45 papers 👉上期速览✈更多精彩请移步主页 Interesting: 📚AI与机器人安全, 从攻击界面、伦理法律和人机交互层面进行了论述。(from 密西西比大学) 📚机器人与图机器学…

Windows端口号被占用的查看方法及解决办法

Windows端口号被占用的查看方法及解决办法 Error starting ApplicationContext. To display the conditions report re-run your application with debug enabled. 2023-10-14 22:58:32.069 ERROR 6488 --- [ main] o.s.b.d.LoggingFailureAnalysisReporter : ***…

Qt 布局(QLayout 类QStackedWidget 类) 总结

一、QLayout类(基本布局) QLayout类是Qt框架中用于管理和排列QWidget控件的布局类。它提供了一种方便而灵活的方式来自动布局QWidget控件。QLayout类允许您以一种简单的方式指定如何安排控件,并能够自动处理控件的位置和大小,以使其适应更改的父窗口的大…

【HCIA】静态路由综合实验

实验要求: 1、R6为ISP,接口IP地址均为公有地址,该设备只能配置IP地址之后不能再对其进行任何配置 2、R1-R5为局域网,私有IP地址192.168.1.0/24,请合理分配 3、R1、R2、R4,各有两个环回IP地址;R5,R6各有一…

基于 Kubernetes 的 Serverless PaaS 稳定性建设万字总结

作者:许成铭(竞霄) 数字经济的今天,云计算俨然已经作为基础设施融入到人们的日常生活中,稳定性作为云产品的基本要求,研发人员的技术底线,其不仅仅是文档里承诺的几个九的 SLA 数字&#xff0c…

MyBatis的缓存,一级缓存,二级缓存

10、MyBatis的缓存 10.1、MyBatis的一级缓存 一级缓存是SqlSession级别的,通过同一个SqlSession对象 查询的结果数据会被缓存,下次执行相同的查询语句,就 会从缓存中(缓存在内存里)直接获取,不会重新访问…

c++string类的赋值问题

来看问题: 为什么呢?是因为定义string a""时候a没有占用空间,所以没有a[0],a[1],a[3]。如果说string a"hhhhhh",那么图中a[0],a[1],a[3]就有效了。正确的做法是用连接,或者是定义时写成string a(6…

爬虫 | 正则、Xpath、BeautifulSoup示例学习

文章目录 📚import requests📚import re📚from lxml import etree📚from bs4 import BeautifulSoup📚小结 契机是课程项目需要爬取一份数据,于是在CSDN搜了搜相关的教程。在博主【朦胧的雨梦】主页学到很多…

vsc连接wsl安装vsc时遇到权限问题的解决方案

当点击左下角的连接 遇到下面的权限提示时 mkdir: cannot create directory ‘/home/xxx(用户名)/.vscode-server’: Permission denied 可以新建文件 /etc/wsl.conf,并拷贝如下内容 # Automatically mount Windows drive when the distribution is launched [aut…

面试总结之Java基础

1、反射 1.1、概述 反射:加载类(通过反射将类的字节码文件加载到内存中),并允许以编程的方式解剖类中的各种成分(成员变量、方法、构造器等)反射需要掌握的内容: 1)记载类&#xf…

实习项目遇到的bug

问题1: 大概是因为没设置ts类型,它查不到的问题,不定义的话加上问号,加上可选链就不会报错了 {{bizEquipmentInfo.lastUnlockingVO?.lastUnlockingTime.replace(T, )? bizEquipmentInfo.lastUnlockingVO?.lastUnlockingTime.r…

通讯网关软件024——利用CommGate X2Access实现Modbus TCP数据转储Access

本文介绍利用CommGate X2ACCESS实现从Modbus TCP设备读取数据并转储至ACCESS数据库。CommGate X2ACCESS是宁波科安网信开发的网关软件,软件可以登录到网信智汇(http://wangxinzhihui.com)下载。 【案例】如下图所示,实现从Modbus TCP设备读取数据并转储…

【EventLoop】问题一次搞定

📍 JS的事件循环机制恐怕是大多数前端开发者头顶上的一座大山之一,最近通过拜读两篇文档,对eventloop进行了深刻的理解;通过这篇文档对要点进行总结; article1: 波神的这篇eventLoop文章适合反复重温&…

Ubuntu22安装Docker engine(apt安装方式)

一、准备工作 新创建一个虚拟机。 进入虚拟机: 二、安装docker docker现在对用不同主机提供了不同安装包:docker engine 和 docker desktop。 docker desktop适用于图形化的桌面电脑,docker engine适用于服务器。我们这里当然是安装docker…

Mac 远程 Ubuntu

1. Iterm2 添加ssh 参考:https://www.javatang.com/archives/2021/11/29/13063392.html 2. Finder 添加远程文件管理 2.1 ubuntu 配置 安装samba sudo apt-get install samba配置 [share]path /home/USER_NAME/shared_directoryavailable yesbrowseable ye…

快速计算发票金额

快速计算发票总额 背景 在日常的工作中,我们不免需要面临费用报销问题,在进行费用报销时,我们需要提供费用相关的发票,并需要在报销单上填写相关的金额数据。这时我们将面临核对和计算发票金额的需求。 核对发票 如今&#xf…