JS将PDF转图片,pdfjs的使用

news2024/12/23 10:18:58

Hi I’m Shendi

最近做转换工具,需要将pdf转图片,这里记录下来


JS将PDF转图片,pdfjs的使用




简介

A general-purpose, web standards-based platform for parsing and rendering PDFs.

一个通用的、基于web标准的平台,用于解析和呈现PDF。

简单讲就是用来展示pdf的



官方Demo

https://mozilla.github.io/pdf.js/examples/



API文档

这个api文档感觉不太好,没有目录和重定向链接之类的,全程靠Ctrl+F搜素…

https://mozilla.github.io/pdf.js/api/draft/index.html



下载

https://mozilla.github.io/pdf.js/getting_started/

点击下载即可

在这里插入图片描述


下载后解压,进入build目录,需要的文件有两个,pdf.jspdf.worker.js



使用

代码内只需要引入 pdf.js

上面说到的两个文件如果不放在同一文件夹下的话就需要进行以下设置

pdfjsLib.GlobalWorkerOptions.workerSrc = "pdf.worker.js的地址";

当然,放在同一文件夹也可以进行以上设置,不然控制台会输出一个提示


Deprecated API usage: No “GlobalWorkerOptions.workerSrc” specified.

不推荐使用API:未指定“GlobalWorkerOptions.workerSrc”。




有一全局变量 pdfjsLib,通过此来进行操作

大致分为以下几步

  1. 获取文档 - getDocument
  2. 通过文档获取页 - getPage
  3. 将页渲染到canvas - render


我的目的是将pdf转图片,经过上面的步骤,最后将canvas转图片就可以达到目的了


获取文档

getDocument 函数接收一个参数为pdf文件,API文档上说明可以为以下类型

string | URL | TypedArray | ArrayBuffer | DocumentInitParameters

我将用户上传的文件转链接,使用 URL.createObjectURL(),(下面示例使用的sw是我封装的工具包)

返回一个 PDFDocumentLoadingTask,操作是异步的,可以使用Promise来获取结果

pdfjsLib.getDocument(sw.getObjectURL(file)).promise.then(function(pdf) {
    // 参数pdf代表获取的文档了
});


获取页

拿到文档后,可以通过文档获取页,通过 getPage 函数

在这里插入图片描述


numPages 属性为总页数,可以通过这个来遍历,同样获取页数也是异步

示例如下

for (let i = 1; i <= pdf.numPages; i++) {
    pdf.getPage(i).then(function(page) {
        // page为拿到的页数
    });
}

还有很多的函数,可以参考api文档



渲染

拿到页后,通过 render 来渲染

在这里插入图片描述


具体参数可以查阅api文档,这里传递的obj大致需要canvas环境和页面视口,渲染同样也是异步的,渲染完后,在canvas上就显示pdf的内容了。如下

var canvas = document.createElement("canvas");
page.render({
    canvasContext: canvas.getContext('2d'),
    // scale代表缩放
    viewport: page.getViewport({ scale: 1.5 })
}).promise.then(function () {
    // 渲染完成,进行后续操作
});;


我的目的是将pdf转图片,现在内容渲染到canvas上,只需要将canvas转图片就可以了



Canvas转图片

可以用 canvas.toDataURL 转图片链接,用a标签打开下载,但我需要将多图片打包到压缩文件,所以需要转字节,使用 canvas.toBlob

// canvas转链接,通过a标签下载. 这里下载使用我自己封装的库了
sw.downUrl(canvas.toDataURL("image/png"), "图片.png");

// canvas转字节数组,加入到压缩文件,使用的jszip
canvas.toBlob(function (e) {
    // 这里是jszip的用法,e是canvas内容数据,可以参考api文档
    folder.file(i + "." + outType, e);
}, "image/png", 1);



END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/681574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

word公式mathtype公式

行间公式&#xff1a; 直接点“有编号” 内联公式&#xff1a; 直接点“内联” 交叉引用&#xff1a; 插入引用&#xff0c;双击编号 行内公式大小不统一&#xff0c;公式的代码可能上漂 解决方案&#xff1a;法一&#xff1a;切换Tex&#xff0c;再次切换过来。 法二&…

ElasticSearch的核心概念简单描述

我正在参加「掘金启航计划」 ES核心概念 ES是面向文档,下面表格是和关系型数据库的对比,一切都是JSON 关系数据库(Mysql)ES数据库(database)索引(indices) 和数据库一样表(tables)types 慢慢会被弃用 7.0已经过时 8.0会彻底废弃行(rows)documents (数据)文档字段(columns)fi…

简单图论+二分搜索:环境治理

题目描述 LQ 国拥有 n 个城市, 从 0 到 n−1 编号, 这 n 个城市两两之间都有且仅有 一条双向道路连接, 这意味着任意两个城市之间都是可达的。每条道路都有一 个属性 D, 表示这条道路的灰尘度。当从一个城市 A 前往另一个城市 B 时, 可 能存在多条路线, 每条路线的灰尘度定义为…

前端项目规范化:手把手教你使用prettier和pre-commit(git hook或者husky)优化规范项目代码

如何在提交代码之前&#xff0c;进行代码格式化检查&#xff0c;保证每个成员的代码都是同一个风格呢&#xff1f; 最简单的两种方式&#xff1a; 使用 prettier git pre-commit 使用 prettier husky(原理和第一种一模一样哦) 名词简介 git hooks 下图为git hooks的官方…

FcaNet: Frequency Channel Attention Networks论文总结和代码详解

论文&#xff1a;https://arxiv.org/abs/2012.11879 中文版&#xff1a;FcaNet: Frequency Channel Attention Networks 源码&#xff1a;https://github.com/cfzd/FcaNet或https://gitee.com/yasuo_hao/FcaNet 目录 一、论文背景和出发点 二、创新点 三、离散余弦变换&…

FastDFS-图灵

1. 分布式文件系统应用场景 互联网海量非结构化苏剧的存储需求 电商网站&#xff1a;海量商品图片视频网站&#xff1a;海量视频文件网盘&#xff1a;海量文件社交网站&#xff1a;海量图片 2.FastDFS介绍 https://github.com/happyfish100/fastdfs 2.1 简介 FastDFS是一个…

(转载)支持向量机(support vector machine, SVM)的分类(matlab实现)

支持向量机(support vector machine,SVM)是一种新的机器学习方法&#xff0c;其基础是Vapnik 创建的统计学习理论(statistical learning theory,STL)。统计学习理论采用结构风险最小化(structural risk minimization,SRM)准则&#xff0c;在最小化样本点误差的同时&#xff0c;…

Redis进阶 - Redis主从

原文首更地址&#xff0c;阅读效果更佳&#xff01; Redis进阶 - Redis主从 | CoderMast编程桅杆https://www.codermast.com/database/redis/redis-advance-master-slave.html 搭建主从架构 单节点 Redis 的并发能力是有上限的&#xff0c;要进一步提高 Redis 的并发能力&am…

CSS3技巧35:滚动的条纹背景

感觉好久没更博客了&#xff0c;虽然我经常登录看下粉丝数。O(∩_∩)O 端午节摆烂&#xff0c;休息了下&#xff0c;恢复下元气。 节后开始满负荷工作。 ---------------------------正文开始------------------------------------------ 做进度条的时候&#xff0c;有时候会…

Tomcat【部署zrlog】

目录 目录 1、单节点部署zrlog【192.168.200.121】 1.1、 创建数据库、远程登录用户 1.2、 浏览器访问 2、 LB集群-构建-部署zrlog-NFS共享存储 2.1、 安装、配置LB【192.168.200.120】 2.2、 NFS-资源共享【192.168.200.125】 3、配置tomcat访问日志中记录真实IP 1、单…

[元带你学: eMMC协议详解 20] emmc的命令(cmd)、响应(resp)详解

依JEDEC eMMC 5.1及经验辛苦整理&#xff0c;付费内容&#xff0c;禁止转载。 所在专栏 《元带你学: eMMC协议详解》 内容摘要 全文 8100字&#xff0c; 主要内容 对eMMC的command进行详细介绍&#xff0c;主要包含如下内容&#xff1a; (1) emmc命令有哪些 (2) 使用不同命…

Java POI (1)—— 数据读写操作快速入门

一、Excel的版本区别&#xff08;03版和07版&#xff09; 所谓“03版” 和 “07版”&#xff0c;指的是 Microsoft Excel 版本号。这些版本号代表着不同的Excel 文件格式。2003版 Excel 使用的文件格式为 .xls&#xff0c;而2007版开始使用新的文件格式 .xlsx。 . xlsx 文件格式…

Unreal 5 蓝图常用的一些节点和规范

命名规范 蓝图类以 BP_作为前缀 对应Blue Print 混合空间以 BS_作为前缀 Blend Space 静态网格体以 SM_作为前缀 StaticMesh 骨骼网格体以 SK_作为前缀 Skeletal Mesh 纹理以 T_作为前缀 Texture 粒子系统 以 PS_作为前缀 Particle System 主材质以 M_作为前缀 Material 材质子…

手术机器人常见骨科手术 TKA UKA HTO

TKA UKA HTO 首先这几种手术都是常见的手术&#xff0c;下面先进行常见的但要介绍&#xff1a; 近年来有大量的研究聚焦于手术方式的对比&#xff0c;这里先就现有证据对「HTO」、单髁置换「UKA」和全膝置换「TKA」做一个简要的总结&#xff0c;以便于速查&#xff1a; TKA 不…

熵权法步骤及例题讲解

一、基本原理 在信息论中&#xff0c;熵是对不确定性的一种度量。不确定性越大&#xff0c;熵就越大&#xff0c;包含的信息量越大&#xff1b;不确定性越小&#xff0c;熵就越小&#xff0c;包含的信息量就越小。 根据熵的特性&#xff0c;可以通过计算熵值来判断一个事件的随…

【玩转Linux操作】详细讲解shell的注释,变量,字符串,数组等操作

&#x1f38a;专栏【玩转Linux操作】 &#x1f354;喜欢的诗句&#xff1a;更喜岷山千里雪 三军过后尽开颜。 &#x1f386;音乐分享【Counting Stars 】 欢迎并且感谢大家指出小吉的问题&#x1f970; 文章目录 &#x1f354;概述⭐注意⭐示例&#x1f3f3;️‍&#x1f308;然…

scala的基本语法

注释 对于scala的注释&#xff0c;简而言之就是一句话&#xff0c;和java的注释一模一样 基本语法 &#xff08;1&#xff09;单行注释&#xff1a;// &#xff08;2&#xff09;多行注释&#xff1a;/* */ &#xff08;3&#xff09;文档注释&#xff1a;/****/代码示例&…

samaphore、countdownlatch、cyclinarrier

目录 一、samaphore 1、介绍 2、应用 3、原理 二、countdownlatch 三、cyclicbarrier 一、samaphore 1、介绍 信号量&#xff0c;用来限制同时访问共享资源的线程上限。可以理解为停车场入口的提示排&#xff0c;标识有多少车位&#xff0c;有车位才能进去停车&#xf…

ElasticSearch-使用IK分词器进行分词

使用KIbana测试IK分词器 打开开发工具台 ik_smart 最少分词器 分词结果比较少 GET _analyze{"analyzer": "ik_smart","text": "中国共产党"}ik_max_word 颗粒度最细分词器 分词结果比较多,组成各种结果,穷尽词库的可能&#xff01…

easypan前端学习

文章目录 前端项目node 版本node镜像构建项目创建项目安装项目所有依赖 图片资源网站encodeURI & decodeURIapp.config.globalProperties与getCurrentInstanceObject.assignvue-cookies安装vue-cookies 使用vue-cookiesrouter.currentRoutepreserve logimport.meta.envRequ…