使用 React 16+Webpack 和 pdfjs-dist 或 react-pdf 实现 PDF 文件显示、定位和高亮

news2025/2/13 11:51:11

写在前面

在本文中,我们将探讨如何使用 React 16+Webpack 和 pdfjs-dist 或 react-pdf 库来实现 PDF 文件的显示、定位和高亮功能。这些库提供了强大的工具和 API,使得在 Web 应用中处理 PDF 文件变得更加容易。

项目设置

首先,我们需要创建一个新的 React 项目并安装所需的依赖。可以使用 create-react-app 工具来快速生成项目骨架:

npx create-react-app pdf-viewer
cd pdf-viewer

接下来,安装 pdfjs-dist 或 react-pdf 库:

# 使用 pdfjs-dist
npm install pdfjs-dist

# 或者使用 react-pdf
npm install react-pdf

使用 pdfjs-dist

pdfjs-dist 是一个流行的 JavaScript 库,用于在浏览器中解析和显示 PDF 文件。以下是使用 pdfjs-dist 实现 PDF 文件显示、定位和高亮的步骤:

  1. 导入 pdfjs-dist

在你的 React 组件中导入 pdfjs-dist:

import { PDFDocument } from 'pdfjs-dist';
  1. 加载 PDF 文件

使用 PDFDocument 类从 URL 或文件对象加载 PDF 文档:

const pdfUrl = 'https://example.com/sample.pdf';

PDFDocument.load(pdfUrl).promise.then((pdf) => {
  // PDF 加载完成后的处理逻辑
});
  1. 显示 PDF 页面

获取 PDF 文档的第一页并将其渲染到 canvas 元素中:

const canvas = document.getElementById('pdf-canvas');
const ctx = canvas.getContext('2d');

pdf.getPage(1).then((page) => {
  const viewport = page.getViewport({ scale: 1 });
  canvas.height = viewport.height;
  canvas.width = viewport.width;

  const renderContext = {
    canvasContext: ctx,
    viewport,
  };

  page.render(renderContext);
});
  1. 定位到特定页面

使用 getPage() 方法获取指定页码的页面对象:

const targetPageNumber = 3;
pdf.getPage(targetPageNumber).then((page) => {
  // 定位到目标页面的处理逻辑
});
  1. 高亮文本

使用 getTextContent() 方法获取页面上的文本内容,并使用 canvas API 在文本位置绘制高亮矩形:

page.getTextContent().then((textContent) => {
  const items = textContent.items;
  for (let i = 0; i < items.length; i++) {
    const item = items[i];
    if (item.str === 'Hello, world!') {
      const transform = page.getTransform(item.transform);
      const x = transform[4];
      const y = transform[5];
      const width = item.width;
      const height = item.height;

      ctx.fillStyle = 'rgba(255, 255, 0, 0.5)';
      ctx.fillRect(x, y, width, height);
    }
  }
});

使用 react-pdf

react-pdf 是一个专门为 React 应用设计的 PDF 查看器组件。以下是使用 react-pdf 实现 PDF 文件显示、定位和高亮的步骤:

  1. 导入 react-pdf

在你的 React 组件中导入 react-pdf:

import { Document, Page } from 'react-pdf';
  1. 加载 PDF 文件

使用 Document 组件加载 PDF 文档:

const pdfUrl = 'https://example.com/sample.pdf';

<Document file={pdfUrl}>
  <Page pageNumber={1} />
</Document>
  1. 显示 PDF 页面

使用 Page 组件渲染 PDF 页面:

const pdfUrl = 'https://example.com/sample.pdf';

<Document file={pdfUrl}>
  <Page pageNumber={1} />
</Document>
  1. 定位到特定页面

通过更改 Page 组件的 pageNumber 属性来定位到指定页码:

const targetPageNumber = 3;

<Document file={pdfUrl}>
  <Page pageNumber={targetPageNumber} />
</Document>
  1. 高亮文本

react-pdf 不直接支持高亮文本功能,但可以通过自定义渲染函数来实现。例如,可以使用 onLoadSuccess 回调获取 PDF 文档的文本内容,并在渲染页面时绘制高亮矩形:

const pdfUrl = 'https://example.com/sample.pdf';

function CustomPage({ pageNumber, width, height }) {
  const [textContent, setTextContent] = useState(null);

  useEffect(() => {
    const page = pdf.getPage(pageNumber);
    page.getTextContent().then((textContent) => {
      setTextContent(textContent);
    });
  }, [pageNumber]);

  return (
    <Page
      pageNumber={pageNumber}
      width={width}
      height={height}
      render={(page) => {
        // 在这里绘制高亮矩形
        if (textContent) {
          const canvas = page.getCanvas();
          const ctx = canvas.getContext('2d');
          //...
        }
      }}
    />
  );
}

<Document file={pdfUrl}>
  <CustomPage pageNumber={1} width={400} height={600} />
</Document>

总结

在本文中,我们探讨了如何使用 React 16+Webpack 和 pdfjs-dist 或 react-pdf 库来实现 PDF 文件的显示、定位和高亮功能。无论选择哪种库,都可以轻松地在 Web 应用中处理 PDF 文件。记住,根据你的具体需求和项目要求,选择最适合的库和方法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2297340.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LabVIEW显微镜成像偏差校准

在高精度显微镜成像中&#xff0c;用户常常需要通过点击图像的不同位置&#xff0c;让电机驱动探针移动到指定点进行观察。然而&#xff0c;在实际操作中&#xff0c;经常会遇到一个问题&#xff1a;当点击位于图像中心附近的点时&#xff0c;探针能够相对准确地定位&#xff1…

23页PDF | 国标《GB/T 44109-2024 信息技术 大数据 数据治理实施指南 》发布

一、前言 《信息技术 大数据 数据治理实施指南》是中国国家标准化管理委员会发布的关于大数据环境下数据治理实施的指导性文件&#xff0c;旨在为组织开展数据治理工作提供系统性的方法和框架。报告详细阐述了数据治理的实施过程&#xff0c;包括规划、执行、评价和改进四个阶…

AI代码生成器如何重塑前端开发的工作环境

近年来&#xff0c;人工智能&#xff08;AI&#xff09;技术迅猛发展&#xff0c;深刻地改变着各行各业的工作方式。在软件开发领域&#xff0c;AI写代码工具的出现更是掀起了一场革命&#xff0c;尤其对前端开发工程师的工作环境和协作方式产生了深远的影响。本文将深入探讨AI…

Xcode证书密钥导入

证书干嘛用 渠道定期会给xcode证书&#xff0c;用来给ios打包用&#xff0c;证书里面有记录哪些设备可以打包进去。 怎么换证书 先更新密钥 在钥匙串访问中&#xff0c;选择系统。(选登录也行&#xff0c;反正两个都要导入就是了)。 mac中双击所有 .p12 后缀的密钥&#xff…

Python 基于 OpenCV 的人脸识别上课考勤系统(附源码,部署教程)

博主介绍&#xff1a;✌2013crazy、10年大厂程序员经历。全网粉丝12W、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&a…

TikTok网页版访问受限?一文解析解决方案

TikTok网页版是许多用户用来浏览视频、管理账号和发布内容的重要工具。然而&#xff0c;部分用户可能会遇到无法打开TikTok网页版的问题&#xff0c;如页面加载失败、显示网络错误或提示访问受限。本文将帮助你快速排查问题&#xff0c;并提供解决方案&#xff0c;让你顺利访问…

【vs2022配置cursor】

Cursor搭配cmake实现C程序的编译、运行和调试的参考地址 cursor下载地址 第一步&#xff1a; 电脑上按爪cmake 第二步&#xff1a;cursor 配置 安装中文 第三步环境变量&#xff1a; D:\Program Files\Microsoft Visual Studio\2022\Professional\VC\Tools\MSVC\14.35.322…

Redis 的缓存雪崩、缓存穿透和缓存击穿详解,并提供多种解决方案

本文是对 Redis 知识的补充&#xff0c;在了解了如何搭建多种类型的 Redis 集群&#xff0c;并清楚了 Redis 集群搭建的过程的原理和注意事项之后&#xff0c;就要开始了解在使用 Redis 时可能出现的突发问题和对应的解决方案。 引言&#xff1a;虽然 Redis 是单线程的&#xf…

DeepSeek-R1复现方案梳理

open-r1 项目地址&#xff1a;https://github.com/huggingface/open-r1 由huggingface组建&#xff0c;目前刚上线2周&#xff0c;发布了最新进展open-r1/update-1&#xff0c;在MATH-500任务上接近deepseek的指标&#xff0c;可以在open-r1/open-r1-eval-leaderboard查看指标的…

用php tp6对接钉钉审批流的 table 表格 明细控件 旧版sdk

核心代码 foreach ($flows[product_list] as $k>$gift) {$items_list[] [[name > 商品名称, value > $gift[product_name] ?? ],[name > 规格, value > $gift[product_name] ?? ],[name > 数量, value > $gift[quantity] ?? ],[name > 单位, v…

大模型RLHF:PPO原理与源码解读

大模型RLHF&#xff1a;PPO原理与源码解读 原文链接&#xff1a;图解大模型RLHF系列之&#xff1a;人人都能看懂的PPO原理与源码解读 本文直接从一个RLHF开源项目源码入手&#xff08;deepspeed-chat&#xff09;&#xff0c;根据源码的实现细节&#xff0c;给出尽可能丰富的训…

SQLite 数据库:优点、语法与快速入门指南

文章目录 一、引言二、SQLite 的优点 &#x1f4af;三、SQLite 的基本语法3.1 创建数据库3.2 创建表3.3 插入数据3.4 查询数据3.5 更新数据3.6 删除数据3.7 删除表 四、快速入门指南4.1 安装 SQLite4.2 创建数据库4.3 创建表4.4 插入数据4.5 查询数据4.6 更新数据4.7 删除数据4…

5、大模型的记忆与缓存

文章目录 本节内容介绍记忆Mem0使用 mem0 实现长期记忆 缓存LangChain 中的缓存语义缓存 本节内容介绍 本节主要介绍大模型的缓存思路&#xff0c;通过使用常见的缓存技术&#xff0c;降低大模型的回复速度&#xff0c;下面介绍的是使用redis和mem0&#xff0c;当然redis的语义…

LangChain系列:LangChain基础入门教程

LangChain 是一个开源框架&#xff0c;旨在简化使用大型语言模型&#xff08;LLM&#xff09;创建应用程序的过程。它为链提供了标准接口&#xff0c;与许多其他工具进行了集成&#xff0c;并为常见应用提供了端到端的链。 LangChain 让 AI 开发人员能够基于大型语言模型&#…

修改docker内容器中的某配置文件的命令

先找到配置文件config.php find / -name "config.php" 2>/dev/null 然后用vi编辑器修改配置文件 vi /var/www/config.php 最后就是vi的基本操作&#xff0c;根据具体需求使用&#xff1a; vi 有两种主要模式&#xff1a; 命令模式&#xff1a;进入 vi 后的默认…

无人机遥感图像拼接及处理实践技术:生态环境监测、农业、林业等领域,结合图像拼接与处理技术,能够帮助我们更高效地进行地表空间要素的动态监测与分析

近年来&#xff0c;无人机技术在遥感领域的应用越来越广泛&#xff0c;尤其是在生态环境监测、农业、林业等领域&#xff0c;无人机遥感图像的处理与分析成为了科研和业务化工作中的重要环节。通过无人机获取的高分辨率影像数据&#xff0c;结合图像拼接与处理技术&#xff0c;…

基于Springmvc+MyBatis+Spring+Bootstrap+EasyUI+Mysql的个人博客系统

基于SpringmvcMyBatisSpringBootstrapEasyUIMysql的个人博客系统 1.项目介绍 使用Maven3Spring4SpringmvcMybatis3架构&#xff1b;数据库使用Mysql&#xff0c;数据库连接池使用阿里巴巴的Druid&#xff1b;使用Bootstrap3 UI框架实现博客的分页显示&#xff0c;博客分类&am…

Vision Transformer:打破CNN垄断,全局注意力机制重塑计算机视觉范式

目录 引言 一、ViT模型的起源和历史 二、什么是ViT&#xff1f; 图像处理流程 图像切分 展平与线性映射 位置编码 Transformer编码器 分类头&#xff08;Classification Head&#xff09; 自注意力机制 注意力图 三、Coovally AI模型训练与应用平台 四、ViT与图像…

软考高级《系统架构设计师》知识点(二)

操作系统知识 操作系统概述 操作系统定义&#xff1a;能有效地组织和管理系统中的各种软/硬件资源&#xff0c;合理地组织计算机系统工作流程&#xff0c;控制程序的执行&#xff0c;并且向用户提供一个良好的工作环境和友好的接口。操作系统有三个重要的作用&#xff1a; 管理…

DeepSeek的魔法:如何让复杂概念变得通俗易懂?

日常生活中&#xff0c;常常会被复杂的概念所困扰。怎么样将这些晦涩难懂的概念变得通俗易懂&#xff1f;当然是利用大模型帮我们解答&#xff0c;不过让大模型解答也需要有好的沟通提示词。  我收集整理了 2 套提示词&#xff0c;大家一起学习一下。  一、用推理模型解释概…