python 获取pdf文件中的超链接

news2026/2/11 19:34:18

pip install pymupdf
pip install fitz

import fitz  # PyMuPDF


def get_pdf_links(pdf_path):
    # 打开PDF文件
    document = fitz.open(pdf_path)
    links = []

    for page_num in range(len(document)):
        page = document[page_num]
        # 获取当前页面的链接
        for link in page.get_links():
            links.append((page_num, link))

    document.close()
    return links
link=get_pdf_links(pdf_path)
print(link)

如图所示
在这里插入图片描述

这段代码会打开指定的PDF文件，遍历每一页，并获取每一页上的超链接。每个链接是一个元组，包含页码（从0开始）和链接的字符串

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2049303.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Mac升级系统文件都丢了怎么办？Mac更新后资料找不到了怎么恢复

Mac电脑由于其卓越的性能，受到了众多电脑用户的青睐。为了让用户获得更好的使用体验，Mac系统会定期推出新版本，来弥补前一个版本的不足。然而有用户反馈，Mac升级后，电脑里的部分资料消失了。mac升级会丢失文件吗?mac升…

iOS ColleCtionView 如何让cell 不重复创建并且只在展示的时候才创建

前言使用 collectionView 一屏只展示一个 cell ，一次只加载当前 cell，还要能够缓存已加载过的 cell ，使 cell 不重复加载，听着好像就是将 collectionView 的复用机制禁用掉。用collectionView 实现这个需求，就出现了…

【GD32】从零开始学GD32单片机 | PMU电源管理单元+深度睡眠和待机例程（GD32F470ZGT6）

1. 简介 PMU电源管理单元通俗讲就是用来管理MCU的电源域的，它主要有两个功能——电压监测和低功耗管理。在GD32中一共有3个电源域——VDD/VDDA域、1.2V域和备份域。 VDD/VDDA域主要供PMU控制器、ADC、DAC等外设使用；1.2V域就是大部分外设都会使用的电源域…

ai大模型之争-生成音乐-豆包

豆包网页版：豆包可以生成自定义音乐了 1，打开网页，登录 2，选择音乐生成 3，进行音乐配置 3.1，可以选择： 1，自己写歌词或者ai创造歌词； 2，可以选输入歌词…

xss漏洞复现

目录第一关第二关第三关第四关第五关第一关要求： Pop an alert(1337) on sandbox.pwnfunction.com. No user interaction. 代码：  <h2 id"spaghet"></h2> <script> spaghet.inn…

【数据结构与算法 | 图篇】Floyd-Warshall算法（多源最短路径算法）

1. 前言 Floyd-Warshall算法是一种在有向图或无向图中寻找所有顶点对之间的最短路径的动态规划算法。该算法可以处理带权重的边，并且能够正确处理负权重的边（但不包括负权重循环），不过它不能处理包含负权重循环的情况&#xff0c…

IDEA 设置SVN项目管理忽略文件

忽略已经控制的文件打开本地已经克隆下来的项目，并找到需要忽略控制的文件或文件夹操作完成之后需要将当前的操作更新到SVN服务器。直接在IDEA中提交修改（快捷键CTRL K）就可以 unverison: 取消版本控制 add to ignore list&#xff1…

C语言之文件操作上卷（二十一）（逆行人生-2024）

📣📣📣📣📣📣📣📣 ✏️作者主页：枫霜剑客 📋 系列专栏：C语言知识学习归纳总结（逐梦篇专栏合集） 🌲上一篇: C语…

17 Menubutton 组件

17 Menubutton 组件 Tkinter 的 Menubutton 组件是一个特殊的按钮，当点击时会弹出一个菜单。这个菜单可以包含多个菜单项，允许用户从菜单中选择一个选项。Menubutton 通常用于创建带有下拉菜单的界面。以下是对 Menubutton 组件的详细说明和一个使用案例…

力控机器人torque-controlled robots

力控机器人（Torque-Controlled Robots），也称为力矩控制机器人，是一种能够感知并实时控制施加在物体上力量的机器人系统。这类机器人通过集成力传感技术（Force Sensing Technology）和控制算法（Co…

C++ | Leetcode C++题解之第343题整数拆分

题目： 题解： class Solution { public:int integerBreak(int n) {if (n < 3) {return n - 1;}int quotient n / 3;int remainder n % 3;if (remainder 0) {return (int)pow(3, quotient);} else if (remainder 1) {return (int)pow(3, quotient …