pip install pymupdf
pip install fitz
import fitz # PyMuPDF
def get_pdf_links(pdf_path):
# 打开PDF文件
document = fitz.open(pdf_path)
links = []
for page_num in range(len(document)):
page = document[page_num]
# 获取当前页面的链接
for link in page.get_links():
links.append((page_num, link))
document.close()
return links
link=get_pdf_links(pdf_path)
print(link)
如图所示
这段代码会打开指定的PDF文件,遍历每一页,并获取每一页上的超链接。每个链接是一个元组,包含页码(从0开始)和链接的字符串