程序示例精选
Python批量提取pdf标题-作者信息
如需安装运行环境或远程调试,见文章底部个人QQ名片,由专业技术人员远程协助!
前言
这篇博客针对《Python批量提取pdf标题-作者信息》编写代码,代码整洁,规则,易读。 学习与应用推荐首选。
文章目录
一、所需工具软件
二、使用步骤
1. 主要代码
2. 运行结果
三、在线协助
一、所需工具软件
1. Python
2. Pycharm
二、使用步骤
代码如下(示例):
# 定义一个函数从PDF文件中提取文本
def extract_text_from_pdf(pdf_path):
text = ""
with open(pdf_path, 'rb') as file:
reader = PyPDF2.PdfReader(file)
for page in reader.pages:
text += page.extract_text()
return text
# 定义一个函数从文本中提取标题和作者信息
def extract_title_and_authors(text):
lines = splitlines()
title = lines[0] if lines else "No Title Found" # 假设标题是
# 批量处理PDF文件的目录
pdf_dir = 'path/to/your/pdf_directory' # 替换为您本地的PDF文件夹路径
# 初始化一个列表来存储所有PDF文件的提取信息
data = []
# 遍历目录中的所有PDF文件
for pdf_file in os.listdir(pdf_dir):
if pdf_file.endswith('.pdf'):
pdf_path = os.path.join(pdf_dir, pdf_file)
pdf_text = extract_text_from_pdf(pdf_path)
title, authors = extract_title_and_authors(pdf_text)
data.append({'File Name': pdf_file, 'Title': title, 'Authors': authors})
print(f"Processed {pdf_file}")
# 将数据转换为Pandas DataFrame并导出为Excel文件
df = pd.DataFrame(data)
output_file = 'extracted_data.xlsx'
df.to_excel(output_file, index=False)
print(f"Data extraction completed. Results saved to {output_file}")
运行结果
三、在线协助:
如需安装运行环境或远程调试,见文章底部个人 QQ 名片,由专业技术人员远程协助!
1)远程安装运行环境,代码调试
2)Visual Studio, Qt, C++, Python编程语言入门指导
3)界面美化
4)软件制作
5)云服务器申请
6)网站制作
当前文章连接:https://blog.csdn.net/alicema1111/article/details/132666851
个人博客主页:https://blog.csdn.net/alicema1111?type=blog
博主所有文章点这里:https://blog.csdn.net/alicema1111?type=blog
博主推荐:
Python人脸识别考勤打卡系统:
https://blog.csdn.net/alicema1111/article/details/133434445
Python果树水果识别:https://blog.csdn.net/alicema1111/article/details/130862842
Python+Yolov8+Deepsort入口人流量统计:https://blog.csdn.net/alicema1111/article/details/130454430
Python+Qt人脸识别门禁管理系统:https://blog.csdn.net/alicema1111/article/details/130353433
Python+Qt指纹录入识别考勤系统:https://blog.csdn.net/alicema1111/article/details/129338432
Python Yolov5火焰烟雾识别源码分享:https://blog.csdn.net/alicema1111/article/details/128420453
Python+Yolov8路面桥梁墙体裂缝识别:https://blog.csdn.net/alicema1111/article/details/133434445
Python+Yolov5道路障碍物识别:https://blog.csdn.net/alicema1111/article/details/129589741
Python+Yolov5跌倒检测 摔倒检测 人物目标行为 人体特征识别:https://blog.csdn.net/alicema1111/article/details/129272048