【全队项目】智能学术海报生成系统PosterGenius（项目介绍）

🌈 个人主页：十二月的猫-CSDN博客
🔥 系列专栏：🏀大模型实战训练营_十二月的猫的博客-CSDN博客

💪🏻 十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光

1. 前言

2. 项目进度

3. 项目介绍

3.1 学术海报是什么

3.2 传统学术海报制作的工具

3.2 基于LLM生成论文Poster技术的必要性与可行性分析

3.3 市场调研及前沿科学领域研究调研

3.4 项目介绍

3.4.1 项目名称和商标

3.4.2 模型微调&提示词调优使用的数据集

4. 项目任务和目标

4.1 论文分部分概述（Introduction，method等）生成

4.1.1 任务要点

4.1.2 相关技术

4.1.3 量化指标

4.2 Poster 格式（layout）生成

4.2.1 任务要点

4.2.2 相关技术

4.2.3 参考模型（非本项目模型，仅做参考）

4.2.4 量化指标

4.3 Poster 背景图片个性化生成

4.3.1 任务要点

4.3.2 相关技术

4.3.3 方案设计

4.3.4 量化指标

4.4 论文概述与Poster图片的匹配

4.4.1 任务要点

4.4.2 相关技术与量化指标

4.5 前后端图形化展示

4.5.1 前端工作内容

4.5.2 后端工作内容

4.5.3 量化指标

5. 总结

1. 前言

【大模型实战训练营】专栏的建立得益于山东大学软件学院2025年的创新实训课程。在创新实训中，我们小组所选择的研究课题是【基于Deepseek、Janus等大模型的智能学术海报生成系统】，因此应山东大学戴鸿君教授要求，创建本专栏将我们的研究成果和研究全过程公开展示。

2. 项目进度

PosterGenius项目开发进度
项目开发活动	时间	状态
项目介绍	2025.3.22	⏩

3. 项目介绍

3.1 学术海报是什么

要明白什么是学术海报，我们先要明白海报的概念。海报是一种宣传的形式，用于向公众展示自己的商品或者是服务等。而学术海报则是向广大与会者或读者介绍自己的学术工作，帮助大家快速理解你工作的内容、步骤与意义。如下图所示：

3.2 传统学术海报制作的工具

PhotoShop和PPT就是最常见的两种传统制作海报的工具。Photoshop的优点在于插入的图片在导出之后能够调整分辨率，从而更加清晰，但缺点在于Photoshop需要电脑足够的内存，并且对于大部分的小伙伴来说PS上手难度较高，对于诸多操作还需要重新学习，因此在制作海报的过程中可能会耽误总体进度。PPT是目前大家所使用的主流制作软件，其优点在于普及度高，大家在使用的过程中较为方便、快捷。但缺点在于PPT无法在导出时调整图片分辨率，即使可以调整但步骤非常繁琐。但根据小科的制作经验来看，PPT做出来的海报完全能够满足使用需求，除特殊情况下大家可以放心使用。

但是所有传统海报制作工具都存在一个难以避免的弊端——制作费时费力，且难以转交。从某种角度来说，制作学术海报是一个劳动密集型的工作，因为并没有很精密的技术要求。但由于其他人又难以快速对你的论文有深入的理解，因此这一无聊的工作又无法轻易转交给其他人。

3.2 基于LLM生成论文Poster技术的必要性与可行性分析

科学海报是用来以图形的形式有效地展示科学论文的贡献。然而，创建一个设计良好的海报，有效地总结了一篇论文的核心是劳动密集型和耗时的。一个系统可以自动设计并生成良好的论文海报从而将减少科研工作者的工作量，并帮助读者直观地了解论文的大纲。这就是为什么我们团队想要制作这样一款智能化软件。

目前关于海报生成系统的研究，相当有限，主要原因是缺乏公开可用的数据集。但是有幸在2024年，一篇CVPR论文的研究团队，他们整理了SciPostLayout数据集，其中包括7855个科学海报和用于版面分析和生成的手动版面注释还包含100篇与海报配对的科学论文。同时数据集中的所有海报和论文都是根据CC-BY许可证，并公开提供。这就为我们工作的开展提供了必要条件。下图便是论文中做出贡献的前沿工作者们：

3.3 市场调研及前沿科学领域研究调研

虽然通过利用ML模型自动化这项任务已经显示出希望，但对科学海报的研究由于任务的高度复杂性和多模态性，真正有成果的仍然很少。虽然以前的研究已经建立了数据集来评估科学论文的海报生成系统，但这些数据集要么不是公开的，要么数据许可证不清楚，这使得该研究领域缺乏黄金标准基准。导致无论是市场上实地化的产品，还是科学界前沿的研究员们都没有真正在这一领域开展工作。这个领域仍然是一个空白领域，等待大家研究探索。

3.4 项目介绍

3.4.1 项目名称和商标

我们的项目叫做PosterGenius——智能学术海报生成系统。旨在基于Deepseek、Janus等开源大模型，辅助以RAG数据增强模块、多LLM讨论纠正模块、CLIP+T2I循环矫正模块、Prompt提示词调优、本部部署+微调等技术真正实现高质量的学术海报生成系统。

下图为本项目的log（本专栏虽然公开，但是未经允许严禁盗用log或公开商用代码）：

3.4.2 模型微调&提示词调优使用的数据集

数据集主要来源于huggingface中开源数据集——scipostlayout。该数据集包含7855个带有手动布局注释的科学海报。数据集中包含的所有海报都在CC-BY许可证1下。下图显示SciPostLayout的海报和注释示例。

SciPostLayout可以用于评估布局分析和生成系统，方法与现有其他领域的数据集相同。但是SciPostLayout的布局分析和生成都比其他领域的其他数据集更具挑战性，因为图和表格等元素的位置不同。此外，我们手动收集了与海报相关的100篇论文，以利用SciPostLayout从科学论文中生成布局。

4. 项目任务和目标

论文Poster生成这个问题分为五个子任务：

论文分部分概述（Introduction，method等）生成。
Poster 格式（layout）生成。
Poster 背景图片个性化调整。
论文概述与Poster图片的匹配。
前后端图形化展示。

4.1 论文分部分概述（Introduction，method等）生成

4.1.1 任务要点

采用多智能体辩论技术完成。

任务要点1：从PDF论文中提取文本
任务要点2：调用多模型API生成摘要
任务要点3：优化摘要内容并保存结果。

4.1.2 相关技术

涉及PDF解析工具（如PyMuPDF）、多模型API调用（如ChatGPT、DeepSeek）、以及多轮辩论优化机制。

4.1.3 量化指标

任务选取了至少100篇PDF论文作为输入数据，每篇论文平均大小为5MB，文本提取完整率达到98%；调用API的成功率不低于99%，响应时间控制在3秒以内；生成的摘要点数量为每篇论文5-10个，格式标准化处理准确率为100%；通过2轮辩论优化，最终摘要的语义一致性评分达到4/5（人工评估），覆盖论文核心内容的90%以上；JSON文件保存成功率为100%，系统资源占用控制在CPU使用率≤80%、内存使用≤2GB，单篇论文处理总时间不超过30秒。