关注我们 - 数字罗塞塔计划 -
随着科技的飞速发展,AI技术逐渐深入我们的工作与生活,特别是随着2022年底ChatGPT的横空出世,AIGC(Artificial Intelligence Generated Content,内容生成式人工智能)开始登上历史舞台。作为从业10余年的档案信息化老兵,笔者却一直有一个档案文创梦,近几年一直在思考如何改变档案文创中存在的创意少、效率低、前期工作量大的问题。
当档案文创遇上AIGC,文字、图片、影像便“活”了起来!通过智能分析、深度学习、图像识别等AI技术的综合应用,挖掘档案背后的故事,将其转化为引人入胜的文创产品,您是不是很期待呢?笔者通过自己搭建AIGC运行环境不断尝试,终于探索出一条档案文创设计的速成之路,通过罗塞塔公众号平台分享给大家。
一、流程、工具和环境
1、基于AIGC的档案文创设计流程
整个流程大致分为六个步骤,如下图所示:
2、用到的软件工具
通用大模型:文心一言、讯飞星火、Kimi;
AIGC:ComfyUI、stable diffusion;
后期制作:Photoshop、ZBrush等。
3、硬件配置
服务器1
CPU:I7-11700 8核心16线程,
内存:128G,
显卡:RTX 3080TI 12G;
服务器2
CPU:E5-2699V4 44核心88线程,
内存:64G,
显卡:RTX3060 12G *2。
二、步骤分解
1、明确目标和定位
需要明确文创产品的目标和定位,第一步回答我们到底想要什么。将大脑中零散的词汇、记忆片段、不成熟的想法,或者直白想要的东西真实表达出来,然后通过AI串起来。
示例一
Prompt(提示词):国潮风,文创,档案,文化,帮我把这几个字串起来,做文创产品的建议
从示例1中可以看到,AI已经给出了部分建议,选择第四项“文创T恤和服饰”再进行二次优化。
示例二
Prompt:请为夏天设计的国风T恤,包含敦煌元素,拟写几个吸引人的标题。
要求:1.标题应突出国风T恤的特色。2.标题应简洁明了,易于理解。3.标题应具有一定的创意和吸引力,能够引起消费者的兴趣。4.标题应考虑到目标受众的喜好和需求,以吸引他们购买。
标题有了之后不一定是你满意的,可以再进行多次优化,直到满意为止。
2、背景知识学习
知识的积累是循序渐进的过程,获取相关知识的途径非常多,但在这个AI时代,最高效的途径无疑就是借助“文心一言”、“Kimi”等通用大模型快速获取自己想要的知识了。
示例
Prompt:我需要做敦煌风格的档案文创项目,但我对敦煌历史和文化了解不够。请推荐一些相关的书籍、杂志论文或学习资料?
换个大模型再试试,确保获取知识的准确度,广度和深度(来自于网络资料,可直接访问网址链接):
通过以上的操作,知识已经获取到,剩下的就是我们自己去挑灯夜读了。
3、内容提炼
笔者在经历挑灯夜读学习后,最终选择“敦煌壁画中的飞天、仙女等形象”,进入下一步骤。
示例
Prompt:敦煌壁画中的飞天、仙女等形象,已成为中国传统文化的重要符号,根据这句话分别形成T恤和书签的文创产品介绍,要求包括文创主题、核心内容、亮点元素、文创属性、预期效果。
经过整理,如下表所示:
4、提示词和模型选择
既然确定了“敦煌飞天”作为文创产品的主题,下一步就要借助AIGC工具来帮我们设计了。笔者选用开源的ComfyUI来生成设计图,由于ComfyUI只接受英文提示词,需要进行翻译。
示例
【中文提示词】一幅描绘精美敦煌飞天形象的画面,仙女身姿轻盈,衣裙飘带仿佛在空中飘舞。画面中还细致地描绘了周围传统的云纹图案,增添了神秘而古老的氛围。
【Prompt】A high-resolution, high-quality image of a delicate Dunhuang Feitian figure with a maiden's graceful posture and flowing dress ribbons as if dancing in the air. The surrounding area is adorned with traditional cloud patterns, creating an enchanting ancient atmosphere, with a touch of fantasy and mythology.
【参数】Sampling method:DPM++ SDE Karras;Sampling steps:20;CFG Scale:7;Seed:123456789;最优长宽比:16:9。
ComfyUI节点配置:
模型选择:
Checkpoint模型,模型说明:写实。配合LoRA模型一起使用:
5、训练和出图
在训练、出图过程中需要多次调节以下几个参数:
批次(latent)
一般设置为10,值越大生成图片越多,但是速度会慢。
步数(steps)
一般设置为20,步数小的话噪点会多,步数大的话,图像越清晰,但是对显卡要求高,速度上也有影响。
图片与提示词的关联程度(CFG)
一般设置为8,CFG值越大,生成的图片细节越丰富。
提示词(prompt)
优美文雅且表达准确的提示词为图片的生成起到至关重要的作用,需反复修改提炼直至满意。可以先写好中文再利用讯飞星火等工具翻译成英文,再对英文进行优化。
6、挑选和调整
从AIGC生成的图片中挑选自己满意的,然后对其中的不满意处进行略微修图调整。下面直接上成品:
示例
T恤类:
手机套类:
其他类:
二次元摆件(需要采用ZBrush等工具输出3D模型):
三、过程总结
为完成这篇文章,笔者花了差不多两个月时间对AIGC赋能档案文创设计的整个过程进行了摸索,虽说流程是走通了,但实际上细节方面还是有很多不明白的地方,特别是ComfyUI一旦出现后台英文报错就傻眼。
总结一下,上述AIGC框架(工具)的优缺点如下:
根据笔者的经验,这里面最关键的实际上是提示词,难怪现在已经出现了一个新的职业——提示词工程师。优质的提示词可以事半功倍,可以使AI回答的准确度以及生成的成果物质量更高。以下为笔者梳理的关于“如何写好提示词”的要点:
数字罗塞塔计划公众号致力于成为全国领先的档案信息化知识分享与交流平台。独木难成林,众创力量大!作为中立的第三方平台,我们将努力为广大档案信息化从业企业提供一个展示自身业务与技术专业水平的舞台,共同推动档案行业的进步与发展。
关注我们 - 数字罗塞塔计划 -