1 前言
本次是学习内容是Datawhale AI夏令营第四期-AIGC文生图方向的学习笔记。
2 AIGC简介
AIGC(Artificial Intelligence Generated Content)即人工智能生成内容,即人工智能通过学习大量的数据,来实现自动生成各种内容,如文本、图像、音频、视频等,是继专家生产内容、用户生产内容之后的新型内容创作方式。
以下是我在魔搭社区生成的图片示例,也是task1的学习笔记。概览 · 魔搭社区 (modelscope.cn)https://modelscope.cn/my/overview
上边仅仅只是二次元漫画的画风,目前AIGC已经可以生成比较真实的图片甚至是视频了,这也为网络安全带来了诸多挑战。比如下方图片这个博主,第一眼看上去像是真人博主,实际上是机器人。这也是我们要介绍的Deepfake技术。
3 Deepfake技术
Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实,但实际上是由计算机生成的。这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。
Deepfake技术虽然在多个领域展现出其创新潜力,但其滥用也带来了一系列严重的危害。在政治领域,Deepfake可能被用来制造假新闻或操纵舆论,影响选举结果和政治稳定。经济上,它可能破坏企业形象,引发市场恐慌,甚至操纵股市。法律体系也面临挑战,因为伪造的证据可能误导司法判断。此外,深度伪造技术还可能加剧身份盗窃的风险,成为恐怖分子的新工具,煽动暴力和社会动荡,威胁国家安全。
是不是觉得AI的发展超乎我们的想象?我是被震惊到了!
4 通义千问
学计算机专业的同学是不是经常遇到代码报错,无从下手的情况,反复修改反复错,代码经常修改到深夜,是不是很崩溃?那么好~,最近我接触了比较好的大模型软件,通义千问。
推荐原因:首先通义千问是国内的大模型,响应速度肯定是比国外的快,为我们节省大量时间;在中文文本理解方面,肯定也是比国外模型好的。此外,通义千问是具有信息查询、语言理解、文本创作等多能力的AI助手。编程与技术支持是它的强项之一。很适合我们计算机专业的小码农成长
5 实战演练
下边我将带领大家沉浸式的操作本次项目--基于话剧的连环画制作
5.1 数据准备
你是一个文生图专家,我们现在要做一个实战项目,就是要编排一个文生图话剧
话剧由8张场景图片生成,你需要输出每张图片的生图提示词
具体的场景图片
1、女主正在上课
2、开始睡着了
3、进入梦乡,梦到自己站在路旁
4、王子骑马而来
5、两人相谈甚欢
6、一起坐在马背上
7、下课了,梦醒了
8、又回到了学习生活中
生图提示词要求
1、风格为古风
2、根据场景确定是使用全身还是上半身
3、人物描述
4、场景描述
5、做啥事情
例子:
古风,水墨画,一个黑色长发少女,坐在教室里,盯着黑板,深思,上半身,红色长裙
通义千问会根据我们的问题,提取关键词,方便我们后续进行文本生成图片操作。
5.2 提示词表格绘制
图片编号 | 场景描述 | 正向提示词 | 反向提示词 |
图片1 | 女主正在上课 | 古风,淡雅色调,一个身穿蓝色汉服的女子,上半身特写,正坐在古色古香的学堂内,聚精会神地聆听夫子讲解,手中轻握毛笔,面前摆放着书简和砚台。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片2 | 开始睡着了 | 古风,朦胧光影,同一个女子,上半身,倚靠在窗边,头微垂,发丝轻拂,手中的书卷滑落一旁,沉入梦乡,窗外是静谧的竹林和远处的山峦。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片3 | 进入梦乡,梦到自己站在路旁 | 古风,梦幻色彩,全身画面,女子站立于一条蜿蜒的古道旁,周围是盛开的桃花,她穿着一袭粉色衣裳,仰望天空,仿佛在倾听自然的声音。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片4 | 王子骑马而来 | 古风,英勇与优雅并存,全身画面,一位英俊的少年骑着骏马缓缓驶来,他身穿金甲,手执长剑,目光坚定,身后是连绵起伏的山脉和晨雾。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片5 | 两人相谈甚欢 | 古风,温馨色调,男女主角,上半身,坐于一片花海之中,彼此对视,微笑交谈,女子手持折扇,男子轻轻抚琴,四周环绕着蝴蝶与飞鸟。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片6 | 一起坐在马背上 | 古风,浪漫意境,全身画面,女子侧坐于马背上,一手轻扶马鬃,另一手被男子紧握,两人眼神交汇,背景是夕阳下的草原,马儿缓步前行。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片7 | 下课了,梦醒了 | 古风,清新的晨光,女子,上半身,突然从梦中惊醒,揉着眼睛,周围是学堂的环境,书卷散落一地,窗外是初升的朝阳。 | 丑陋,变形,嘈杂,模糊,低对比度 |
图片8 | 又回到了学习生活中 | 古风,日常氛围,女子,全身,回到学堂,与同学们一同读书写字,身旁堆满了书籍,夫子在前方授课,窗外可见忙碌的市井生活。 | 丑陋,变形,嘈杂,模糊,低对比度 |
5.3 图片生成
图片生成前,小伙伴们需要学会在魔搭社区PAI实例,详细教程在下边,由Datawhale AI夏令营提供,已经创建过的小伙伴可以直接跳过这一步。Docshttps://datawhaler.feishu.cn/wiki/CMYkwKow0ihxOikg1G9cd9Zhnng
5.4 结果展示
以上便是本次学习实践的成果, 欢迎大家交流学习!