Datawhale AI夏令营第四期魔搭- AIGC文生图方向 task02笔记

news2024/11/22 6:56:53

1 前言

        本次是学习内容是Datawhale AI夏令营第四期-AIGC文生图方向的学习笔记。

2 AIGC简介

        AIGC(Artificial Intelligence Generated Content)即人工智能生成内容,即人工智能通过学习大量的数据,来实现自动生成各种内容,如文本、图像、音频、视频等,是继专家生产内容、用户生产内容之后的新型内容创作方式。

        以下是我在魔搭社区生成的图片示例,也是task1的学习笔记。概览 · 魔搭社区 (modelscope.cn)https://modelscope.cn/my/overview

b5b28c55782640be89c2f5bc0a73f5bc.png        0c383e0a689e4b20bcabc5e2ef2230ef.png280c096caa9c408398f8800a72a63457.png

         上边仅仅只是二次元漫画的画风,目前AIGC已经可以生成比较真实的图片甚至是视频了,这也为网络安全带来了诸多挑战。比如下方图片这个博主,第一眼看上去像是真人博主,实际上是机器人。这也是我们要介绍的Deepfake技术。

3 Deepfake技术

        Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实,但实际上是由计算机生成的。这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。

19a86f13865242f2979c3554fbee4273.png

         Deepfake技术虽然在多个领域展现出其创新潜力,但其滥用也带来了一系列严重的危害。在政治领域,Deepfake可能被用来制造假新闻或操纵舆论,影响选举结果和政治稳定。经济上,它可能破坏企业形象,引发市场恐慌,甚至操纵股市。法律体系也面临挑战,因为伪造的证据可能误导司法判断。此外,深度伪造技术还可能加剧身份盗窃的风险,成为恐怖分子的新工具,煽动暴力和社会动荡,威胁国家安全。

        是不是觉得AI的发展超乎我们的想象?我是被震惊到了!

4 通义千问

       学计算机专业的同学是不是经常遇到代码报错,无从下手的情况,反复修改反复错,代码经常修改到深夜,是不是很崩溃?那么好~,最近我接触了比较好的大模型软件,通义千问。

        推荐原因:首先通义千问是国内的大模型,响应速度肯定是比国外的快,为我们节省大量时间;在中文文本理解方面,肯定也是比国外模型好的。此外,通义千问是具有信息查询、语言理解、文本创作等多能力的AI助手。编程与技术支持是它的强项之一。很适合我们计算机专业的小码农成长

5 实战演练

        下边我将带领大家沉浸式的操作本次项目--基于话剧的连环画制作

5.1 数据准备

你是一个文生图专家,我们现在要做一个实战项目,就是要编排一个文生图话剧
话剧由8张场景图片生成,你需要输出每张图片的生图提示词

具体的场景图片
1、女主正在上课
2、开始睡着了
3、进入梦乡,梦到自己站在路旁
4、王子骑马而来
5、两人相谈甚欢
6、一起坐在马背上
7、下课了,梦醒了
8、又回到了学习生活中

生图提示词要求
1、风格为古风
2、根据场景确定是使用全身还是上半身
3、人物描述
4、场景描述
5、做啥事情

例子:
古风,水墨画,一个黑色长发少女,坐在教室里,盯着黑板,深思,上半身,红色长裙

       通义千问会根据我们的问题,提取关键词,方便我们后续进行文本生成图片操作。

        a564d207c80a47688cf4a8b05bdd2381.png

  5.2 提示词表格绘制

图片编号

场景描述

正向提示词

反向提示词

图片1

女主正在上课

古风,淡雅色调,一个身穿蓝色汉服的女子,上半身特写,正坐在古色古香的学堂内,聚精会神地聆听夫子讲解,手中轻握毛笔,面前摆放着书简和砚台。

丑陋,变形,嘈杂,模糊,低对比度

图片2

开始睡着了

古风,朦胧光影,同一个女子,上半身,倚靠在窗边,头微垂,发丝轻拂,手中的书卷滑落一旁,沉入梦乡,窗外是静谧的竹林和远处的山峦。

丑陋,变形,嘈杂,模糊,低对比度

图片3

进入梦乡,梦到自己站在路旁

古风,梦幻色彩,全身画面,女子站立于一条蜿蜒的古道旁,周围是盛开的桃花,她穿着一袭粉色衣裳,仰望天空,仿佛在倾听自然的声音。

丑陋,变形,嘈杂,模糊,低对比度

图片4

王子骑马而来

古风,英勇与优雅并存,全身画面,一位英俊的少年骑着骏马缓缓驶来,他身穿金甲,手执长剑,目光坚定,身后是连绵起伏的山脉和晨雾。

丑陋,变形,嘈杂,模糊,低对比度

图片5

两人相谈甚欢

古风,温馨色调,男女主角,上半身,坐于一片花海之中,彼此对视,微笑交谈,女子手持折扇,男子轻轻抚琴,四周环绕着蝴蝶与飞鸟。

丑陋,变形,嘈杂,模糊,低对比度

图片6

一起坐在马背上

古风,浪漫意境,全身画面,女子侧坐于马背上,一手轻扶马鬃,另一手被男子紧握,两人眼神交汇,背景是夕阳下的草原,马儿缓步前行。

丑陋,变形,嘈杂,模糊,低对比度

图片7

下课了,梦醒了

古风,清新的晨光,女子,上半身,突然从梦中惊醒,揉着眼睛,周围是学堂的环境,书卷散落一地,窗外是初升的朝阳。

丑陋,变形,嘈杂,模糊,低对比度

图片8

又回到了学习生活中

古风,日常氛围,女子,全身,回到学堂,与同学们一同读书写字,身旁堆满了书籍,夫子在前方授课,窗外可见忙碌的市井生活。

丑陋,变形,嘈杂,模糊,低对比度

5.3 图片生成

        图片生成前,小伙伴们需要学会在魔搭社区PAI实例,详细教程在下边,由Datawhale AI夏令营提供,已经创建过的小伙伴可以直接跳过这一步。Docshttps://datawhaler.feishu.cn/wiki/CMYkwKow0ihxOikg1G9cd9Zhnng

5.4 结果展示

        e2cd1fcbd04047f7b8b1f7f13215f78f.png38ec118ef88f4b3ba112491661678cf0.png             

 

bea52aa20cd0463fa0d7b261f8c404d8.png 3a45a046481a456e9ae026d4c59e5368.png

 

 f366bf585f8946dfb5ba992bbdaa7e75.png3aaf389352194418b98a9e2bd5e9ce7b.png

 efa115f6ea52422c96200db9010aa5c4.pngcf5609432039402c88361200849b070b.png

        以上便是本次学习实践的成果, 欢迎大家交流学习!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2036722.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

仿RabbitMQ实现消息队列

前言:本项目是仿照RabbitMQ并基于SpringBoot Mybatis SQLite3实现的消息队列,该项目实现了MQ的核心功能:生产者、消费者、中间人、发布、订阅等。 源码链接:仿Rabbit MQ实现消息队列 目录 前言:本项目是仿照Rabbi…

JVM运行时数据区之虚拟机栈

【1】概述 Java虚拟机栈(Java Virtual Machine Stack),早期也叫Java栈。每个线程在创建时都会创建一个虚拟机栈,其内部保存一个个的栈帧(Stack Frame),对应着一次次的Java方法调用。 栈是运行…

World of Warcraft [CLASSIC] 80 WLK [Gundrak] BUG

World of Warcraft [CLASSIC] 80 WLK [Gundrak] BUG 魔兽世界怀旧版,80级,5人副本古达克,科技队伍(BUG队伍) 副本有两个门口 这样看,是不是觉得很怪。是的,和图1刚好相反的。 因此应该翻转180…

24电赛H题总结

一、题目 题目链接:自动行驶小车(H题) 我们截取一些重要信息 1. 小车行驶场地示意图 2.要求 二、赛题分析 技术挑战与准备 MCU熟悉度:尽管TI MSPM0系列MCU在使用上类似于STM32CUBEIDEKeil,但其开发环境也需要熟悉。因…

数据结构入门——04栈

1.栈 栈是限制在一端进行插入操作和删除操作的线性表(俗称堆栈) 允许进行操作的一端称为“栈顶”,另一固定端称为“栈底”,当栈中没有元素时称为“空栈”。 栈的特点 :后进先出LIFO(Last In First Out&a…

支持I2C接口、抗干扰性强、14通道触摸按键的电容式触摸芯片-GTX314L

电容式触摸芯片 - GTX314L是具有多通道触发传感器的14位触摸传感器系列,它是通过持续模式提供中断功能和唤醒功能,广泛适用于各种控制面板应用,可直接兼容原机械式轻触按键的处理信号。 GTX314L芯片内部采用特殊的集成电路,具有高…

C++进阶-智能指针

1. 为什么需要智能指针? 下面我们先分析一下下面这段程序有没有什么内存方面的问题?提示一下:注意分析MergeSort函数中的问题。 int div() {int a, b;cin >> a >> b;if (b 0)throw invalid_argument("除0错误");retur…

【C语言】内存管理

C语言-内存管理 一、C进程内存布局二、栈内存1、存储在栈内存中的参数有哪些?2、栈内存的特点? 三、静态数据四、数据段与代码段五、堆内存 一、C进程内存布局 \qquad 任何一个程序,正常运行都需要内存资源,用来存放诸如变量、常量…

第九届“创客中国”武汉区域赛正式启幕 灵途科技勇夺前三,晋级决赛!

8月8日,第九届“创客中国”武汉区域赛正式启幕,首场聚焦先进制造领域。灵途科技勇夺先进制造领域专场企业组前三名,成功晋级决赛。 “创客中国”大赛是工业和信息化部组织开展的双创赛事活动,以构建产业链协同发展为出发点&#…

Win10 VisualStudio 2022编译ollvm 13.x

VisualStudio配置 1,正常配置C桌面环境 2,在单个组件中选择用于Windows得C Cmake工具 下载OLLVM13.x https://github.com/heroims/obfuscator/tree/llvm-13.x 解压后进入文件夹,命令行输入 cmake -G “Visual Studio 17 2022” -DLLVM_EN…

Java面试--设计模式

设计模式 目录 设计模式1.单例模式?2.代理模式?3.策略模式?4.工厂模式? 1.单例模式? 单例模式是Java的一种设计思想,用此模式下,某个对象在jvm只允许有一个实例,防止这个对象多次引…

依赖倒置原则:构建灵活软件架构的基石 - 通过代码实例深入解析

1.引言 1.1为什么要学习依赖倒置原则 在软件开发过程中,我们经常需要对代码进行修改和扩展。如果代码之间的耦合度过高,那么在进行修改或扩展时,可能会对其他部分的代码产生影响,甚至引发错误。这就要求我们在编写代码时&#xf…

【VS Code】 vue项目使用scss显示语法错误、build编译正常

开发vue项目,使用scss老是报这个错误 解决方式: 1.安装vetur 2.在vs code的设置中添加 "files.associations": { "*.vue": "vue" }解决:

线性规划约束一个矩形在Polygon内部

最近在用线性规划,有一个比较有趣的问题,记录一下思路。 如何用线性规划约束一个矩形在Polygon内部? 问题:有如下图蓝色矩形,用线性规划表示出绿色矩形被约束在polygon内部,矩形的中心坐标是(x, y),宽和高…

计算机组成原理---关于乘法电路与除法运算电路的理解

目录 一.乘法电路 1.无符号数乘法运算的硬件实现逻辑: 2.补码1位乘法运算的硬件实现逻辑: 3.无符号阵列乘法器 4.补码阵列乘法器 二.除法电路 1.原码除法运算 2.补码除法运算(不恢复余数法) 本篇是看湖科大与王道视频总结…

35_WebShell管理工具、中国蚁剑AntSword的安装及使用、御剑的使用、后台目录扫描

WebShell管理工具 WebShell 以asp、php、jsp或cgi等网页形式存在的一种代码执行环境主要用于网站和服务器管理由于其便利性和功能强大,被特别修改后的WebShell也被部分人当作网站后门工具使用国内常用的WebShell有海阳ASP木马,Phpspy,c99sh…

<Qt> 系统 - 事件

目录 前言: 一、事件介绍 二、事件的处理 (一)鼠标事件 1. 进入和离开事件 2. 鼠标点击事件 3. 释放事件 4. 双击事件 5. 移动事件 6. 滚轮事件 (二)键盘按键事件 1. 单个按键 2. 组合按键 (…

如何判断监控设备是否支持语音对讲

目录 一、大华摄像机 二、海康摄像机 三、宇视摄像机 一、大华摄像机 注意:大华摄像机支持跨网语音对讲,即设备和服务器可以不在同一网络内,大华设备的语音通道填写:34020000001370000001 配置接入示例: 音频输入…

十日Python项目——第七日(商品购物车)

#前言: 在最近十天我会用Python做一个购物类电商项目,会用到DjangoMysqlRedisVue等。 今天是第六天,主要负责撰写编写关于商品购物车的编写,以及相应的增删改查。若是有不懂大家可以先阅读我的前六篇博客以能够顺承。 若是大家…

Github Copilot 使用技巧

🎯目标读者 本文不包含如何安装 Github Copilot本文介绍了 Github Copilot 使用方法和一些技巧 本人已经使用 Github Copilot 2 年了,交了 3 次年费,每年 100$ 着实心痛,但是用着确实爽歪歪 但是感觉一直只用了一小部分功能&am…