图像生成技术飞速发展,个人化艺术创造还有多远?

news2025/1/11 18:29:22

图像生成技术飞速发展,个人化艺术创造还有多远?

  • 通义万相文本绘图与人像美化
  • 希望图像生成类应用具备哪些功能
  • 通义万相改进建议

在当今这个创意与科技交织的时代,图像生成技术正以前所未有的速度重塑视觉艺术的边界。不管你是否有艺术细胞,不管你是否接受了系统的艺术创作教育,你都可以通过图像生成技术创造出属于你自己的艺术。

通义万相文本绘图与人像美化

在开始话题之前,我先点进去了话题中提供的体验链接:https://www.aliyun.com/solution/tech-solution/tongyi-wanxiang 最开始进去这个页面看着和通义万相感觉一点关系没有,后来再次确认了链接没有错,那么意思就是需要自己部署 【通义万相文本绘图与人像美化】 这个,然后再体验通义万相的文生图
在这里插入图片描述
在文档中找到部署操作的内容,这里我为了可以快速体验自己部署版的通义万相,我选择【一键部署】
在这里插入图片描述
进入一键部署后,部署步骤比较简单,按照部署步骤先准备账号和DashScope API-KEY ,然后点击 一键部署 到ROS控制台,选择DashScope API-KEY、ECS实例规格和可用区,以及输入实例密码
在这里插入图片描述
这里需要说明一点,因为创建过程中需要用到ECS服务器,那么ECS服务器默认是按量付费,如果你没有购买ECS服务器,且账户余额小于100元,就会报这个错误
在这里插入图片描述
错误信息

Resource CREATE failed: ResponseException: resources.EcsInstance: Your account does not have enough balance to order postpaid product. Code: InvalidAccountStatus.NotEnoughBalance RequestId: 4A2DEAEE-D4B0-30F6-AE5E-D9CA88AEC243

那么此时的解决办法就是去用户中心补足账户余额大于100元,然后再次从ROS控制台重新操作。其实在你选择完资源之后的创建页面就有账户余额不足提示的
在这里插入图片描述
补足余额大于100元之后点击【创建】进入部署,部署到 80% 左右,会比较慢,耐心等待
在这里插入图片描述
创建成功后,点击【输出】找到体验地址,
在这里插入图片描述
然后点击体验地址即可进入通义万相体验页面
在这里插入图片描述
部署结束之后,下面就开始对话题展开聊聊。

希望图像生成类应用具备哪些功能

对于图像生成类应用,那么从用户群体来看,自然是像我这样的需要文生图,并且自己不会画画的用户。文生图的一大重要场景就是可以通过输入文本内容,实现转化大脑中期待的这段文本所描述的场景。
通义万相的功能个人也用的不少,基本上是从一开始就在用,通义万相地址:https://tongyi.aliyun.com/wanxiang/creation
在这里插入图片描述
目前通义万相的生成效果基本是没有大方向的问题,但是在一些小细节处理上总是不太理想。比如这里我需要生成的是【可爱 姐姐 淘气 弟弟】然后生成的四幅图中我唯一比较满意的图左上角却有个图标。然后我就下载这图再次通过通义万相想要去掉这个图标,正如截图中的一样,尝试了几次都没有成功。

希望后续图像生成类应用,比如通义千问,可以有上下文的功能。当提供关键词文生图之后,那么可以基于已经生成的图片继续提出关键词进行优化,就像我需要去掉左上角图标一样。这样的话经过关键词的不断精细化和目的化,从而让图片生成的效果更符合预设的效果,从而更好的满足图像生成类应用的用户需求。

通义万相改进建议

就像上面我提到的一样,从通义万相上线到现在,自己一直是有在使用通义万相文生图的,从整体上来说,通义万相对于文本内容的把握方向是很准确的,且每次生成的图片也都是契合文本内容的。但是从使用之初到现在,并没有那次的文生图是特别满意和认可的,往往最终的选择就是四选一,从四个中挑出来一个相对满意的。

改进建议,正如上面提到的一样,希望通义万相可以有一个上下文的理解在里面,用户可以基于第一次提出的文本内容对生成的图片进行多次的精修,从而达到用户期待的效果这样。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2112513.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

递推,CF 353D - Queue

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 353D - Queue 二、解题报告 1、思路分析 手玩一下,我们发现相…

数据结构 - 线性表

0.线性表 1.定义 线性表就是零个或多个相同数据元素的有限序列。 2.线性表的存储结构 ①.顺序结构 ②.链式结构 3.线性表的表示方法 例如: 一.线性表的基本运算 二.线性表的复杂运算 1.线性表的合并运算 2.线性表的去重运算 三.顺序表 1.定义 顺序表,就…

Tensorflow2 如何扩展现有数据集(缩放、随机旋转、水平翻转、平移等),从而提高模型的准确率 -- Tensorflow自学笔记14

实际生活中的数据集,往往不是标准的数据,而是有倾斜角度、有旋转、有偏移的数据,为了提高数据集的真实性,提高模型预测的准确率,可以用ImageDataGenerator函数来扩展数据集 import tensorflow as tffrom tensorflow.k…

单机部署Redis集群

文章目录 Redis集群1.单机安装Redis2.Redis主从集群2.1.集群结构2.2.准备实例和配置2.3.启动2.4.开启主从关系2.5.测试 3.搭建哨兵集群3.1.集群结构3.2.准备实例和配置3.3.启动3.4.测试 4.搭建分片集群4.1.集群结构4.2.准备实例和配置4.3.启动4.4.创建集群4.5.测试 Redis集群 …

[数据集][目标检测]井盖丢失未盖破损检测数据集VOC+YOLO格式2890张5类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):2890 标注数量(xml文件个数):2890 标注数量(txt文件个数):2890 标注…

基于人工智能的聊天情感分析系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 情感分析是一种自然语言处理任务,旨在识别文本中的情感,如“积极”、“消极”或“中立”。在聊天应用中&#…

Unity制作更换字体的插件

目录 1.前置知识 1.1 EditorWindow 1)目的 2)使用方式 1.2 OnGUI() 1)目的 2)使用方式 1.3 AssetDatabase 1)目的 2)使用方式 1.4 PrefabUtility 1)目的 2)使用方式 2…

永远学习:为什么人工智能难以适应新挑战

理解深度学习的局限性并追求真正的持续适应 欢迎来到雲闪世界。 “智者适应环境,正如水适应水瓶。”——中国谚语 “适应或灭亡,现在和以往一样,是大自然的必然法则。”——赫伯特乔治威尔斯 近年来,人工智能取得了长足的进步。所…

Android的logcat日志详解

Android log系统 logcat介绍 logcat是android中的一个命令行工具,可以用于得到程序的log信息。下面介绍 adb logcat中的详细参数命令以及如何才能高效的打印日志,或把日志保存到我们指定的位置。 可以输入 adb logcat --help,查看一下一些简…

Xinstall助力App全渠道统计,参数传递下载提升用户体验!

在移动互联网时代,App已成为我们日常生活中不可或缺的一部分。然而,对于App开发者来说,如何有效地推广和运营自己的应用,却是一个不小的挑战。尤其是在面对众多渠道、复杂的数据统计和用户需求多样化的情况下,如何精准…

【ffmpeg】转换音频格式

在音频文件所在目录启动终端输入以下 ffmpeg -y -i original.aac target.mp3-y 如果输出文件已经存在,则覆盖它而不询问。 执行完毕后在当前文件夹目录下生成目标文件

项目9-网页聊天室9(测试报告)

1.项目背景 本项目采用 SSM框架结合 Websocket 技术构建。用户通过简单的注册和登录即可进入聊天室,与其他在线用户实时交 流。系统支持文字消息的快速发送和接收、消息实时推送,确保交流的及时性和流畅性。SSM 框架为项目提供了稳定的架构和高效的 数据…

学习笔记--MybatisPlus

官网:MyBatis-Plus 🚀 为简化开发而生 快速入门 入门案例 引入MybatisPlus的起步依赖 定义Mapper 问题: MybatisPlus中Invalid bound statement (not found): com.itheima.mp.mapper.UserMapper.insert 一定要指定实体类!&am…

ASTER 地表动能温度 (AST_08) 是利用 8 至 12 µm 光谱范围内的五个热红外波段

ASTER L2 Surface Temperature V00 简介 ASTER 地表动能温度 (AST_08) 是利用 8 至 12 m 光谱范围内的五个热红外波段(白天或夜间获取)生成的 (https://lpdaac.usgs.gov/documents/996/ASTER_Earthdata_Search_Order_Instructions.pdf)。 它只包含陆地…

Slideflow:数字病理学中的深度学习与全切片可视化工具库|文献精析·24-09-02

小罗碎碎念 群里今天有人提问Histolab相关的问题,作者在交流的过程中谈到了Slideflow,恰好我没有看过这篇文章,所以便有了这期推文。 作者角色作者姓名单位名称(英文)单位名称(中文)第一作者Jam…

性能工具之 JProfiler 简单登录案例分析实战

文章目录 一、前言二、准备工作三、使用JProfile定位问题四、登陆案例分析四、总结 一、前言 JProfiler是一款 Java的性能监控工具。可以查看当前应用的对象、对象引用、内存、CPU使用情况、线程、线程运行情况(阻塞、等待等),同时可以查找应…

66、脑机接口产业联盟天津第一次全体大会参会分享

我注意到脑机联盟网上搜不到第一次和第二次大会的有关资料,这是非常遗憾的,所以我根据自己参会的记录,写成文章,与各位同学分享,此课件我也做成了公开课讲解,连接在我的Github。写这些,也算是为…

uAI - AI Assistant 人工智能辅助助手插件

uAI助手支持GPT 3.5 Turbo、GPT 3.5 Turbo16K、GPT 4-8k和GPT 4 Turbo-128k 什么是uAI助理? uAI Assistant是Unity游戏引擎的强大扩展,它使用GPT AI帮助游戏开发人员轻松创建专业代码和引人入胜的游戏内容。 你需要一个OpenAI密钥才能使用uAI助手!阅读我们的文档以获取更多说…

PDF 格式的文件编辑难度非常大,相比 .docx格式,它存在的意义是什么?

知乎上有个热门问题,PDF 格式的文件编辑难度非常大,相比 .docx格式,它存在的意义是什么? 回答这个问题得承认一个大前提,PDF是用来查看的,而不是编辑的。 否则就相当于提问,詹姆斯的足球踢得并…

Qt基础类03-直线类QLine

Qt基础类03-直线类QLine 摘要基本信息成员函数程序全貌QLine::QLine()QLine::QLine(const QPoint &p1, const QPoint &p2)QLine::QLine(int x1, int y1, int x2, int y2)QPoint QLine::p1() constQPoint QLine::p2() constint QLine::x1() constint QLine::x2() consti…