PowerPaint:强大扩图编辑工具,兼具上下文感知和文本引导对象修复,ComfyUI体验指南

news2025/1/22 13:04:12

大家好我是极客菌!

ComfyUI扩图编辑工具,是一款功能强大的图像编辑软件,集成了多种先进的图像处理技术和创意工具。无论你是想要放大图像、修复图像中的缺陷,还是想要实现上下文感知和文本引导对象修复,ComfyUI都能轻松应对。这一工具的出现,为图像编辑和创作带来了极大的便利。

PowerPaint 是一款由清华大学和上海人工智能实验室共同合作的首个多功能图像修复模型,能够在各种修复任务中取得了先进的结果,如文本引导的对象修复、上下文感知图像修复、可控形状拟合的形状引导对象修复和外部绘制

为了克服实现高质量的多功能图像修复(根据用户意图用合理内容填充用户指定的区域)这一挑战,研究团队引入了 PowerPaint方法,这是首个在同时处理上下文感知图像修复文本引导对象修复两个任务重都表现出色的高质量多功能修复模型。

  • • 首先,引入了可学习的任务提示以及定制的微调策略,明确引导模型关注不同的修复目标。这使得 PowerPaint 能够通过使用不同的任务提示完成各种修复任务,从而实现优秀的性能。

  • • 其次,通过展示任务提示在 PowerPaint 中的有效性,作为对象移除的负面提示,展示了任务提示的多功能性。此外,研究团队还利用提示插值技术实现可控的形状引导对象修复。

  • • 最后,在各种修复基准上广泛评估 PowerPaint,证明模型能够在多功能图像修复中的优越性能。

在这里插入图片描述

PowerPaint架构方法

PowerPaint 是对一个文本到图像的模型进行了微调,使用了两个任务提示,即 PobjPctxt,分别用于文本引导的对象修复和上下文感知图像修复。具体来说,Pobj 可以用作负面提示,通过无分类器引导采样进行有效的对象移除。研究团队还进一步引入了 Pshape 进行形状引导的对象修复,这可以通过与 Pctxt 的提示插值进一步扩展,以控制生成的对象与遮罩形状的对齐程度。

ComfyUI PowerPaint体验

之前文章中已经介绍过ComfyUI-BrushNet的安装方法,如果已安装同学自行跳过。(插件文末扫描可自行获取)

  • • 首先通过ComfyUI插件管理器搜索ComfyUI-BrushNet,并安装该插件。

  • • 下载对应模型,并放置在ComfyUI/models/inpaint目录下。模型和工作流可在文末中获取

  • • 如使用PowerPaint,还需要获取 SD1.5 文本编码器模型 model.fp16.safetensors。它应该放置在本地的 models/clip 文件夹中。

  • • 导入工作流,并重启ComfyUI。

插件安装界面

模型目录

在使用PowerPaint功能时候,PowerPaint作者建议在提示中添加以下短语:

  • 对象移除empty scene blur

  • 上下文感知empty scene

  • 外部绘制empty scene

PowerPaint扩图体验

工作流界面

这里采用的是横向扩图设置。

01. 蛋糕

原图

效果图

02. 人物-肖像写真

原图

效果图

03. 室内-客厅

原图

效果图

04. 室内-沙发

原图

效果图

PowerPaint对象移除体验

工作流界面

关于这款对象移除功能,并不是完美,对于便于物体移除效果显著,如下面演示的植物叶,但是对于中心物体如蛋糕移除,总会产生新替代物。因此不在这里推荐该功能,只作简单演示。

01. 边缘主体移除(干净移除)

移除提示词为:leafage。能够清晰看见移除叶子。

原图

效果图

02. 中心主体移除(不完美,移除并新增物体)

移除提示词为:cake。蛋糕虽然移除了,但是新增了其他物体。

原图

效果图

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述
在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

在这里插入图片描述

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述
在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1860632.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TypeError: compilation.getPathWithInfo is not a function

本地运行,npm run dev 正常启动,当修改内容后保存,出现报错,中断编译。 TypeError: compilation.getPathWithInfo is not a function 项目首次能成功运行,热更新时报错而中断; 参考网上的解决办法&#x…

Webpack: 底层配置逻辑

概述 Webpack 5 提供了非常强大、灵活的模块打包功能,配合其成熟生态下数量庞大的插件、Loader 资源,已经能够满足大多数前端项目的工程化需求,但代价则是日益复杂、晦涩的使用方法,开发者通常需要根据项目环境、资源类型、编译目…

Python生成器嵌套太多?使用yield from秒变简洁!

目录 1、yield from基础概念 🌐 1.1 yield关键字回顾 1.2 yield from引入动机 2、yield from深入解析 🧭 2.1 语法与用法 2.2 传递生成器控制权 2.3 与迭代器的高效整合 2.4 与传统yield对比优势 3、实战应用示例 📈 3.1 链接多个生成器 3.2 简化递归生成器实…

什么牌子的开放式耳机好?五大优质机型,新手必看!小白闭眼入系列

音乐技术的不断进步为耳机市场的发展有了更多的选择,开放式耳机成为音乐爱好者们新的一个选择。从最初的基础音质到如今的高解析度音频,开放式耳机经历了一次次的技术革新和升级。这类耳机以开放式不入耳的设计,舒适的佩戴体验著称&#xff0…

C语言实现的飞机票系统解析

前言 操作系统:Windows下运行。如果需要在Linux运行(单机版),则需要修改删除conio.h,自己写个头文件获取键盘输入。我已经写好了getch.h文件,需要将其导入使用。 开发环境:CodeBlocks || VS C…

界面组件DevExpress WinForms v24.1 - 支持DateOnly TimeOnly类型

DevExpress WinForms拥有180组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜…

嘀嗒出行项目管理专家和项目管理负责人王禹华受邀为第十三届中国PMO大会演讲嘉宾

全国PMO专业人士年度盛会 嘀嗒出行项目管理专家和项目管理负责人王禹华女士受邀为第十三届中国PMO大会演讲嘉宾,演讲议题为“AI时代项目经理挑战机会和个人成长”。大会将于6月29-30日在北京举办,敬请关注! 议题简要: AI时代对互…

Pyecharts入门

数据可视化 Pyecharts简介 Apache ECharts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时&#…

Vue下载接口返回流的处理

1.下载接口返回流如下: 2.可以写公共方法处理 excelDownload(obj, name Date.now(), suffix xlsx) {//Date.now()获取当前日期const url window.URL.createObjectURL(//Blob是二进制大对象new Blob([obj], { type: application/vnd.ms-excel }))const aDOM docu…

【一竞技LCK】夏季赛:HLE强势横扫2比0击败KT!

北京时间6月24日,LCK夏季赛在昨天结束了第二周最后一个比赛日的比赛。昨天第二场比赛是HLE战队迎战DK战队,本赛季DK战队的状态可以说是相当的低迷,在首轮比赛是被KDF战队给2比0横扫,昨天面对实力不俗的HLE战队也是落了下风&#x…

工程化视角的 Kotlin Multiplatform核心解读及优化

本篇为KMP技术的技术及实践系列文章的第二篇。在这篇技术文章中我们会以百人移动研发团队的工程化视角,探讨Kotlin Multiplatform的核心技术及优化。 Kotlin: 语言与编译 人们在用自然语言沟通时,内容可以不明确,甚至小的错误,而听…

【数学建模】—【Python库】—【Numpy】—【学习】

目录 ​编辑 1. NumPy安装 2. ndarray对象 1. 创建ndarray 1.从列表或元组创建: 2.使用内置函数创建: 2. ndarray属性 3. 数组运算 1. 基本运算 2. 数学函数 3.统计函数 4. 数组索引与切片 1. 一维数组索引与切片 2.多维数组索引与切片 5.…

Excel 宏录制与VBA编程 —— 16、InputBox函数的使用方式

Input函数基本操作 InputBox函数的Type参数使用技巧(输入类型限制,若输入类型不符系统提示) 关注 笔者 - jxd

山东大学-科技文献阅读与翻译(期末复习)(选择题+翻译)

目录 选择题 Chapter1 1.which of the following is not categorized as scientific literature 2.Which of the followings is defined as tertiary(三级文献) literature? 3.Which type of the following international conferences is listed as Number one conference…

【Redis】数据持久化

https://www.bilibili.com/video/BV1cr4y1671t?p96 https://blog.csdn.net/weixin_54232666/article/details/128821360 单点redis问题: 数据丢失问题:实现Redis数据持久化并发能力问题:搭建主从集群,实现读写分离故障恢复问题&…

jeecg导入excel 含图片(嵌入式,浮动式)

jeecgboot的excel导入 含图片(嵌入式,浮动式) 一、啰嗦二、准备三、 代码1、代码(修改覆写的ExcelImportServer)2、代码(修改覆写的PoiPublicUtil)3、代码(新增类SAXParserHandler&a…

算法设计与分析:并查集法求图论桥问题

目录 一、实验目的 二、问题描述 三、实验要求 四、算法思想 1. 基准算法 1.1 算法思想 1.2 代码 1.3 时间复杂度 2. 使用并查集的高效算法 2.1 算法思想 2.2 代码: 2.3 时间复杂度: 五、实验结果 一、实验目的 1. 掌握图的连通性。 2. 掌…

《代码大模型安全风险防范能力要求及评估方法》正式发布

​代码大模型在代码生成、代码翻译、代码补全、错误定位与修复、自动化测试等方面为研发人员带来了极大便利的同时,也带来了对安全风险防范能力的挑战。基于此,中国信通院依托中国人工智能产业发展联盟(AIIA),联合开源…

干货分享 | TSMaster 的 CAN UDS 诊断操作指南(下)

上期,我们主要介绍了 UDS 诊断模块的创建以及TSMaster 基础诊断配置。很多客户表示意犹未尽。因此我们将继续带来《TSMaster 的 CAN UDS 诊断操作指南(下)》的精彩内容,为您带来UDS on CAN/CAN FD 的功能以及详细的使用操作。 本文…

深入浅出:npm常用命令详解与实践

简介 在现代的软件开发中,特别是在 JavaScript 生态系统中,npm(Node Package Manager)是一个核心工具。它不仅仅是 Node.js 的包管理器,还扮演着项目依赖管理、脚本执行、项目发布等多重角色。理解 npm 的常用命令不仅…