python抠图(去水印)开源库lama-cleaner入门应用实践

news2024/12/23 0:14:03

1. 关于 Lama Cleaner

Lama Cleaner 是由 SOTA AI 模型提供支持的免费开源图像修复工具。可以从图片中移除任何不需要的物体、缺陷和人,或者擦除并替换(powered by stable diffusion)图片上的任何东西。

特征:

  • 完全免费开源,完全自托管,支持CPU & GPU & M1/2
  • Windows 一键安装程序
  • 本机 macOS 应用程序
  • 多种SOTA AI模型
    • 擦除模型:LaMa/LDM/ZITS/MAT/FcF/Manga
    • 擦除和替换模型:稳定扩散/绘制示例
  • 后期处理插件:
    • RemoveBG:删除图像背景
    • RealESRGAN:超分辨率
    • GFPGAN:面部恢复
    • RestoreFormer:面部修复
    • 分割任何东西:准确快速的交互式对象分割
  • 文件管理器:方便地浏览您的图片并将它们直接保存到输出目录。

插件
在图像清洗的后处理中,除了擦除之外,还经常使用面部修复或超分辨率等算法。现在您可以直接在 Lama Cleaner 中使用它们。启动Lama Cleaner服务时,您可以通过命令行参数启用插件。启用的插件将在左上角显示。

开源地址:https://github.com/Sanster/lama-cleaner

2. 擦除模型

Lama Cleaner默认擦除模型为LaMa,开源地址为:https://github.com/advimman/lama 。

LaMa 图像修复,采用傅立叶卷积的分辨率鲁棒大型掩模修复,WACV 2022

现代图像修复系统尽管取得了显着的进步,但常常难以应对大面积缺失区域、复杂的几何结构和高分辨率图像。我们发现造成这种情况的主要原因之一是修复网络和损失函数都缺乏有效的感受野。为了缓解这个问题,我们提出了一种称为大掩模修复(LaMa)的新方法。 LaMa 基于:

  • 一种新的修复网络架构,使用快速傅立叶卷积,具有图像范围的感受野
  • 高感受野感知损失;
  • 大型训练掩码(masks),释放前两个组件的潜力。

我们的修复网络提高了一系列数据集的最新技术,即使在具有挑战性的场景(例如完成周期性结构)中也能实现出色的性能。我们的模型出人意料地很好地概括了比训练时所见的分辨率更高的分辨率,并且以比竞争基准更低的参数和计算成本实现了这一点。

在这里插入图片描述
其中,模型中FFC结构如下:
在这里插入图片描述

3. 安装 Lama Cleaner

很遗憾,我的电脑没有GPU,具体环境如下:

  • Windows 10专业版
  • 处理器:Intel® Core™ i5-9400 CPU @ 2.90GHz 2.90 GHz
  • 内存(RAM):32.0 GB(31.8 GB可用)
  • 显卡:Intel® UHD Graphics 630

安装Lama Cleaner最简单的方法是通过pip安装(支持python 3.7 ~ 3.10)。

关于GPU安装,官方说明如下:

	# 为了使用GPU,请先安装cuda版本的pytorch。
	# pip install torch==1.13.1+cu117 --extra-index-url https://download.pytorch.org/whl/cu117

我的电脑没有GPU,直接使用CPU。

	pip install -i https://pypi.tuna.tsinghua.edu.cn/simple lama-cleaner

另外还有基于Docker安装,在此略过,感兴趣自己看官方文档实践。

下面附上安装包列表,供参考:

 Werkzeug-2.3.7
 aiofiles-23.2.1 
 annotated-types-0.5.0 
 antlr4-python3-runtime-4.9.3 
 anyio-3.7.1 
 bidict-0.22.1 
 controlnet-aux-0.0.3 
 diffusers-0.16.1 
 einops-0.6.1 
 fastapi-0.103.1 
 ffmpy-0.3.1 
 filelock-3.12.4 
 flask-2.2.3 
 flask-cors-4.0.0 
 flask-socketio-5.3.6 
 flaskwebgui-0.3.5 
 fsspec-2023.9.1 
 gradio-3.44.3 
 gradio-client-0.5.0 
 httpcore-0.18.0 
 httpx-0.25.0 
 huggingface-hub-0.17.1 
 itsdangerous-2.1.2 
 lama-cleaner-1.2.3 
 mpmath-1.3.0 
 omegaconf-2.3.0 
 orjson-3.9.7 
 piexif-1.1.3 
 pydantic-2.3.0 
 pydantic-core-2.6.3 
 pydub-0.25.1 
 python-engineio-4.7.1 
 python-multipart-0.0.6 
 python-socketio-5.9.0 
 regex-2023.8.8 
 safetensors-0.3.3 
 semantic-version-2.10.0 
 simple-websocket-0.10.1 
 starlette-0.27.0 
 sympy-1.12 
 timm-0.9.7 
 tokenizers-0.13.3 
 torch-2.0.1 
 torchvision-0.15.2 
 transformers-4.27.4 
 uvicorn-0.23.2 
 websockets-11.0.3 
 whichcraft-0.6.1 
 yacs-0.1.8

安装完成后,可以通过lama-cleaner命令启动服务器,第一次使用时会下载模型文件(建议确保网络畅通)。

GPU启动命令如下:lama-cleaner --model=lama --device=cuda --port=8080

4. 启动

启动命令如下:

	lama-cleaner --model=lama --device=cpu --port=8080
	
	- Platform: Windows-10-10.0.17763-SP0
	- Python version: 3.8.10
	- torch: 2.0.1
	- torchvision: 0.15.2
	- Pillow: 8.4.0
	- diffusers: 0.16.1
	- transformers: 4.27.4
	- opencv-python: 4.7.0.72
	- xformers: N/A
	- accelerate: N/A
	- lama-cleaner: 1.2.3
	- rembg: N/A
	- realesrgan: N/A
	- gfpgan: N/A
	
	The cache for model files in Transformers v4.22.0 has been updated. Migrating your old cache. This is a one-time only operation. You can interrupt this and resume the migration later on by calling `transformers.utils.move_cache()`.
	0it [00:00, ?it/s]
	Downloading: "https://github.com/Sanster/models/releases/download/add_big_lama/big-lama.pt" to C:\Users\xiaoyw\.cache\torch\hub\checkpoints\big-lama.pt
	
	2023-09-18 14:10:06.177 | INFO     | lama_cleaner.helper:download_model:52 - Download model success, md5: e3aa4aaa15225a33ec84f9f4bc47e500
	2023-09-18 14:10:06.179 | INFO     | lama_cleaner.helper:load_jit_model:102 - Loading model from: C:\Users\xiaoyw\.cache\torch\hub\checkpoints\big-lama.pt
	Running on http://127.0.0.1:8080

工具的使用是基于浏览器的,我安装在本机,使用默认端口8080,打开浏览器使用如下地址:http://127.0.0.1:8080。
在这里插入图片描述

5. 去水印抠图操作

如下图所示,从左到右操作,中间图分两块涂抹需要清除的标记,最后按下方的橡皮檫,形成最右边的图像。

声明:感谢哈马的摄影者,就这样把你的水印删除了,感谢哈马组委会,同时也给删除了。本文只是讲抠图处理AI技术,未涉及到商业活动。
在这里插入图片描述
其中,标记多块需要清除点时,需要使用手动修复模式。默认情况下,Lama Cleaner 将在绘制笔划后运行修复。您可以在设置中启用手动修复模式。
在这里插入图片描述

6. 其他擦除模型对比举例

LDM 与 LaMa 模型擦除效果对比:
在这里插入图片描述

👍 可能得到比 LaMa 更好、更详细的结果
👍 通过调整步骤可以达到时间和质量的平衡
😐 比 LaMa 模型慢得多(3080 12it/s)
😐 需要更多GPU内存(512x512 5.8G)

7. 最后

如果要取得好的图像效果,是需要GPU的。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1021133.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

axios取消上一页面的请求

请求拦截 声明变量用于存放请求请求拦截存放请求导出请求 导航守卫 导入请求集合路由前置守卫中遍历取消所有请求 登录失效取消后续请求

Go学习视频整理(总共59门课程,860GB)

由阿里P8 Golang架构师亲自精心筛选整理的全网最新最具价值的Golang进阶学习课程! 培训机构原版教程! 课程知识点和一线大厂完美匹配! 所有课程资源完整成套,不残缺,不拼凑,不拆开乱发! 这系…

深度学习——线性神经网络一

深度学习——线性神经网络一 文章目录 前言一、线性回归1.1. 线性回归的基本元素1.1.1. 线性模型1.1.2. 损失函数1.1.3. 解析解1.1.4. 随机梯度下降1.1.5. 用模型进行预测 1.2. 向量化加速1.3. 正态分布与平方损失1.4. 从线性回归到深度网络 二、线性回归的从零开始实现2.1. 生…

【每日运维】文件系统损坏:shutting down filesystem

问题场景:服务器突发断电导致 处理步骤 先确认属于哪个逻辑卷:ls -l /dev/mapper 通过文件系统命令进行修复:xfs_repair -L /dev/mapper/centos-root 最终修复的预期效果如下: 重启服务器后验证是否正常进入系统

Polygon L2扩容方案揭秘

1. 引言 前序博客: Polygon生态 以太坊扩容是一个几乎与以太坊本身一样古老的问题。扩容任务的复杂性是 以太坊伟大之处的直接结果: 以太坊是有活力的协议,其缓慢进化,以确保链的安全性和去中心化。 当活动的增加刺激了更大的…

vue3项目学习一:创建vue3项目

创建vue3项目 一、使用vue-cli创建vue3项目1.安装vue-cli2.创建vue3项目 二、初始化项目结构三、导入element-ui 一、使用vue-cli创建vue3项目 1.安装vue-cli 先查看是否安装vue-cli 在cmd窗口输入vue -V查看版本,如果出现 则说明存在vue-cli,如果出现 则需要安…

FTP这么“好用”和“便宜”,为什么企业还要替换掉?

FTP是一种历史悠久的网络协议,自1971年问世以来,它因其简易性、便捷性以及强大的跨平台兼容性而被广泛使用。在网站开发、软件更新和数据备份等多个场景中,FTP都发挥了重要作用。不过,随着互联网技术的不断发展和企业需求的多样化…

DockerCompose和Docker镜像仓库

个人名片: 博主:酒徒ᝰ. 个人简介:沉醉在酒中,借着一股酒劲,去拼搏一个未来。 本篇励志:三人行,必有我师焉。 本项目基于B站黑马程序员Java《SpringCloud微服务技术栈》,SpringCloud…

SpringCloud Alibaba - Nacos

1.安装与部署 Nacos是阿里巴巴开源的服务注册与发现、配置管理的组件,相当于是EurekaConfig的组合。 Nacos服务器是单独安装部署的,需要下载Nacos服务端程序,下载地址https://github.com/alibaba/nacos。 window下双击startup.cmd 登录Naco…

Linux的Redis集群搭建-主从集群哨兵模式

上次教大家在linux中安装单机版本的redis: Linux安装Redis(图文解说详细版) 这次我们讲一下Linux安装redis的集群版本 文章目录 🌴准备redis环境🌴第一步,下载redis🌴第二步,传输到…

PCIE研究-2

PCIe是一种高速串行总线,用于连接计算机内部的各种设备。在PCIe中,有四种不同的设备类型:Switch、Bridge、Root Complex和EndPoint。本篇文章将介绍这四种设备类型的基础知识。 1. Switch Switch是PCIe中最常见的设备类型之一,它…

【LeetCode热题100】--11.盛最多水的容器

11.盛最多水的容器 给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 **说明:*…

【线下培训】上海临港: RT-Thread × 瑞萨 工业监视器 RA6M3 HMI Board解决方案

注册RT-Thread官方论坛,即可第一时间获得最新消息!更有大量活动赚取积分,免费兑换开发板! 注册地址:https://www.rt-thread.org/account/user/register.html RT-Thread 与瑞萨将于10月14日在上海临港举行一场线下培训…

java_web的框架分析

文章目录 本阶段技术体系用项目理解原理controllersClassPathXmlApplicationContextDispatcherServletFruitServiceImplFilter 本阶段技术体系 用项目理解原理 项目的目录 首先设置一个参数,这里里面用反射机制,获取方法的时候如果不设置会获取到arg[0…

AI绘画关键词:小龙女

a lady dressed in a white gown stand beside a dragon, in the style of peter gric, traditional essence, kazuki takamatsu, andreas rocha, life-like avian illustrations, serene faces, aurorapunk,3D --ar 9:16 --s 250 --v 5.2

浅述数据中心供配电系统解决方案及产品选型

安科瑞 华楠 【摘 要】现如今,社会主要领域已从对单个设备的关注转化为对于系统解决方案的关注,数据中心的供应商们也想尽办法去满足所面对的各方面需求。基于此,主要提出了云计算数据中心供配电解决方案,同时还对数据中心供配电…

中小型教育机构这样做,让你轻松抓住受众注意力

教育一直都是家长对于孩子最关心的事情,对于部分家庭来说,教育支出占整个家庭支出的50%左右。 而软文作为目前效果比较明显而且性价高的推广方式,也很适合教育培训行业,因为它能让潜在客户可以清楚地了解产品的特性,感…

乐观善良的属马人,这几年的运势怎么样?

生肖马的人是一个乐观向上,拥有对生活的热情态度,更是个实打实过日子的人, 品性善良,对朋友尽心尽力,在朋友的面前没有丝毫的不真诚, 且乐于助人,因此朋友多,贵人也多。 属马人精力充…

LED智能家居灯 开关调光 台灯落地灯控制驱动 降压恒流IC AP5191

产品描述 AP5191是一款PWM工作模式,高效率、外围简单、内置功率MOS管,适用于4.5-150V输入的高精度降压LED恒流驱动芯片。输出最大功率150W,最大电流6A。AP5191可实现线性调光和PWM调光,线性调光脚有效电压范围0.55-2.6V.AP5191 工作频率可以…

热烈祝贺金伯帆集团成功入选航天系统采购供应商库

经过航天系统采购平台的严审,上海金伯帆信息科技集团有限公司成功入选中国航天系统采购供应商库。航天系统采购平台是航天系统内企业采购专用平台,服务航天全球范围千亿采购需求,目前,已有华为、三一重工、格力电器、科大讯飞等企…