FaceChain 打造个人证件照 职业照 写真照

news2024/11/15 19:57:10

一、简介

        FaceChain可实现兼具可控性与ID保持能力的无限风格写真与固定模板写真功能,同时对ControlNet和LoRA具有优秀的兼容能力。FaceChain支持在gradio的界面中使用模型训练和推理能力、支持资深开发者使用python脚本进行训练推理,也支持在sd webui中安装插件使用。

        FaceChain就是帮你生成 个人证件照 职业照 写真照。

二、效果展示

三、基础原理

        (1)基本原理

        个人写真模型的能力来源于Stable Diffusion模型的文生图功能,输入一段文本或一系列提示词,输出对应的图像。我们考虑影响个人写真生成效果的主要因素:写真风格信息,以及用户人物信息。为此,我们分别使用线下训练的风格LoRA模型和线上训练的人脸LoRA模型以学习上述信息。LoRA是一种具有较少可训练参数的微调模型,在Stable Diffusion中,可以通过对少量输入图像进行文生图训练的方式将输入图像的信息注入到LoRA模型中。因此,个人写真模型的能力分为训练与推断两个阶段,训练阶段生成用于微调Stable Diffusion模型的图像与文本标签数据,得到人脸LoRA模型;推断阶段基于人脸LoRA模型和风格LoRA模型生成个人写真图像。

        (2)训练阶段        

        输入:用户上传的包含清晰人脸区域的图像

        输出:人脸LoRA模型

        描述:首先,我们分别使用基于朝向判断的图像旋转模型,以及基于人脸检测和关键点模型的人脸精细化旋转方法处理用户上传图像,得到包含正向人脸的图像;接下来,我们使用人体解析模型和人像美肤模型,以获得高质量的人脸训练图像;随后,我们使用人脸属性模型和文本标注模型,结合标签后处理方法,产生训练图像的精细化标签;最后,我们使用上述图像和标签数据微调Stable Diffusion模型得到人脸LoRA模型。

        (3)推断阶段

        输入:训练阶段用户上传图像,预设的用于生成个人写真的输入提示词

        输出:个人写真图像

        描述:首先,我们将人脸LoRA模型和风格LoRA模型的权重融合到Stable Diffusion模型中;接下来,我们使用Stable Diffusion模型的文生图功能,基于预设的输入提示词初步生成个人写真图像;随后,我们使用人脸融合模型进一步改善上述写真图像的人脸细节,其中用于融合的模板人脸通过人脸质量评估模型在训练图像中挑选;最后,我们使用人脸识别模型计算生成的写真图像与模板人脸的相似度,以此对写真图像进行排序,并输出排名靠前的个人写真图像作为最终输出结果。

四、官网地址

官网地址: https://github.com/modelscope/facechain

在线体验: 魔搭社区


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2078459.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【精选】基于springboot休闲娱乐代理售票系统(源码+定制+开发辅导)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

进销存专业化管理系统,降低采购和销售成本 带完整的安装代码包以及搭建部署教程

系统概述 在当今竞争激烈的市场环境中,企业的运营效率与成本控制直接关联到其生存与发展。特别是对于中小企业而言,如何高效地管理进销存流程,减少不必要的开支,成为了提升竞争力的关键。为此,我们精心打造了一款“进…

推荐一个能在博客中运行代码的平台

博客中粘贴代码,这是很常见的做法了。如果我们博客中的代码可以直接运行,是不是很酷呢? 来看看: https://andi.cn/page/621698.html 推荐一个平台,有以下功能: 博客中的代码可以直接运行、一键复制可以…

【Resoved】编译 OpenCV 4.5.5 源码,fatal error: mpi.h: No such file or directory

0. 背景 Ubuntu20.04 OpenCV 4.5.5 Anaconda ROS2 foxy 等 1. 问题描述 编译 OpenCV4.5.5源码,make -j10 时,报错: 2. 问题分析 这个错误表明在编译 OpenCV 的 HDF5 模块时,尽管你在 CMake 中指定了 MPI 的路径,但编译器仍然无法找到 mpi.h 文件。或者 HDF5 没有正确地…

【STM32】MDK安装

1 MDK 历史背景 Keil公司是一家业界领先的微控制器(MCU)软件开发工具的独立供应商。Keil公司由两家私人公司联合运营,分别是德国慕尼黑的Keil Elektronik GmbH和美国德克萨斯的Keil Software Inc。Keil公司制造和销售种类广泛的开发工具&am…

神经网络动画讲解 - 构建灵活可调节参数

神经网络核心思想 神经网络核心思想:(1)机器学习、深度学习是一种方法论 机器学习: 核心思想是使计算机系统能够从经验(通常是大量数据)中学习和改进,以优化性能并做出准确的预测或决策&#…

827 leetcode +网络

01背包问题的衍生题目: 对于01背包问题,只需要明白四件事,1重量是啥,2value是啥,3优化目标是啥,4约束目标是啥。 这个题目里面重量是:0,1,4,9,16。。。。 value:1,1,1&…

72 华为资源库

1 报文格式 https://info.support.huawei.com/info-finder/tool/zh/enterprise/packetformat 2 华为IP网络电子书 资源可以下载 https://e.huawei.com/cn/topic/enterprise-network/ip-ebook 3 华为产品文档 https://support.huawei.com/enterprise/zh/doc/index.html 4 华为…

访问者模式详解

访问者模式 简介: 类的内部结构不变的情况下,不同的访问者访问这个对象都会呈现出不同的处理方式。 人话: 其实就是为了解决类结构不变但操作处理逻辑易变的问题,把对数据的操作都封装到访问者类中, 我们只需要调用不同的访问者,…

前端算法 === 力扣 111 二叉树的最小深度

目录 问题描述 DFS(深度优先搜索)方案 BFS(广度优先搜索)方案 总结 力扣(LeetCode)上的题目111是关于二叉树的最小深度问题。这个问题可以通过深度优先搜索(DFS)和广度优先搜索&…

Start OpenAI gym on arbitrary initial state

题意:“在任意初始状态下启动 OpenAI Gym” 问题背景: Anybody knows any OpenAI Gym environments where we can set the initial state of the game? For example, I found the MountainCarContinuous-v0 can do such thing so that we can select a…

游戏+AI

我们来聊聊AI【作者声明,个人观点,欢迎友好讨论】 我想这也是很多目前为止很多投资者对于AI举旗不定,不敢投资,业内游戏行业目前正式商用产品也是寥寥无几。 AI全称Artificial Intelligence,中文译名人工智能。人类从工…

信息打点-Web架构篇域名语言中间件数据库系统源码获取

知识点: 1、打点-Web架构-语言&中间件&数据库&系统等 2、打点-Web源码-CMS开源&闭源售卖&自主研发等 CMS:网站程序源码是可以通过搜索引擎搜索到并且下载的; 闭源售卖:不是一个开源的,要么从内…

【网络安全】分析重置密码功能实现账户接管

未经许可,不得转载。 文章目录 正文正文 目标为“target.com”,我执行了一些正常操作,比如创建或删除某些内容来保存 API 请求,然后检查是否存在任何 idor 或访问控制错误。然而,我没发现漏洞。 接着,我读取 JavaScript 文件来检查是否存在任何敏感信息,但一无所获。 …

浅谈 @Transtational 原理 及其失效场景(1)

上篇讲述了 当Transtctional遇到Async遇碰撞出怎样的火花? 本篇则主要从Transtational出发仔细谈谈。 一、调用场景复现,代码层面什么情况会失效? 1)同类操作:事物A调取非事物B,A报错/B报错(事…

流体力学解迷宫

诶,我手机呢?我手机放哪了?我手机是不是落餐厅了?会议室?厕所? 最近脑子有点不好使,可能需要练一练……解解迷宫吧 怕脑子吃不消,从简单的开始,不错,轻松拿…

EEtrade:黄金首饰是不是越软越好

黄金一直以来都是人们喜爱的贵金属之一。许多人在购买黄金首饰时,常常会关注黄金的纯度和硬度。那么,黄金首饰是不是越软越好呢?本文将详细探讨这个问题,并分析黄金首饰的硬度与其使用和美观性的关系。 黄金的纯度与硬度 黄金纯度 黄金的…

Linux系列之基础篇

文章目录 开篇明义基础篇实际操作篇高级篇Linux之JavaEELinux在哪些地方使用Linux应用领域 Linux入门基本介绍Linux和Unix关系 VM和Linux的安装基本说明安装VM17.5安装Centos7.6网络连接解释 虚拟机克隆虚拟机快照虚拟机迁移和删除安装vmtools设置共享文件夹 Linux目录结构 开篇…

屏幕翻译app下载哪个?高效学习工作必备

新学期即将开始,无论是线上学习还是筹备假期的海外交流,面对满屏的外文资料,一款得心应手的屏幕翻译软件成为必备利器。 幸运的是,现在有许多免费且功能强大的屏幕翻译工具,能够让你的学习与旅行更加顺畅。 以下是五…

Win7 配置Oracle 11G R2、PLSQL Development、添加用户名、远程访问数据库

本教程所有操作均在VMWare虚拟机上操作,Oracle这种又难装、又难卸、污染性这么大的程序,怎么会让他出现在我的生产环境中呢?自己在虚拟机上新建了一个Win7_x64的系统,进行Oracle安装测试。 1.Oracle文件的获取 网上有很多下载这…