人脸融合相关调研

news2024/11/27 15:46:14

以前的记录,整理发现了值得分享一下。

云解决方案

  • 腾讯: https://ai.qq.com/product/facemerge.shtml
  • Face++: https://www.faceplusplus.com.cn/face-merging/
  • Baidu:https://ai.baidu.com/tech/face/merge

自研

  • 纯Opencv实现,基于人脸检测及人脸关键点检测

    • https://github.com/yejunzhou/yry 换脸,基于dlib人脸关键点检测进行特征融合
    • http://matthewearl.github.io/2015/07/28/switching-eds-with-python/
    • https://www.learnopencv.com/face-morph-using-opencv-cpp-python/
    • https://github.com/tonyiweb/face_merge_master 基于dlib人脸关键点检测进行特征融合,tornado web service
  • ML/DL实现

    • Deepfake: Unsupervised Image to image translation networks
    • 基于GAN和VAE实现,其中GAN将两个域中的图像映射到同一个潜在空间,VAE对图像进行迁移
    • CNN/AE
    • Fast Face-swap Using Convolutional Neural Network
  • 软件

    • Swapface:视频
    • ZAO:单张照片怎么做

试用

  • baidu api

在这里插入图片描述

  • tencent api
    在这里插入图片描述

资源

  • https://cloud.tencent.com/developer/article/1401153

  • https://www.cnblogs.com/wm123/p/5370064.html

  • @声音克隆 zao应该是没有用到网传的开源东西.前几天看到一篇知户上的文章,一个多年CV的人测试了zao,根据他的说法,zao不紧紧是检测脸部的关键点还识别出了局部5关特征,他用蓝和红的小方框分别遮挡了了左右眼睛,换脸后的效果大叠眼镜,相同的嘴巴也可以遮挡下,换回来的就露馅了.应该不是用的早先网传的那些东西实现的.根据他的说法 ZAO应该是提前制作了大量的五关模型,快速替换脸部信息.说明zao不只分析了整个脸部肯定也分析了五官特征。这样一个可能的答案就出现了,zao应该是预设了某种模版,可以和对象的五官匹配,生成的视频用的可能不是对象的样貌,而是来自于预设数据库中和对象最吻合的模版。(也许同时也叠加了对象本身五官)一张包含人脸的图像中有几种核心元素,即通用概念范畴上的姿态,角度,表情以及个性化生物属性即所谓的个体长相(五官)包含在编码器和解码器的中间层,这些属性数据解耦,dst保留姿态角度表情属性,叠加src的个人属性进行训练,输出后即是保留dst演技水平的又具备src五官特征的完整视频。

  • 论文《Towards Open-Set Identity Preserving Face Synthesis》中网络I和E实际是要提取图像的两组正交的解耦的特征,感觉I和E是可以放到一个网络中完成的,而且这样同时提取两个输入A和B的两组特征,可以进行交叉验证,即A变为B,B变为A,整个网络的结构对称性就加强了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/620782.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

由世纪互联运营的Microsoft Teams携创新功能正式发布,助力合作伙伴生态共赢

2023年4月18日,北京——由世纪互联运营的Microsoft Teams推出一系列创新功能,围绕企业数字核心能力,赋能数字化协作空间、智能化协作体验、整合生产力工具和工作流、安全合规、构建团队文化等五大落地场景,这将进一步帮助中国市场…

【unity造轮子】最简单的双向可穿越平台制作(Platform Effector 2D的使用)

文章目录 先看最终效果2D平台效应器(Platform Effector 2D)1. 这里简单解释一下2.一些常见的效果包括:3.Platform Effector 2D具有各种属性,使我们可以控制它的行为。这些属性包括: 可向上穿越的平台向下穿越的平台最终…

代码随想录算法训练营第一天| 704.二分查找、27.移除元素

LeetCode704.二分查找 链接:(704.二分查找) 题目描述:给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 题目就…

远程服务调用的简单应用,并轻松解决LinkedHashMap无法转成相关实体类的问题

🏀(一)为啥需要远程服务调用? 🐠知其然还要知其所以然,在我们的生产项目上一般而言会部署多个微服务,每个微服务会负责不同版块的业务工作。如果某个微服务需要借助另外的某些微服务中的接口才能…

尚硅谷甄选

搭建后台管理系统模板 项目初始化 今天来带大家从0开始搭建一个vue3版本的后台管理系统。一个项目要有统一的规范,需要使用eslintstylelintprettier来对我们的代码质量做检测和修复,需要使用husky来做commit拦截,需要使用commitlint来统一提…

tb6612电机驱动与JGB37-520减速直流电机

tb6612电机驱动与JGB37-520减速直流电机 文章目录 tb6612电机驱动与JGB37-520减速直流电机电机驱动模块TB6612TB6612的引脚说明真值表(直流电机的驱动状态)TB6612的正转反转原理 直流电机原理减速器编码器一、关于编码器的介绍二、编码器的工作原理&…

Linux:DHCP服务

我的DHCP服务器 是 centos7 使用的yum安装DHCP服务(如果不会搭建yum库可以查看) Linux:rpm查询安装 && yum安装_鲍海超-GNUBHCkalitarro的博客-CSDN博客 我的环境为: 两台centos7一台win10 第一台centos7 为 DHCP服务器…

【Python 私有变量和私有方法】零基础也能轻松掌握的学习路线与参考资料

Python是一种面向对象的编程语言。在Python类中,私有变量和私有方法是常见的概念。私有变量和私有方法是指只能在类内部访问的变量和方法。在本文中,我们将介绍Python私有变量和私有方法的学习路线,并给出参考资料和优秀实践。 学习Python面…

【MySQL数据库 | 第七篇】图形化界面工具DataGrip基础应用教学

目录 前言: DataGrip安装界面: 利用DataGrip创建数据库: 利用DataGrip为数据库创建表: 利用datagrip修改表: 添加元素: 结束! 前言: 在之前我们一直接触的是MySQL命令行语句开…

macOS Sonoma 14beta With OpenCore 0.9.3 and winPE双引导分区黑苹果原版镜像

镜像特点(原文地址:http://www.imacosx.cn/113888.html) 完全由黑果魏叔官方制作,针对各种机型进行默认配置,让黑苹果安装不再困难。系统镜像设置为双引导分区,全面去除clover引导分区(如有需要…

RL - 强化学习 马尔可夫决策过程 (MDP) 转换 马尔可夫奖励过程 (MRP)

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/131097165 马尔可夫决策过程(Markov Decision Process,MDP)和马尔可夫奖励过程(Markov R…

FluxMQ 规则引擎 《一》

规则引擎介绍 演示环境 http://demo.fluxmq.com:50000/ 账号:fluxmq密码:fluxmq 简介 FluxMQ Rule Engine (以下简称规则引擎) 用于配置FluxMQ 消息流与设备事件的处理、响应规则。规则引擎不仅提供了清晰、灵活的 “配置式” 的业务集成方案&#xff0…

(二)CSharp-关于内存分配的总结和疑惑(未解决)

同时看了好几本书,对变量的内存分配概念总是稀里糊涂的。所以干脆专门写一篇文章来对C#内存分配进行研究和总结。 1、值类型和引用类型 对值类型: 值类型实例通常存在线程的堆栈里。即所有值类型的非成员数据都放在线程的堆栈里。如果值类型是类的数据…

4.使用Express跨域资源共享(继上一章)

4.5、CORS跨域资源共享 1.接口的跨域问题 刚才编写的GET和POST接口,存在一个很严重的问题:不支持跨域请求。 解决接口跨域问题的方案主要有两种: ①CORS(主流的解决方案,推荐使用) ②JSONP&#xff08…

Windows软件架构概念

我是荔园微风,作为一名在IT界整整25年的老兵,今天我们来聊聊Windows软件架构的概念。 Shaw和Garlan在他们划时代的著作中以如下方式讨论了软件的体系结构:从第一个程序被划分成模块开始,软件系统就有了体系结构。现在&#xff0c…

PostgreSQL部署出现只有超级用户能创建扩展

最近在Windows Server服务器上部署PostgreSQL12遇到了一个问题,部署完成时,任务问题都没有,也可以远程连接。但是在给数据库添加扩展时出现了如下所述的问题: 执行sql命令create extension "uuid-ossp"出现问题如下:create extension “uuid-ossp” 错误: 创建扩…

文心一言 VS 讯飞星火 VS chatgpt (34)-- 算法导论5.3 1题

一、Marceau 教授不同意引理 5.5 证明中使用的循环不变式。他对第1次送代之前循环不变式是否为真提出质疑。他的理由是,我们可以很容易宣称一个空数组不包含0排列。因此一个空的子数组包含一个0排列的概率应是 0,从而第 1次选代之前循环不变式无效。请重…

Python3+Selenium2完整的自动化测试实现之旅(三):Selenium-webdriver提供的元素定位方法

目录 前言 前端技术名词解释 Selenium-webdriver定位元素 一、 通过id定位 二、通过name定位 三、通过class定位 四、 通过tag定位 五、 通过link定位 六、通过partial_link定位 七、 通过Xpath定位 八、通过CSS定位 总结 前言 本篇以实例介绍selenium下的webdriv…

mysql数据库备份文件回复的方法

备份数据表的恢复 前提配置 关闭防火墙 systemctl stop firewalld iptables -F setenforce 0 安装了mysql数据库 以下列库表为例 先有一个数据库mydb,包含两个数据表customer,timestamps; 其中customer数据表包含数据如下: 备份数据表的回复 第一步…

回溯算法之深度优先搜索

目录 放牌 员工的重要性 图像渲染 岛屿的周长 被围绕的区域 岛屿的数量 岛屿的最大面积 电话号码的字母组合 二进制手表 组合总和 活字印刷 N皇后 深度优先搜索(Depth First Search)------ 一条道走到黑 放牌 假如有编号为1~3的3张扑克牌…