GAN模型1

news2024/11/20 6:19:31

本次是用GAN模型弄出时光机效果~ 穿越时空的人脸 得到你100年前的样子~~

时光穿梭第一步:解决数据集难题

鉴于最近StyleGAN在高质量人脸合成和编辑方面的成功,许多工作都集中在使用预先训练好的StyleGAN模型进行人像编辑。

然而,现有的技术通常会处理定义明确的语义属性。例如,添加或删除一个微笑或修改图片中人像的年龄。

这项工作背后的逻辑是保持这些构成一个人身份的属性不变,与此同时,用这辆人工智能的马车送他们回到过去或去往未来。

在这种情况下,人们面对的主要问题是缺乏合适的数据集。众所周知,即使有完美的神经网络模型,数据集仍然是每个人工智能研究者的噩梦。

数据不平衡不充分不可用是深度学习领域常见的问题,会导致数据偏见或结果不准确。

为了克服这个问题,来自康奈尔大学的华裔科学家Eric Ming Chen(左2)主导的研究团队创建了FTT(穿越时光的人脸)数据集。

Chen与来自佐治亚大学的华人科学家Jin Sun等人共同发刊,详细解释了「穿越时光的人脸」数据集的运作原理。

该数据集中的图片来自维基共享资源(Wikimedia Commons)。该平台拥有众包和开放许可的五千万张图片。FTT分析了26,247张19至21世纪的肖像,平均每十年大约有1,900张图片。

GANs父子层次结构,化身AI「时光机」

这些变化是如何实现的呢?

研究团队借助了StyleGAN(生成对抗网络)父子层次结构。特殊之处在于,他们没有选择训练一个涵盖所有年代的单一模型,而是为每十年的图像集添加一个子模型,通过训练模型集更好地综合每个时期的数据分布。

同时,为了保留被描述者的身份和姿势,研究团队采用一个父模型,将这些信息映射到隐空间向量中。

首先,训练一个StyleGAN模型集,每个年代各设置一个,使用对抗性损失和身份损失来训练一张混合人脸图。这张人脸图是子模型的输出,经过修改后,该混合图与父模型的颜色相似。

研究团队提示,在此过程中,有必要避免由于ArcFace(一种流行的面部识别模型)中的特征计算导致的身份损失的不一致性。由于ArcFace模型只在现代图像上训练,研究人员发现它在历史图像上的表现很差。

之后,每张真实图像被投射到十年流形上的一个向量w上(下图中的1960)。在该向量上,生成器G′t被训练来将精细化细节转移到所有的子模型上。最后,在输入图像上应用一个掩码,以鼓励模型保留人像的面部细节。

在微调全部子模型后,研究团队发现,FTT的不同年代的子模型(下图橙色)在发型、妆容发生改变的同时,都成功捕捉到父模型中(下图蓝色)每张图片的人像特征。 

这项全新的合成图像框架有两大亮点:首先,它使人像穿越时光的愿望成真;其次,在对人脸进行时光转换时,该技术还能保留人像的大部分细节。         whaosoft aiot http://143ai.com   

尽管它在数据集中还存在微小偏差(例如,在20世纪初的图像中出现了几个短发的女性),导致输出图像的不一致,但与以前的工作相比,这个模型在真实性上有了很大改善。

「穿越时光的人脸」开启了时光穿梭的第一步。如此高的准确度让人不禁遐想:这次跨越时光的是人像,那么下次呢?

参考资料:

https://www.marktechpost.com/2022/11/09/latest-artificial-intelligence-ai-research-proposes-a-method-to-transform-faces-through-time/

https://facesthroughtime.github.io

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/10881.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]计算机毕业设计JAVA儿童资源教育网站

[附源码]计算机毕业设计JAVA儿童资源教育网站 项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybati…

聚观365|抖音上线“防打扰保护工具”;亚马逊拟计划裁员1万人

今日要闻:抖音上线“防打扰保护工具”;亚马逊拟计划裁员1万人;苹果为iPhone14提供同机维修;美国硅谷裁员潮蔓延;乔布斯拖鞋拍卖融入NTF元素 抖音上线“防打扰保护工具” 11月15日,抖音上线“防打扰保护工具…

【数据结构与算法】第一章 绪论 2-数据结构的基本概念

第一章 绪论 2-数据结构的基本概念 思考? 程序 算法数据结构,算法 逻辑控制数据结构有两大用途: 一是用于存放要处理的数据,如迷宫地图二是用于实现算法策略,如迷宫例子中探索方向增量数组,回溯的栈&am…

如何深度自定义mybatis

回顾mybatis的操作的核心步骤 编写核心类SqlSessionFacotryBuild进行解析配置文件 深度分析解析SqlSessionFacotryBuild干的核心工作 编写核心类SqlSessionFacotry 深度分析解析SqlSessionFacotry干的核心工作 编写核心类SqlSession 深度分析解析SqlSession干的核心工作 …

物联网电池产品硬件电路设计思维

最近在整改之前工程师设计的电路板,是采用18650电池供电的一个物联网小板。 像这种电池供电的产品,很重要的一点就是要保证其低功耗,才得以提高续航,因此,对于这类电路板的对外接口的设计,对供电的控制尤其…

Arch Linux 的安装

Arch Linux 的安装 作者:Grey 原文地址: 博客园:Arch Linux 的安装 CSDN:Arch Linux 的安装 版本 Arch Linux:2022.07.01 VMware workstation: 16.2 安装步骤 下载 Arch Linux 并记录其 kernel 版…

【考研英语语法】口语语法

区别一:句子结构 口语中结构更为简单,较少使用从句 只有少量高频连词(and / but / or / so / because / if / when)正式: While the region was remarkable for its natural beauty, the family experienced seriousl…

法国博士后招聘|国家健康与医学研究院(INSERM)-计算化学

【国外博士后招聘-知识人网】法国国家健康与医学研究院(INSERM)计算化学博士后 法国国家健康与医学研究院(法文为:Institut national de la sant et de la recherche mdicale),简称“Inserm”,成…

软件测试有哪些原则?

软件产品从开发到发布的过程中有一道至关重要的程序—软件测试,也就是验证软件系统的正确性、完整性、安全性和质量的过程。在规定的条件下对程序进行操作,以发现程序错误,衡量软件质量,并对其是否能满足设计要求进行评估的过程。…

股票如何量化选股?

量化选股是通过数量分析的方法去评价某一上市公司的发展前景,以及它的股票是否值得买入,一般采用多因子选股策略:假设有多种因子共同对股票资产收益产生了作用,且这些作用满足线性关系,那么我们就可以通过计算因子的值…

【pymysql的基本使用】

0. 介绍 本文主要介绍如何使用pymysql库来操作mysql数据库,包含docker安装MySQL和对Mysql的各种操作。 参考链接: Welcome to PyMySQL’s documentation! — PyMySQL 0.7.2 documentation Python3 MySQL 数据库连接 – PyMySQL 驱动 | 菜鸟教程 Pyt…

聚焦“生态化”,e签宝讲好电子签名的“中国故事”

文丨智能相对论 作者丨沈浪 电子签名,终于在政企数字化转型的浪潮里得到了认可,正在快速破圈,从过去名不见经传的小赛道成长为了今天的数字化基建工程。 在今年的“科技向实,万物生长“钉钉2022发布会上,e签宝再度亮…

ADC噪声系数 —— 一个经常被误解的参数

噪声系数(NF)是RF系统设计师常用的一个参数,它用于表征RF放大器、混频器等器件的噪声,并且被广泛用作无线电接收机设计的一个工具。许多优秀的通信和接收机设计教材都对噪声系数进行了详细的说明(例如参考文献1),本文重点讨论该参数在数据转换…

MySQL-事务隔离机制的实现

目录一、MySQL事务1、什么是事务2、事务的四个特性3、MySQL事务使用1、显式启动事务语句2、关闭事务自动提交二、MySQL事务隔离机制1、四种隔离级别2、并发事务引起的问题3、隔离级别问题1 、查看mysql事务隔离级别2、脏读问题3、不可重复读一、MySQL事务 1、什么是事务 事务…

通过股票数据接口如何看懂Level-2行情?

交易用户在进行投资的时候,通过股票数据接口来实现自己的盈利目标,今天来聊聊如何看懂Level-2行情? 在交易开盘之后某股快速杀跌,但杀跌后盘面缺不跌反涨,甚至一度差点翻红,如果是五档行情,我们…

高数 | 【数一】 多元函数积分学预备知识 —— 总复习框架总结

自用复习笔记框架整理。 整理参考于 2023版张宇高数18讲、李林讲义等资料。 空间曲线的切线与法平面 曲线由参数方程给出 曲线由方程组给出 空间曲面的切平面与法线 曲面由隐式方程给出 曲面由显式函数给出

[附源码]java毕业设计基于的网上点餐系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

甘露糖-聚赖氨酸|PLL-PEG-mannose|聚赖氨酸-PEG-甘露糖

甘露糖-聚赖氨酸|PLL-PEG-mannose|聚赖氨酸-PEG-甘露糖 聚赖氨酸为淡黄色粉末、吸湿性强,略有苦味,是赖氨酸的直链状聚合物,可以提供PEG接枝修饰甘露糖,甘露糖-聚乙二醇-聚赖氨酸,PLL-PEG-mannose,聚赖氨酸…

Web中间件常见漏洞总结

IIS IIS是Internet Information Services的缩写,意为互联网信息服务,是由微软公司提供的基于运行MicrosoftWindows的互联网基本服务。 IIS目前只适用于Windows系统,不适用于其他操作系统。 解析漏洞 IIS 6.x 基于文件名 该版本默认会将*…

基于源码搭建运行 RocketMQ 主从架构

前言 上一篇 基于 IDEA 搭建 RocketMQ-4.6 源码环境 我们搭建并跑通了 rocketmq 的源码环境 . 本文我们紧接上文, 继续基于源码搭建并运行 broker 主从架构. 1 个 NameServer 节点 (与前文一样)2 个 Broker 节点, 一个作为 Master, 一个作为 Slave1 个 Producer 生产者 (与前…