好莱坞电影里瞬间恢复模糊人像是如何实现的,是真实的技术吗?
图片来源:论文《PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models》
使用非常低分辨率照片和视频恢复人像高清照片的桥段,在现实中确实存在,但实现方式相对复杂且依赖于多种技术手段。最终实现的效果也还要看原始输入的图片和视频所包含的信息是否足够。
举几个浅显的例子
1.单独一张16*16分辨率的模糊人像,恢复出1024*1024的高清人像,大概率是无解的
2.有1000张不同场景,不同距离,不同角度的16*16分辨率的模糊人像,恢复出1024*1024的高清人像,大概率是可行的
3.仅有几秒的32*32分辨率的连续视频,且场景单一,恢复出1024*1024的高清人像,大概率是无解的
4.有一段时间很长的视频,且场景、距离、角度都有变化的32*32分辨率的连续视频,恢复出1024*1024的高清人像,大概率是可行的
原理
好莱坞电影中出现的使用非常低分辨率照片和视频恢复人像高清照片的桥段在现实中是存在的,并且可以通过图像超分辨率技术、图像修复与增强技术以及人工智能与机器学习技术等多种手段来实现。然而需要注意的是,这些技术的效果受到多种因素的影响(如原始图像的质量、算法的复杂度等),因此在实际应用中需要根据具体情况进行选择和优化。
一、图像超分辨率技术(Super-Resolution)
技术原理
图像超分辨率技术是一种通过软件或硬件的方法提高原有图像分辨率的技术。其核心思想是利用一系列低分辨率的图像来重建一幅高分辨率的图像。这通常涉及到复杂的算法,如插值、学习模型等,以补充原图像中缺失的高频细节。
实现方式
- 插值算法:最基础的超分辨率方法,通过计算邻近像素的值来估计缺失的像素。但这种方法往往无法恢复出图像的细节信息。
- 基于学习的超分辨率:利用机器学习或深度学习的方法,通过训练模型来学习低分辨率图像到高分辨率图像的映射关系。这种方法能够更好地恢复图像的细节和纹理。
- 多帧超分辨率:如果有多张同一场景的低分辨率图像,可以利用这些图像之间的互补信息来重建高分辨率图像。这种方法在视频处理中尤为有效。
二、图像修复与增强技术
技术原理
图像修复技术旨在去除图像中的缺陷(如划痕、噪点等),并恢复图像的完整性。图像增强技术则用于改善图像的视觉效果,如提高对比度、锐化边缘等。
实现方式
- 去噪:使用滤波器或算法去除图像中的噪点,使图像更加清晰。
- 锐化:通过增强图像的边缘信息来提高图像的清晰度。
- 填充与修复:对于图像中的缺失部分,可以使用邻近像素的信息进行填充,或使用图像修复算法进行修复。
三、人工智能与机器学习技术
技术原理
人工智能和机器学习技术在图像处理领域有着广泛的应用。通过训练深度学习模型,可以实现对图像内容的自动分析和处理。
实现方式
- 卷积神经网络(CNN):CNN是深度学习中最常用的模型之一,特别适用于图像处理任务。通过训练CNN模型,可以实现对低分辨率图像到高分辨率图像的映射。
- 生成对抗网络(GANs):GANs由生成器和判别器组成,通过不断的对抗训练来生成逼真的图像。在超分辨率任务中,GANs可以生成具有丰富细节的高分辨率图像。
也借此话题,了解一下人工智能与机器学习在图像恢复中的应用~从一片论文开始讲起。
人工智能与机器学习在图像恢复中的应用
2020年,美国杜克大学的研究者提出一种新型算法,名为PULSE。属于超分辨率算法,通俗意义上讲,它是一款“去码神器”,经过运算与处理,能够将低分辨率、模糊的照片转换成清晰且细节逼真的图像。按照原论文描述,PULSE能够在几秒钟的时间内,将16×16像素的低分辨率小图放大64倍。
论文名称:PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models
论文: https://arxiv.org/pdf/2003.0380
参考项目:
- https://github.com/adamian98/pulse
项目github地址:
- github:https://github.com/Martion-z/Paddle-PULSE
参考资料:https://zhuanlan.zhihu.com/p/433612244
图片来源:论文《PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models》,论文原地址:https://arxiv.org/pdf/2003.03808.pdf
如果没有真实的原图,仅对比低分和高分的图像,算法很优秀啊,毛发,皮肤纹理都非常真实。
图片来源:论文《PULSE:Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models》
整体思路是利用一个预先训练好的GAN,然后通过不断迭代找到一个最优的latent vector使得生成的HR图片经过下采样能够与输入的LR图片最接近。该方法主要用来处理大因子的图像超分辨率问题,可以将模糊的照片秒变清晰。
但这篇论文在处理人像恢复时更多的是依据已有的训练集,通过AI完成脑补,生成的图像虽然清晰,但不一定真实,比如下图是某老外做的测试,用奥巴马的低分照片生成高分,人种都发生了变化~
图:奥巴马照片经PULSE处理为白人男性面孔 图源Twitter@Brad Wyble
这也比较好理解,论文使用的训练集大多是白人,最终输出的结果是个白人面孔,如果训练集是亚洲面孔,那最终输出的结果就是亚洲面孔。
杜克大学团队认为虽然不能用于模糊人像的面部识别,但这项AI模型可以作为一种分类和探索工具,用于天文学、医学等难以获得清晰图像的领域。也就是说,基于模糊图像中缺失信息的各种可能性,AI模型可以生成许多清晰的图像,生成的多种图像可以为天文学、医学等领域的研究人员提供参考。