深度图的方法实现加雾,Synscapes数据集以及D455相机拍摄为例

news2024/11/26 22:22:22

前言

在次之前,我们已经做了图像加雾的一些研究,这里我们将从深度图的方法实现加雾展开细讲

图像加雾算法的研究与应用_图像加雾 算法-CSDN博客

接下来将要介绍如何使用深度图像生成雾效图像的方法。利用Synscapes数据集,通过读取EXR格式的深度信息,结合摄像机参数和暗通道先验等技术,计算传输图和大气光照强度,并应用朗伯-比尔定律生成雾效图像。文中提供了完整的代码示例,包括从深度图读取数据、计算传输图和大气光、以及生成和保存雾效图像。此外,还介绍了如何使用自制数据集进行处理。该方法适用于自动驾驶数据增强、增强现实和图像去雾等领域,并提供了详细的注释和参考资料,帮助读者更好地理解和实现图像加雾技术。 

Synscapes数据集

下载路径:Synscapes data set (liu.se)

这个数据集很大,全部下载完成后才能解压。

从exr文件读取深度信息并进行可视化的方法在上一次已经讲过,所以不在赘述:图像加雾算法的研究与应用_图像加雾,具体在第5部分给出。

原作者使用的是matlab版本的:sakaridis/fog_simulation-SFSU_synthetic (github.com)

# utils.py

import json
import numpy as np
from skimage.color import rgb2gray
from skimage.morphology import square, erosion

def camera_parameters(camera_parameters_file):
    """
    相机参数从 JSON 文件中读取相机参数。
    :param camera_parameters_file:存储摄像机参数的 JSON 文件的完整路径。
    :return:f_x (float): 标量,类型为 float,对应于 x 轴的焦距参数(包含纵横比),单位为像素。
            c_x (float): 标量,类型为 float,对应于 x 轴的光学中心,单位为像素。
            c_y (float): 标量,类型为 float,对应于 y 轴的光学中心,单位为像素。
    """
    with open(camera_parameters_file, 'r') as file:
        camera_parameters = json.load(file)
    f_x = camera_parameters['camera']['intrinsic']['fx']
    c_x = camera_parameters['camera']['intrinsic']['u0']
    c_y = camera_parameters['camera']['intrinsic']['v0']

    return f_x, c_x, c_y

def distance_in_meters(depth_map_in_meters, camera_parameters_file):
    """
    以米为单位的距离使用密集深度图和摄像机固有参数作为输入,
    以与图像相同分辨率的密集图计算空气厚度,即被描绘物体与摄像机中心的距离,以米为单位。
    :param depth_map_in_meters: 深度图,以米为单位。
    :param camera_parameters_file: 相机参数文件。
    :return: 与深度图相同大小的距离图,以米为单位。
    """
    f_x, c_x, c_y = camera_parameters(camera_parameters_file)
    height, width = depth_map_in_meters.shape    #创建一个与深度图像大小相同的网格,以便后续计算距离
    X, Y = np.meshgrid(np.arange(1, width + 1), np.arange(1, height + 1))
    # 深度图像中的像素值(通常是相机到物体的距离)转换为实际距离,以米为单位
    distance_map_in_meters = depth_map_in_meters * np.sqrt((f_x ** 2 + (X - c_x) ** 2 + (Y - c_y) ** 2) / f_x ** 2)
    return distance_map_in_meters

def brightest_pixels_count_rf(number_of_pixels, brightest_pixels_fraction):
    """
    计算最亮像素的数量
    :param number_of_pixels: 图片中的像素数量
    :param brightest_pixels_fraction: 最亮像素分数
    :return: 最亮像素的数量
    """
    brightest_pixels_count_tmp = int(brightest_pixels_fraction * number_of_pixels)
    brightest_pixels_count = brightest_pixels_count_tmp + ((brightest_pixels_count_tmp + 1) % 2)
    return brightest_pixels_count

def estimate_atmospheric_light_rf(I_dark, I):
    """
    估计大气光照强度
    根据输入图像暗通道中最亮像素的一部分来估算大气光,如《图像去噪学习框架中的雾霾相关特征研究》中所建议。
    :param I_dark: 暗通道的灰度图像。
    :param I:      与 I_dark 高度和宽度相同的彩色图像。
    :return:        L (numpy.ndarray): 1x1x3 矩阵,包含大气光值估算值。
    index_L (int): 单通道版本图像中与大气光等值的像素的线性指数。
    """
    brightest_pixels_fraction = 1 / 1000  #最亮像素分数
    height, width = I_dark.shape
    number_of_pixels = height * width
    brightest_pixels_count = brightest_pixels_count_rf(number_of_pixels, brightest_pixels_fraction)

    # 识别暗通道中最亮像素的指数。
    I_dark_vector = I_dark.flatten()
    indices = np.argsort(I_dark_vector)[::-1]  # 按降序排序
    brightest_pixels_indices = indices[:brightest_pixels_count]

    # 计算原始图像中暗部亮像素的灰度强度。
    I_gray_vector = rgb2gray(I).flatten()
    I_gray_vector_brightest_pixels = I_gray_vector[brightest_pixels_indices]

    # 从原始图像中灰度强度中值最亮的像素中找出能产生大气光的像素下标。
    median_intensity = np.median(I_gray_vector_brightest_pixels)
    index_median_intensity = np.where(I_gray_vector_brightest_pixels == median_intensity)[0][0]
    index_L = brightest_pixels_indices[index_median_intensity]
    row_L, column_L = np.unravel_index(index_L, (height, width))
    L = I[row_L, column_L]

    return L

def get_dark_channel(I, neighborhood_size = 15):
    """
     获取暗色通道
    使用侵蚀法计算输入图像相对于正方形邻域斑块的暗色通道。
    :param I: 输入彩色或灰度图像。
    :param neighborhood_size: 用于侵蚀的正方形斑块的边长,单位为像素。
    :return:    I_dark (numpy.ndarray): 输出与 I 相同类型、高度和宽度的灰度图像。
                I_eroded (numpy.ndarray): 与 I 尺寸相同的中间侵蚀图像。
    """
    # 设置邻域大小
    # neighborhood_size = 15
    # 创建方形结构元素
    se_single_channel = square(neighborhood_size)
    # 将结构元素在每个通道上重复三次
    se = np.stack([se_single_channel] * 3, axis=-1)  #用来定义一个矩形区域,用于后续的图像形态学操作。
    I_eroded = erosion(I, se)                        #侵蚀是形态学操作之一,它用结构元素扫描图像,并将图像中的每个像素值替换为其邻域内像素值的最小值。
    I_dark = np.min(I_eroded, axis=2)                #获取每个像素在第三个维度(通常是颜色通道)上的最小值。这样做可能是为了将图像从彩色转换为灰度,因为对于灰度图像来说,每个像素只有一个值,即灰度值。
    return I_dark

def haze_linear(R, t, L_atm):
    """
    使用与朗伯-比尔定律相对应的线性灰度模型,从干净图像生成灰度图像。
    :param R: H×W×image_channels 表示场景真实辐射度的干净图像。
    :param t: H×W 传输图。
    :param L: 1×1×image_channels 均质大气光。
    :return: 合成灰度图像,大小与输入的干净图像 R 相同。
    """
    L_atm = L_atm.reshape(1, 1, 3)
    image_channels = L_atm.shape[2]                                        # 包含所有通道传输图副本的辅助矩阵,可方便地表达灰度图像。
    t_replicated = np.repeat(t[:, :, np.newaxis], image_channels, axis=2)  # 将一个灰度图像的雾度值扩展到所有颜色通道上
    I = t_replicated * R + (1 - t_replicated) * L_atm
    return I

def transmission_homogeneous_medium(d, beta, camera_parameters_file):
    """
    根据比尔-朗伯定律,利用给定的深度图计算透射图。区分场景深度 d 和摄像机与每个像素所描绘物体之间的距离 l。
    :param d: H×W 矩阵,包含处理后图像的深度值(以米为单位)。
    :param beta: 衰减系数(以米为单位)。常数,因为介质是均质的。
    :param camera_parameters_file: 相机参数文件。
    :return: H×W 矩阵,介质传输值范围为 [0,1]。
    """
    l = distance_in_meters(d, camera_parameters_file)
    t = np.exp(-beta * l)
    return t


if __name__=="__main__":
    camera_parameters_file = r"D:\PythonProject\MB_TaylorFormer\RShazy\FoggySynscapes\data\demo\camera\camera.json"
    f_x, c_x, c_y = camera_parameters(camera_parameters_file)
    print(f_x, c_x, c_y)

详细解析请看中文注解

这里请按照默认下载的目录进行,不要随意做修改,相机的内参请自己创建,在数据集的json文件中已经给出。

import os
import numpy as np
from PIL import Image
from skimage.io import imread
import matplotlib.pyplot as plt
from RShazy.FoggySynscapes.utils import get_dark_channel, transmission_homogeneous_medium
from RShazy.FoggySynscapes.utils import estimate_atmospheric_light_rf, haze_linear
plt.rcParams['font.family'] = 'serif'
plt.rcParams['font.serif'] = 'Times New Roman'
from pyzjr.data import multi_makedirs
from RShazy.FoggySynscapes.depth_utils import read_depth_from_exr

def demo_test(demo_root_dir, iter, beta = 0.06, window_size = 15):
    depth_exr_path = os.path.join(demo_root_dir, 'depth')
    camera_json_file = os.path.join(demo_root_dir, 'camera.json')
    image_rgb_path = os.path.join(demo_root_dir, 'rgb')

    depth_image = read_depth_from_exr(os.path.join(depth_exr_path, f"{iter}.exr"))
    img_uint8 = imread(os.path.join(image_rgb_path, f'{iter}.png'))
    clear_image = img_uint8.astype(float) / 255.0

    t = transmission_homogeneous_medium(depth_image, beta, camera_json_file)

    clear_image_dark_channel = get_dark_channel(clear_image, window_size)
    L_atm = estimate_atmospheric_light_rf(clear_image_dark_channel, clear_image)

    I = haze_linear(clear_image, t, L_atm)
    converted_I = (I * 255).astype(np.uint8)
    pil_I = Image.fromarray(converted_I)

    return pil_I

if __name__=="__main__":
    import matplotlib
    # import pyzjr
    matplotlib.use('TkAgg')
    demo_root_dir = r"F:\dataset\Dehazy\synscapes\Synscapes\img"
    foggy_result_dir = r"D:\PythonProject\MB_TaylorFormer\RShazy\FoggySynscapes\Synscapes\test/hazy"
    multi_makedirs(foggy_result_dir)
    # _, length = pyzjr.get_file_list(os.path.join(demo_root_dir, "rgb"))
    # print(length)  # 25000
    for i in range(251, 352):
        pil_I = demo_test(demo_root_dir, i)
        # plt.imshow(pil_I)
        # plt.show()
        print(f"{i} 已保存图片到",os.path.join(foggy_result_dir, f"{i}.png"))
        pil_I.save(os.path.join(foggy_result_dir, f"{i}.png"))

合成效果如下所示:

D455相机拍摄自制数据集

拍摄以及无效区域处理方法请看此文:D455相机RGB与深度图像对齐,缓解相机无效区域的问题

这里我们需要修改读取深度图的方式:

import numpy as np

def read_depth_from_npy(npy_file_path):
    """读取指定的NPY文件中的深度信息"""
    depth_data = np.load(npy_file_path)
    return depth_data

记得将自己拍摄rgb图像和处理过后的depth文件进行替换

目录结构请按照下面的方式进行:

D455相机的参数:

{
  "camera": {
    "intrinsic": {
      "fx": 387.3067321777344,
      "fy": 387.3067321777344,
      "resx": 640,
      "resy": 480,
      "u0": 321.67352294921875,
      "v0": 237.27777099609375
    }
  }
}

import os
import numpy as np
from PIL import Image
from skimage.io import imread
import matplotlib.pyplot as plt
from RShazy.FoggySynscapes.utils import get_dark_channel, transmission_homogeneous_medium
from RShazy.FoggySynscapes.utils import estimate_atmospheric_light_rf, haze_linear
plt.rcParams['font.family'] = 'serif'
plt.rcParams['font.serif'] = 'Times New Roman'
from RShazy.FoggySynscapes.depth_utils import read_depth_from_exr, read_depth_from_npy

def demo_test(demo_root_dir, iter, beta = 0.06, window_size = 15):
    depth_exr_path = os.path.join(demo_root_dir, 'depth')
    camera_json_file = os.path.join(demo_root_dir, 'camera.json')
    image_rgb_path = os.path.join(demo_root_dir, 'rgb')
    
    depth_image = read_depth_from_npy(os.path.join(depth_exr_path, f"{iter}.npy"))
    img_uint8 = imread(os.path.join(image_rgb_path, f'{iter}.png'))
    clear_image = img_uint8.astype(float) / 255.0

    t = transmission_homogeneous_medium(depth_image, beta, camera_json_file)

    clear_image_dark_channel = get_dark_channel(clear_image, window_size)
    L_atm = estimate_atmospheric_light_rf(clear_image_dark_channel, clear_image)

    I = haze_linear(clear_image, t, L_atm)
    converted_I = (I * 255).astype(np.uint8)
    pil_I = Image.fromarray(converted_I)

    return pil_I

if __name__=="__main__":
    import matplotlib
    matplotlib.use('TkAgg')
    demo_root_dir = r"D:\PythonProject\MB_TaylorFormer\RShazy\FoggySynscapes\datas\img"
    foggy_result_dir = r"D:\PythonProject\MB_TaylorFormer\RShazy\FoggySynscapes\outputs/hazy"
    os.makedirs(foggy_result_dir, exist_ok=True)
    # _, length = pyzjr.get_file_list(os.path.join(demo_root_dir, "rgb"))
    # print(length)  # 25000
    for i in range(1, 5):
        pil_I = demo_test(demo_root_dir, i, beta = 0.2)
        # plt.imshow(pil_I)
        # plt.show()
        print(f"{i} 已保存图片到",os.path.join(foggy_result_dir, f"{i}.png"))
        pil_I.save(os.path.join(foggy_result_dir, f"{i}.png"))

室外场景: 

室内场景:

 

参考文章

完善后的根据深度图加雾代码Python_图像加雾python-CSDN博客

【python】通过深度图生成雾图(HAZERD)_深度图像信息合成雾-CSDN博客

图片合成雾的方法概述_图像加雾-CSDN博客

MATLAB实现利用图像深度信息合成不同浓度的雾【Cityscapes_foggy数据集】_自己合成带雾数据集-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1803167.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux☞进程控制

在终端执行命令时,Linux会建立进程,程序执行完,进程会被终止;Linux是一个多任务的OS,允许多个进程并发运行; Linxu中启动进程的两种途径: ①手动启动(前台进程(命令gedit)...后台进程(命令‘&’)) ②…

重构大学数学基础_week04_从点积理解傅里叶变换

这周我们来看一下傅里叶变换。傅里叶变换是一种在数学和许多科学领域中广泛应用的分析方法,它允许我们将信号或函数从其原始域(通常是时间域或空间域)转换到频域表示。在频域中,信号被表示为其组成频率的幅度和相位,这…

STM32F103C8T6基于HAL库完成uC/OS-III多任务程序

一、在STM32CubeMX中建立工程 配置RCC 配置SYS 配置PC13为GPIO_Output 配置USART1 生成代码 二、获取uC/OS-III源码 官网下载地址:Micrium Software and Documentation - Silicon Labs 网盘下载:百度网盘 请输入提取码 提取码:lzjl 三、复…

反射型xss靶场练习

反射型xss危害小,这里使用的xss靶场是常用的xss靶场:xss-labs。 当我们完成弹窗后就通过该关卡,说该关卡存在xss的一个漏洞并且可以解析js代码。 第一关: 这里没有过滤我们输入的代码:直接将js代码放在js代码中&a…

SpringBoot图书管理系统【附:资料➕文档】

前言:我是源码分享交流Coding,专注JavaVue领域,专业提供程序设计开发、源码分享、 技术指导讲解、各类项目免费分享,定制和毕业设计服务! 免费获取方式--->>文章末尾处! 项目介绍048: 图…

springboot中路径默认配置与重定向/转发所存在的域对象

今天在写项目的时候,突然发现引用js的时候路径不匹配,让我再次对路径问题产生了疑问,通过查阅springboot官网可以发现,在springboot中查找静态资源的时候,会默认在static、public、resources下查找,官网中也…

C++面向对象程序设计 - 字符串流

文件流是以外存文件为输入输出对象的数据流,字符串流不是以外存文件为输入输出的对象,而以内存中用户定义的字符数组(字符串)为输入输出的对象,即将数据输出到内存中的字符数组,或者从字符数组(…

【NI国产替代】PCIe 高速采集卡, 8 位双通道数字化仪器,采集卡最高采样率高达 5 GS/s 模拟带宽高达 500 MHz

• 8 位双通道数字化仪器 • 最高采样率高达 5 GS/s • 模拟带宽高达 500 MHz • 采用 PCIe 3.0 x 8 接口 • 基于 Xilinx Kintex UltraScale, XCKU040 • 提供硬件、FPGA、软件定制服务 高速采集卡是一款 8 位双通道数字化仪器,采集卡最高采样率高达 5 GS/s 模…

【python报错】list indices must be integers or slices, not tuple

【Python报错】list indices must be integers or slices, not tuple 在Python中,列表(list)是一种常用的数据结构,用于存储一系列的元素。当你尝试使用不支持的索引类型访问列表元素时,会遇到list indices must be in…

【教学类-36-07】20240608动物面具(通义万相)-A4大小7图15手工纸1图

背景需求: 风变的AI对话大师一年到期了,也没有看到续费的按钮。不能使用它写代码了。 MJ早就用完了,最后480次,我担心信息课题会用到它生图,所以不敢用。 最近探索其他类似MJ的免费出图工具——找到了每天给50张免费图…

DIO控制卡,IRIG-B码卡,PCI-E总线接口卡,百兆数据采集卡

DIO控制卡 ● 4路继电器输出(5A250VAC) ● 4路开关量输入(24VDC) ● 1路IDE接口 ● 端口浪涌保护 IRIG-B码卡 ● 1路IRIG-B对时接口(RS485/光纤) ● 1路IEEE1588 V2对时接口(RJ45/光纤&#…

linux本地搭建dns

不需要图形化界面 使用的是dnsmasq,配置简单 1.安装 deb系列linux apt-get install dnsmasqrhat系列linux yum install dnsmasq2.编辑配置文件 vi /etc/dnsmasq.conf设置主dns服务器,比如现有公用的的114.114.114.114 8.8.8.8这类的 server8.8.8.8…

C语言详解(动态内存管理)2

Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~ 💥💥个人主页:奋斗的小羊 💥💥所属专栏:C语言 🚀本系列文章为个人学习…

零空间(Null Space)控制例子

零空间(Null Space)控制是一种用于多任务控制系统的技术,特别适用于机器人和多自由度系统。其基本原理是将控制任务分解为不同的优先级,其中高优先级任务在主空间(Task Space)中执行,而低优先级任务在零空间(Null Space)中执行。这样可以保证在完成主要任务的同时,次…

VScode的插件使用

1、正则插件-1 2、AI助手工具-1-fittentech 3、画图工具-1 4、GitHub的查看工具 5、shell测试工具

vuInhub靶场实战系列--Kioptrix Level #1

免责声明 本文档仅供学习和研究使用,请勿使用文中的技术源码用于非法用途,任何人造成的任何负面影响,与本人无关。 目录 免责声明前言一、环境配置1.1 靶机信息1.2 靶场配置 二、信息收集2.1 主机发现2.2 端口扫描2.2.1 masscan2.2.2 nmap 2.3 指纹识别2.4 目录扫描2.4.1 dirb…

Python在股票交易分析中的应用:布林带与K线图的实战回测

引言 在股票交易的世界中,技术分析是投资者们用来预测市场动向的重要工具。布林带(Bollinger Bands)作为一种动态波动范围指标,因其直观性和实用性而广受欢迎。本文将通过Python代码,展示如何使用布林带结合K线图来分…

【动态规划-BM79 打家劫舍(二)】

题目 BM79 打家劫舍(二) 描述 你是一个经验丰富的小偷,准备偷沿湖的一排房间,每个房间都存有一定的现金,为了防止被发现,你不能偷相邻的两家,即,如果偷了第一家,就不能再偷第二家,如…

鸿蒙低代码开发一个高频问题

在版本是DevEco Studio 3.1.1 Release,SDK是3.1.0(API9)。 创建和设计的visual文件经常会遇到无法渲染的情况,或者自定义组件在Custom列表中突然不见了的情况。 有以下报错信息的: JSON schema validation error: data/visualModel/value/…

【python报错】TypeError: dict.get() takes no keyword arguments

【Python报错】TypeError: dict.get() takes no keyword arguments 在Python中,字典(dict)是一种非常灵活的数据结构,用于存储键值对。dict.get()方法是用来从字典中获取与给定键(key)相关联的值&#xff0…