图像信号处理器(ISP)基础算法及处理流程

news2024/10/6 1:11:20

在这里插入图片描述

💪 专业从事且热爱图像处理,图像处理专栏更新如下👇:
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》


在这里插入图片描述

传统的ISP(Image Signal Processing)图像处理算法涵盖了从图像传感器(通常是CMOS或CCD传感器)获取原始图像数据到生成最终显示图像的全过程。以下是一些常见的传统ISP图像处理算法处理步骤。

目录

  • 一、黑电平校正(Black Level Correction)
    • 1.1 代码
  • 二、去噪(Denoising)
    • 2.1 固定模式噪声校正
    • 2.2 随机噪声去除
    • 2.3 代码
  • 三、白平衡(White Balance)
    • 3.1 灰世界算法(Gray World Algorithm)
    • 3.2 完美反射算法(Perfect Reflector Algorithm)
    • 3.3 代码
  • 四、去马赛克(Demosaicing)
    • 4.1 代码
  • 五、伽玛校正(Gamma Correction)
    • 5.1 代码
  • 六、色彩校正(Color Correction)
    • 6.1 色彩空间转换
    • 6.2 色彩矩阵处理
    • 6.3 代码
  • 七、锐化(Sharpening)
    • 7.1 拉普拉斯锐化
    • 7.2 非线性锐化
    • 7.3 代码
  • 八、色彩空间转换(Color Space Conversion)
    • 8.1 代码
  • 九、色调映射(Tone Mapping)
    • 9.1 局部色调映射
    • 9.2 全局色调映射
    • 9.3 代码
  • 十、变换(Transformations)
    • 10.1 代码
  • 十一、校准和矫正(Calibration and Correction)
    • 11.1 镜头畸变校正
    • 11.2 色差校正
    • 11.3 遮光校正
    • 11.4 代码
  • 十二、自动对焦(Autofocus)
    • 12.1 对比度检测
    • 12.2 相位检测
    • 12.3 代码
  • 十三、曝光控制(Exposure Control)
    • 13.1 代码
  • 十四、自动增益控制(Auto Gain Control, AGC)
    • 14.1 代码
  • 十五、动态范围压缩(Dynamic Range Compression, DRC)
    • 15.1 局部动态范围压缩
    • 15.2 全局动态范围压缩
    • 15.3 代码
  • 十六、总结

一、黑电平校正(Black Level Correction)

目的:在图像传感器捕获的原始图像中,可能存在黑电平偏移。这一步校正这些偏移,使得黑电平值归零,从而提高图像的动态范围。

步骤:

传感器捕获的原始图像可能包含偏移的黑电平值。
计算或查找黑电平值。
从每个像素值中减去黑电平值,使得图像黑电平归零。

1.1 代码

def black_level_correction(image, black_level=16):
    return np.clip(image - black_level, 0, 255).astype(np.uint8)

black_level_corrected_image = black_level_correction(image)
cv2.imwrite('black_level_corrected_image.jpg', black_level_corrected_image)

二、去噪(Denoising)

抑制图像中的各种噪声,如固定模式噪声(FPN)和随机噪声。

步骤:

2.1 固定模式噪声校正

固定模式噪声是由传感器中各像素的响应不均匀引起的。
使用暗帧(captured when no light is entering the sensor)来校正固定模式噪声。

2.2 随机噪声去除

随机噪声通常包括热噪声和读出噪声。
使用滤波技术(如中值滤波、均值滤波或高斯滤波)来抑制随机噪声。

2.3 代码

下面给出通过高斯模糊去噪的例子:

import cv2
import numpy as np

def denoise_image(image):
    return cv2.GaussianBlur(image, (5, 5), 0)

image = cv2.imread('input_image.jpg')
denoised_image = denoise_image(image)
cv2.imwrite('denoised_image.jpg', denoised_image)

三、白平衡(White Balance)

白平衡算法调整图像的色温,以确保图像在各种照明条件下颜色的准确性。常见的白平衡方法包括灰世界算法(Gray World Algorithm)和完美反射算法(Perfect Reflector Algorithm)。

步骤:

3.1 灰世界算法(Gray World Algorithm)

假设图像中所有颜色的平均值应该是中性的灰色。
计算图像中红、绿、蓝三通道的平均值。
根据平均值的偏差,调整各通道的增益使其均衡。

3.2 完美反射算法(Perfect Reflector Algorithm)

假设图像中存在一个完美反射的白色物体。
使用该物体的颜色作为白平衡参考点,调整其他颜色的增益。

3.3 代码

def white_balance(image):
    result = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)
    avg_a = np.average(result[:, :, 1])
    avg_b = np.average(result[:, :, 2])
    result[:, :, 1] = result[:, :, 1] - ((avg_a - 128) * (result[:, :, 0] / 255.0) * 1.1)
    result[:, :, 2] = result[:, :, 2] - ((avg_b - 128) * (result[:, :, 0] / 255.0) * 1.1)
    return cv2.cvtColor(result, cv2.COLOR_LAB2BGR)

white_balanced_image = white_balance(denoised_image)
cv2.imwrite('white_balanced_image.jpg', white_balanced_image)

四、去马赛克(Demosaicing)

大多数图像传感器使用拜耳(Bayer)滤色器阵列,因此捕获的图像是单色图像(每个像素只记录一种颜色)。去马赛克算法将这些单色图像转换为全彩色图像。

步骤:

传感器使用拜耳滤色器阵列捕获图像,每个像素只记录一种颜色(红、绿或蓝)。

插值算法(Interpolation Algorithms):
最简单的方法是线性插值。
更复杂的方法包括双向插值、边缘方向插值和加权方向插值。

4.1 代码

去马赛克将拜耳阵列转换为RGB图像。

def demosaic(image):
    return cv2.cvtColor(image, cv2.COLOR_BAYER_BG2BGR)

demosaiced_image = demosaic(black_level_corrected_image)
cv2.imwrite('demosaiced_image.jpg', demosaiced_image)

五、伽玛校正(Gamma Correction)

伽玛校正用于调整图像的亮度,以匹配显示设备的特性。它将线性传感器数据转换为非线性,以更好地反映人眼对亮度的感知。

步骤:

原始图像数据通常是线性响应的。
应用非线性伽玛曲线将线性数据转换为伽玛校正后的数据。
常见的伽玛值为2.2(对于sRGB显示设备)。

5.1 代码

加粗样式

def gamma_correction(image, gamma=1.0):
    invGamma = 1.0 / gamma
    table = np.array([((i / 255.0) ** invGamma) * 255 for i in np.arange(0, 256)]).astype("uint8")
    return cv2.LUT(image, table)

gamma_corrected_image = gamma_correction(color_corrected_image, gamma=2.2)
cv2.imwrite('gamma_corrected_image.jpg', gamma_corrected_image)

六、色彩校正(Color Correction)

色彩校正包括色彩空间转换和色彩矩阵处理,以确保图像的颜色准确性。

步骤:

6.1 色彩空间转换

将原始RGB数据转换为目标色彩空间(如sRGB)。

6.2 色彩矩阵处理

应用色彩校正矩阵,调整图像的颜色分布。
该矩阵通常根据摄像头和显示设备的色彩特性预先计算。

6.3 代码

def color_correction(image, red_gain=1.0, green_gain=1.0, blue_gain=1.0):
    b, g, r = cv2.split(image)
    b = cv2.multiply(b, blue_gain)
    g = cv2.multiply(g, green_gain)
    r = cv2.multiply(r, red_gain)
    return cv2.merge([b, g, r])

color_corrected_image = color_correction(white_balanced_image, red_gain=1.1, green_gain=1.0, blue_gain=1.2)
cv2.imwrite('color_corrected_image.jpg', color_corrected_image)

七、锐化(Sharpening)

锐化算法用于增强图像的细节和边缘,使图像看起来更加清晰。常用的方法包括拉普拉斯锐化和非线性锐化。

步骤:

7.1 拉普拉斯锐化

使用拉普拉斯算子计算图像的二阶导数,增强边缘。

7.2 非线性锐化

使用非线性滤波器,如高斯拉普拉斯(LoG)滤波器,增强细节。

7.3 代码

图像锐化可以通过卷积操作来实现。

def sharpen_image(image):
    kernel = np.array([[0, -1, 0],
                       [-1, 5, -1],
                       [0, -1, 0]])
    return cv2.filter2D(image, -1, kernel)

sharpened_image = sharpen_image(gamma_corrected_image)
cv2.imwrite('sharpened_image.jpg', sharpened_image)

八、色彩空间转换(Color Space Conversion)

将图像从一种色彩空间转换到另一种色彩空间,例如从RGB到YCbCr,以便于压缩和显示。

步骤:

常见的色彩空间转换包括RGB到YCbCr。
这种转换有助于压缩和显示。
使用线性变换矩阵进行转换。

8.1 代码

色彩空间转换将图像从一种色彩空间转换到另一种。

def convert_color_space(image, conversion_code=cv2.COLOR_BGR2YCrCb):
    return cv2.cvtColor(image, conversion_code)

color_converted_image = convert_color_space(demosaiced_image, cv2.COLOR_BGR2YCrCb)
cv2.imwrite('color_converted_image.jpg', color_converted_image)

九、色调映射(Tone Mapping)

色调映射用于处理高动态范围(HDR)图像,将其映射到低动态范围显示设备上,同时保留细节和对比度。

步骤:

9.1 局部色调映射

根据局部亮度调整色调,保留细节。

9.2 全局色调映射

根据整体亮度调整色调,压缩动态范围。

9.3 代码

def tone_mapping(image, gamma=2.2):
    invGamma = 1.0 / gamma
    table = np.array([((i / 255.0) ** invGamma) * 255 for i in np.arange(0, 256)]).astype("uint8")
    return cv2.LUT(image, table)

tone_mapped_image = tone_mapping(color_converted_image)
cv2.imwrite('tone_mapped_image.jpg', tone_mapped_image)

十、变换(Transformations)

图像几何变换包括旋转、缩放、平移和镜像等,用于图像的对齐和校正。

步骤:

使用变换矩阵对图像进行几何变换。
常用的变换包括仿射变换、透视变换和投影变换。

10.1 代码

def transform_image(image, angle=0, scale=1.0):
    h, w = image.shape[:2]
    M = cv2.getRotationMatrix2D((w/2, h/2), angle, scale)
    return cv2.warpAffine(image, M, (w, h))

transformed_image = transform_image(tone_mapped_image, angle=15, scale=1.1)
cv2.imwrite('transformed_image.jpg', transformed_image)

十一、校准和矫正(Calibration and Correction)

包括镜头畸变校正、色差校正、遮光校正等,以补偿镜头和传感器引入的各种失真和缺陷。

步骤:

11.1 镜头畸变校正

计算镜头畸变参数(如径向和切向畸变)。
应用畸变校正模型(如鱼眼校正)校正图像。

11.2 色差校正

校正由于不同波长的光在镜头中折射率不同引起的色差。

11.3 遮光校正

补偿由于镜头遮光引起的图像边缘变暗现象(渐晕)。

11.4 代码

def calibrate_and_correct(image, camera_matrix, dist_coeffs):
    h, w = image.shape[:2]
    new_camera_matrix, roi = cv2.getOptimalNewCameraMatrix(camera_matrix, dist_coeffs, (w, h), 1, (w, h))
    corrected_image = cv2.undistort(image, camera_matrix, dist_coeffs, None, new_camera_matrix)
    x, y, w, h = roi
    return corrected_image[y:y+h, x:x+w]

# 示例相机矩阵和畸变系数
camera_matrix = np.array([[800, 0, 320], [0, 800, 240], [0, 0, 1]], dtype=np.float32)
dist_coeffs = np.array([-0.2, 0.1, 0, 0], dtype=np.float32)

calibrated_image = calibrate_and_correct(transformed_image, camera_matrix, dist_coeffs)
cv2.imwrite('calibrated_image.jpg', calibrated_image)

十二、自动对焦(Autofocus)

自动对焦算法根据图像内容调整镜头位置,以确保图像的清晰度。

步骤:

12.1 对比度检测

通过检测图像的对比度最大化来实现自动对焦。

12.2 相位检测

使用相位检测传感器快速确定对焦位置。

12.3 代码

def auto_focus(image):
    # 示例:评估图像的拉普拉斯变换的方差,作为对焦度的度量
    focus_measure = cv2.Laplacian(image, cv2.CV_64F).var()
    return focus_measure

focus_value = auto_focus(calibrated_image)
print(f"Focus measure: {focus_value}")

十三、曝光控制(Exposure Control)

根据场景亮度调整曝光时间和增益,以获得最佳亮度的图像。

步骤:

自动曝光(Auto Exposure, AE):
测量场景的整体亮度。
根据预设的曝光策略调整曝光参数(快门速度、光圈和ISO感光度)。

13.1 代码

def adjust_exposure(image, target_brightness=128):
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    current_brightness = np.mean(gray)
    correction_factor = target_brightness / current_brightness
    return np.clip(image * correction_factor, 0, 255).astype(np.uint8)

exposure_adjusted_image = adjust_exposure(calibrated_image)
cv2.imwrite('exposure_adjusted_image.jpg', exposure_adjusted_image)

十四、自动增益控制(Auto Gain Control, AGC)

调整图像传感器的增益,以确保在不同光照条件下图像的亮度。

步骤:

增益调整:
根据测量到的图像亮度,动态调整传感器的增益。

14.1 代码

自动增益控制用于调整图像的对比度。

def auto_gain_control(image, clip_limit=2.0, tile_grid_size=(8, 8)):
    lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)
    lab_planes = cv2.split(lab)
    clahe = cv2.createCLAHE(clipLimit=clip_limit, tileGridSize=tile_grid_size)
    lab_planes[0] = clahe.apply(lab_planes[0])
    lab = cv2.merge(lab_planes)
    return cv2.cvtColor(lab, cv2.COLOR_LAB2BGR)

gain_adjusted_image = auto_gain_control(exposure_adjusted_image)
cv2.imwrite('gain_adjusted_image.jpg', gain_adjusted_image)

十五、动态范围压缩(Dynamic Range Compression, DRC)

压缩图像的动态范围,以适应显示设备的能力。

步骤:

15.1 局部动态范围压缩

在保留细节的情况下压缩亮度范围。

15.2 全局动态范围压缩

调整图像的整体对比度,压缩高光和阴影部分的亮度。

15.3 代码

直方图均衡化对图像的亮度通道(L通道)进行处理,从而实现动态范围压缩。以下是代码的实现步骤:

将图像转换为LAB色彩空间:LAB色彩空间将亮度和色彩分离,便于单独处理亮度。

对L通道进行直方图均衡化:直方图均衡化是一种常见的动态范围压缩技术,通过调整图像亮度分布来增强图像的对比度和细节。

合并通道并转换回BGR色彩空间:处理完L通道后,重新合并LAB通道并转换回BGR色彩空间,以便显示和保存图像。

显示和保存结果图像:使用matplotlib库显示原始图像和处理后的图像,并将结果保存为JPEG文件。

import cv2
import numpy as np
from matplotlib import pyplot as plt

def dynamic_range_compression(image):
    # 将图像转换为LAB色彩空间
    lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)
    l, a, b = cv2.split(lab)
    
    # 对L通道进行直方图均衡化
    l_eq = cv2.equalizeHist(l)
    
    # 合并通道并转换回BGR色彩空间
    lab_eq = cv2.merge((l_eq, a, b))
    compressed_image = cv2.cvtColor(lab_eq, cv2.COLOR_LAB2BGR)
    
    return compressed_image

# 读取图像
image = cv2.imread('input_image.jpg')

# 进行动态范围压缩
compressed_image = dynamic_range_compression(image)

# 保存结果图像
cv2.imwrite('compressed_image.jpg', compressed_image)

# 显示原图和处理后的图像
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.title('Original Image')
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.subplot(1, 2, 2)
plt.title('Compressed Image')
plt.imshow(cv2.cvtColor(compressed_image, cv2.COLOR_BGR2RGB))
plt.show()

十六、总结

通过以上步骤,ISP图像处理系统能够将传感器捕获的原始图像数据转换为高质量的可视图像,适用于各种应用和显示设备。以上算法只是基础算法,各个板块都可以衍生出独立领域研究,现在更多的研究引入深度学习(AI ISP),与传统方法相比,深度学习方法可以提供更高质量的图像处理效果,并且能够适应复杂多变的图像内容和拍摄环境。

感谢您阅读到最后!😊总结不易,多多支持呀🌹 点赞👍收藏⭐评论✍️,您的三连是我持续更新的动力💖

关注公众号「视觉研坊」,获取干货教程、实战案例、技术解答、行业资讯!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1893958.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

录屏软件哪个好?3款宝藏软件,分享给你

在数字化时代,录屏软件因其强大的功能性和实用性,逐渐成为工作和生活中的得力助手。然而,市面上的录屏软件众多,选择一款适合自己的录屏软件却成为了一个难题。 不同的录屏软件在功能、性能、易用性等方面都有所不同,…

js之模糊搜索

多的不说 少的不唠 直接上代码

2.5 C#视觉程序开发实例1----设计一个IO_Manager

2.5 C#视觉程序开发实例1----设计一个IO_Manager 第一步目标: 1 实现获取IO触发信号Trig0 2 能够实现程序切换 3 图像处理后能够输出一个脉冲 1 IO 引脚定义 1.1 输入信号定义 1.2 输出信号定义 2 IO时序图 2.1 触发时序 2.2 切换程序时序图 3 IO_Manager.cs …

数据库表导出到excel

数据库表导出到excel:前置知识1 ALL_TAB_COLS 数据库表导出到excel:前置知识2 Quartz基本使用 数据库表导出到excel:前置知识3 项目封装的Quartz实现动态定时任务 数据库表导出到excel:前置知识4 业务和效果 发起清单下载control层InventoryDownloadLogController /* * */ pa…

用户资料门户的构建

1. 需求背景 老的页面停止维护了,且老旧, 功能单一,且页面分散. 急需做功能集成的平台化建设原先的用户资料查询没有做权限管控, 每一次查询都会消耗我们组的人力资源. 2. 项目介绍 2.1. 项目地址 服务地址: [公司内网服务(略)] 工蜂地址: [公司内网仓库(略)] 2.2 项目的价…

女性经济崛起,天润融通用客户感知挖掘市场潜力

每逢一年一度的国际妇女节,“女性”话题都会被郑重地讨论。 从消费市场上来说,最近几年女性群体正在拥有越来越大的影响力,甚至出现了“她经济”这样的专属词汇在最近几年被市场反复讨论。 毫无疑问,女性消费群体的崛起已经成为…

揭秘品牌成功秘诀:品牌营销策略的核心要素大公开

品牌营销作为企业战略中至关重要的一环,其核心是建立和传播品牌的独特魅力,使其在消费者心目中占据重要位置。 一个成功的品牌营销策略能够提升品牌的知名度和影响力,带来持续的销售和忠诚客户群体。 在当今竞争激烈的市场环境中&#xff0…

Prompt的万能公式和优化技巧

文章目录 前言一、万能公式二、优化技巧1.设定角色2.设定目标和动机3.引导主观回答4.预设条件5.做强调6.思维链(COT)7.巧用定界符 前言 随着LLM的发展,能给我们带来很多方便,但是又引出了一个新的问题就是我们该如何使用他们&…

明星代言方式8种助力品牌占领市场-华媒舍

1. 明星代言的重要性和市场价值 明星代言是一种常见的品牌推广方式,通过联系知名度高的明星来推广产品或服务,从而提升品牌的知名度和美誉度。明星代言能够借助明星的影响力和粉丝基础,将品牌信息传达给更广泛的受众,从而提高销量…

【数据结构】建堆的时间复杂度

一.向下调整建堆 1.二叉树层数与总节点个数关系 层数一定时,在二叉树节点个数最大的情况下,二叉树为满二叉树,如下图所示,可以清晰地看到在满二叉树中第h层有2^(h-1)个节点,总节点N就等于一个等比数列的求和&#xf…

【Python机器学习】模型评估与改进——在模型选择中使用评估指标

我们通常希望,在使用GridSearchCV或cross_val_score进行模型选择时能够使用AUC等指标。scikit-learn提供了一种非常简单的实现方法,那就是scoring参数,它可以同时用于GridSearchCV和cross_val_score。你只需要提供一个字符串,用于…

RabbitMQ入门教程(精细版二带图)

目录 六 RabbitMQ工作模式 6.1Hello World简单模式 6.1.1 什么是简单模式 6.1.2 RabbitMQ管理界面操作 6.1.3 生产者代码 6.1.4 消费者代码 6.2 Work queues工作队列模式 6.2.1 什么是工作队列模式 6.2.2 RabbitMQ管理界面操作 6.2.3 生产者代码 6.2.4 消费者代码 …

谷粒商城学习-06-使用vagrant快速创建linux虚拟机

这一节的内容是在Windows上安装虚拟机。 为什么要按照虚拟机呢? 原因是很多软件只能在Linux下运行,有的虽然也可以在Windows上运行,但从安装到运行会遇到很多问题,为这些解决这些问题花时间对于大多数人特别是初学者是没有什么价…

WPS操作技巧:制作可以打对勾的方框,只需简单几步!沈阳wps办公软件培训

日常工作中,我们经常需要在表格中添加复选框,比如【性别选择】、【任务完成状态】等等,通过打对勾来确定状态。今天就分别从WPS的Excel表格和Word文档2种场景,介绍制作可以打对勾的复选框的方法技巧,掌握技巧&#xff…

k8s-第十节-Ingress

Ingress 介绍 Ingress 为外部访问集群提供了一个 统一 入口,避免了对外暴露集群端口;功能类似 Nginx,可以根据域名、路径把请求转发到不同的 Service。可以配置 https跟 LoadBalancer 有什么区别? `LoadBalancer`` 需要对外暴露端口,不安全;无法根据域名、路径转发流量到…

Linux之文本三剑客

Linux之三剑客 Linux的三个命令,主要是用来处理文本,grep,sed,awk,处理日志的时候使用的非常多 1 grep 对文本的内容进行查找 1) 基础用法 语法 grep 选项 内容|正则表达式 文件选项: -i 不区分大小写 -v 排除,反选 -n 显示行号 -c 统计个数查看文件里包含有的内容 [roo…

rtsp地址 + 测试网站 + java(免环境、免插件、零编码转换http播放)

目录 1、创建rtsp网站 2、测试rtsp网站 3、Java实现rtsp播放 ①maven添加依赖 ②访问http地址即可展示视频内容 1、创建rtsp网站 填写邮箱即可获得两个可用的rtsp网站(每月可免费用2G): https://rtsp.stream/ 2、测试rtsp网站 测试网络…

k8s kubectl top pod报错error Metrics API not available

文章目录 1、场景2、解决方法1、确认Metrics Server是否已经在集群中安装2、安装metric-server组件2.1、组件地址2.2、组件与K8S集群版本对应关系2.3、apply资源清单文件2.4、验证Metrics Server正常工作 1、场景 在使用kubectl top pod 命令时遇到了error: Metrics API not a…

人力资源中的人工智能:你应该知道的一切

人工智能已经成为行业讨论更广泛的突出话题。人力资源(HR)对于人力资源专业人士来说,了解这门课程也是如此。除了简要介绍什么是人工智能,以及你可能遇到的主要人工智能类型(或者你可能很快就会遇到它!)此外,本文还将探讨人工智能…