opencv入门学习总结

opencv学习总结

不多bb，直接上代码！！！

案例一：


import cv2
# 返回当前安装的 OpenCV 库的版本信息 并且是字符串格式
print(cv2.getVersionString())
"""
作用：它可以读取不同格式的图像文件并将其转换为一个 NumPy 数组
    image = cv2.imread(filename, flags)
    filename: 要读取的图像文件路径，支持绝对路径和相对路径。
    flags(可选): 指定图像读取的方式，控制图像的加载格式。这个参数是可选的，默认为 cv2.IMREAD_COLOR
            cv2.IMREAD_COLOR: 以彩色图像加载，忽略图像的透明度（默认值）。rgb
            cv2.IMREAD_GRAYSCALE: 以灰度图像加载，返回一个单通道图像（没有颜色信息）
            cv2.IMREAD_UNCHANGED: 加载图像包括其 alpha 通道，即加载图像时包括透明度信息（如果有的话）。rgba
"""
image = cv2.imread("opencv_logo.jpg")
print(image.shape)

"""
作用：用于在窗口中显示图像。该函数可以将图像或视频帧显示在一个新的窗口中。
    cv2.imshow(window_name, image)
    window_name：窗口的名称，是一个字符串类型的参数
    image：要显示的图像。它通常是一个 NumPy 数组，表示图像数据
"""
cv2.imshow("image", image)
# 等待用户输入（例如按键事件）任意按键退出

"""
作用：用于等待用户输入键盘事件
    cv2.waitKey(delay)
    delay: 延迟时间，单位：毫秒
"""
cv2.waitKey()


# 关闭所有打开的窗口
cv2.destroyAllWindows()

案例二：



import cv2

image = cv2.imread("opencv_logo.jpg")

"""
1.这段代码展示了如何分别显示 OpenCV 彩色图像的三个颜色通道（蓝色、绿色和红色）单独的图像。
2.OpenCV 中加载的彩色图像是以 BGR（蓝色、绿色、红色）顺序存储的，而不是常见的 RGB 顺序。
    image[:, :, 0]: 表示图像的蓝色通道。
    image[:, :, 1]: 表示图像的绿色通道。
    image[:, :, 1]: 表示图像的红色通道。
    这里使用了数组的切片，返回了一个二维数组。
    例如：
        import numpy as np
        
        # 假设这是一个 3x3 的图像，每个像素有 3 个通道
        image = np.array([[[100, 150, 200], [120, 170, 220], [140, 190, 240]],
                          [[110, 160, 210], [130, 180, 230], [150, 200, 250]],
                          [[120, 170, 220], [140, 190, 240], [160, 210, 260]]])
        
        # 提取蓝色通道
        blue_channel = image[:, :, 0]
        print(blue_channel)
        
    输出：[[100 120 140]
         [110 130 150]
         [120 140 160]]
"""
cv2.imshow("blue", image[:, :, 0])
cv2.imshow("green", image[:, :, 1])
cv2.imshow("red", image[:, :, 2])

"""
    作用：将图像从一种颜色空间转换到另一种颜色空间
    cv2.cvtColor(src, code)
        src：输入图像，通常是一个 NumPy 数组（例如通过 cv2.imread() 读取的图像）。
        code：颜色空间转换代码，指定要应用的转换类型
            常见的几种：
                cv2.COLOR_BGR2RGB：从 BGR 转换为 RGB。
                cv2.COLOR_BGR2GRAY：从 BGR 转换为灰度图像。
                cv2.COLOR_RGB2BGR：从 RGB 转换为 BGR。
"""
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2.imshow("gray", gray)

cv2.waitKey()

在这里插入图片描述

案例三：


import cv2
# 是在对一个图像 image 进行切割操作，返回一个新的图像区域
image = cv2.imread("opencv_logo.jpg")

crop = image[10:170, 40:200]

cv2.imshow("crop", crop)
cv2.waitKey()

在这里插入图片描述

案例四：


import cv2
import numpy as np

image = np.zeros([300, 300, 3], dtype=np.uint8)
"""
作用：在图像上绘制一条直线
    cv2.line(image, start_point, end_point, color, thickness)
    image：要在其上绘制线条的图像（通常是一个 NumPy 数组）。
    start_point：线条的起始点坐标，格式为 (x, y)，其中 x 是水平坐标（列），y 是垂直坐标（行）。
    end_point：线条的结束点坐标，格式为 (x, y)。
    color：线条的颜色，通常是 BGR 格式的元组，即 (蓝色, 绿色, 红色)。
    thickness：线条的粗细，单位是像素。
"""
cv2.line(image, (100, 200), (250, 250), (255, 0, 0), 2)

"""
作用：在图像上绘制一个矩形
    cv2.rectangle(image, start_point, end_point, color, thickness)
    image：目标图像，矩形将被绘制在此图像上。
    start_point：矩形的左上角坐标，格式为 (x, y)，其中 x 为水平坐标（列），y 为垂直坐标（行）
    end_point：矩形的右下角坐标，格式同样为 (x, y)。
    color：矩形的颜色，采用 BGR（蓝色、绿色、红色）格式。
    thickness：线条的粗细，单位是像素。
"""
cv2.rectangle(image, (30, 100), (60, 150), (0, 255, 0), 2)

"""
作用：在图像上绘制一个圆形
    cv2.circle(image, center, radius, color, thickness)
    image：目标图像，圆形将被绘制在此图像上。
    center：圆形的中心点坐标，格式为 (x, y)，其中 x 为水平坐标（列），y 为垂直坐标（行）。
    radius：圆形的半径，单位为像素。
    color：圆形的颜色，采用 BGR（蓝色、绿色、红色）格式。
    thickness：圆形的边框宽度，单位为像素。如果设置为负值（如 -1），则表示填充圆形。
"""
cv2.circle(image, (150, 100), 20, (0, 0, 255), 3)

"""
作用：在图像上添加文本
    cv2.putText(image, text, position, font, font_scale, color, thickness, line_type)
    image：目标图像，文本将被绘制在此图像上。
    text：要绘制的文本字符串。
    position：文本的左下角位置（起始坐标），格式为 (x, y)，其中 x 是水平坐标（列），y 是垂直坐标（行）。
    font：字体类型（通过 OpenCV 提供的常量来指定）。0 表示使用 OpenCV 默认字体 cv2.FONT_HERSHEY_SIMPLEX
    font_scale：字体的缩放比例（即字体大小）。
    color：文本颜色，采用 BGR（蓝色、绿色、红色）格式。
    thickness：文本的线条粗细，单位为像素。
    line_type：线条类型，用于指定文本的抗锯齿（通常设置为 1 表示抗锯齿）。
"""
cv2.putText(image, "hello", (100, 50), 0, 1, (255, 255, 255), 2, 1)

cv2.imshow("image", image)
cv2.waitKey()

在这里插入图片描述

案例5：

首先我们先明白什么是噪点？

噪点（Noise） 是指图像中出现的随机、无关的像素值，它们通常表现为干扰、杂散的亮度或颜色变化，可能会影响图像的质量和分析。噪点通常是由于图像捕获、传输、处理等过程中引入的误差或不稳定因素。

如何去除噪点？

去噪点（去噪）是图像处理中常见且重要的一步，目的是减少图像中的噪声，恢复图像的质量和细节。不同类型的噪点（如椒盐噪声、高斯噪声等）可以通过不同的去噪方法进行处理。下面是一些常见的去噪方法：


import cv2

image = cv2.imread("plane.jpg")


# 用均值滤波去除噪点
mean_blur = cv2.blur(image, (5, 5))  # 5x5 窗口
# 用高斯滤波去除噪点
gauss = cv2.GaussianBlur(image, (5, 5), 0) # 5x5 窗口 标准差为 0
# 用中值滤波去除噪点
median = cv2.medianBlur(image, 5) # 5 是邻域大小
# 用双边滤波去除噪点
# 参数1：直径，参数2：颜色空间标准差，参数3：坐标空间标准差
bilateral_blur = cv2.bilateralFilter(image, 9, 75, 75)


cv2.imshow("image", image)
cv2.imshow("mean_blur", mean_blur)
cv2.imshow("gauss", gauss)
cv2.imshow("median", median)
cv2.imshow("bilateral_blur", bilateral_blur)

cv2.waitKey()

在这里插入图片描述

除了以上opencv中自带的函数去除噪点，还可以使用深度学习模型更好的去除噪点。

OpenCV本身并不直接提供深度学习去噪的实现，但你可以利用深度学习框架（如TensorFlow、PyTorch等）和预训练的去噪模型（如DnCNN、U-Net等）来进行去噪。下面是一个使用深度学习去噪的简化示例（假设你已经有一个训练好的模型）。

import cv2
import torch
import numpy as np

# 加载训练好的模型 (假设你已经训练了一个去噪模型)
model = torch.load("denoising_model.pth")  # 这是一个假设的模型路径
model.eval()

# 读取图像
image = cv2.imread("plane.jpg")
image_tensor = torch.from_numpy(image).float().unsqueeze(0).unsqueeze(0)  # 转换为 PyTorch Tensor

# 将图像输入模型进行去噪
with torch.no_grad():
    denoised_image_tensor = model(image_tensor)

# 将去噪后的 Tensor 转换回图像格式
denoised_image = denoised_image_tensor.squeeze().numpy().astype(np.uint8)

# 显示原图像和去噪后的图像
cv2.imshow("Original Image", image)
cv2.imshow("Denoised Image (Deep Learning)", denoised_image)

cv2.waitKey(0)
cv2.destroyAllWindows()