【OpenCV】基础操作学习--实现原理理解

news2025/1/15 6:39:36

读取和显示图像

基本操作

  • cv2.imread(filename , flags):文件中读取图像,从指定路径中读取图像,返回一个图像数组(NumPy数组)
    • filename:图像文件的路径
    • flags:指定读取图像的方式
      • cv2.IMREAD_COLOR(默认为1):以彩色图像读取,忽略透明度通道
      • cv2.IMREAD_GRAYSCALE(0):以灰度图像读取
      • cv2.IMREAD_UNCHANGED(-1):包含图像中alpha通道
  • cv2.imshow():窗口中显示图像,从新窗口中显示图像
  • cv2.waitkey():控制图像显示事件,参数值是毫秒,0表示无限等待
  • 因为运行环境在云服务器上,所以无法实时显示图像,后期补充测试

代码实现1

#读取与显示图像
import cv2 

#读取
img = cv2.imread('your_image.jpg')

#检测是否加载成功
if img is None:
    print("图像读取失败,检查图像路径是否存在")
else:
    #显示图像
    cv2.imshow('显示窗口',img)
    #等待任意按键
    cv2.waitKey(0)
    cv2.destroyAllWindows()
   

代码实现2: 根据三种读取方式,分别读取图片

 

import cv2

# 读取彩色图像
# color_img = cv2.imread('your_image.jpg', cv2.IMREAD_COLOR)
# cv2.imwrite('color.jpg',color_img)


# 读取灰度图像
# gray_img = cv2.imread('your_image.jpg', cv2.IMREAD_GRAYSCALE)
# cv2.imwrite('gray.jpg',gray_img)


# # 读取包含 alpha 通道的图像
unchanged_img = cv2.imread('your_image.png', cv2.IMREAD_UNCHANGED)
cv2.imwrite('unchange.jpg',unchanged_img)

 实现理解

  • 图像读取逻辑:底层调用图像解码库来读取图像文件,然后将其转换为NumPy数组
  • 图像显示逻辑:创建一个窗口,然后调用GUI库(例如Qt)将图像数据渲染到屏幕上

计算机图像学相关知识

像素与颜色空间

  • 像素:图像中的基本元素,通常表示为数值的集合,代表图像在某个位置上的颜色和亮度
    • 图像的最小单位,类似于拼图中的一小块,拼在一起就是一个整体的图像
  • 颜色空间:描述颜色的模型,使用坐标系或者子空间来表示颜色,例如RGB、BGR、HSV等
    • 不同描述颜色的方法,相似与不同语言但是最终表示的都是相同含义

颜色通道

  • RGB颜色:Red , Green , Blue三个颜色通道组成
    • 每个通道的数值是0-255的整数,相对应着表示颜色强弱
  • BGR颜色:OpenCV默认的颜色模型
    • OpenCV中使用BGR颜色主要是因为需要与早期设计的图形格式兼容
    • 可以通过函数对图片的格式进行变换

像素与图像的理解

import cv2

# 读取彩色图像
img = cv2.imread('your_image.jpg')

# 查看图像的尺寸和像素值
print("图像尺寸:", img.shape)
print("像素值示例:", img[0, 0])  # 输出第一个像素的 BGR 值

# 转换为灰度图像
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print("灰度图像尺寸:", gray_img.shape)
print("灰度像素值示例:", gray_img[0, 0])  # 输出第一个像素的灰度值

# 保存灰度图像
cv2.imwrite('gray_image.jpg', gray_img)

 

保存图像

基本操作

  • cv2.imwrite(filename , img , params = None):将图像保存为文件,也就是将图像保存为指定格式,最终格式取决于设定拓展名
    • filename:保存的文件名,其格式是由拓展名决定的
    • img:需要保存的图像对象
    • params:可选参数,用于设置特定格式的编码参数

代码实现

参数设置

import cv2

# 读取图像
img = cv2.imread('your_image.jpg')

# 保存为不同格式
cv2.imwrite('output_image.jpg', img, [int(cv2.IMWRITE_JPEG_QUALITY), 90])  # JPEG,质量90
cv2.imwrite('output_image.png', img, [int(cv2.IMWRITE_PNG_COMPRESSION), 5])  # PNG,压缩级别5

print("图像已保存。")

 

import cv2 

img = cv2.imread('your_image.jpg')

# JPEG 质量90
cv2.imwrite('output_image.jpg',img,[int(cv2.IMWRITE_JPEG_QUALITY),90])
cv2.imwrite('output_image.png',img,[int(cv2.IMWRITE_PNG_COMPRESSION),5])

参数调整总结

  • JPEG质量参数:数值越高,图像质量越好,相应的文件体积越大
  • PNG压缩级别:数值越高,压缩率越高,文件体积也就越小

计算机图形学知识补充 

图像编码与压缩

  • 无损压缩:例如PNG,图像的质量不受损失,但是文件的体积较大
  • 有损压缩:例如JPEG,会舍弃部分的像素来达到压缩的目的,文件体积会更小

保存图像函数实现分析

图像保存会调用编码库,会将NumPy数组编码为指定格式的图像文件,其中编码参数params传递给编码器,从而控制压缩质量和压缩级别

调整图像大小 

基本操作

  • cv2.resize(src , dsize , fx=0 , fy=0 , interolation = cv2.INTER_LINEAR):按照指定的尺寸或者缩放比例去调整图像大小
    • 参数
      • src:输出图像
      • desize:输出图像的尺寸(宽、高)
      • fx,fy:水平和垂直方向的缩放因子
      • interpolation:插值方法
    • 插值方法
      • cv2.INTER_NEAREST: 最近邻插值,速度快,质量低
      • cv2.INTER_LINEAR: 双线性插值,默认值,适用于放大
      • cv2.INTER_AREA: 区域插值,适用于缩小
      • cv2.INTER_CUBIC: 三次插值,质量较高,速度较慢

代码实现

 

#调整尺寸
import cv2 

img = cv2.imread('your_image.jpg')

#按比例将其缩放成原来的一半
resized_img = cv2.resize(img,None,fx=0.5,fy=0.5,interpolation=cv2.INTER_AREA)

#保存查看
cv2.imwrite('resized_image.jpg',resized_img)

参数调整测试

import cv2

# 读取图像
img = cv2.imread('your_image.jpg')

# 指定输出尺寸
resized_img_fixed = cv2.resize(img, (800, 600), interpolation=cv2.INTER_LINEAR)

# 使用缩放因子
resized_img_scale = cv2.resize(img, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_LINEAR)

# 使用不同的插值方法
resized_img_nearest = cv2.resize(img, None, fx=2, fy=2, interpolation=cv2.INTER_NEAREST)
resized_img_cubic = cv2.resize(img, None, fx=2, fy=2, interpolation=cv2.INTER_CUBIC)

# 保存结果
cv2.imwrite('resized_fixed.jpg', resized_img_fixed)
cv2.imwrite('resized_scale.jpg', resized_img_scale)
cv2.imwrite('resized_nearest.jpg', resized_img_nearest)
cv2.imwrite('resized_cubic.jpg', resized_img_cubic)
  • 通过改变输出尺寸与缩放因子,可以调整图像的大小
  • 不同的插值方法会影响图像的质量,最近邻插值可能会出现像素化,三次插值则会更加的平滑

计算机图像学相应知识

图像缩放与插值

  • 图像缩放,主要就是改变图像分辨率,需要重新计算其像素值
  • 插值算法:用于估计新的像素值,常见的右最近邻、双线性、双三次插值等
    • 处理图像的时候,插值算法主要用于在图像缩放和旋转的时候生成新像素
    • 也就是说当要放大或者缩小图像的时候,原图中的像素不够使用了,插值算法就是用来填补这些空白区域的,目的就是为了让变换后的新图像看起来更加的平滑自然

插值方法原理理解

  • 最近邻插法:选择最接近的像素值,简单但是可能会出现锯齿或者马赛克的效果
    • 观察哪个已有像素距离新位置最近,然后直接将这个最近的像素颜色搬运过来
    • 也就类似于在放大图片的时候,直接把原来的像素点扩大复制出来,这样省时省力,但是结果可能会出现锯齿现象,图像看起来也就不平滑
    • 具体理解,类似于网格纸上的像素画,该算法就是暴力将每个格子放大几倍,但是格子的颜色不变,这样放大后的图像在视觉上一定是存在锯齿形状
  • 双线性插值:根据周围四个像素的加权平均计算,效果比较好
    • 考虑周围4个像素,并根据这些像素做一个加权平均生成一个新的像素,也就是根据周围的颜色混合出一个中间值,所以图像会比最近邻插值平滑的多
    • 根据周围的四个颜色计算出一个过度色,从而更加自然
  • 双三次插值:考虑周围16个像素,计算更加复杂一些,效果更加平滑
    • 考虑16个相邻的像素,然后利用数学公式生成新的像素,这样就会让边缘和细节更加清晰
  • 超分辨率插值
    • 该种方法不是简单的利用周围元素生成新的像素,而是利用机器学习来理解图像的内容,甚至预测出新的细节,所以该种方法可以恢复一些模糊的部分

调整图像背后实现理解

  • 重采样:计算机通过对目标图像每个像素在源图像的对应位置,使用插值方法计算新的像素值
  • 插值计算:根据插值算法,对源图像的像素值进行加权平均,最终得到目标像素值

转换色彩空间

基本操作 

  • cv2.cvtColor(src , code):转换图像颜色空间,主要用于不同颜色空间之间的转换(BGR转换到灰度)
    • src :输入的图像
    • code:颜色空间转换代码
      • cv2.COLOR_BGR2GRAY: BGR 转 灰度
      • cv2.COLOR_BGR2HSV: BGR 转 HSV
      • cv2.COLOR_BGR2RGB: BGR 转 RGB
  • OpenCV默认的颜色空间是BGR

代码实践 

#颜色空间转换
import cv2

img = cv2.imread('your_image.jpg')

#转换为灰度图像
gray_img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

#保存灰度图像
cv2.imwrite('gray_image.jpg',gray_img)

实现原理理解 

  • 该函数会使用预定义的转换公式,将像素值从一种颜色空间映射到另一种颜色空间
  • 颜色空间的转换会涉及到对图像的每一个像素和通道进行计算

计算机图形学相应知识补充

颜色空间

  • BGR/RGB:基于三原色的颜色模型,一般用于显示设备
  • HSV(色调、饱和度、明度):接近于人类感知,主要用于处理颜色分析和处理

颜色空间转换

  • 线性转换:部分颜色空间是可以直接通过线性变换转换
  • 非线性转换:RGB转换为HSV,就需要使用到非线性公式

图像裁剪

基本说明

  •  图像在OpenCV中是以NumPy数组形式表示,所以图像裁剪可以使用数组切片的方式实现
  • 数组切片:img[y1:y2 , x1:x2] ,先行后列
    • y1:y2:行索引范围(高度)
    • x1:x2:列索引范围(宽度)

代码实践

import cv2

img = cv2.imread('your_image.jpg')

#裁剪图像,获取[100,100]到[400,400]
cropped_img = img[100:400,100:400]

#保存图像
cv2.imwrite('cropped_image.jpg',cropped_img)

 函数实现

  • 图像在内存中是以二维或者三维数值表示的,裁剪操作实际上就是对数组进行切片
  • 裁剪得到的图像与原图像共享内存,修改裁剪后的图像会影响原图像

计算机原理知识补充

ROI(感兴趣区域

  • 图像中需要处理或者分析的特定区域,主要用于降低计算量,聚焦于关键部分
    • ROI是图像中的一块区域,当对这个区域的内容感兴趣的时候,并且需要在这个部分进行处理、分析或者提取信息
    • 例如在对一张风景照进行处理,只是对该图片上的一朵花感兴趣,那么只需要提取这朵花的ROI区域,那么接下来的操作就可以对这朵花进行操作,例如放大、修改其形状等
  • 实现流程
    • 确定ROI的位置,即通过矩形划出感兴趣的部分,然后提取ROI,作为一个独立的小图像
    • 处理ROI,针对于该块区域进行处理,最后将ROI还原到原图即可
  • 裁剪,即是选取图像中感兴趣的部分,类似于用剪刀将照片上剪下一块

ROI实验

import cv2

# 读取图像
img = cv2.imread('your_image.jpg')

# 定义 ROI 区域(假设已知需要裁剪的坐标)
x, y, w, h = 100, 100, 200, 200  # 左上角坐标 (x, y),宽度 w,高度 h

# 裁剪 ROI
roi = img[y:y+h, x:x+w]

# 对 ROI 进行处理,例如转换为灰度
roi_gray = cv2.cvtColor(roi, cv2.COLOR_BGR2GRAY)

# 将处理后的 ROI 放回原图(需要匹配通道数)
roi_color = cv2.cvtColor(roi_gray, cv2.COLOR_GRAY2BGR)
img[y:y+h, x:x+w] = roi_color

# 保存结果
cv2.imwrite('processed_image.jpg', img)

绘制形状和添加文字

基本方法

  • cv2.line(img , pt1 , pt2 , color , thickness , lineType):绘制直线
    • pt1 , pt2 :起点和终点坐标
    • color:线条颜色(B G R)
    • thickness:线条厚度
    • lineType
      • cv2.LINE_8: 8-connected line(默认)
      • cv2.LINE_AA: 抗锯齿线条,效果更平滑
      • cv2.LINE_4: 4-connected line
  • cv2.rectangle(img , pt1 , pt2 , color-BGR , thickness,lineType,shift ):绘制矩形
    • img:目标图像
    • pt1:矩形左上角顶点(x,y)
    • pt2:矩形的右下顶点
    • color:矩形边框颜色
    • thickness(可选):边框的厚度,如果将其设置为负数或者cv2.FILLED矩形将被填充
    • lineType(可选):边框线条类型
    • shift(可选):坐标的小数位表示
  • cv2.circle(img , center , radius , color , thickness=None , lineType=None , shift=None):绘制圆形
    • img:目标图像
    • center:圆心位置
    • radius:圆的半径
    • color:圆的颜色
    • thickness(可选):元边框的厚度
  • cv2.putText(img , text , org , fontFace , fontScale , color , thickness=None,lineType=None,bottomLeftOrigin=None):在图形上添加文字
    • img:目标图像
    • text:要绘制的文本字符串
    • org:文本左下角的起始位置,格式为 (x, y)
    • fontFace:字体类型。常用的字体类型:
      • cv2.FONT_HERSHEY_SIMPLEX: 常用字体,正常大小
      • cv2.FONT_HERSHEY_PLAIN: 非常小的字体
      • cv2.FONT_HERSHEY_DUPLEX: 比较粗的字体
      • cv2.FONT_HERSHEY_COMPLEX: 比较复杂的字体
      • cv2.FONT_HERSHEY_TRIPLEX: 更复杂的字体
      • cv2.FONT_HERSHEY_COMPLEX_SMALL: 小字体
      • cv2.FONT_HERSHEY_SCRIPT_SIMPLEX: 类似手写字体
      • cv2.FONT_HERSHEY_SCRIPT_COMPLEX: 更复杂的手写字体
    • fontScale:字体的缩放比例(大小)
    • color:文本颜色,格式为 (B, G, R)
    • thickness(可选):文本线条的粗细,默认为 1
    • lineType(可选):线条类型,通常是 cv2.LINE_AA 抗锯齿
    • bottomLeftOrigin(可选):如果为 True,则文本原点为左下角,默认是 False,即左上角为原点

代码实践

#绘制文字与添加形状
import cv2 
import numpy as np

#创建纯黑色背景
img = np.zeros((512,512,3),np.uint8)

#蓝色直线,左上角到右下角
cv2.line(img,(0,0),(511,511),(255,0,0),5)

#绿色矩形,左上角到右下角
cv2.rectangle(img,(100,100),(400,400),(0,255,0),3)

#红色圆形,中心坐标和半径
cv2.circle(img,(256,256),50,(0,0,255),-1) #-1是填充的意思

#添加文字
font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img,'openCv_stu',(10,500),font,2,(255,255,255),2,cv2.LINE_AA)

#保存结果
cv2.imwrite('shapes_text.jpg',img)

参数调整分析 

import cv2
import numpy as np

# 创建黑色图像
img = np.zeros((512, 512, 3), np.uint8)

# 绘制不同厚度和颜色的线条
cv2.line(img, (50, 50), (462, 50), (255, 0, 0), 1)
cv2.line(img, (50, 100), (462, 100), (0, 255, 0), 3)
cv2.line(img, (50, 150), (462, 150), (0, 0, 255), 5)

# 绘制填充和非填充的矩形
cv2.rectangle(img, (50, 200), (200, 350), (255, 255, 0), 3)
cv2.rectangle(img, (250, 200), (450, 350), (255, 0, 255), -1)

# 绘制不同半径的圆形
cv2.circle(img, (256, 400), 50, (0, 255, 255), 2)
cv2.circle(img, (256, 400), 30, (255, 255, 255), -1)

# 添加不同字体和大小的文字
fonts = [cv2.FONT_HERSHEY_SIMPLEX, cv2.FONT_HERSHEY_COMPLEX]
cv2.putText(img, 'OpenCV', (10, 450), fonts[0], 1, (255, 255, 255), 2)
cv2.putText(img, 'Graphics', (10, 500), fonts[1], 2, (255, 255, 255), 3)

# 保存结果
cv2.imwrite('drawings.jpg', img)

 计算机图形学补充

光栅化与绘制

  • 光栅化就是将几何图形转换为像素阵列
  • 光栅图形
    • 由像素组成的图像,类似于一个由多个小方格组成的画,每个方格都有颜色
  • 抗锯齿即是通过灰度处理平滑边缘,减少锯齿效果

矢量图形

  • 使用数学描述图形,放大不会模糊
  • 矢量图形是可以实现无损缩放、光栅图形由像素组成,缩放会失真

图像算术运算

基本操作

  • cv2.add():图像相加
  • cv2.addWeighted(src1 , alpha , scr2 , beta , gamma):图像融合
    • src1 , src2 :输入图像
    • alpha , beta:图像的权重
    • gamma:加到结果上的标量值

代码实践

 

 

#图像运算
import cv2 

#读取两个相同尺寸的图片
img1 = cv2.imread('image1.jpg')
img2 = cv2.imread('image2.jpg')

#简单相加
added_img = cv2.add(img1,img2)

#两张图像融合
blended_img = cv2.addWeighted(img1,0.7,img2,0.3,0)

#保存结果
cv2.imwrite('added_imge.jpg',added_img)
cv2.imwrite('boended_image.jpg',blended_img)

参数调整测试 

 

import cv2

# 读取图像
img1 = cv2.imread('image1.jpg')
img2 = cv2.imread('image2.jpg')

# 确保图像尺寸相同
img2 = cv2.resize(img2, img1.shape[1::-1])

# 不同权重的加权融合
blended_img1 = cv2.addWeighted(img1, 0.2, img2, 0.8, 0)
blended_img2 = cv2.addWeighted(img1, 0.5, img2, 0.5, 0)
blended_img3 = cv2.addWeighted(img1, 0.8, img2, 0.2, 0)

# 保存结果
cv2.imwrite('blended_20_80.jpg', blended_img1)
cv2.imwrite('blended_50_50.jpg', blended_img2)
cv2.imwrite('blended_80_20.jpg', blended_img3)

 计算机图形学知识补充

 图像融合

  • 加权平均:对两张图像的像素值按照权重求和,实现融合效果
  • Alpha通道:用于表示图像的透明度,在图像叠加的时候起作用

像素级运算

  • 逐像素计算:对图像的每个像素进行算术运算,生成新的图像
    • 对图像中的每个元素进行计算,就像个每个像素加上一样的亮度
  • 图像融合
    • 将两个图像按照一定比例进行叠加,从而产生融合效果,类似于PS中的正片叠底等效果

 图像阈值处理

基本操作

  • cv2.threshold(src , thresh , maxval , type):主要负责对图像的阈值进行处理,阈值就是用来将灰度图像二值化,根据阈值将像素进行分类
    • src:输出灰度图像
    • thresh:阈值
    • maxval:当满足条件的时候,赋予的像素值
    • type:阈值类型
      • cv2.THRESH_BINARY: 大于阈值的像素赋值为 maxval,否则为 0
      • cv2.THRESH_BINARY_INV: 反转的二值化
      • cv2.THRESH_TRUNC: 大于阈值的像素赋值为阈值
      • cv2.THRESH_TOZERO: 大于阈值的保留,其他设为 0
  • 注意其返回值有两个,以代码事例来说,ret是阈值,thresh_img是处理后的图像

代码实践

import cv2 

#读取灰度图像
gray_img = cv2.imread('gray_image.jpg',0)

#应用全局阈值
ret,thresh_img = cv2.threshold(gray_img,127,255,cv2.THRESH_BINARY)

#保存处理结果
cv2.imwrite('threshold_image.jpg',thresh_img)

参数调整测试

import cv2

# 读取灰度图像
gray_img = cv2.imread('gray_image.jpg', 0)

# 应用不同阈值和类型
ret, thresh_binary = cv2.threshold(gray_img, 127, 255, cv2.THRESH_BINARY)
ret, thresh_binary_inv = cv2.threshold(gray_img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh_trunc = cv2.threshold(gray_img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh_tozero = cv2.threshold(gray_img, 127, 255, cv2.THRESH_TOZERO)

# 保存结果
cv2.imwrite('thresh_binary.jpg', thresh_binary)
cv2.imwrite('thresh_binary_inv.jpg', thresh_binary_inv)
cv2.imwrite('thresh_trunc.jpg', thresh_trunc)
cv2.imwrite('thresh_tozero.jpg', thresh_tozero)

计算机图形学概念理解 

 阈值处理

  • 阈值处理理解
    • 类似于一张黑白照片,然后手动管设定一个亮度数值,照片上比这个亮度更亮的部分都变成的了白色,低于这个亮度的部分都变成了黑色,该操作就是阈值处理
    • 阈值处理就是设定了一个门槛值,将图像的像素分成的两类,一类就是高于这个门槛的像素,另一个就是低于这个门槛的像素,一般用于区分图像前景和后景
  • 图像分割:根据像素值,将图像分为前景和背景
    • 将自己想要的图像分割出来,但是这个区分标准是基于像素的亮度
  • 直方图分析:通过图像的灰度直方图,选择合适的阈值
    • 首先直方图就是一个统计表,该直方图中显式的告诉照片中有多少亮的像素和多少暗的像素,这样就可以合理的找出自己想要设定的阈值
    • 例如一张黑白图片,上面主要有亮的和暗的物体,直方图中就统计了这张照片亮和暗的像素有多少,然后设计了一个统计表,然后就可以利用直方图将明暗区域分开

自动阈值算法

  • 大津算法:自动计算最佳阈值,最大化类间方差
    • 大津算法就是在照片中找到一个最佳的分界线,让前景物体和背景区分最明显
    • 也就是自动帮忙找到最佳阈值,从而找到最佳分割亮度值

 图像平滑(模糊)

基本操作

  • 主要功能:图像平滑主要就是用来降低噪声,改善图像质量
  • 滤波核大小:核越大,模糊的程度就越高
  • 高斯滤波:比均值更加平滑,保留边缘能力更强
  • cv2.blur(src , ksize):均值滤波
    • ksize:滤波核大小
  • cv2.GaussianBlur(src , kszie , sigmaX):高斯滤波
    • sigmaX:高斯核在X方向的标准差
  • cv2.medianBlur(src , ksize)
    • ksize:滤波核大小,必须是奇数

代码实践

#图像平滑
import cv2 

img = cv2.imread('your_image.jpg')

#均值滤波
blur_img = cv2.blur(img,(10,10))

#高斯滤波
gaussian_img = cv2.GaussianBlur(img,(5,5),0)

cv2.imwrite('blur_image.jpg',blur_img)
cv2.imwrite('gaussian_image.jpg',gaussian_img)

 参数调整变化分析

 

 

 

 

计算机图形学知识补充

滤波器

  • 滤波器,类似于PS中的模版或者工具,可以达到模糊、锐化等效果,就像在照片上盖了一层透明的薄膜一样
    • 不同滤波器的理解:卷积就像手中拿到的放大镜,观察图像中的每一个部分,然后使用滤波器,类似的滤波器不同的类型可以让图像达到不同的效果
  • 空间域滤波:直接在图像像素空间上进行操作
  • 卷积操作:滤波器与图像进行卷积,从而得到平滑效果
    • 将滤波器在图像上滑动,对对应的像素进行运算,这就像用滚筒在墙上刷漆一样
    • 本身是一种数学运算,通过将滤波器核与图像进行点积,得到滤波后的结果

高斯滤波器

  • 其权重按照高斯分布,中心权重大,边缘权重小
  • 主要用于平滑噪声以及保留边缘信息

不同滤波器实践验证 

  • 均值滤波对随机噪声有一定抑制作用,但会模糊边缘
  • 高斯滤波保留边缘的能力较好,适合去除高斯噪声
  • 中值滤波对椒盐噪声有很好的去除效果
import cv2

# 读取图像
img = cv2.imread('your_image.jpg')

# 均值滤波
mean_blur = cv2.blur(img, (5, 5))

# 高斯滤波
gaussian_blur = cv2.GaussianBlur(img, (5, 5), 1)

# 中值滤波
median_blur = cv2.medianBlur(img, 5)

# 保存结果
cv2.imwrite('mean_blur.jpg', mean_blur)
cv2.imwrite('gaussian_blur.jpg', gaussian_blur)
cv2.imwrite('median_blur.jpg', median_blur)

 

 

 边缘处理

基本用法

  • 边缘检测主要用于提取图像中的边缘信息
  • cv2.Canny( image , threshold1 , threshold2 , aertureSize=3 , L2gradient=False):边缘检测算法
    • image(输入图像)
      • 必须是单通道的灰度图像,如果输入的是彩色图像,需要先将其转为灰度图像,然后进行边缘检测
    • threshold1 , threshold2 :低阈值与高阈值
      • 低阈值,表示任何小于该值的像素梯度将会被认为不是边缘,低阈值直接影响检测出边缘的数量和强度
      • 高阈值,任何大于该值的像素梯度都会被认为是边缘,高阈值会直接的影响边缘的强度和检测的灵敏度
    • aertureSize:Sobel算子的大小,默认是3
      • Sobel算子就是用于计算图像梯度的卷积核尺寸,该算子是一种用于检测边缘的算子
      • apertureSize的数值必须是奇数,卷积和越大,计算出来梯度就越精细,但是可能也会导致边缘模糊
    • L2gradient:是否使用更加精确的L2范数进行梯度的运算

代码实践

参数调整

结论: 改变阈值可以控制检测到的边缘数量;增大aertureSize,可以检测到更粗的边缘

import cv2 

gray_img = cv2.imread('gray_image.jpg',0)

#不同阈值边缘检测
edges_50_150 = cv2.Canny(gray_img, 50, 150)
edges_100_200 = cv2.Canny(gray_img, 100, 200)
edges_150_250 = cv2.Canny(gray_img, 150, 250)

# 使用不同的 apertureSize
edges_aperture_5 = cv2.Canny(gray_img, 100, 200, apertureSize=5)

# 保存结果
cv2.imwrite('edges_50_150.jpg', edges_50_150)
cv2.imwrite('edges_100_200.jpg', edges_100_200)
cv2.imwrite('edges_150_250.jpg', edges_150_250)
cv2.imwrite('edges_aperture_5.jpg', edges_aperture_5)

 

 

 计算机图形学知识补充

边缘检测算法

  • Canny边缘检测:多级边缘检测算法,
  • Sobel算子:用于计算图形的梯度

梯度

  • 梯度就是图像中像素值变化的程度,就像山坡的坡度,坡度越大变化也就越明显
  • 图像处理中的梯度,表示的是在空间位置上的变化率,是向量,包含幅值和方向
  • 课本概念理解
    • 梯度是图像中亮度(灰度值)变化的方向和强度,对于每个像素,梯度是一个向量,其指的是像素值变化最快的方向
    • Gx:图像在水平方向的变化
    • Gy:图像上垂直方向上变化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2204375.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

IP地址我个人的理解

作为连IP地址都没弄懂的一个网络小白,有时候开发以及建站会接触到IP、DNS等等概念,所以说有必要去查询一下相关知识内容,羞耻地说其实我是有一个计算机网络技术三级证书,但是这个啥用没有死记硬背就行了,许多知识点不能…

软件工程pipeline梳理

文章目录 软件工程pipeline梳理为什么需要梳理软件工程的pipeline软件工程pipeline的概念与注意点软件工程pipeline中的最大挑战rethink相关资料 软件工程pipeline梳理 为什么需要梳理软件工程的pipeline 反思自己日常工作中的认知和行为。以算法/软件工程师为代表的技术工种往…

2024-10-10 问AI: [AI面试题]激活函数在神经网络中的作用是什么?

文心一言 激活函数在神经网络中扮演着至关重要的角色。它们的主要作用包括: 引入非线性: 神经网络中的每一层通常是由线性变换(如权重矩阵乘以输入向量再加上偏置)构成的。如果没有激活函数,多层神经网络将仅仅是一个…

正点原子讲解SPI学习,驱动编程NOR FLASH实战

配置SPI传输速度时,需要先失能SPI,__HAL_SPI_DISABLE,然后操作SPI_CR1中的波特率设置位,再使能SPI, NM25Q128驱动步骤 myspi.c #include "./BSP/MYSPI/myspi.h"SPI_HandleTypeDef g_spi1_handler; /* SPI句柄 */void spi1_init(void) {g_spi…

前端基础(四十):拖放功能的实现

效果 源码 <div class"draggable-wrap"><div class"draggable-box" draggable"true" data-json{"name": "Lee"}><h1>Lee</h1><div class"drop-box" data-json{"name": &qu…

API网关之Hango

Hango 是基于云原生和服务网格技术的开源 API 网关&#xff0c;专为现代分布式系统设计&#xff0c;提供高效、安全、可扩展的流量管理解决方案。Hango 网关是基于 Envoy Proxy 构建的&#xff0c;能够处理复杂的微服务架构中流量控制、服务治理和安全需求。Hango 强调与 Kuber…

Java | Leetcode Java题解之第472题连接词

题目&#xff1a; 题解&#xff1a; class Solution {Trie trie new Trie();public List<String> findAllConcatenatedWordsInADict(String[] words) {List<String> ans new ArrayList<String>();Arrays.sort(words, (a, b) -> a.length() - b.length(…

大模型1-本地部署实现交互问答

任务 在本地部署大模型&#xff0c;调用大模型进行对话。 添加库&#xff1a; 1、Transformer Transformers 是由 Hugging Face 开发的一个开源库&#xff0c;广泛应用于自然语言处理&#xff08;NLP&#xff09;任务。其主要功能是简化了对大型预训练语言模型的加载和使用…

神经网络整体架构

文章目录 1.输入层Input2.卷积层Conv3.激活函数层(一)Sigmoid 函数(二)Tanh 函数(三)修正线性单元ReLU(四)Leaky ReLU函数(带泄露的Relu)(五)参数化ReLU 4.池化层POOL5.全连接层FC6.输出层Output 用全连接神经网络处理大尺寸图像具有三个明显的缺点&#xff1a; ①将图像展开为…

从加载到对话:使用 Transformers 本地运行量化 LLM 大模型(GPTQ AWQ)

&#xff08;无需显卡&#xff09;使用 Transformers 在本地加载具有 70 亿参数的 LLM 大语言模型&#xff0c;通过这篇文章你将学会用代码创建属于自己的 GPT。 LLM 的加载、微调和应用涉及多个方面&#xff0c;今天我们先聚焦于加载&#xff0c;本文的难点仅在于正确安装和知…

SQL第16课挑战题

1. 美国各州的缩写应始终用大写。更新所有美国地址&#xff0c;包括供应商状态&#xff08;Vendors表中的vend_state)和顾客状态&#xff08;customers表中的cust_state),使它们均为大写。 2. 第15课挑战题1要求将自己添加到customers表中&#xff0c;现在删除自己&#xff0c;…

活动预告丨第二十八期 “CCF 开源高校行”暨“木兰技术开放日”活动走进北京大学...

点击蓝字 关注我们 CCF Opensource Development Committee 开源高校行 北京大学站 在数字化转型的浪潮中&#xff0c;开源软件人才的培养是信息技术创新发展的重要根基&#xff0c;高校学子作为我国开源生态的源头活水备受重视。10月9日下午15:00-17:10 “CCF 开源高校行”暨“…

【VScode】如何使用详细步骤【笔记】、配置 C / C ++【笔记】

2024 - 10 - 10 - 笔记 - 24 作者(Author)&#xff1a;郑龙浩(仟濹) 该笔记写于 2024-07-02 摘抄到博客上的时间是 2024-10-10 VScode配置 C / C 笔记 我是看了下方链接的视频后为了方便后期复习做的笔记: B站某UP主的视频如下&#xff1a; VScode配置C/C开发环境&#xff…

科研绘图系列:R语言绘制SCI文章图2

文章目录 介绍加载R包导入数据图a图b图d系统信息介绍 文章提供了绘制图a,图b和图d的数据和代码 加载R包 library(ggplot2) library(dplyr) library(readxl) library(ggpmisc)导入数据 数据可从以下链接下载(画图所需要的所有数据): 百度网盘下载链接: https://pan.baid…

S14 瑞士轮胜者组 TES 2:0 击败 DK 晋级淘汰赛

电子竞技的赛场上&#xff0c;总有一些瞬间&#xff0c;让所有的质疑和嘲笑变得苍白无力。 今天&#xff0c;滔搏战队用自己的行动&#xff0c;再次证明了这一点。 他们不仅翻越了挡在面前的高山&#xff0c;更让世界听到了他们的故事。 这支曾被低估的队伍&#xff0c;在夏季…

使用Pytorch+Numpy+Matplotlib实现手写字体分类和图像显示

文章目录 1.引用2.内置图片数据集加载3.处理为batch类型4.设置运行设备5.查看数据6.绘图查看数据图片(1)不显示图片标签(2)打印图片标签(3)图片显示标签 7.定义卷积函数8.卷积实例化、损失函数、优化器9.训练和测试损失、正确率(1)训练(2)测试(3)循环(4)损失和正确率曲线(5)输出…

绘图技巧 | 矩形树状图(Treemap)绘图技巧分享~~

今天这篇推文&#xff0c;小编还是像往常一样交给大家绘图技巧&#xff0c;今天的主角就是-*树形矩阵图(Treemap)*。绘制树形图使用R或者Python都是可以绘制的&#xff0c;今天我们还是使用R进行绘制(Python绘制结果为交互式&#xff0c;后面统一介绍相应的库)。在R中有专门的包…

Java项目-----图形验证码登陆实现

原理: 验证码在前端显示,但是是在后端生成, 将生成的验证码存入redis,待登录时,前端提交验证码,与后端生成的验证码比较. 详细解释: 图形验证码的原理(如下图代码).前端发起获取验证码的请求后, 1 后端接收请求,生成一个键key(随机的键) 然后生成一个验证码作为map的valu…

npm运行时出现npm ERR! builtins is not a function报错!

项目场景&#xff1a; 项目运行时什么都没动都没改突然运行不起来了&#xff0c;报错 TypeError: builtins is not a function 代码什么都没动&#xff0c;不是代码问题&#xff0c;排查后只有可能是node和npm的问题&#xff0c;所以卸载掉node重装重启 解决方案&#xff1a; …

Python:赋值的本质其实是引用

相关阅读 Pythonhttps://blog.csdn.net/weixin_45791458/category_12403403.html?spm1001.2014.3001.5482 在Python编程中&#xff0c;我们经常会遇到各种赋值操作&#xff0c;无论是简单的变量赋值&#xff0c;还是复杂的数据结构操作。表面上看&#xff0c;赋值就是把一个值…