Android OpenCV（二）主体识别位置检测

news2025/4/12 3:30:59

前言

工作中遇到需要通过OpenCV找到图片主体体积占图片百分比的比例，这里做一个问题解决思路的记录。该方面新手小白，有不对的地方可以评论指出哈。

重要API

Sobel算法

Sobel 计算参考文章

索贝尔算子是计算机视觉领域的一种重要处理方法。
主要用于获得数字图像的一阶梯度，常见的应用和物理意义是边缘检测。
索贝尔算子是把图像中每个像素的上下左右四领域的灰度值加权差，在边缘处达到极值从而检测边缘。在技术上，它是一离散性差分算子，用来运算图像亮度函数的梯度之近似值。在图像的任何一点使用此算子，将会产生对应的梯度矢量或是其法矢量。索贝尔算子不但产生较好的检测效果，而且对噪声具有平滑抑制作用，但是得到的边缘较粗，且可能出现伪边缘。
该算子包含两组3x3的矩阵，分别为横向及纵向，将之与图像作平面卷积，即可分别得出横向及纵向的亮度差分近似值。如果以A代表原始图像，Gx及Gy分别代表经横向及纵向边缘检测的图像，其公式如下:

图像的每一个像素的横向及纵向梯度近似值可用以下的公式结合，来计算梯度的大小。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nJRhDdGQ-1674892594274)(https://upload-images.jianshu.io/upload_images/6188347-f1dde384106a4b75.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/124)]
然后可用以下公式计算梯度方向。
在以上例子中，如果以上的角度θ等于零，即代表图像该处拥有纵向边缘，左方较右方暗【引用：百度百科】

//src : 输入图像  dst: 输出图像
//ddepth: 输出图像的深度（可以理解为数据类型），-1表示与原图像相同的深度
//dx:  dy: 当组合为dx=1,dy=0时求x方向的一阶导数，当组合为dx=0,dy=1时求y方向的一阶导数
//ksize: （可选参数）Sobel算子的大小，必须是1,3,5或者7,默认为3。
//scale: 对导数计算结果进行缩放的缩放因子，默认系数为1，不进行缩放
//delta: 偏值，在计算结果中加上偏值。
//borderType: 像素外推法选择标志。默认参数为BORDER_DEFAULT，表示不包含边界值倒序填充。
public static void Sobel(Mat src, Mat dst, int ddepth, int dx, int dy, int ksize, double scale, double delta, int borderType)

注意点：

图像深度是指存储每个像素值所用的位数，例如cv2.CV_8U，指的是8位无符号数，取值范围为0~255，超出范围则会被截断（截断指的是，当数值大于255保留为255，当数值小于0保留为0，其余不变）。
具体还有：CV_16S（16位无符号数），CV_16U（16位有符号数），CV_32F（32位浮点数），CV_64F（64位浮点数）
当ddepth 输出图像深度采用CV_8U，由于Sobel算子在计算X方向梯度时，如果某像素点右侧像素值大于左侧像素值，则梯度大小为正保留，相反梯度大小为负被截断，梯度大小保存为0。这里可以使用 CV_32F 防止数据存在负数情况。
在我们使用CV_32F数据类型求出XY阶后，需要配合使用函数convertScaleAbs()将图像深度为CV_64F的梯度图像重新转化为CV_8U,这是由于函数cv2.imshow()的默认显示为8位无符号数，即[0,255]。

具体思路

第一步，使用OpenCV的 Sobel算子来计算x，y方向上的梯度，在x方向上减去y方向上的梯度，通过这个减法，我们会留下有高水平梯度和低垂直梯度的图像区域。

        Mat gradX = new Mat();
        Mat gradY = new Mat();
        Mat binary = new Mat();
        //求X Y 阶 转换为32位浮点数个数
        Imgproc.Sobel(grayImage, gradX, CvType.CV_32F, 1, 0, -1);
        Imgproc.Sobel(grayImage, gradY, CvType.CV_32F, 0, 1, -1);
        //相减
        Core.subtract(gradX, gradY, binary);
        //转换数据格式CV_8U
        Core.convertScaleAbs(binary, binary);

以上步骤我们可以得到一个带有很多噪点的边界图，为了剔除掉那些噪点对于主体的判断，我们需要使用 blur 方法和黑白两极化对图片进行处理

第二步，使用低通滤泼器平滑图像（9 x 9内核）,这将有助于平滑图像中的高频噪声。低通滤波器的目标是降低图像的变化率。如将每个像素替换为该像素周围像素的均值。这样就可以平滑并替代那些强度变化明显的区域。

//去噪
Imgproc.blur(binary, binary, new Size(9.0, 9.0));
//对模糊图像二值化。梯度图像中不大于90的任何像素都设置为0（黑色）。 否则，像素设置为255（白色）为第五步做准备工作
Imgproc.threshold(binary, binary, 90.0, 255.0, Imgproc.THRESH_BINARY | Imgproc.THRESH_OTSU);

第三步，通过上述方法可以得到一个黑白图，但是图片中可能会存在很多空白空隙，我们要用白色填充这些空余，使得后面的程序更容易识别昆虫区域，这需要做一些形态学方面的操作。

//为形态学操作返回指定大小和形状的结构元素 用于形态学处理
Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_RECT, new Size(25.0, 25.0));
// 使用腐蚀和膨胀作为基本操作来执行高级形态学转换
Imgproc.morphologyEx(binary,binary,Imgproc.MORPH_CLOSE,kernel);

第四步，通过上述处理，可能还会存在一些大的噪点，可以通过形态学腐化和膨胀进行消除

Point p = new Point(-1.0, -1.0);
Imgproc.erode(binary, binary, ker, p, 4);
Imgproc.dilate(binary, binary, ker, p, 4);

第五步，通过 findContours()函数框选出主体的位置信息

List<MatOfPoint> contours = new ArrayList<>();
Mat hierarchy = new Mat();
// binary : 要检索的图片，必须是为二值图，即黑白的
//hierarchy ： 结果返回值
Imgproc.findContours(binary,contours,hierarchy,
                Imgproc.RETR_EXTERNAL,Imgproc.CHAIN_APPROX_SIMPLE);

findContours 函数最后两个参数，mode 和 method 单独拿出来列举下不同的参数代表的含义
mode ：
Imgproc.RETR_EXTERNAL 表示只检测外轮廓
Imgproc.RETR_LIST 检测的轮廓不建立等级关系
Imgproc.RETR_CCOMP 建立两个等级的轮廓，上面的一层为外边界，里面的一层为内孔的边界信息。如果内孔内还有一个连通物体，这个物体的边界也在顶层。
Imgproc.RETR_TREE 建立一个等级树结构的轮廓。

method ：
Imgproc.CHAIN_APPROX_NONE 存储所有的轮廓点，相邻的两个点的像素位置差不超过1，即max（abs（x1-x2），abs（y2-y1））==1
Imgproc.CHAIN_APPROX_SIMPLE 压缩水平方向，垂直方向，对角线方向的元素，只保留该方向的终点坐标，例如一个矩形轮廓只需4个点来保存轮廓信息

结果都存储在 contours 数组中，我们可以使用他进行一些业务判断。
由于脱敏原因，这里没有demo图片，该篇文章主要参考文章对我的帮助非常大，小白这里只是做一个开发记录，今天的这篇文章就到这里。