Kotlin OpenCV 图像图像50 Haar 级联分类器模型

news2024/11/14 20:39:10

Kotlin OpenCV 图像图像50 Haar 级联分类器模型

  • 1 OpenCV Haar 级联分类器模型
  • 2 Kotlin OpenCV Haar 测试代码

1 OpenCV Haar 级联分类器模型

Haar级联分类器是一种用于对象检测(如人脸检测)的机器学习算法。它由Paul Viola和Michael Jones在2001年提出,通常用于实时检测,因为它速度快且性能良好。

基本原理解释
Haar特征Haar特征是从图像中提取的简单矩形特征,通过比较相邻区域的像素值来描述图像的局部特征。
常见的Haar特征有边缘特征、线条特征和四边形特征。
每个Haar特征值由区域内像素的加权和计算得到,具体公式为特征值 = 黑色区域像素值总和 - 白色区域像素值总和。
积分图(Integral Image)积分图是一种图像表示方法,方便快速计算矩形区域的像素和。
通过积分图,可以在常数时间内计算任意矩形区域的像素和。
级联分类器(Cascade Classifier)级联分类器由一系列弱分类器(如决策树桩)组成,每个弱分类器使用一个或多个Haar特征进行分类。
弱分类器按顺序排列,每个分类器将图像区域分为正例(目标对象)和负例(非目标对象)。
如果某个区域被认为是负例,则立即停止检测;如果被认为是正例,则继续传递到下一个分类器。
这种级联结构大大提高了检测速度,因为大部分非目标区域在早期就被排除。

OpenCV Haar 级联分类器模型
在这里插入图片描述

文件夹用途特点
lbpcascades包含基于局部二值模式 (Local Binary Patterns, LBP) 的级联分类器文件。LBP 是一种有效的纹理特征描述符,在对象检测中表现良好。计算效率高: LBP 特征计算简单,因此在对象检测时速度较快。
鲁棒性: 对光照变化和其他环境变化有较好的鲁棒性。
常用分类器: 人脸检测等。
hogcascades包含基于方向梯度直方图 (Histogram of Oriented Gradients, HOG) 特征的级联分类器文件。HOG 特征在检测行人等对象时表现良好。特征描述能力强: HOG 特征能够捕捉对象的形状和外观信息。
高检测精度: 尤其在检测行人方面有较高的精度。
haarcascades_cuda包含利用 CUDA 加速的 Haar 特征级联分类器文件。这些分类器利用 GPU 进行加速计算,提高检测速度。 类似于 haarcascades 文件夹中的文件,是加速版本。高性能: 利用 GPU 的并行计算能力,大幅提升检测速度。
需要支持 CUDA 的 GPU: 需要系统安装 CUDA 并支持相应的 GPU 硬件。
haarcascades包含基于 Haar 特征的级联分类器文件。这是 OpenCV 中最常用的对象检测分类器之一。历史悠久: Haar 级联分类器是最早用于人脸检测的算法之一。
计算复杂度适中: 相比 LBP 更复杂,但特征描述能力也更强。
广泛应用: 用于人脸、眼睛、微笑等对象的检测。

haarcascades_cuda 和 haarcascades 文件的主要区别在于它们是否利用 CUDA 加速进行对象检测。

haarcascades/haarcascades_cuda 文件夹用途
haarcascade_eye.xml用于检测人眼。
haarcascade_eye_tree_eyeglasses.xml用于检测戴眼镜的人眼。
haarcascade_frontalcatface.xml用于检测猫的正面脸部。
haarcascade_frontalcatface_extended.xml用于检测猫的正面脸部(扩展版本)。
haarcascade_frontalface_alt.xml用于检测人脸的另一个版本。
haarcascade_frontalface_alt2.xml用于检测人脸的另一个替代版本。
haarcascade_frontalface_alt_tree.xml用于检测人脸的另一个替代版本(树状结构)。
haarcascade_frontalface_default.xml用于检测人脸的默认版本。
haarcascade_fullbody.xml用于检测人体的完整体。
haarcascade_lefteye_2splits.xml用于检测左眼(两部分)。
haarcascade_license_plate_rus_16stages.xml用于检测俄罗斯车牌(16阶段)。
haarcascade_lowerbody.xml用于检测人体的下半身。
haarcascade_profileface.xml用于检测人脸的侧面(侧脸)。
haarcascade_righteye_2splits.xml用于检测右眼(两部分)。
haarcascade_russian_plate_number.xml用于检测俄罗斯车牌号码。
haarcascade_smile.xml用于检测微笑。
haarcascade_upperbody.xml用于检测人体的上半身。
hogcascades文件夹用途
hogcascade_pedestrians.xml用于在图像或视频中检测行人。
lbpcascades文件夹用途
lbpcascade_frontalcatface.xml用于检测猫的正面脸部。
lbpcascade_frontalface.xml用于检测人脸的正面部分。
lbpcascade_frontalface_improved.xml用于检测人脸的正面部分,改进版本。
lbpcascade_profileface.xml用于检测人脸的侧面部分。
lbpcascade_silverware.xml用于检测银器(如刀、叉、勺等餐具)。

2 Kotlin OpenCV Haar 测试代码

package com.xu.com.xu.image

import org.opencv.core.MatOfRect
import org.opencv.core.Point
import org.opencv.core.Scalar
import org.opencv.highgui.HighGui
import org.opencv.imgcodecs.Imgcodecs
import org.opencv.imgproc.Imgproc
import org.opencv.objdetect.CascadeClassifier
import java.io.File
import java.util.*

object FaceDetect {

    init {
        val os = System.getProperty("os.name")
        val type = System.getProperty("sun.arch.data.model")
        if (os.uppercase(Locale.getDefault()).contains("WINDOWS")) {
            val lib = if (type.endsWith("64")) {
                File("lib\\opencv\\x64\\" + System.mapLibraryName("opencv_java4100"))
            } else {
                File("lib\\opencv\\x86\\" + System.mapLibraryName("opencv_java4100"))
            }
            System.load(lib.absolutePath)
        }
    }

    @JvmStatic
    fun main(args: Array<String>) {
        face()
    }

    private fun face() {
        val facebook = CascadeClassifier("lib/opencv/data/haarcascades/haarcascade_frontalface_alt2.xml")
        val image = Imgcodecs.imread("C:\\Users\\hyacinth\\Desktop\\1.png")
        val face = MatOfRect()
        facebook.detectMultiScale(image, face)
        val reacts = face.toArray()
        println("匹配到 " + reacts.size + " 个人脸")
        for (i in reacts.indices) {
            Imgproc.rectangle(
                image,
                Point(reacts[i].x.toDouble(), reacts[i].y.toDouble()),
                Point((reacts[i].x + reacts[i].width).toDouble(), (reacts[i].y + reacts[i].height).toDouble()),
                Scalar(0.0, 0.0, 255.0), 2
            )
            Imgproc.putText(
                image,
                i.toString(),
                Point(reacts[i].x.toDouble(), reacts[i].y.toDouble()),
                Imgproc.FONT_HERSHEY_SCRIPT_SIMPLEX,
                1.0,
                Scalar(0.0, 0.0, 255.0),
                2,
                Imgproc.LINE_AA,
                false
            )
        }
        HighGui.imshow("人脸识别", image)
        HighGui.waitKey(0)
    }

}

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1976442.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

conda环境pip 安装Tensorflow-gpu 2.10.2提示nbconvert 的包依赖冲突

问题如下&#xff1a; ERROR: pip’s dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts. nbconvert 7.16.4 requires beautifulsoup4, which is not inst…

DETR论文详解

文章目录 前言一、DETR理论二、模型架构1. CNN2. Transformer3. FFN 三、损失函数四、代码实现总结 前言 DETR是Facebook团队在2020年提出的一篇论文&#xff0c;名字叫做《End-to-End Object Detection with Transformers》端到端的基于Transformers的目标检测&#xff0c;DET…

数仓入门:数据分析模型、数仓建模、离线实时数仓、Lambda、Kappa、湖仓一体

往期推荐 大数据HBase图文简介-CSDN博客 数仓分层ODS、DWD、DWM、DWS、DIM、DM、ADS-CSDN博客 数仓常见名词解析和名词之间的关系-CSDN博客 目录 0. 前言 0.1 浅谈维度建模 0.2 数据分析模型 1. 何为数据仓库 1.1 为什么不直接用业务平台的数据而要建设数仓&#xff1f; …

ChatGPT能代替网络作家吗?

最强AI视频生成&#xff1a;小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频百万播放量https://aitools.jurilu.com/ 当然可以&#xff01;只要你玩写作AI玩得6&#xff0c;甚至可以达到某些大神的水平&#xff01; 看看大神、小白、AI输出内容的区…

重塑企业知识库:AI搜索的深度应用与变革

在数字化浪潮的推动下&#xff0c;企业知识库已成为企业智慧的核心载体。而AI搜索技术的融入&#xff0c;让海量信息瞬间变得井然有序&#xff0c;触手可及。它不仅革新了传统的搜索方式&#xff0c;更开启了企业知识管理的新纪元&#xff0c;引领着企业向更加智能化、高效化的…

【人工智能】FPGA实现人工智能算法硬件加速学习笔记

一. FPGA的优势 FPGA拥有高度的重配置性和并行处理能力,能够同时处理多个运算单元和多个数据并行操作。FPGA与卷积神经网络(CNN)的结合,有助于提升CNN的部署效率和性能。由于FPGA功耗很低的特性进一步增强了其吸引力。此外,FPGA可以根据具体算法需求量身打造硬件加速器。针对动…

[CR]厚云填补_SEGDNet

Structure-transferring edge-enhanced grid dehazing network Abstract 在过去的二十年里&#xff0c;图像去雾问题在计算机视觉界受到了极大的关注。在雾霾条件下&#xff0c;由于空气中水汽和粉尘颗粒的散射&#xff0c;图像的清晰度严重降低&#xff0c;使得许多计算机视觉…

鸿蒙媒体开发【基于AVCodec能力的视频编解码】音频和视频

基于AVCodec能力的视频编解码 介绍 本实例基于AVCodec能力&#xff0c;提供基于视频编解码的视频播放和录制的功能。 视频播放的主要流程是将视频文件通过解封装->解码->送显/播放。视频录制的主要流程是相机采集->编码->封装成mp4文件。 播放支持的原子能力规…

【从0到1进阶Redis】Jedis 操作 Redis

笔记内容来自B站博主《遇见狂神说》&#xff1a;Redis视频链接 Jedis 是一个用于 Java 的 Redis 客户端库&#xff0c;它提供了一组 API 用于与 Redis 数据库进行交互。Redis 是一个高性能的键值存储数据库&#xff0c;广泛用于缓存、消息队列等场景。Jedis 使得 Java 开发者能…

图欧科技-IMYAI智能助手24年5月~7月更新日志大汇总

上一篇推文盘点了我们图欧科技团队近一年来的更新日志&#xff0c;可以说是跟随着人工智能时代的发展&#xff0c;我们的IMYAI也丝毫不落后于这场时代的浪潮&#xff01;近三个月以来&#xff0c;我们的更新频率直线上升&#xff0c;现在我们AI网站已经成为一个集GPT、Claude、…

《学会 SpringMVC 系列 · 消息转换器 MessageConverters》

&#x1f4e2; 大家好&#xff0c;我是 【战神刘玉栋】&#xff0c;有10多年的研发经验&#xff0c;致力于前后端技术栈的知识沉淀和传播。 &#x1f497; &#x1f33b; CSDN入驻不久&#xff0c;希望大家多多支持&#xff0c;后续会继续提升文章质量&#xff0c;绝不滥竽充数…

Inno Setup 安装界面、卸载界面+美化

Inno Setup Inno Setup用Delphi写成&#xff0c;其官方网站同时也提供源程序免费下载。它虽不能与Installshield这类恐龙级的安装制作软件相比&#xff0c;但也当之无愧算是后起之秀。Inno Setup是一个免费的安装制作软件&#xff0c;小巧、简便、精美是其最大特点&#xff0c;…

arduino程序—模拟输出(基础知识)

arduino程序—模拟输出&#xff08;基础知识&#xff09; 1-25 模拟输出1-analogWrite电路效果演示模拟输出analog output复合运算符示例程序Analogwrite&#xff08;&#xff09; 1-26 模拟输出2-PWMPWM概念&#xff08;极其重要&#xff09; 1-27 模拟输出3-for电路效果演示程…

【Verilog-CBB】开发与验证(2)——单比特信号CDC同步器

引言 多时钟域的设计中&#xff0c;CDC处理的场景还是蛮多的。单比特信号在CDC时&#xff0c;为保证信号采样的安全性&#xff0c;降低亚稳态&#xff0c;必须要对信号做同步处理。CDC从时钟的快慢关系来说分为两种case&#xff1a;快到慢、慢到快。对于脉冲型的控制信号&…

『C++实战项目 负载均衡式在线OJ』一、项目介绍与效果展示(持续更新)

文章目录 一、项目介绍二、开发环境三、第三方库四、相关技术五、项目整体框架代码目录框架 代码仓库连接 点击这里✈ 一、项目介绍 本项目是实现一个仿 leetcode 的 OJ (Online-Judge&#xff09;系统。更准确的说应该称之为leetcode 的裁剪版。因为本项目只实现了leetcode中…

‘#‘ is not followed by a macro parameter 关于宏定义的错误

今天在项目代码上想定义一个这样的宏&#xff0c;结果编译错误&#xff0c;这个宏定义类似这样的&#xff1a; #define DELETE_FILE_DPP(key) \ #ifdef PLATFORM_DPP \delete_file(&key); \ #endif 因为有平台之分需要用到编译宏&#xff0c;但不想每个调用的地方都写 #i…

HTML 专业词汇与语法规则

目录 1. 专业词汇 2. 语法规则 1. 专业词汇 标签&#xff08;tag&#xff09;&#xff1a;一堆尖叫号&#xff08;<>&#xff09;&#xff0c; 属性&#xff08;attribute&#xff09;&#xff1a;对标签特征设置的方式&#xff1b; 文本&#xff08;text&#xff0…

【外排序】--- 文件归并排序的实现

Welcome to 9ilks Code World (๑•́ ₃ •̀๑) 个人主页: 9ilk (๑•́ ₃ •̀๑) 文章专栏&#xff1a; 数据结构 我们之前学习的八大排序&#xff1a;冒泡&#xff0c;快排&#xff0c;插入&#xff0c;堆排等都是内排序&#xff0c;这些排序算法处理的都是…

java对接kimi详细说明,附完整项目

需求&#xff1a; 使用java封装kimi接口为http接口&#xff0c;并把调用kimi时的传参和返回数据&#xff0c;保存到mysql数据库中 自己记录一下&#xff0c;以做备忘。 具体步骤如下&#xff1a; 1.申请apiKey 访问&#xff1a;Moonshot AI - 开放平台使用手机号手机号验证…

SuccBI+低代码文档中心 — 低代码应用(SuccAP)(概论)

概述&#xff1a; 低代码是什么&#xff1f; 低代码就是通过易用的、可视化的操作、加上少量的代码或脚本的方式快速的搭建业务应用。 低代码的优势&#xff1f; 低代码可以提升开发人员的效率&#xff0c;也可以让非开发人员也能进行应用开发。 低代码的分类&#xff1a;…