数字验证码识别新思路及对opencv支持向量机机器学习总结

news2026/2/12 11:38:30

验证码识别框架

在这里插入图片描述

新问题

最近遇到了数字验证码识别的新问题。

由于这次的数字验证码图片有少量变形和倾斜，所以，可能需要积累更多的原始采样进行学习。但按照4个验证码10个数字的理论随机组合(暗含某种数字仅有少量变化，不然此组合数量还应更大)，也就是要采样差不多一万张图片；对每个图片适当分割后，那就差不多几万张图片了。想要对这些切割后的图片进行手工分类，成为基本数字的训练学习数据，手工工作量不小，也很无趣。

当时就在想，为什么不能用机器学习的聚类分析来做一部分粗略的前期工作呢？

基本数字图片存在某些相似性，即使无监督的聚类分析，应该可以提供一定程度上的分类。在粗略自动化聚类分析的基础上，选取少量、一部分正确数据作为训练样本，训练完第一个学习器后，利用增强分类能力的学习器，再对切割后的大量基本数字样本进行精确度更高的分类，然后不断迭代此过程进行自举。

随着不断地降低学习素材的噪声，和增大新样本数量提高信息量，是否在某个阶段就可以完成整个过程的自举了，而不用手工分类上万张基本图片了呢？

这个逐步提精和自举的过程，粗略觉得可行，而且至少和上一次的图片验证码走的路子不同，或许可以学到更多的东西。

最后幸运的是，这个新路子验证了猜测和想法，自举了几次后，就能够正确分类所有的数字图片了:)

对于机器学习的新认识

最初，对于这样的有变形的图片数据是否可以被简单的SVM支持向量机学习器识别正确，心内存在疑问，不过，结果还是不错的，依然可以达到100%的识别率。即使使用非线性核的SVM学习器，效果还并不如线性SVM学习器。

可能正如书本中评价SVM支持向量机的那样，对于高维数据，拥有足够稀疏性，本身就可以进行比较好的线性划分

总结

对于线性可分的数据，机器学习器能力都差不多；关键是如何形成线性可分的数据，即特征提取
噪音的降低和信息量的增加，一方面在于去除错误样本，另一方面在于正向增益样本的增多，这是一个信息论的问题！
- 集成学习多样而不同视角的特性数据，有助于算力窘迫的学习器进行学习

opencv的AI包

对于初步学习机器学习的朋友，可以利用opencv提供的机器学习组件，就可以完成一定程度的认知。

opency的机器学习包括了聚类分析、SVM支持向量机和KNN聚类分析，对于一般的机器学习应用也是足够的！

SVM支持向量机深入认识

SVM支持向量机学习器对采样数据，仅能经过一层的处理，这点要弱于CNN神经网络学习器。

可以认为，CNN神经网络能够对原始数据进行更多层的处理，特别是大量参数化的特性选取、抽取。

相比较于SVM的采样数据，必须就已经是线性可分，或者利用恰当的非线性核可进行处理，不然，就达不到有效的效果。

在你不拥有超强算力的时间，我的初步想法是，如果你可以对采样数据，做很多不同视角的特性抽取，可利用人类知识，或领域专家知识，即使是一些识别正确率不高的特性数据，利用集成学习加线性支持向量机的组合方法，应该依然可以取得比较好的学习效果！

异或分类问题

对于最简单的异或性质的分类，线性SVM也类似感知机，不能具有非常好的效果，需要核化方法的支持

CNN神经网络的认识

CNN神经网络学习，可以看成对第一层输入的全信息图片能够进行学习。一般这些特性规则无法用算法描述，利用CNN神经网络进行学习处理，包括了可参数化的特性的抽取和选取，通常具有较好的效果。但如果输入并非全信息，我想CNN也会徒呼奈何的！

对比SVM来说，如果在一个相对比较容易降噪和特性抽取的领域，SVM也会具有非常好的效果

采样数据的全信息特性很重要

细微地方

为了增强基本数字图片中零值的数量，采用了阈值反向翻转的策略，使得图片中未提供信息的像素点值全部为零
同时opencv对图片机器学习，采用简单的拼接多行成为一行多维数据的做法，根据数字的形状特点，对于数字图片进行矩阵转置，可以将零值和非零信息更密集地集中在一些区域，可能会造成更好的聚性数据

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/778773.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

知识图谱--入门笔记

知识图谱--入门笔记

知识图谱–入门笔记-----整体的概念 1.什么是知识图谱？ 描述现实世界中各个实体或者概念之间的关系，其构成一张海量的语义网络图，节点表示实体或者概念，边表示属性或者关系。 2.知识图谱中的三个节点 （1&#xff09…

阅读更多...

【LeetCode每日一题合集】2023.7.17-2023.7.23（离线算法环形子数组的最大和接雨水）

【LeetCode每日一题合集】2023.7.17-2023.7.23（离线算法环形子数组的最大和接雨水）

文章目录 415. 字符串相加（高精度计算、大数运算）1851. 包含每个查询的最小区间⭐⭐⭐⭐⭐解法1——按区间长度排序离线询问并查集解法2——离线算法优先队列 874. 模拟行走机器人（哈希表方向数组）918. 环形子数组的最大和…

阅读更多...

会议OA项目之会议审批（亮点功能：将审批人签名转换为电子手写签名图片）

会议OA项目之会议审批（亮点功能：将审批人签名转换为电子手写签名图片）

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于OA项目的相关操作吧目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一.主要功能点介绍二.效果展示三.前端…

阅读更多...

AVLTree深度剖析（双旋）

AVLTree深度剖析（双旋）

在上一篇文章中我们提到了，单旋的情况（无论是左单旋还是右单旋），都仅仅适用于绝对的左边高或者绝对的右边高 b插入，高度变为h1，我们可以来试试单旋会变成什么样子旋完之后，形成了对称关系&…

阅读更多...

自然语言处理之AG_NEWS新闻分类

自然语言处理之AG_NEWS新闻分类

前言: 先简单说明下，关于AG_NEWS情感分类的案例，网上很多博客写了，但是要么代码有问题，要么数据集不对，要么API过时，在这里我再更新一篇博客。希望对各位同学有一定的应用效果。 1、DataSets 数据集的处理…

阅读更多...

部署mycat2

部署mycat2

因为mycat是Java写的，要装jdk 下载包 jdk-8u261-linux-x64.rpm 安装安装好后，查看版本安装mycat2 解压到data目录修改权限把所需的jar复制到mycat/lib目录查看MyCat目录结构回为mycat代理连接启动时需要有一个默认的数据源，所以我们…

阅读更多...

C#读取写入文件的三种方式

C#读取写入文件的三种方式

最新对文件的操作比较频繁。这里记录一下常用的几种文件读写的方式。我这里使用窗体来做测试，例子在文末，可下载。 1：二进制读写 /// <summary>/// 二进制写入文件/// </summary>private void button1_Click(object sender, E…

阅读更多...

PuTTY连接服务器报错Connection refused

PuTTY连接服务器报错Connection refused

天行健，君子以自强不息；地势坤，君子以厚德载物。每个人都有惰性，但不断学习是好好生活的根本，共勉！ 文章均为学习整理笔记，分享记录为主，如有错误请指正，共同学习进步。…

阅读更多...

基于SpringBoot + Vue实现单个文件上传（带上Token和其它表单信息）的前后端完整过程

基于SpringBoot + Vue实现单个文件上传（带上Token和其它表单信息）的前后端完整过程

有时遇到这种需求，在上传文件的同时还需要带上token凭据和其它表单信息，那么这个需求前端可以使用FormData数据类型来实现。FormData和JSON一样也是通过body传递的，前者支持字符串和二进制文件，后者只能是字符串，如下图…

阅读更多...

[CISCN 2023 初赛]go_session 解题思路过程

[CISCN 2023 初赛]go_session 解题思路过程

过程下载题目的附件，是用go的gin框架写的后端，cookie-session是由gorilla/sessions来实现，而sessions库使用了另一个库：gorilla/securecookie来实现对cookie的安全传输。这里所谓的安全传输，是指保证cookie中的值不能…

阅读更多...

STM32 USB使用记录：HID类设备（前篇）

STM32 USB使用记录：HID类设备（前篇）

文章目录目的基础说明HID类演示代码分析总结目的 USB是目前最流行的接口，现在很多个人用的电子设备也都是USB设备。目前大多数单片机都有USB接口，使用USB接口作为HID类设备来使用是非常常用的，比如USB鼠标、键盘都是这一类。这篇文章将简单…

阅读更多...

向npm注册中心发布包（上）

向npm注册中心发布包（上）

目录 1、创建package.json文件 1.1 fields 字段 1.2 Author 字段 1.3 创建 package.json 文件 1.4 自定义 package.json 的问题 1.5 从当前目录提取的默认值 1.6 通过init命令设置配置选项 2、创建Node.js 模块 2.1 创建一个package.json 文件 2.2 创建在另一个应用程…

阅读更多...

UE5 AI移动无动作问题

UE5 AI移动无动作问题

文章目录问题背景解决方法问题背景在使用行为树让角色移动时，出现角色行走不播放动作的情况：解决方法其实有2个问题导致出现这种情况 1、角色动画蓝图的问题角色动画蓝图可能存在4个问题： ① 无播放行走动画 ② 速度的值未正常传递 ③ 播放移动动作逻辑的值判断错…

阅读更多...

【每日一题】——C - Standings（AtCoder Beginner Contest 308 ）

【每日一题】——C - Standings（AtCoder Beginner Contest 308 ）

🌏博客主页：PH_modest的博客主页 🚩当前专栏：每日一题 💌其他专栏： 🔴 每日反刍 🟡 C跬步积累 🟢 C语言跬步积累 🌈座右铭：广积粮，缓称…

阅读更多...

Clion开发STM32之W5500系列(DNS服务封装)

Clion开发STM32之W5500系列(DNS服务封装)

概述在w5500基础库中进行封装，通过域名的方式获取实际的ip地址用于动态获取ntp的ip地址 DNS封装头文件 /*******************************************************************************Copyright (c) [scl]。保留所有权利。****************************…

阅读更多...

JVM对象在堆内存中是否如何分配？

JVM对象在堆内存中是否如何分配？

1：指针碰撞：内存规整的情况下 2：空闲列表: 内存不规整的情况下选择那种分配方式是有 java堆是否规整而决定的。而java堆是否规整是否对应的垃圾回收器是否带有空间压缩整理的能力决定的。因此当使用Serial,ParNew等带有压缩整理过程的收…

阅读更多...

win10环境下，应用无法启动并被删除（无法完成操作，因为文件包含病毒或潜在的垃圾文件）

win10环境下，应用无法启动并被删除（无法完成操作，因为文件包含病毒或潜在的垃圾文件）

现象： 解决办法： 一、关闭所有自己安装的杀毒软件，如：360安全卫士，金山毒霸等二、关闭win10本身的杀毒软件，步骤如下： 1、搜索栏输入“病毒和威胁防护” 2、进入以后，点击"病…

阅读更多...

Pytorch迁移学习使用Resnet50进行模型训练预测猫狗二分类

Pytorch迁移学习使用Resnet50进行模型训练预测猫狗二分类

目录 1.ResNet残差网络 1.1 ResNet定义 1.2 ResNet 几种网络配置 1.3 ResNet50网络结构 1.3.1 前几层卷积和池化 1.3.2 残差块：构建深度残差网络 1.3.3 ResNet主体：堆叠多个残差块 1.4 迁移学习猫狗二分类实战 1.4.1 迁移学习 1.4.2 模型训练 1.…

阅读更多...

vue3基础+进阶（二、vue3常用组合式api基本使用）

vue3基础+进阶（二、vue3常用组合式api基本使用）

目录第二章、组合式API 2.1 入口：setup 2.1.1 setup选项的写法和执行时机 2.1.2 setup中写代码的特点 2.1.3 script setup语法糖 2.1.4 setup中this的指向 2.2 生成响应式数据：reactive和ref函数 2.2.1 reactive函数 2.2.2 ref函数 2.2.3 rea…

阅读更多...

Cesium态势标绘专题-入口

Cesium态势标绘专题-入口

本专题没有废话，只有代码，撸！标绘主类MilitaryPlotting.ts /** 态势标绘主类* @Author: Wang jianLei* @Date: 2023-01-13 14:47:20* @Last Modified by: jianlei wang* @Last Modified time: 2023-05-31 09:55:34*/ import * as Creator from ./create/index; import Cre…

阅读更多...

推荐文章

最新文章