最近研究了一下抖音中文点选验证码的识别,居然正确率高达98%。
首先我们来看一下效果
一、识别方法
1、数据集准备
我们需要借助爬虫去下载大量的验证码图片。这些有两种图片,一种是小图,包含需要点选的中文和顺序,还有一种是大图,需要进行点选的地方,如下图:
2、标注中文位置
使用labelimg标注中文位置,之后会进行中文位置识别训练,如下图
3、标记每一个中文小图
4、训练识别模型
5、测试验证
我们将训练好的模型用100张图片来进行测试,虽然识别出来角度有所偏差,但是这个误差范围都能够使验证通过,所以正确率接近100%。因为100张测试图片比较少,所以保守估计正确率应该在99%左右。
如果再想提升正确率,可以再增加训练的数据量,就需要再投入大量人力,这个投入与提升产出比需要自己权衡。
二、免费使用地址
我将训练好的模型放在了网上,可以供大家免费学习使用:得塔云