注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
如有侵犯,请联系作者下架
某yandex 不定长旋转验证码如下:
可以看到,此种验证码非常变态,旋转角度不固定,干扰背景不固定,字符长度不固定,弯曲形变都是不固定的,在人眼都很难分辨验证码的情况下,其实都是对于模型来讲,也是比较困难的哈哈,传统验证码可能小几百张就能达到很好的效果了,是因为,验证码难度比较简单,通常都是4,6位定长,但是对于模型而言,无非就是增加数据量
由于该验证码的复杂度,自己写一个rcnn或者其他模型,来优化改数据集进行训练变的尤为困难复杂,所以这里强烈推荐百度飞桨的开源模型PaddleOCR
其开源框架开箱即用的特性,使得对于新手小白训练验证码而言变得即为容易上手,且本身就由较为优秀的预训练模型和数据增强预处理,更是直接解放小白,使得小白可以在毫无基础的情况下进行训练,好话不多说,准备一下数据集,直接就是干,所有配置默认即可,GPU,启动&#