-
声明
-
本文以教学为基准、本文提供的可操作性不得用于任何商业用途和违法违规场景。
-
本人对任何原因在使用本人中提供的代码和策略时可能对用户自己或他人造成的任何形式的损失和伤害不承担责任。
-
如有侵权,请联系我进行删除。
-
文章中没有代码,只有过程思路,请大家谨慎订阅。
先说目标,下面是我们要识别的验证码图片:
上面的图片中其实是分成的两部分:
- 需要点击的汉字部分(这里称作标签部分)。有些事文字,这里的是图片
- 验证码图片(这里叫做验证部分)。一般就是给一张背景图,里面有几个汉字,汉字个数通常会大于上面标签部分的个数。dy的点选验证码,通常是5选3、4选2
我们需要按照他给的标签汉字顺序点击验证部分的汉字。
一、方案选择
遇到这种验证码,我们通常有两种方式解决:
- 打码平台
- 自己训练模型
如果是需求量不大,就临时需要,就可以用第一种,如果是长期,量大,就可以自己训练模型,来搞定他,节约成本。这里主要讲第二种
二、问题、流程梳理
2.1、问题
我们要结局的问题是按照顺序标签顺序点击验证部分的汉字。
- 1、我们得知道背景图中的哪些坐标有汉字(每个字的坐标&