用opencv+playwright过滑动验证码

news2024/9/27 7:43:47

目录

梳理思路

编写代码

总结与提高


在本节,我们将使用opencv和playwright这两个库通过QQ空间的滑动验证码。 

梳理思路

1. 使用playwright打开浏览器,访问qq空间登录页面。

2. 点击密码登录。

 

3. 输入账号密码并点击登录。

4. 出现滑动验证码图片后,我们就可以获取到验证码背景图以及滑块图片。验证码背景图片通过元素style中的url链接就可以获取到,由于下载保存的是原图,所以我们要将宽度调整为280px,280这个值同样也可以在style中看到。

注:从style中也可以看到height值为200px,但其实这个包含了下方滑轨的高度,因此图片的真实高度要小于200px。所以我们在调整原图大小时,高度不要设为200px,而是通过以下公式进行等比缩放。

调整后的高度 = 原图高/(原图宽/280)

5. 我们同样可以找到滑块图片的链接,但打开后却是这样的。

由于不知道滑块在这张大图上的位置,所以无法有效截取。另一种方案是直接通过屏幕截取获得滑块图片。首先,对全屏幕进行截图,然后用playwright获取到滑块元素,获取到该元素的位置和大小后,就可以截取了。滑块的起始位置就是style中的left值。

6. 验证码背景图有了,滑块有了,滑块初始位置也有了,接下来就是判断背景图的缺口位置,再求出滑动距离。我们可以使用opencv-python的matchTemplate()和minMaxLoc()方法获取缺口的x坐标。拿到缺口x坐标后减去滑块的x坐标就可以求出滑动距离了。

为了让matchTemplate()的结果更加准确,我们可以对滑块图片做下处理,调整下对比度,让它暗一些,跟缺口差不多。

注:minMaxLoc()这个函数返回一个最大值和最小值,因为无法知道哪一个是正确的,所以我们两个值都应该拿来验证。也就是说,我们会拿到两个距离值,并且可能要滑动两次。当然,这个其实没啥关系,因为滑动验证码验证失败了的话,是可以再次滑动的。

7. 位置拿到之后,就是用鼠标控制滑轨上的按钮并进行滑动操作。滑动操作要真实,不能匀速,滑动时鼠标肯定也会有上下抖动,总之要尽量模拟人的滑动操作。

8. 滑动成功的话下方的滑轨元素就会消失,我们可以通过这点来判断是否通过了滑动验证码。如果滑了两次都没有通过(小概率),则刷新验证码并再次执行步骤4,5,6,7,8。

编写代码

根据以上思路,我们可以编写出如下代码。

from playwright.sync_api import sync_playwright
from PIL import Image
import numpy as np
import cv2 as cv
import requests
import random
import re


class QQZonSlide:
    def __init__(self):
        self.login_url = "https://i.qq.com/"
        self.username = "你的账号"
        self.password = "你的密码"
        self.page = None

    def start(self):
        with sync_playwright() as p:
            self.init_page(p)
            self.login()

            while True:
                self.get_slide_bg_img()
                start_x = self.get_slide_block_img_and_start_x()
                distance1, distance2 = self.get_slide_distance(start_x)
                slide_result = self.move_to_notch(distance1, distance2)
                if not slide_result:
                    self.refresh_captcha()
                else:
                    break

    def init_page(self, p):
        """初始化浏览器,获取page对象"""
        browser = p.chromium.launch(headless=False)
        self.page = browser.new_page()

    def login(self):
        """通过账号密码登录"""
        print("开始登录")

        # 访问页面
        self.page.goto(self.login_url)

        # 定位到登录框元素并点击密码登录
        login_frame = self.page.frame_locator("#login_frame")
        login_frame.get_by_role("link", name="密码登录").click()

        # 清空账号框然后输入账号
        login_frame.locator("#u").clear()
        login_frame.locator("#u").fill(self.username)

        # 清空密码框然后输入密码
        login_frame.locator("#p").clear()
        login_frame.locator("#p").fill(self.password)

        # 点击登录按钮
        self.page.wait_for_timeout(1000)
        login_frame.locator("#login_button").click()

    def get_slide_bg_img(self):
        """截取滑动验证码背景图片"""
        self.page.wait_for_timeout(2000)
        print("正在获取滑动验证码背景图片")

        # 获取滑动验证码所在的iframe
        captcha_iframe = self.page.frame_locator("#login_frame").frame_locator("#tcaptcha_iframe_dy")

        # 获取滑动验证码的背景图
        slide_bg_style = captcha_iframe.locator("#slideBg").get_attribute("style")
        slide_bg_url = re.search(r'url\("(.+)"\)', slide_bg_style).groups()[0]
        r = requests.get(slide_bg_url)
        with open("./slide_bg.png", "wb") as f:
            f.write(r.content)

        # 调整图片大小,根据style内容将宽度调整为280,高度等比例调整
        img = Image.open("./slide_bg.png")
        ratio = img.width / 280
        img = img.resize(size=(280, int(img.height/ratio)))
        img.save("./slide_bg.png")

    def get_slide_block_img_and_start_x(self):
        """获取滑块图片以及初始x坐标"""
        print("正在获取滑块图片")

        # 首先保存整个登录背景截图
        self.page.screenshot(path="bg.png")

        # 获取滑动验证码所在的iframe
        captcha_iframe = self.page.frame_locator("#login_frame").frame_locator("#tcaptcha_iframe_dy")

        # 获取滑块图片
        # .tc-fg-item对应的有三个元素,一个是目标滑块,一个是滑轨,还有一个是滑轨上的按钮
        for i in range(3):
            slide_block_ele = captcha_iframe.locator(".tc-fg-item").nth(i)
            slide_block_style = slide_block_ele.get_attribute("style")

            # 滑轨按钮元素的style值中不包含url字符串
            if "url" not in slide_block_style:
                continue

            # 从元素的style值中分析得出只有目标滑块的top值小于150
            top_value = re.search(r'top: (.+)px;', slide_block_style).groups()[0]
            if float(top_value) > 150:
                continue

            # 获取x坐标
            slide_block_x = float(re.search(r'left: (.+)px; top: ', slide_block_style).groups()[0])

            # 通过滑块位置,从背景图中截取滑块图片
            slide_block_rect = slide_block_ele.bounding_box()
            bg = Image.open("./bg.png")
            offset = slide_block_rect["width"] // 4  # 从背景图上截取会混入滑块周围的一些像素点,所以加一个偏移值,截取到滑块内部的图片。
            slide_block_img = bg.crop((slide_block_rect["x"] + offset, slide_block_rect["y"] + offset,
                                       slide_block_rect["x"] + slide_block_rect["width"] - offset,
                                       slide_block_rect["y"] + slide_block_rect["height"] - offset))
            slide_block_img.save("slide_block.png")

            return slide_block_x + slide_block_rect["width"] // 4

    @staticmethod
    def set_contrast_brightness(frame, contrast_value, brightness_value):
        if not contrast_value:
            contrast_value = 0.0

        if not brightness_value:
            brightness_value = 0

        blank = np.zeros(frame.shape, frame.dtype)
        frame = cv.addWeighted(frame, contrast_value, blank, 1 - contrast_value, brightness_value)

        return frame

    def get_slide_distance(self, start_x):
        """获取滑动距离"""
        print("正在获取滑动距离")
        # 通过opencv比较图片,获取缺口位置
        slide_bg_img = cv.imread("./slide_bg.png")
        slide_block_img = cv.imread("./slide_block.png")
        slide_block_img = self.set_contrast_brightness(slide_block_img, 0.4, 0)
        result = cv.matchTemplate(slide_block_img, slide_bg_img, cv.TM_CCOEFF_NORMED)
        minVal, maxVal, minLoc, maxLoc = cv.minMaxLoc(result)

        # 缺口的x坐标
        notch_x1 = minLoc[0]
        notch_x2 = maxLoc[0]

        # 距离
        distance1 = notch_x1 - start_x
        distance2 = notch_x2 - start_x
        return distance1, distance2

    @staticmethod
    def get_tracks(distance):
        """获取移动轨迹"""
        tracks = []                             # 移动轨迹
        current = 0                             # 当前位移
        mid = distance * 4 / 5                  # 减速阈值
        t = 0.2                                 # 计算间隔
        v = 0                                   # 初始速度

        while current < distance:
            if current < mid:
                a = random.randint(3, 5)        # 加速度为正5
            else:
                a = random.randint(-5, -3)      # 加速度为负3

            v0 = v                              # 初速度 v0
            v = v0 + a * t                      # 当前速度
            move = v0 * t + 1 / 2 * a * t * t   # 移动距离
            current += move
            tracks.append(round(current))

        return tracks

    def move_to_notch(self, distance1, distance2):
        """移动滑轨按钮到缺口处"""
        # 获取滑动验证码所在的iframe
        captcha_iframe = self.page.frame_locator("#login_frame").frame_locator("#tcaptcha_iframe_dy")

        for i in range(2):
            # 获取按钮位置,将鼠标移到上方并按下
            slider_btn_rect = captcha_iframe.get_by_alt_text("slider").bounding_box()
            self.page.mouse.move(slider_btn_rect['x'], slider_btn_rect['y'])
            self.page.mouse.down()

            distance = [distance1, distance2][i]
            if distance <= 0:   # 距离不可能小于等于0
                continue

            print(f"正在进行第{i+1}次滑动")
            tracks = self.get_tracks(distance)
            for x in tracks:
                self.page.mouse.move(slider_btn_rect['x']+x, random.randint(-5, 5)+slider_btn_rect['y'])
            self.page.mouse.move(slider_btn_rect['x'] + tracks[-1] + 5, random.randint(-5, 5) + slider_btn_rect['y'])
            self.page.mouse.move(slider_btn_rect['x'] + tracks[-1] - 5, random.randint(-5, 5) + slider_btn_rect['y'])
            self.page.mouse.up()

            # 滑动结束后等待一段时间
            self.page.wait_for_timeout(2000)

            # 寻找按钮是否还存在,不存在的话表明已通过滑动验证码,存在的话尝试下一个距离
            try:
                captcha_iframe.get_by_alt_text("slider").wait_for(timeout=2000)
            except Exception as e:
                print("已通过滑动验证码")
                return True
            else:
                print(f"第{i+1}次滑动失败")

        return False

    def refresh_captcha(self):
        """刷新验证码"""
        # 获取滑动验证码所在的iframe
        print("刷新验证码")
        captcha_iframe = self.page.frame_locator("#login_frame").frame_locator("#tcaptcha_iframe_dy")
        captcha_iframe.locator("#e_reload").click()
        self.page.wait_for_timeout(2000)


if __name__ == "__main__":
    slide = QQZonSlide()
    slide.start()

运行视频如下:

用opencv-python+playwright过滑动验证

从视频中可以看出,程序一共滑动了两次,在第二次的时候成功了。不过QQ空间又弹出了点选验证码(有时候不会弹出),我们会在之后章节中讲解如何通过这种类型验证码。

总结与提高

有时候就算通过了滑动验证码,QQ空间也会提示当前网络异常或者不安全,导致这种情况出现的原因很可能是轨迹出了问题,后台识别出这是程序生成的轨迹。不过我们可以使用机器学习生成更真实的滑动轨迹来避免这种情况出现,笔者会在之后的章节中专门讲解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/430214.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大型语言模型综述,非常详细,格局打开!A Survey of Large Language Models

大型语言模型综述&#xff0c;非常详细&#xff0c;格局打开&#xff01;A Survey of Large Language Models 返回论文和资料目录 论文地址 项目地址 1.导读 讲得通俗易懂&#xff0c;且格局拉满&#xff01;基本覆盖了自ChatGPT以来的AI比较火的事件&#xff0c;还多次提到…

AI 模型首次有了国家标准!头部大厂参与编制,辐射 AMD

3月17日&#xff0c;国内首个面向人工智能生成式模型的国家标准正式公开&#xff0c;并向社会征求意见。 该标准全称为《信息技术神经网络表示与模型压缩第一部分&#xff1a;卷积神经网络》 &#xff08;GB&#xff0f;T 42382&#xff0e;1&#xff0d;2023&a…

【Linux系统下安装JDK】

一&#xff0c;linux下载JDK最方便快捷的方式&#xff1a;yum 1&#xff0c;执行下方命令&#xff0c;查看可安装java版本。 yum -y list java*2&#xff0c;选择一个进行安装&#xff0c;带-devel的安装的是jdk&#xff0c;而不带-devel的安装的是jre 3&#xff0c;安装命令…

【springBoot篇1】概念、创建和运行

目录 一、什么是springBoot&#xff1f;为什么要学springBoot springBoot的优点&#xff1a;(5点) 优点1&#xff1a;快速集成框架 优点2&#xff1a;内置了Tomcat容器 优点3&#xff1a;快速部署项目 优点4&#xff1a;少配置&#xff0c;多注解 优点5&#xff1a;支持更…

机器学习中的公平性

文章目录机器学习公平性评估指标群体公平性指标个人公平性指标引起机器学习模型不公平的潜在因素提升机器学习模型公平性的措施机器学习公平性 定义&#xff1a; 机器学习公平性主要研究如何通过解决或缓解“不公平”来增加模型的公平性&#xff0c;以及如何确保模型的输出结果…

生信刷题之ROSALIND——Part 1

目录写在前面1、Counting DNA NucleotidesProblemSample DatasetSample OutputCodeOutput2、Transcribing DNA into RNAProblemSample DatasetSample OutputCodeOutput3、Complementing a Strand of DNAProblemSample DatasetSample OutputCodeOutput4、Rabbits and Recurrence…

Android操作系统介绍

目录 Android 名词 Android LOGO 体系架构 Android系统架构 Linux 内核 硬件抽象层&#xff08;HAL&#xff09; Android Runtime 原生C/C库 Java API框架 系统应用 应用组件 活动 &#xff08;Activity) 服务 &#xff08;Service &#xff09; 广播接收器 &…

BLOOM模型结构详解

《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》 论文地址: https://arxiv.org/pdf/2211.05100.pdf 代码地址: transformers库-modeling_bloom.py BigScience 官方提供的代码链接并没有找到完整的模型实现代码,只有提示说模型结构代码是在 Megatron 的…

JS 中深拷贝的几种爱恨情仇

页面开发中&#xff0c;经常会碰到需要对数据进行某些处理操作&#xff0c;又不想影响原先的数据&#xff0c;所会经常将数据进行拷贝&#xff0c;当然这里指的是深拷贝。 深拷贝和浅拷贝的区别&#xff1f; 深拷贝通通俗点来讲呢&#xff0c;其实就是不管当前要操作的数据层级…

目标检测算法——YOLOv5/v7/v8改进结合涨点Trick之Wise-IoU(超越CIOU/SIOU)

超越CIOU/SIOU | Wise-IoU助力YOLO强势涨点&#xff01;&#xff01;&#xff01; 论文题目&#xff1a;Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism 论文链接&#xff1a;https://arxiv.org/abs/2301.10051 ​ 近年来的研究大多假设训练数据中的…

Java实现发送邮件(定时自动发送邮件)

系列文章目录 Redis缓存穿透、击穿、雪崩问题及解决方法Spring Cache的使用–快速上手篇分页查询–Java项目实战篇全局异常处理–Java实战项目篇 该系列文章持续更新&#xff0c;更多的文章请点击我的主页查看哦&#xff01; 文章目录 目录 系列文章目录 文章目录 前言 一…

算法训练第五十七天 | 647. 回文子串、516.最长回文子序列、动态规划总结篇

动态规划part17 647. 回文子串题目描述思路暴力解法动态规划双指针法 516.最长回文子序列题目描述思路 动态规划总结篇动划基础背包问题系列打家劫舍系列股票系列子序列系列总结 647. 回文子串 题目链接&#xff1a;647. 回文子串 参考&#xff1a;https://programmercarl.com…

hot100:数组——31、33

31. 下一个排列 思路&#xff1a;其实这道题的意思就是&#xff0c;简单地说&#xff0c;就是找到一个比现有的给出的数组代表的值大的最小的数 比如给出的数组是[1,2,3]&#xff0c;它代表的数值是123&#xff0c;现有的元素组成的数值中&#xff0c;比123大的有很多&#xf…

3.6 n维随机变量

学习目标&#xff1a; 学习n维随机变量需要掌握一定的数学知识&#xff0c;包括多元微积分、线性代数和概率论等。要学习n维随机变量&#xff0c;我会采取以下步骤&#xff1a; 复习相关的数学知识&#xff1a;首先&#xff0c;我会复习多元微积分、线性代数和概率论的基本知…

OpenCV介绍与GUI特征(一)

目录0.1 OpenCV-Python教程简介OpenCVOpenCV-PythonOpenCV-Python教程OpenCV需要你!!!贡献者0.2 在Windows中安装OpenCV-Python目标从预制的二进制文件中安装OpenCV从源代码构建OpenCV练习0.3 在Ubuntu中安装OpenCV-Python目标从预制的二进制文件中安装OpenCV-Python从源码构建…

Revit怎么绘制结构梁?一键生成梁?

绘制结构梁是Revit基础的功能&#xff0c;对于不少刚接触Revit的小伙伴来说似乎还无从下手&#xff0c;今天就让小编来告诉大家在Revit中绘制结构梁的方法。 一、Revit中结构梁图文绘制过程 首先&#xff0c;我们选择“结构”选项卡中的“梁”工具&#xff0c;点击选择梁的类…

android12 displayArea学习

一&#xff1a;数据结构分析 1&#xff1a;android 12 WindowContainer 的类继承关系如下 下图为 WindowContainer 简要的对象图。 下图是 Aosp默认的display层次结构对象图。 Aosp定义的feature有如下 FEATURE_ROOT 0; FEATURE_DEFAULT_TASK_CONTAINER 1; FEATURE_WINDOW_…

DNS服务器 - 理论

DNS服务器1. 概念2. DNS域名结构3. 域名的分级4. 域名服务器5. 域名解析过程5.1 递归查询与迭代查询5.2 解析流程1. 迭代查询2. 递归查询6. 高速缓存&#xff1a;7. 加上主机缓存后的DNS解析流程8. 常见的域名解析记录9. DNS正向解析和反向解析1. 概念 DNS服务器&#xff08;D…

C++指针与其它复合类型

目录 前言&#xff1a; 1.指针与字符串 1.1cout接收char类型的地址的反应 1.2字符串字面值 1.3字符串备份 2.使用new创建动态结构 3.使用new和delete搭配存储键盘输入的字符串 前言&#xff1a; 指针我们已经知道如何使用了&#xff0c;也知道指针和数组配合起来使用&am…

DHCP及中继(UOS)

DHCP服务器 中继器 客户端 服务器 安装DHCP apt install isc-dhcp-server -y 编辑配置文件 vim /etc/dhcp/dhcpd.conf 重启服务 systemctl restart isc-dhcp-server 配置监听网卡 vim /etc/default/isc-dhcp-server 中继器 安装dhcp yum install dhcp -y nmtui 修改…