使用Python实现B站自动答题机器人

news2024/9/27 11:16:14

文章目录

  • 1. 写在前面
  • 2. 接口分析
  • 3. 点选验证分析
  • 4. Python程序实现

【🏠作者主页】:吴秋霖
【💼作者介绍】:擅长爬虫与JS加密逆向分析!Python领域优质创作者、CSDN博客专家、阿里云博客专家、华为云享专家。一路走来长期坚守并致力于Python与爬虫领域研究与开发工作!
【🌟作者推荐】:对爬虫领域以及JS逆向分析感兴趣的朋友可以关注《爬虫JS逆向实战》《深耕爬虫领域》
未来作者会持续更新所用到、学到、看到的技术知识!包括但不限于:各类验证码突防、爬虫APP与JS逆向分析、RPA自动化、分布式爬虫、Python领域等相关文章

作者声明:文章仅供学习交流与参考!严禁用于任何商业与非法用途!否则由此产生的一切后果均与作者无关!如有侵权,请联系作者本人进行删除!

1. 写在前面

  一个新注册的账号一般我们会需要去完成一些基本的任务,比如通过完成答题的方式来进行升级提升权重,而对于答题至少需要完成60道题目的提交才算通过结束!本期我们通过对接口协议的分析来实现一个自动答题机器人,以及在答题的过程中出现点选验证码自动识别验证(8~10道题会要求验证一次

在这里插入图片描述

验证码的话是极验3代三代的一个点选,难度不高!目前有很多种方式来识别验证。如果不想自己训练模型的话可以选择三方的平台

2. 接口分析

首先,我们进入到答题页面,每一道题刷新或者进入下一道题统一走如下接口,如下所示:

在这里插入图片描述

{"code":0,"message":"0","ttl":1,"data":{"question":{"id":710,"number":2,"q_height":38.4,"q_coord_y":0,"image":"https://i0.hdslb.com/bfs/member/56093e64936bb5ab040338287adbbfa5.png","from":"","options":[{"number":1,"high":42,"coord_y":38.4,"hash":"12a780b4550d69984494393c9db37faa"},{"number":2,"high":42,"coord_y":80.4,"hash":"a5d259743588549bdb6d98bf4fe50201"}],"type_id":0,"type_name":"","type_image":"","question":{"title":"IX3s9ZxyNPkxiLQracOZ93LB9rR5kXS9chmlm00P9SJ0sCjs2cDCXAaXpFC25xXveXzNqyjBjSCkCKRTqeecRw==","ans":[{"key":"12a780b4550d69984494393c9db37faa","title":"GSjdQikjaZ7uBkdw6H9nmS5NzYhmHZThuPBC4Bh1vY4FIoZ1wIz6xbvwiF0vUmAj"},{"key":"a5d259743588549bdb6d98bf4fe50201","title":"AacVYsQd6gJvrgjs0mwtVijK8weBcJdu2SFrOaTWn615C4iVb/REFsJWJU9rafY7"}]},"decision_ctx":{}}}}

我们对上面生成题的接口响应信息进行一个简单的分析,数据如上所示!因为60道题的类型都是选择题,且只有两个选项,在options字段中就是题选项的信息。外层的number是当前答题的进度(第几题),hash是提交答案接口的字段,如下所示:

在这里插入图片描述

可以看到接口check是提交答案的发包接口,其中ans_key字段则是上面说到的hash字段
,在提交答案后,我们需要取判断提交的回答是否正确,在响应JSON的数据中通过is_right字段去检验,如下所示:

{"code":0,"message":"0","ttl":1,"data":{"passed":true,"is_right":true,"ans_right":"a5d259743588549bdb6d98bf4fe50201"}}

3. 点选验证分析

这个自动答题的自动化流程中,难点在于答题过程中出现的点选验证码!这个跟行为无关,就算是手动去答题也是会在几道后出现的。我们现在来分析一下验证码的接口,如下:

在这里插入图片描述

上图出现验证码所提交的json_payload那一堆参数(一些环境、IP、设备相关的信息),在提交check答题的时候如果遇到了验证码,接口响应code是41096,然后拿到那一堆参数去请求register接口,拿到验证所需要的关键字段信息,如下所示:

{"code":0,"message":"0","ttl":1,"data":{"type":"geetest","token":"731eeeb787214dd59e6e6ebeebb31d64","geetest":{"challenge":"76cc14453621e982ecc7bfe163cbf841","gt":"ac597a4506fee079629df5d8b66dd4fe"},"biliword":null,"phone":null,"sms":null}}

在这里插入图片描述

可以看到validate验证码验证接口所提交的参数,即是上面register接口响应内的。通过调用训练好的验证码识别模型进行点选验证,验证成功通过is_valid来区分,如下所示:

在这里插入图片描述

然后拿register接口内给的token字段去提交当前出现验证码的题,即可通过!如下所示:

在这里插入图片描述

4. Python程序实现

梳理完整个题答流程后,现在可以开始实现完整的Python答题程序,首先获取Cookie信息,Web端答题的话必须拿到浏览器登录后的完整全参Cookie信息,不然的话buvid参数缺失!如下:

在这里插入图片描述

这里需要注意登录的IP保持跟答题的一致!虽然风控强度不是很高,但是测试发现会关小黑屋!拿到Cookie信息直接去请求出题接口,正式开始答题,代码实现如下所示:

url = "https://api.bilibili.com/x/answer/v4/base"
params = {
    "platform": "pc",
    "image_version": "v",
    "re_src": "0",
    "web_location": "333.858"
}

try:
    response = requests.get(
        url,
        headers=headers,
        cookies=cookies,
        proxies=proxies
    ).json()
if code == 41020:
    logger.info('已完成答题!!!')
    
elif code == 101:
    logger.error(f'账号出现异常!!!')
            
elif code == 0:
    question = response.get('data', {}).get('question', {})
    question_id = question.get('id', '')
    number = question.get('number', '')
    logger.info(f'当前答题进度: 第 {number} 题~~')
    options = question.get('options', [])
    for opts in options:
        hashs = opts.get('hash', '')
        result = check(headers, cookies, question_id, hashs, proxies)
        if result:
            logger.info('提交答案成功,进入下一题!')

code目前三种最常见的状态码及含义已在上面程序分支中表示!可以看到作者在拿到options答案选项后采取了遍历的方式去答题,因为平台机制就是答错了可以继续提交其他选项答案,也是能够通过的。且就两个选项(作者测试的话采取的枚举

这个地方其实可以有更加好的方案!比如我们先去收集一个庞大且完整的题库,让答题更加精准!因为枚举的方式太过于机器人化,也是会有风控的!或者让选择更加的随机化以及对接AI去完成答题都是比较好的一个方案(感兴趣自行去研究尝试

接下来,继续实现check接口提交答案代码,这部分就需要对接点选验证码的处理了,因为在页面上触发验证码也是在提交选项的时候出现。代码实现如下所示:

url = "https://api.bilibili.com/x/answer/v4/base/check"
data = {
    "re_src": 0,
    "question_id": question_id,
    "ans_key": hashs,
    "csrf": cookies['bili_jct']
}
if token:
    data['token'] = token
response = requests.post(
    url,
    headers=headers,
    cookies=cookies,
    data=data,
    proxies=proxies).json()
logger.info(f'提交回答信息: {response}')
code = response.get('code', -1)
if code == 41096:
    grisk_id = response.get('data', {}).get('grisk_id', '')
    decision_ctx = response.get('data', {}).get('decision_ctx', {})
    logger.error(f'出现点选验证码!!!')
    token = get_geetest(headers, cookies, grisk_id, decision_ctx, proxies)
    if token:
        # 过了验证码直接携带Token提交答题验证
        check(headers, cookies, question_id, hashs, proxies, token=token)

过完点选验证后,其他基本就没有太多的一个编码工作了!需要注意一下整个自动答题的流程、行为、策略。以防止程序的健壮性以及稳定性(比如说答题的间断性、不要一下把60道全部去完成、IP地址的唯一性

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2052684.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解密Linux中的通用块层:加速存储系统,提升系统性能

通用块层 通用块层是Linux中的一个重要组件,用于管理不同块设备的统一接口,减少不同块设备的差异带来的影响。它位于文件系统和磁盘驱动之间,类似于Java中的适配器模式,让我们无需关注底层实现,只需提供固定接口即可。…

【13】即时编译(JIT)

概念 即时编译是用来提升应用运行效率的技术。代码会先在JVM上解释执行,之后反复执行的热点代码会被即时翻译成为机器码,直接运行在底层硬件上。 分层编译模式 HotSpot包含多个即时编译器:C1、C2和Graal(Java 10,实验…

Native开发与逆向第一篇-字符串

开发 Android studio新建项目 Android studio新建一个Native C项目。 默认代码就是调用Native 方法stringFromJNI 返回一个字符串。 public native String stringFromJNI();C 代码 stringFromJNI 函数的代码,默认使用的是静态注册的方式,静态注册是函…

【数据结构】链式结构实现:二叉树

二叉树 一.快速创建一颗二叉树二.二叉树的遍历1.前序、中序、后序遍历(深度优先遍历DFS)2.层序遍历(广度优先遍历BFS) 三.二叉树节点的个数四.二叉树叶子节点的个数五.二叉树的高度六.二叉树第k层节点个数七.二叉树查找值为x的节点…

C++ //练习 17.23 编写查找邮政编码的正则表达式。一个美国邮政编码可以由五位或九位数字组成。前五位数字和后四位数字之间可以用一个短横线分隔。

C Primer(第5版) 练习 17.23 练习 17.23 编写查找邮政编码的正则表达式。一个美国邮政编码可以由五位或九位数字组成。前五位数字和后四位数字之间可以用一个短横线分隔。 环境:Linux Ubuntu(云服务器) 工具&#x…

【CTF | WEB】004、攻防世界WEB题目之simple_js

文章目录 simple_js题目描述:题目场景:解题思路 simple_js 题目描述: 小宁发现了一个网页,但却一直输不对密码。(Flag格式为 Cyberpeace{xxxxxxxxx} ) 题目场景: 解题思路 尝试了一下随便输入密码,显示如下: 按下F1…

【高阶数据结构】图

图 1. 图的基本概念2. 图的存储结构2.1 邻接矩阵2.2 邻接表2.3 邻接矩阵的实现2.4 邻接表的实现 3. 图的遍历3.1 图的广度优先遍历3.2 图的深度优先遍历 4. 最小生成树4.1 Kruskal算法4.2 Prim算法 5. 最短路径5.1 单源最短路径--Dijkstra算法5.2 单源最短路径--Bellman-Ford算…

CVE-2024-34982 LyLme Spage六零导航页 任意文件上传漏洞漏洞分析

代码分析 文件位于/lylme_spage/include/file.php。 这是用于图片文件处理的 <?php /** Description: 图片文件处理* FilePath: /lylme_spage/include/file.php* Copyright (c) 2024 by LyLme, All Rights Reserved.*/ header(Content-Type:application/json); require_o…

【Linux基础】Linux中的开发工具(3)--make/makefile和git的使用

目录 前言一&#xff0c;Linux项目自动化构建工具-make/makefile1. 背景2. 依赖关系和依赖方法3. 项目清理4. 使用方法和原理5. .PHONY的作用6. makefile中符号的使用 二&#xff0c;进度条的实现1. 理解回车换行2. 理解行缓冲区3. 版本14. 版本2 三&#xff0c;Linux上git的使…

文件包含漏洞(一)

本文仅作为学习参考使用&#xff0c;本文作者对任何使用本文进行渗透攻击破坏不负任何责任。 一&#xff0c;漏洞简述。 文件包含漏洞&#xff0c;通常发生在Web应用程序中&#xff0c;特别是那些使用用户输入动态生成内容的部分。这种漏洞允许攻击者通过提交恶意的文件路径请…

AI预测福彩3D采取888=3策略+和值012路或胆码测试8月19日新模型预测第61弹

经过60期的测试&#xff0c;当然有很多彩友也一直在观察我每天发的预测结果&#xff0c;得到了一个非常有价值的信息&#xff0c;那就是9码定位的命中率非常高&#xff0c;60期一共只错了6次&#xff0c;这给喜欢打私房菜的朋友提供了极高价值的预测结果~当然了&#xff0c;大部…

【Neo4j系列】简化Neo4j数据库操作:一个基础工具类的开发之旅

作者&#xff1a;后端小肥肠 在Neo4j系列我打算写一个Neo4j同步关系数据库、增删改查及展示的基础小系统&#xff0c;这篇文件先分享系统里面的基础工具类&#xff0c;感兴趣的可以点个关注&#xff0c;看了文章的jym有更好的方法可以分享在评论区。 创作不易&#xff0c;未经允…

《勇敢的哈克》开发商:为Xbox移植游戏是一场噩梦

国产类银河恶魔城游戏《勇敢的哈克》开发商Blingame在尝试将游戏移植到Xbox上时&#xff0c;遭遇让人头痛的技术障碍&#xff0c;最终他们只能放弃。《勇敢的哈克》是一款融合了类银河恶魔城元素的末日废土风平台动作游戏。你需要利用多功能能量钩爪组合出独特技能&#xff0c;…

Jenkins使用Publish Over SSH插件远程部署程序到阿里云服务器

前言 使用Jenkins远程构建springboot服务到阿里云上&#xff0c;Jenkins版本&#xff1a;Version 2.462.1 1、准备 在可选插件中&#xff0c;搜索Maven Integration &#xff0c;Gitlab和 Publish Over SSH 三个插件&#xff1a; 如果需要多用户管理那就安装&#xff1a;Ro…

【MySQL进阶之路】表结构的操作

目录 创建表 查看表 查看数据库有哪些表 查看表结构 查看表的详细信息 修改表 表的重命名 添加一列 修改某一列的属性 删除某一列 对列进行重命名 删除表 个人主页&#xff1a;东洛的克莱斯韦克-CSDN博客 【MySQL进阶之路】MySQL基础——从零认识MySQL-CSDN博客 创…

LLM技术揭秘:Qwen的Function Calling实现解析

简介 Function Calling 是一种让 Chat Completion 模型调用外部函数的能力&#xff0c;可以让模型不仅仅根据自身的数据库知识进行回答&#xff0c;而是可以额外挂载一个函数库&#xff0c;然后根据用户提问去函数库检索&#xff0c;按照实际需求调用外部函数并获取函数运行结…

授权cleanmymac访问全部磁盘 Mac授权访问权限 cleanmymac缺少权限

CleanMyMac是Mac系统下的一款专业的苹果电脑清理软件&#xff0c;同时也是一款优秀的电脑系统管理软件。它能有效清理系统垃圾&#xff0c;快速释放磁盘内存&#xff0c;缓解卡顿现象&#xff0c;保障系统顺畅地运行。 全磁盘访问权限&#xff0c;就好比机场内进行的安全检查。…

Vue3页面组件化开发

本节讲解Vue3页面组件化开发的原因和操作 1.原因 1.业务需求 2.页面展示 根据菜单选项展示不同的页面布局和页面信息 3.页面源码 <template><div class"box"><div class"UserInfo"><div class"UserImg"><img src&…

云计算第三阶段---DBA数据库管理

Day1 一.数据库概述 计算机中数据存放的仓库&#xff0c;可以按数据类型划分数据库&#xff0c;又可以在数据库中划分更细节的分类存放到相应的表中。 抽象来说就是生活中的菜市场、五金店之类的场所&#xff0c;根据用途开设&#xff1b;划分广泛的还有百货商场、批发市场等…

HarmonyOS应用程序访问控制探究

关于作者 白晓明 宁夏图尔科技有限公司董事长兼CEO、坚果派联合创始人 华为HDE、润和软件HiHope社区专家、鸿蒙KOL、仓颉KOL 华为开发者学堂/51CTO学堂/CSDN学堂认证讲师 开放原子开源基金会2023开源贡献之星 一、引言 随着信息技术的飞速发展&#xff0c;移动应用程序已经成为…