【注意!水群需谨慎】手把手教你使用Python实时监测QQ群消息

news2024/7/6 18:08:02

文章目录

  • 1. 写在前面
  • 2. 下载源码构建
  • 3. 通过release部署
  • 4. 运行本地服务
  • 5. 通过API获取数据
  • 6. 完整代码实现

1. 写在前面

  前段时间写了一个QQ群消息监测的自动化机器人,需求则是加入到某些特定的群组,对群内对话消息进行实时监测与分析。当然,我们做的只是威胁情报相关的一些信息收集,比如说发布与转载一些盗版仿冒类的内容与应用

我忽然觉得它或许能够用到更有趣的一些需求上去:

1、你的(对象)在某些QQ群内每天都聊了些什么内容?
2、对某些成员的发言特别在意怕错过消息实时监测获取
3、每天哪些人比较活跃,发布带颜色的东西!天天水群摸鱼?


带着上面的需求,来搭建QQ机器人。我们依然需要站在巨人的肩膀上去开展后续的工作,基于开源项目go-qchttp

go-cqhttp是一个QQ机器人框架,它与QQ之间的交互基于 CQHTTP协议(​​CoolQ HTTP API 插件协议)


在这里插入图片描述

2. 下载源码构建

  下载源码并解压运行:

git clone https://github.com/Mrs4s/go-cqhttp.git
cd go-cqhttp
go build -ldflags "-s -w -extldflags '-static'"

3. 通过release部署

  这里我推荐大家从release选择符合版本的客户端下载到本地再去运行:releases

在这里插入图片描述

下载完成后,需要对device.jsonconfig.yml文件进行配置修改

device.json文件需要注意一个地方,目前只有手表协议可以使用 ,所以如下所示protocol配置2即可:

在这里插入图片描述

config.yml文件是基本配置文件,用于设置机器人的基本属性和行为,配置如下所示:

# go-cqhttp 默认配置文件

account: # 账号相关
  uin: 1586501625 # QQ账号
  password: '' # 密码为空时使用扫码登录
  encrypt: false  # 是否开启密码加密
  status: 0      # 在线状态 请参考 https://docs.go-cqhttp.org/guide/config.html#在线状态
  relogin: # 重连设置
    delay: 3   # 首次重连延迟, 单位秒
    interval: 3   # 重连间隔
    max-times: 0  # 最大重连次数, 0为无限制

  # 是否使用服务器下发的新地址进行重连
  # 注意, 此设置可能导致在海外服务器上连接情况更差
  use-sso-address: true
  # 是否允许发送临时会话消息
  allow-temp-session: false

heartbeat:
  # 心跳频率, 单位秒
  # -1 为关闭心跳
  interval: 5

message:
  # 上报数据类型
  # 可选: string,array
  post-format: string
  # 是否忽略无效的CQ码, 如果为假将原样发送
  ignore-invalid-cqcode: false
  # 是否强制分片发送消息
  # 分片发送将会带来更快的速度
  # 但是兼容性会有些问题
  force-fragment: false
  # 是否将url分片发送
  fix-url: false
  # 下载图片等请求网络代理
  proxy-rewrite: ''
  # 是否上报自身消息
  report-self-message: false
  # 移除服务端的Reply附带的At
  remove-reply-at: false
  # 为Reply附加更多信息
  extra-reply-data: false
  # 跳过 Mime 扫描, 忽略错误数据
  skip-mime-scan: false
  # 是否自动转换 WebP 图片
  convert-webp-image: false

output:
  # 日志等级 trace,debug,info,warn,error
  log-level: warn
  # 日志时效 单位天. 超过这个时间之前的日志将会被自动删除. 设置为 0 表示永久保留.
  log-aging: 15
  # 是否在每次启动时强制创建全新的文件储存日志. 为 false 的情况下将会在上次启动时创建的日志文件续写
  log-force-new: true
  # 是否启用日志颜色
  log-colorful: true
  # 是否启用 DEBUG
  debug: false # 开启调试模式

# 默认中间件锚点
default-middlewares: &default
  # 访问密钥, 强烈推荐在公网的服务器设置
  access-token: ''
  # 事件过滤器文件目录
  filter: ''
  # API限速设置
  # 该设置为全局生效
  # 原 cqhttp 虽然启用了 rate_limit 后缀, 但是基本没插件适配
  # 目前该限速设置为令牌桶算法, 请参考:
  # https://baike.baidu.com/item/%E4%BB%A4%E7%89%8C%E6%A1%B6%E7%AE%97%E6%B3%95/6597000?fr=aladdin
  rate-limit:
    enabled: false # 是否启用限速
    frequency: 1  # 令牌回复频率, 单位秒
    bucket: 1     # 令牌桶大小

database: # 数据库相关设置
  leveldb:
    # 是否启用内置leveldb数据库
    # 启用将会增加10-20MB的内存占用和一定的磁盘空间
    # 关闭将无法使用 撤回 回复 get_msg 等上下文相关功能
    enable: true
  sqlite3:
    # 是否启用内置sqlite3数据库
    # 启用将会增加一定的内存占用和一定的磁盘空间
    # 关闭将无法使用 撤回 回复 get_msg 等上下文相关功能
    enable: false
    cachettl: 3600000000000 # 1h

# 连接服务列表
servers:
  # 添加方式,同一连接方式可添加多个,具体配置说明请查看文档
  #- http: # http 通信
  #- ws:   # 正向 Websocket
  #- ws-reverse: # 反向 Websocket
  #- pprof: #性能分析服务器

  - http: # HTTP 通信设置
      address: 0.0.0.0:5700 # HTTP监听地址
      version: 11     # OneBot协议版本, 支持 11/12
      timeout: 5      # 反向 HTTP 超时时间, 单位秒,<5 时将被忽略
      long-polling:   # 长轮询拓展
        enabled: false       # 是否开启
        max-queue-size: 2000 # 消息队列大小,0 表示不限制队列大小,谨慎使用
      middlewares:
        <<: *default # 引用默认中间件
      post:           # 反向HTTP POST地址列表
      #- url: ''                # 地址
      #  secret: ''             # 密钥
      #  max-retries: 3         # 最大重试,0 时禁用
      #  retries-interval: 1500 # 重试时间,单位毫秒,0 时立即
      #- url: http://127.0.0.1:5701/ # 地址
      #  secret: ''                  # 密钥
      #  max-retries: 10             # 最大重试,0 时禁用
      #  retries-interval: 1000      # 重试时间,单位毫秒,0 时立即

以上配置文件一般无需改动,HTTP监控地址默认是5700

4. 运行本地服务

配置完成后,我们直接在命令行启动:

./go-cqhttp

在这里插入图片描述

这里我们不需要在config.yml文件内QQ配置账号及密码,因为账号密码登陆的方式目前也存在小部分的不稳定问题,这里建议直接使用扫码的方式登陆。服务启动后我们不用操作,5秒后会自动弹出二维码

拿出手机扫描二维码登录,然后在手机上点击确认登录即可,如下图所示:

在这里插入图片描述

登陆成功以后控制台会自动加载我们的好友、群等信息等

在这里插入图片描述

服务运行后,我们就可以根据go-cqhttp提供的API接口进行交互啦!CQHTTP协议支持HTTP、WebSocket,允许QQ客户端主动活跃事件和消息给go-cqhttp

CQHTTP 插件是 2017 年初出现的基于 CKYU 机器人平台的一款开源免费插件,它使用户能够通过 HTTP 或 WebSocket 对 CKYU 的事件进行上报以及接收请求来调用 CKYU 的 DLL 接口,从而可以使用其它语言(不方便编译到原生二进制的语言)编写 CKYU 插件

服务相关的日志信息也会在控制台自动打印出来,比如说一些消息的接受,群里的一些信息动态,如下图所示:

在这里插入图片描述

5. 通过API获取数据

  接下来我们通过Postman工具请求API获取群信息数据,如下是手机QQ群内最新消息面板截图:

在这里插入图片描述

对比下面通过API获取到的群内最新消息截图(同步一致):

在这里插入图片描述

字段结构也是非常的丰富,基本上QQ内有的API接口都能够获取到

总的来说,go-cqhttp 扮演了一个中间层,通过 CQHTTP 协议与 QQ 客户端通信,同时为用户插件提供了丰富的功能和 API。这样,可以让用户编写自定义插件,实现各种的功能,从自动回复消息到管理QQ群等。这个框架的灵活和功能性使其在QQ机器人开发领域非常受欢迎

go-cqhttp 具有内置的 HTTP 服务器,用于接收来自 QQ 客户端和插件的 HTTP 请求。这些请求包括发送消息、处理事件、获取用户信息等

6. 完整代码实现

  它的拓展API功能非常丰富,不仅支持对群消息对话信息的监控,还支持对个人好友用户的会话监控

同时也支持用户信息群文件群成员等等数据API

# 视频与图片链接提取
async def extract_regex_matches(self, messages):
    match = re.search(r'url=(https?://\S+?term=(unknow|2))', messages)

    if match:
        url = match.group(1).replace('amp;', '')
        return url

    return messages

# 消息分类处理
async def filter_json_data(self, json_data: dict):
    message = json_data['message']

    if 'CQ:image' or 'CQ:video' in message:
        matches = await self.extract_regex_matches(message)
        json_data['message'] = matches

    elif 'CQ:forward' in message:
        message_id = re.search(r'id=([^,\]]+)', message).group(1)

        forward_data = await self.get_forwarded_message(message_id)
        forward_data = [{'content': await self.extract_regex_matches(msg.get('content', ''))} for msg in forward_data]
        json_data['message'] = forward_data

    return json_data
        
async def fetch_data(url: str):
	async with aiohttp.ClientSession() as session:
	    async with session.get(url, headers=GroupMonitorBot.headers) as response:
	        data = await response.json()
	        return data
	        
async def convert_timestamp_to_datetime(timestamp: int):
	return datetime.datetime.fromtimestamp(
	    timestamp).strftime('%Y-%m-%d %H:%M:%S')

# 获取群消息
async def get_group_messages(self, group_id: int):
	cache_timestamp = await self.deduplicate(group_id, 'msg_time')
	response = await GroupMonitorBot.fetch_data(
	    self.server.format(
	        'get_group_msg_history?group_id={}'.format(
	            group_id)
	    )
	)
	messages = response.get('data', {}).get('messages', [])
	
	if messages:
	
	    for data in messages:
	
	        timestamp = data.get(
	            'time', 0)
	
	        if timestamp > int(cache_timestamp):
	            message_type, group_id = data.get(
	                'message_type', ''), data.get(
	                'group_id', '')
	            role = data.get(
	                'sender', {}).get(
	                'role', '')
	            user_id, message_id, message = data.get(
	                'user_id', ''), data.get(
	                'message_id', ''), data.get(
	                'message', '')
	            user_info = await self.get_member_info(user_id)
	            json_to_analyze = {
	                'message_type': message_type,
	                'time': await convert_timestamp_to_datetime(timestamp),
	                'group_id': group_id,
	                'role': role,
	                'message_id': message_id,
	                'message': message
	            }
	            if user_info:
	                json_to_analyze.update(user_info)
	            analyzed_data = await self.filter_json_data(json_to_analyze)

# 获取用户信息
async def get_member_info(self, user_id: int):
    response = await GroupMonitorBot.fetch_data(
        self.server.format(
            'get_stranger_info?user_id={}'.format(
                user_id)
        )
    )
    data = response.get('data', {})
    return data
        
# 获取转发群聊消息
async def get_forwarded_message(self, message_id: int):
    response = await GroupMonitorBot.fetch_data(
        self.server.format(
            'get_forward_msg?message_id={}'.format(
                message_id)
        )
    )
    data = response.get('data', {}).get('messages', [])
    data = [{'time': await GroupMonitorBot.convert_timestamp_to_datetime(item.get('time', ''))} for item in data]
    return data

有了这个Bot机器人,后续在数据的基础上无论做统计、分析还是用户画像都是非常的简单了!

  好了,到这里又到了跟大家说再见的时候了。创作不易,帮忙点个赞再走吧。你的支持是我创作的动力,希望能带给大家更多优质的文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1136044.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

uniapp:谷歌地图,实现地图展示,搜索功能,H5导航

页面展示 APP H5 谷歌地图功能记录,谷歌key申请相对复杂一些,主要需要一些国外的身份信息。 1、申请谷歌key 以下是申请谷歌地图 API 密钥的流程教程: 登录谷歌开发者控制台:打开浏览器,访问 Google Cloud Platform Console。 1、创建或选择项目:如果你还没有创建项目…

智能低代码洪流涌动程序员节 华为云Astro触发1024的乘法效应

从人工智能至量子计算&#xff0c;再到最新的云原生技术&#xff0c;越来越多的荣耀被程序员斩获。今年1024程序员节&#xff0c;华为云Astro向全民致敬&#xff1a;「低代码高产出 拓荒数字化版图——人人皆是程序员」&#xff0c;为全球工程师及开发爱好者呈现智能化开发的魅…

北京筑龙发声炼化企业大会,助力央国企采购供应链数字化转型

10月25日&#xff0c;以“科技创新引领高质量发展&#xff0c;夯实炼化自立自强根基”为主题的第四届炼化企业创新发展大会暨新技术与解决方案交流会”在浙江省宁波市盛大召开。北京筑龙智能化业务部高级咨询顾问王良受邀出席&#xff0c;带来主题为“智能物料——企业采购供应…

FreeRTOS学习day1任务创建(动态创建)

顾名思义 免费的实时操作系统 用法基本和Linux下的多线程编程类似 探索者开发版实验 动态创建4个任务start_task task1 task2 task3 优先级依次为1 2 3 4 &#xff08;注意优先级不能为0,0是空闲任务&#xff09; 我的理解&#xff1a;主线程start_task 主线程 task1 ta…

uniapp接口请求api封装,规范化调用

封装规范和vue中的差不多&#xff0c;都是统一封装成一个request对象&#xff0c;然后在api.js里面调用。 先创建一个utils文件夹&#xff0c;然后里面创建一个request.js&#xff0c;代码如下&#xff1a; export const baseURL 基础url地址const request (options) > …

k8s-----25、资源调度-ResourceQuota资源配额、资源限制limitrange、服务质量QoS

1、ResourceQuota资源配额 1.0 作用 命名空间资源配额。防止公司内部人员对资源的不合理利用。 1.1、为什么需要资源配额 1、作为k8s集群的管理员&#xff0c;知道集群的规模&#xff0c;会合理规划资源&#xff0c;但是使用侧不知道&#xff0c;会导致很多不合理的使用场景…

ffmpeg的下载和编译(vs2022)

感谢大佬的二创,直接提供了sln编译 ffmpeg二创地址 创建如下目录 build存放代码(build最好改成source,因为作者这么建议,编译完才发现) msvc存放第三方依赖的头文件,这里固定叫msvc,因为大佬的sln里查找的路径是这个,不嫌麻烦也可以自己改 下载代码和编译器 下载源码…

Qt5 Python-docx库的使用,Qt python混合编程,qt 读写word,不依赖office

解决方案的选择 参考&#xff1a; https://www.jianshu.com/p/be68884849c3 因为项目要求不能使用模板方案&#xff0c;不能依赖Office&#xff0c;网上找了一些解决方案进行调研&#xff0c;以下几个方案&#xff1a; OpenOffice: 兼容性差&#xff0c;集成调用难度大LibOffi…

Mac怎么删除文件和软件?苹果电脑删除第三方软件方法

Mac删除程序这个话题为什么一直重复说或者太多人讨论呢&#xff1f;因为如果操作不当&#xff0c;可能会导致某些不好的影响。因为Mac电脑如果有太多无用的应用程序&#xff0c;很有可能会拖垮Mac系统的运行速度。或者如果因为删除不干净&#xff0c;导致残留文件积累在Mac电脑…

产品经理的秘密武器:提高效率的 6 种软件工具

在进入产品坑之前&#xff0c;你被这些假象“欺骗”过吗&#xff1f; 你认为产品经理是这样的&#xff1a;早上喝咖啡&#xff0c;听音乐&#xff0c;看数据报告&#xff0c;处理电子邮件&#xff0c;写一些产品需求&#xff0c;提交给各部门&#xff1b;午餐休息后&#xff0…

Java——Spring的控制反转(一文详解IOC)

Spring&#xff0c;Spring MVC&#xff0c;Spring Boot 三者比较 答&#xff1a; 这三者专注的领域不同&#xff0c;解决的问题也不一样&#xff1b;总的来说&#xff0c;Spring 就像一个大家族&#xff0c;有众多衍生产品例如 Boot&#xff0c;Security&#xff0c;JPA等等。…

Sectigo代码签名证书

自数字化时代以来&#xff0c;软件开发领域一直在迅速发展&#xff0c;而数字签名成为了确保软件和应用程序的完整性和可信性的关键元素之一。Sectigo代码签名证书作为数字签名的一个重要组成部分&#xff0c;为开发者和软件供应商提供了一种可靠的方式来证明其代码的来源和完整…

charles抓包手机的http

一,先写抓包手机的http 1,设置charles 按照如图设置charles,之后拿到ip地址. 2,手机端配置网络 手机连上和电脑同一个局域网,在无线按钮长按或者右键,手动配置ip,配置成刚刚第一步取到的ip和端口: 在配置好之后,电脑会弹出一个弹窗: 点击allow,就能狗抓取手机http的包了.

SAAS智能打印设计->自定义打印模板

1 业务场景 企业在业务运转过程中经常需要在线打印凭证、采购单、出入库单据等等。这时&#xff0c;你可以使用SAAS版打印设计器&#xff0c;根据自身需求自行设计打印模板&#xff0c;无论是打印纸张规格、打印方向&#xff0c;还是打印样式&#xff0c;你都可以自由调整设计…

目前和未来的缓存构建

说起来可能有点反直觉&#xff0c;有时候不运行反而可以帮助我们加快速度&#xff0c;这正是网络浏览器运行的指导原则。不必在页面上加载所有内容&#xff0c;缓存的元素已经存在&#xff0c;不需要每次访问网站或网页时都重新加载。页面加载速度越快&#xff0c;浏览器的工作…

windows 离线安装 vue 环境

由于公司要求在内网开发项目&#xff0c;而内网不能连接外网&#xff0c;因此只能离线安装 vue 环境&#xff0c;在网上找过很多的离线安装方法&#xff0c;但都没有成功&#xff0c;于是在不断的尝试中找到了以下方法。 1、找一台与内网电脑相同系统的有网电脑。 2、在有网的电…

Power BI 实现日历图,在一张图中展示天、周、月数据变化规律

《数据可视化》这本书里介绍了一个时间可视化的案例&#xff08;如下图所示&#xff09;&#xff0c;以日历图的形式展示数据的变化&#xff0c;可以在一张图上同时观察到&#xff1a;&#xff08;1&#xff09;每一天的数据变化&#xff1b;&#xff08;2&#xff09;随周变化…

1024 云上见 · 上云挑战(ChatGPT搭建)

【玩转1024】使用函数计算X通义千问搭建AI助手&#xff0c;参与1024小说创作大赛 【使用函数计算X通义千问搭建AI助手&#xff0c;参与小说创作大赛】&#xff1a;本活动基于函数计算X 通义千问快速部署 AI 个人助手应用&#xff0c;用户可以根据需要选择不同角色的AI助手开启…

Python开发利器KeymouseGo,开源的就是香

1、介绍 在日常工作中&#xff0c;经常会遇到一些重复性的工作&#xff0c;不管是点击某个按钮、写文字&#xff0c;打印&#xff0c;还是复制粘贴拷贝资料之类的&#xff0c;需要进行大量的重复操作。按键精灵大家想必都听说过&#xff0c;传统的方式&#xff0c;可以下载个按…