业务安全情报 | 数十万元的数据报告,竟被50元批量转售

news2025/1/20 13:34:11

近期监测到某咨询公司针数据报告大量泄漏事件,该机构历年的数据报告以及近期更新的针对VIP会员的付费报告均在电商等渠道可以低价获取。

BSL-2022-a3c28号情报文件显示黑灰产通过作弊方式获取查看、下载权限,绕过限制将报告数据大量下载,并通过某些渠道进行二次转卖获利。

分析报告数据本身就是咨询公司财产的一部分,当报告数据泄露,这部分数据资产相当于拱手让给别人,对公司的竞争力会产生威胁,且当该公司官方渠道并非获取数据报告的唯一途径时,会间接减少公司的收益,对公司的用户流失、经济利益都会产生直接影响。

因此,如何做好安全防控,保护好数据资产,对咨询公司而言是一件非常重要的事情。

咨询行业分析报告背后的黑灰产

哪里有利益,哪里就会有黑灰产。

当前,咨询机构众多,对此类数据报告有需求的群体有需求时,常规渠道只能通过付费下载高质量素材或者开通对应网站的付费会使用下载。但对于部分用户来说,数据报告并非日常所需,更多是在某些时期有需求,于是催生了低成本获取高质量数据报告以及数据报告代下服务。

常见的黑产攻击方式分为两种,一是批量注册、批量养号方式获取新用户数据报告下载权益,批量爬取网站的报告数据。二是通过注册少量高等级会员方式获取付费数据报告下载权限,并定期通过自定义下载工具大量爬取数据报告,最后通过电商等渠道进行转卖变现。

我们发现,多家咨询公司、证券公司行业客户,存在账号安全、数据报告被批量爬取的批量注册、批量养号以及爬虫风险。

据此,我们进一步挖掘出黑灰产通过垃圾注册、批量爬取数据以及文档去水印的实现方式。

黑灰产攻击方式

其批量获取数据报告有以下两种方式:

一是通过批量注册新账号,薅取咨询公司赋予新账号的会员权益-数据报告免费下载次数,实现通过多个账号搜索方式批量下载数据报告。通过此类方式批量爬取数据报告对咨询公司来说风险相对可控,因为大多数官网开放给新用户下载权限的报告都并非核心报告,和VIP权限的可读报告内容是不一样的。

主要有以下两种方式:

1)通过批量注册机注册大量账号。黑产事先从卡商、上游黑产等渠道手中获取大批量的黑卡手机号、代理IP资源、自动化操作工具等资源;然后通过注册机批量注册、自动化程序批量登录等方式获取用户权益。

2)使用多账号批量下载数据报告。借着网站开放给新会员的免费权益,实现免费下载批量报告。如某机构新会员可以免费下载10份数据报告,黑产通过批量注册获取大量账号,结合自动化批量下载脚本,实现通过关键词检索批量下载数据报告。

二是注册高级账号批量爬取数据报告,通过注册高级会员账号的方式,获取高等级下载权益,并通过自定义下载工具定期批量爬取最新的数据报告。

证券机构的会员一般是分等级的,不同等级的会员收费不一,等级越高价格越贵,享受权益也越多。用户权益中,主要对用户可检索报告数量、阅读报告数量、下载报告数量做了限制,等级越高,可查看报告数量、种类也越多。

黑灰产会通过注册高级会员账号的方式,获取高等级下载权益,并定期批量爬取数据报告获取大量数据报告。

通过证券官网下载的数据报告,一般都会有对应的logo水印,所以大多数黑产获取数据报告后,会对获取的数据报告进行批量去原水印,并加上自己的水印后,才会进行变现。

实现工具主要是批量去水印、加水印的工具,此类工具市面上有很多成熟的产品,可以根据不同的水印处理;然后加上自定义自动化操作脚本实现快速批量去、加水印。

黑灰产变现链路

黑灰产一般通过数据报告资源整合转卖、或者提供代下单服务,通过各大电商平台、小程序等渠道实现交易变现。

该类变现方式一般有两种,一是直接明码标价交易数据报告,下订单直接发送数据报告;

二是提供报告代下单服务,按单份数据报告收费的模式,可以根据买家需求提供代下服务,价格会根据数据库、权限有所区别,一般服务费在5元-100元之间。

防控建议

针对以上批量注册、批量养号、数据爬取等风险,防控建议如下:

H5混淆:

从客户端安全考虑,网页需要加H5混淆防护。使用H5代码混淆⼯具,通过加密混淆引擎,对H5代码进⾏加密、混淆、压缩,可以⼤⼤增加H5代码的安全性,有效防⽌产品被⿊灰产复制、破解。

通过行为验证码进行人机识别:

根据黑灰产作弊手段分析,黑灰产在积分任务环节主要是以自动化程序作弊方式进行恶意攻击,对于识别机器行为,轻部署且最简单的识别工具就是行为验证码。在数据报告查看、下载场景,可结合决策引擎产品组合使用,当引擎识别为无风险请求时,业务端正常返回请求结果;当识别为中风险请求时,可调行为验证码进一步校验人机;当识别为高风险请求时,可进行验证码校验循环或者直接拦截请求。

外部数据联合防控:

1)手机号黑库:

批量注册批量养号场景黑产使用的手机号除了有虚拟号段、连号手机号特征,还有很多没有任何号段特征的黑产小号。通过手机号黑库可以提高对此类黑产手机号的风险覆盖率。

2)风险IP库:

批量爬取数据、批量下载数据场景自动化程序为了规避IP聚集风险,经常会结合IP代理池一起组合使用,实现秒拨IP,分散请求的目的。通过IP风险库可以覆盖此类IP风险。

防控产品组合建议:

1)设备指纹:

设备指纹可以针对web端风险进行识别,浏览器运行环境检测,校验运行环境是否存在风险特征,例如模拟器、调试、浏览器与UA是否一致、浏览器与当前系统是否匹配等,配合决策引擎使用,可以实时发现风险并给予处置。

2)决策引擎:

①多业务节点接入,注册、登录、报告查询、下载等业务节点全链路接入风控,各场景基础通用风控维度如识别设备聚集、IP聚集、用户高频等维度识别垃圾注册、批量养号以及爬虫风险。

②结合各个场景分别定制不同维度的风控策略,如登录场景同人养号风险,同设备多账号、同IP多账号聚集等;报告查询场景短时间请求量激增、代理IP、同设备高频访问等维度。

③建立本地名单动态运营维护机制,基于注册、登录、报告查询等,沉淀并维护对应黑白名单数据,包括用户ID、手机号、设备ID、IP地址等维度的黑名单。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/161376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

javaEE初阶 — 认识文件

文章目录认识文件1. 树型结构组织和目录2. 文件路径(Path)2.1 绝对路径2.2 相对路径3. 文件的类型认识文件 文件分为 狭义 和 广义 两种 狭义的文件:指的是硬盘上的 文件 和 目录 广义的文件: 泛指计算机中很多的软硬件资源。操…

2022(一等奖)D926刘家峡库区潜在滑坡InSAR识别与分析

作品介绍 1 应用背景 滑坡是普遍存在于世界各地山区的主要灾害之一,严重威胁着人类的生命财产安全和自然环境。滑坡不但会直接破坏人类生命财产安全和建筑物,而且还会造成堰塞湖等次生灾害,进而对人类的生命财产安全和基础设施等造成二次破坏…

暴力破解 SSH

Kali 的 MSF 终端,对渗透目标主机 的 SSH 服务进行暴力破解。 破解的是否成功取决于字典和目标是否使用弱密码。 一,实验环境 分别是攻击机和靶机(也可是其他目标服务器) 二、利用 SSH 弱密码进行暴力破解 暴力破解最重要的要…

100 道 Linux 笔试题,能拿 80 分就算大神!

本套笔试题共100题,每题1分,共100分。(参考答案在文章末尾) 1.cron 后台常驻程序 (daemon) 用于: A. 负责文件在网络中的共享 B. 管理打印子系统 C. 跟踪管理系统信息和错误 D. 管理系统日常任务的调度 2.在大多数Li…

如何使用无标签数据进行预训练?

一、直观解释 简单来说就是“造目标”。也即人为地去构造一些子任务(论文里的protext task),或者利用一些最基本的公理性常识,去设计“类似监督”的任务。所不同的是,我们引入的“类似监督”的任务通常是用来完成表征…

day13|559.n叉树的最大深度、222.完全二叉树的节点个数

559.n叉树的最大深度 给定一个 N 叉树,找到其最大深度。最大深度是指从根节点到最远叶子节点的最长路径上的节点总数。N 叉树输入按层序遍历序列化表示,每组子节点由空值分隔(请参见示例)。 示例 1: 输入:r…

基于opencv的图像:边缘检测 (完整代码+详细教程)

给出“离散拉普拉斯算子”一般形式的数学推导 离散值的导数使用差分代替: 所以: 以(x, y)为中心点,在水平和垂直方向上应用拉普拉斯算子,滤波器(对应a=1的情况)为:

广告归因-让你彻底弄归因架构实现

这里会引用神策数据很多的介绍,然后进行总结 归因方法 自归因 渠道商帮我们做归因,有的是每个用户打开 app 都回传给渠道商,渠道商自己归因有的如华为是从应用商店安装时,应用商店把归因信息写入到 app, 然后首次安装启动时能从本…

【信息学CSP-J近16年历年真题64题】真题练习与解析 第12题之加工零件

加工零件 描述 凯凯的工厂正在有条不紊地生产一种神奇的零件,神奇的零件的生产过程自然也很神奇。工厂里有 𝑛 位工人,工人们从 1~𝑛编号。某些工人之间存在双向的零件传送带。保证每两名工人之间最多只存在一条传送带。 如果 𝑥 号工人想生产一个被加工到第 𝐿(…

回溯法--旅行售货员问题--排列树

回溯法有点类似于暴力枚举的搜索过程,回溯法的基本思想是按照深度优先搜索的策略,从根节点出发深度搜索解空间树,当搜索到某一节点时,如果该节点可能包含问题的解,则继续向下搜索;反之回溯到其祖先节点&…

【学习笔记】【Pytorch】六、nn.Module的使用

【学习笔记】【Pytorch】六、nn.Module的使用学习地址主要内容一、torch.nn模块概述二、nn.Module类的使用1.使用说明2.代码实现学习地址 PyTorch深度学习快速入门教程【小土堆】. 主要内容 一、torch.nn模块概述 概述:帮助程序员方便执行与神经网络相关的行为。…

微信小程序——WXSS模板样式,rpx,样式导入,全局样式和局部样式,全局配置-window

一.WXSS模板样式1.什么是 wxss WXSS ( WeiXin Style Sheets )是一套样式语言,用于美化 WXML 的组件样式,类似于网页开发中的CSS。2. WXSS 和 CSS 的关系WXSS 具有 CSS 大部分特性,同时, WXSS 还对 CSS 进行了扩充以及修…

73. 风格迁移以及代码实现

摄影爱好者也许接触过滤波器。它能改变照片的颜色风格,从而使风景照更加锐利或者令人像更加美白。但一个滤波器通常只能改变照片的某个方面。如果要照片达到理想中的风格,可能需要尝试大量不同的组合。这个过程的复杂程度不亚于模型调参。 本节将介绍如…

数据导入导出(POI以及easyExcel)

一.概念: 1.场景需求 将一些数据库信息导出为Excel表格 将Excel表格数据导入数据库 大量数据的导入导出操作 常⽤的解决⽅案为:Apache POI与阿⾥巴巴easyExcel2.Apache POI介绍 Apache POI 是基于Office Open XML 标准(OOXML)和M…

96、【树与二叉树】leetcode ——404. 左叶子之和:递归法[先序+后序]+迭代法[先序+层次](C++版本)

题目描述 原题链接:404. 左叶子之和 解题思路 一、递归法 (1)设置一个布尔变量判定(先序遍历) 左孩子一定在每个子树的最左侧,因此设置一个局部参数flag,当每次遍历的是左子树时&#xff0c…

记录一次Oracle Linux7上安装RDBMS 11.2.0.4的问题

参考文档: 文档1 OHASD fails to start on SuSE 11 SP2 on IBM: Linux on System z (Doc ID 1476511.1) As part of the root.sh, roothas.pl or rootcrs.pl is called and an entry is placed in /etc/inittab h1:35:respawn:/etc/init.d/init.ohasd run >/de…

cmake入门之二:调用外部共享库和头文件

cmake入门之二:调用外部共享库和头文件1.创建外部共享库1.1 创建相关文件或文件夹1.1.1 ext目录下的CMakeLists.txt1.1.2 ext目录lib文件夹下1.1.2.1 hello.h1.1.2.2 hello.c1.1.2.3 CMakeLists.txt1.2 编译、安装2.创建当前项目2.1 创建相关文件或文件夹2.1.1 proj…

为什么这么努力,还是赚不到钱?你不能不知道赚钱的三个模型

大部分人赚钱,都是通过能力努力运气,这种需要付出自己的大量时间和精力,并且赚到的钱也是有上限的。小部分人赚钱是通过,个人IP的商业模式来赚钱,并且跟我们传统的生意不一样的是,这个亏钱是有下限的&#…

OpenHarmony轻量级设备xts认证大致流程

因为最近公司在做openharmony开发板xts认证,这里对认证过程和过程中遇到的坑做下记录,也给大家探探路。 1. 开发板适配 OpenHarmony轻量系统的移植比较简单,代码中解耦做得非常好。从代码的设计理念上来看,移植主要是3部分的内容…

.vscode/extensions.json和setting.json 是项目用到的插件推荐列表和设置

文章目录前言一、extensions.json安装推荐插件编辑推荐插件二、setting.json总结前言 在前端项目,文件目录中存在.vscode文件夹,文件夹下一般存在两个文件extensions.json和setting.json。作用是保持所有开发者安装了相同的插件和相同的配置&#xff0c…