【K哥爬虫普法】百亿电商数据,直接盗取获利,被判 5 年!

news2024/11/28 9:24:08

01

我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K 哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。

案情简介

2017 年 2 月至 5 月,被告人彭中正利用其在成都市知数科技有限公司(以下简称知数公司)从事技术工作的便利,非法获取公民个人信息数十万条,伙同被告人吕雷,通过 QQ 向被告人周敏、“123 哥”(身份不详)、“49 哥”(身份不详)等人出售,违法获利约 50 万元。被告人周敏以 0.35 元/条、0.4 元/条等价格,从彭中正、吕雷处持续购买约 40 万条公民个人信息用于转卖获利,通过支付宝向吕雷给付对价 161731 元。

2017 年 5 月 16 日,阿里巴巴集团公司以用户数据泄露为由报案。

警察于同年 5 月 18 日 20 时许,在本市天府新区伏龙西街暂住地门口将彭中正挡获;于同日 14 时许许在云南省临沧市临翔区团山村租住房内将吕雷挡获;于 2017 年 6 月 6 日 19 时许,在湖北省武汉市江夏区高新大道湖口社区将周敏挡获。

供述情况

被告人供述与辩解

▶ 彭中正(出售个人信息)

2017 年 2 月底,他加入一个 QQ 群,有人在群内发布消息称可以用现金购买电商数据,他认为这是一条快速挣钱的渠道,且这些买家需要的电商信息,他很方便就能获取,本来当时也没什么钱,就打算做这个事情。这些数据都是他从公司盗取的。公司专门有个信息采集部,通过采集程序对淘宝网页上的买家评论信息进行采集,再拿到“社工库”进行再次分配,通过对淘宝账号的匹配,就能把账号对应的注册姓名和联系方式匹配出来。他们公司成立至今从淘宝网采集用户评价信息的数量在百亿条左右,收集社工库信息有两亿条左右,采集这些信息并没有经过阿里巴巴公司同意。

他通过 QQ 联系网友 “123”,对方需要大量购买淘宝女装买家的数据。谈好价格为 1.5 角/条,为了不让公司发现他盗取信息,他就让对方将钱打到同学吕雷的支付宝上,再由吕雷转给他。盈利大约十万元。后来 “123” 需要一批百万量级的数据,考虑到有风险,就只给对方导入了大概三十万条数据信息,为规避风险,他特意把数据里的电话号码作了修改,并将恢复的方法告诉了 “123”,对方收到数据后说质量一般,没给他钱,就在QQ上把他删了。

后来认识了“支付宝哥”,与对方发生大概七八次数据交易,数据总量约在二三十万条,获利大概在十万元左右。数据是淘宝网上购买女装、化妆品、女鞋的买家数据,这些数据包含买家姓氏、电话,所购商品名称、价格、购买时间

在 QQ 群里还有一个 “49哥” 与他交易。对方购买了大约一万条淘宝女装买家信息,包含买家姓氏、电话、购买商品内容、购买价格和时间。几乎每天都有交易,金额从 6 角至 8 角每条不等。“49哥” 提出叫他买几张黑卡,规避交易风险,他就从 “49哥” 那里以 800 元一张的价格购买了 8 张黑卡。他共计卖给 “49哥” 三十余万条淘宝买家数据,共计获利二十余万。

▶ 吕雷(中间人)

2017 年 2 月 20 日左右,高中同学彭中正提出向让他帮忙转账,说这个事情不想让其公司知情。此后,有人向他支付宝账号转账 5000 元,他又通过支付宝转给彭中正。此后彭中正将一个客户交给他做,对方有数据需求,彭中正就把数据发给他,他再卖给客户来赚钱。前两次,二人平分,后几次他就没有支付差价。大概做了一个月,侵犯公民个人信息的司法解释出台后,他们就没做了。他售卖的数据包括淘宝卖家的姓、电话号码、购物内容、物品分类信息、交易金额、购买时间。经他手的客户与彭中正的转账金额大约有 60 来万。他在这之中没有提成,前后彭中正给过他共计 1 万 6 千左右。单卖后,他共向支付宝哥卖过十来次,大概八、九万条信息,他从中获利两、三万元。因售卖信息他总共获利五万左右。

▶ 周敏(个人信息买家)

从 2017 年 2 月份之后到 5 月份,他从网上购买数据,大约 5 万条左右,支付了 5 万元左右。数据就是一些个人信息,包括姓名、电话、地址、一些购物的信息,信息买来后也是卖给网上的 QQ 好友,通过贩卖信息他获利有 3、4 万左右。基本每天都有信息需求,几千条到几万条不等。信息单价是 3.5 毛一条,到最后几次是按照 4 毛一条。他购买的信息总价大约是 12 万左右,按照这个单价和总结计算,售卖的信息条数在三四十万条左右。

证人证言

▶ 郭某(知数公司股东之一)

知数公司系 2014 年由王某1、王某2、彭中正和他创建,主要是做信贷系统,给审批人员提供查询,通过大数据分析对用户进行征信调查,另外就是给公司提供数据采集分析服务。彭中正负责数据处理、清洗、入库、算法,他负责系统开发、运维、数据采集。采集的数据类型有微博、新闻、招聘信息、电商数据(含店铺信息、商品信息、商品评价)。公司通过程序采集网页、手机 APP 数据,如淘宝评价信息,征信信息来源源于公开的黑名单、最高法执行信息、多平台借贷,及第三方平台提供的用户登录授权,可以直接登录进行采集,如采集手机通话详单和淘宝用户购物记录。公司采集的淘宝信息用来做数据分析,没有出售过。

▶ 王某1(知数公司股东之一,现任法人)

爬虫组会爬取电商的评论、商品价格、商品详细情况、销量;爬取微博的内容、关注关系、注册基本信息;爬取招聘网站的公司招聘信息、注册信息;也爬过淘宝网上的数据,包括一些淘宝网页上的买家用户名,购物后的评价,淘宝买家购买的商品价格。公司客户主要是一些金融机构,如银行、消费金融公司、小贷公司。他们购买或售卖的数据中不包括公民个人信息,全是他们爬取的公开数据,或是其他数据公司爬取的公开数据。

▶ 吴某(知数公司员工)

知数公司主要业务是运用公司大数据信息,为客户提供数据分析并收费。公司所有相关淘宝平台上的数据都是由第三方平台提供给他们的,主要有购物具体时间、金额、购物者的收货地址、联系电话等信息。

法院观点

根据《中华人民共和国网络安全法》及《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》相关规定,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息。彭中正无论是从公司窃取还是自己加工获取,未征得他人同意收集信息,均系非法手段,不影响本罪的构成。

被告人彭中正、吕雷系共同犯罪,二人分工合作,彭中正负责提供相关信息并与买家联系,吕雷负责售卖信息、收取非法获利并与买家周敏联系,二人在犯罪中的地位大致相当,不区分主从犯。

本院认为,被告人彭中正、吕雷、周敏违反国家有关规定,向他人出售或者以非法方法获取公民个人信息,情节特别严重,其行为已构成侵犯公民个人信息罪。

判决情况

一、被告人彭中正,犯侵犯公民个人信息罪,判处有期徒刑五年,并处罚金人民币五十万元;

二、被告人吕雷,犯侵犯公民个人信息罪,判处有期徒刑四年,并处罚金人民币十万元;

三、被告人周敏,犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币四万元。

裁判文书

  • 一审:(2018)川 0191 刑初 94 号
  • 二审:(2018)川 01 刑终 454 号

案例分析

本案被告人彭中正利用职务之便,私自将公司获取的个人隐私数据对外售卖,这是明显缺乏职业素养且严重违法的行为。还值得注意的是,知数公司的几个证人对获取淘宝相关个人隐私数据途径的描述是不一致的,股东郭某称是公司采集的,但没售卖过;而员工吴某则称是通过第三方平台购买的;另一股东王某更表示公司购买或售卖的数据中不包括公民个人信息,可是如果不包括的话,被告人彭中正手中的数据又是从何而来的呢?

不过不论是自己采集还是第三方购买,都涉及到了个人隐私信息,根据《中华人民共和国网络安全法》及《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》相关规定,任何个人和组织不得窃取或者以其他非法方式获取个人信息,不得非法出售或者非法向他人提供个人信息,这属于违法行为,但是本案中提及对知数公司的相关处理行为只有:查处 65 份合同、2 台台式机主机箱。

本案也很好的提醒了我们,就算是朋友、熟人请求帮助,也要先分析帮这个忙是否合理合法,后续是否可能对自己造成影响,不然这个情分给的可就太大了。切记不要为一些蝇头小利而铤而走险,这前面可能是万丈深渊。

最重要的一点,本案很好的验证了触及公民个人信息的情节严重性,从售卖者到中间人再到买家都属于共同犯罪,法网恢恢疏而不漏,还是在此忠告各位爬虫工程师,公民个人信息是万万不能触碰的,这是绝对的 “红线”!不要被一时的利益冲昏了头脑,法律的重锤砸下来的那一刻,可就没有后悔的机会了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/975970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最快1个月录用!9月SCI/SSCI/EI刊源表已更新!

2023年9月SCI/SSCI/EI期刊目录更新 2023年9月份刊源表已更新!计算机、医学、工程、环境、SSCI均有新增期刊,1区(TOP),最快1个月录用,好刊版面紧俏,切莫错失机会! 01 计算机领域 02 医学与制药领域 03 工…

修改部署后的SSM项目配置文件

修改部署后的SSM项目配置文件 环境配置:window10,JDK8,项目采用SSM编写,部署在tomcat上,maven打包是打成war包 1、找到配置文件 打开tomcat目录 D:\Programming\apache-tomcat-8.5.58\webapps\MyPRO\WEB-INF\class…

磁共振脑灌注成像方法(ASL)

前言 与结构成像相比,生理成像是一个可以揭示组织和器官功能的领域,而不仅仅是提供形态信息。通过这种方式,它可以为评估人体提供补充信息。在一些疾病中,与结构变化相比,预期组织中的生理变化发生的时间要早得多。然…

postgresql 安装教程

postgresql 安装教程 本文以window 15版本为教程 文章目录 postgresql 安装教程1.下载地址2.以管理员身份运行3.选择安装路径,点击Next4.选择组件(默认都勾选),点击Next5.选择数据存储路径,点击Next6.设置超级用户的…

智能算力时代,一个中国答案

今年以来,随着AI大模型极速获得认可,全球智能化产业迎来了新的发展高峰。全球各大科技厂商纷纷布局大模型,国内更是出现了“百模大战”的盛况。 而随着大模型的快速崛起,一个早已萦绕在AI行业多年的问题也进一步暴露:针…

内网建自己的pip源

内网建自己的pip源 一. 下载数据包二. 建立索引三. 安装nginx四. 配置nginx五.展示 一. 下载数据包 以清华源为示例 import requests import bs4 import re import wget a requests.get("https://pypi.tuna.tsinghua.edu.cn/simple").text b bs4.BeautifulSoup(a…

冠达管理:券商8月调研热情高 工业机械行业受青睐

截至9月4日记者发稿,8月以来券商累计调研次数约1.44万次,环比增加超160%。其间,工业机械职业公司获券商调研最多。 调研逾900只个股 截至9月4日发稿,8月以来券商累计调研948只个股。从个股调研热度看,容百科技最受券…

配电房无人值守

配电房无人值守依托电易云-智慧电力物联网,实现对整个配用电过程的监管,在数据统计和处理的基础上,对配电房的电气成套设备及环境变化实现即时工作状态实时监控和计算机控制,实现区域环境、监控视频、消防安全、采暖通风系统、照明…

Python综合案例(折线统计图)

首先介绍一个很好的工具网站:懒人工具-手机APP工具下载-手机软件下载大全 - 173软件站 可以在网站对json数据进行格式化分析,效率很高! 安装pyecharts命令: pip install pyecharts 折线统计图实现代码实现 """ 演…

实体店商家为什么要做微信小程序开发

一、引言 在数字化时代,线上线下的融合已经成为零售业的发展趋势。微信小程序作为连接线上线下的重要桥梁,为实体店商家提供了新的商业机会。本文将探讨实体店商家为什么要做微信小程序开发,以及微信小程序能为实体店带来哪些益处。 二、微信…

新蛋跨境电商怎么快速提升Review

Review在新蛋平台的重要性不言而喻,好的评论可以给潜在的顾客以购买的信心,很多的卖家都会通过测评,来增加产品的评论来美化商品,进而带来更多的曝光量和流量,产生更多的订单,所以,对于任何一个…

ModuleNotFoundError: No module named ‘transformers.modeling_bart‘解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

SpringBoot+Vue体育场馆预约管理系统 附带详细运行指导视频

文章目录 一、项目演示二、项目介绍三、运行截图四、主要代码 一、项目演示 项目演示地址: 视频地址 二、项目介绍 项目描述:这是一个基于SpringBootVue框架开发的体育场馆预约管理系统。首先,这是一个前后端分离的项目,代码简…

浅谈Jmeter性能测试流程

不管是Loadrunner还是jmeter进行性能测试,测试流程基本上都是一样的,限制以Jmeter为例分析测试流程: 一、性能测试需求分析 一般而言,被测对象的性能需求,会在用户需求规格说明说中给出,比如单位时间内的…

MySQL主从复制和读写分离搭建

目录 一、主从复制原理 1、MySql支持从复制类型 2、主从复制的原理⭐⭐⭐ 4、mysql主从复制延迟 异步、同步、半同步复制: 二、主从复制实验 1、mysql 时间同步 1.1 主服务设置被同步的时间 1.2 两台从服务器设置时间同步(两台服务器一样配置&am…

MySQL基础1——DDL、DML、DQL及DCL的相关概念和操作

MySQL中DDL、DML、DQL及DCL的相关概念和操作 一. SQL通用语法二. SQL分类1. DDL(Data Definition Language)1.1 查询1.1.1 查询所有数据库1.1.2 查询当前数据库1.1.3 查询当前数据库所有表1.1.4 查询表结构1.1.5 查询指定表的建表语句 1.2 创建1.2.1 创建数据库1.2.2 …

【Web】vue开发环境搭建教程(详细)

系列文章 C#底层库–记录日志帮助类 本文链接:https://blog.csdn.net/youcheng_ge/article/details/124187709 文章目录 系列文章前言一、安装准备1.1 node.js1.2 国内镜像站1.3 Vue脚手架1.4 element ui1.5 Visual Studio Code 二、安装步骤2.1 下载msi安装包2.2 …

【考研数学】高等数学第五模块 —— 级数(1,常数项级数)

文章目录 引言一、常数项级数1.1 基本概念1.2 基本性质1.3 两个重要级数1.3.1 p 级数1.3.2 几何级数 1.4 正项级数及其敛散性判断1.5 交错级数及其审敛法1.6 级数的绝对收敛与条件收敛 写在最后 引言 来攻坚级数了,其实也不用这么畏难,几年前刚接触时没…

【力扣每日一题】2023.9.5 从两个数字数组里生成最小数字

目录 题目: 示例: 分析: 代码: 题目: 示例: 分析: 题目给我们两个数字数组,要我们用这两个数组里的元素组成一个数字,这个数字里需要同时拥有两个数组里的至少一个元…

10个最强大的基于生成式AI的3D建模工具

推荐:用 NSDT编辑器 快速搭建可编程3D场景 在快速发展的技术世界中,人工智能 (AI) 已经改变了游戏规则,尤其是在 3D 对象生成领域。 AI 驱动的 3D 对象生成器彻底改变了我们创建和可视化 3D 模型的方式,使该过程更加高效、准确且可…