OpenAI遭集体诉讼!窃取数百万用户信息?明星大模型变“数据小偷”!

news2024/12/24 21:32:33

   “尽管制定了购买和使用个人信息的协议,但被告采取了不同的方法:窃取。”近日,一家律师事务所用一份长达157页的诉讼将OpenAI告到法庭,指控其在利润的驱使下,窃取大量个人信息来训练人工智能模型。

   起诉书称,OpenAI对数据的抓取规模是前所未有的,该公司从互联网上窃取了约3000亿字的内容,其中包括书籍、文章、网站和帖子,甚至还包括未经同意的个人信息。这一数据窃取行为的受害人预计有数百万,潜在损失达30亿美元,违反了服务协议条款以及州和联邦的隐私和财产法。

   “通过收集数百万人以前模糊的个人数据,并将其挪用,进而开发不稳定的、未经测试的技术,OpenAI将每个人置于不可估量的风险之中,但无论采取任何负责任的数据保护和使用措施,都是不可接受的。”该律师事务所的一位合伙人Timothy K.Giordano表示。

   因此原告诉求则是,要求法院暂时冻结OpenAI产品的商业访问和进一步开发。包括允许人们选择退出数据收集,并防止其产品超越人类智能并对他人造成伤害。除了OpenAI,其背后的主要支持者微软也被列为被告。

   OpenAI并不是唯一一家借助互联网获取大量数据来训练AI模型的公司,谷歌、Meta、微软和越来越多的其他公司都在做同样的事情。但该律师事务所的一位合伙人表示,他们之所以决定追击OpenAI,是因为去年OpenAI通过ChatGPT刺激了更大的竞争对手推出自己的人工智能产品,因此他们自然是第一目标。

   随着以数据为基石的大模型百花齐放,数据安全问题正变得越来越重要。因此,OpenAI是否按照其隐私政策合法合理地收集并利用用户个人信息,以及是否有效识别并剔除其训练数据来源中“偶然”包含的个人信息,可能是该起诉讼的争议焦点所在。

   这波未平,那波又起。据路透社报道,又有两名作者在美国旧金山联邦法院起诉OpenAI,他们认为OpenAI滥用其作品来训练ChatGPT,在未经许可的情况下挖掘了数千本书的数据,侵犯了作者的版权。

   公开资料显示,今年3月,在ChatGPT被接连发现意外泄露用户聊天记录后,意大利数据保护局于3月底宣布将暂时禁用ChatGPT并对该工具涉嫌违反隐私规则展开调查。加拿大也对OpenAI“未经同意收集、使用和披露个人信息”的投诉进行调查。

   今年4月,Reddit官方宣布将对调用其API的公司收费,原因正是OpenAI、谷歌等公司利用该平台上的数据训练模型。一时之间,围绕OpenAI的训练数据问题不断被暴露。

   以大模型原理构建的生成式人工智能产品,是算力与数据加持下的“暴力美学”,数据是门槛,语料库海量数据存在高度的数据合规风险,拥有1亿用户、数十亿访问量的ChatGPT因为“树大”其问题首当其冲。

   然而,这并不是OpenAI这家公司、ChatGPT这个产品的个例,其暴露出的隐私泄露、存储敏感信息、未授权访问等数据安全问题是大模型产品落地应用后可能普遍面临的问题。自ChatGPT发布后,中国企业目前已经发布了超70个基础大模型。雨后春笋般的大模型,在接下来商用过程中如何做到数据合规,已经成为每一个产品需要面对的“必答题”。

总结

   AI的浪潮不会停歇,如何掌好前行的船舵,在企业生存与合规生产间找到平衡向前,已经成为第四次工业革命下的时代命题。对于已经发布或即将发布基础大模型的企业来说,确保数据合规将成为他们必须应对的问题之一。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/713578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UE4 TCP通信 (UE作为客户端接收字节)

在上一篇(UE4 TCP通信)基础上,实现UE客户端接收服务端推送的字节数据并解析。 效果 (注意看左上角的打印信息) 步骤 1. 首先新建一个工程,然后创建一个Actor蓝图,这里命名为“BP_TCPConnect” 打开“BP_TCPConnect”,添加如下节点: (1)当服务端与客户端断开连接时…

SpringBoot+Vue+Element-ui实现简单登录注册功能

目录 1.前端 (1)登录和注册页面 HomeView.vue RegisterView.vue (2) main.js,作请求和响应拦截 2.后端 (1)mapper.xml (2)mapper接口 (3&#xff0…

六本入选!首批“十四五”职业教育国家规划教材书目

近日,教育部办公厅公布了首批“十四五”职业教育国家规划教材书目,其中广东泰迪智能科技股份有限公司携手院校联合编写的6本教材入选该名单。 入选首批“十四五” 职业教育国家规划教材介绍 高职“十四五”职业教育国家规划教材 Python编程基础(第2版)…

平时成绩综合评价与总成绩预测模型

已排除非本人创作部分 摘要 针对问题一,我们首先对所有团队的数据做了正态性检验,共x次作业,每次作业成绩分布均可用正态分布描述。其次,我们对团队之间的成绩变化做了格兰杰因果检验,列出了成绩变化相关的一部分团队…

STL补充:STL中遵循的左闭右开原则/STL随机访问

文章目录 左闭右开原则示例:示例中erase的用法不能写成s.erase(s.begin()left)的原因 STL中支持随机访问的迭代器 左闭右开原则 在 C 中,容器(如 vector,set,map 等)的迭代器都遵循左闭右开的原则。 也就…

微服务- Eureka 注册

1. 首先从结构方面来说 单体架构:比较适合用于小型项目(像一些学生管理系统),简单方便,高度耦合 分布式架构:松耦合,扩展性好,但架构复杂,难度大,适合大型互联…

CIO40---3个亿数字化供应链实战

2019年某天,我被总裁叫到办公室,我当是VP A:企业情况 一家A股上市 市值150亿,年销售50亿, 员工4000人,全国4个工厂 家庭企业,高管老人多 经销商模式,总代模式,工程…

unserialize3

看着这个源码长度,就觉着比较简单 本题就一个__wakeup方法需要绕过,但是不对哦没有提示也不知道该参数得多少呀 本来都要复制进编译器写了,发现源码闭合有点问题,可能是做了隐藏 解题步骤 实在找不到了,就尝试了一下fl…

81、基于STM32单片机的颜色识别 TCS3200 RGB 检测系统设计(程序+原理图+PCB源文件+参考论文+开题报告+任务书+设计资料+元器件清单等)

摘 要 随着现代工业生产向高速化、自动化方向的发展,色彩识别广泛应用于各种工业检测和自动控制领域,而生产过程中长期以来由人眼起主导作用的颜色识别工作将越来越多地被相应的颜色传感器所替代。如:各种物体表面颜色识别(产品包…

什么是三极管推挽电路

这是一个三极管推挽电路,上面是一个NPN的三极管,下面是一个PNP的三极管。 当输入信号为VCC时,上面的三极管导通,下面的三极管截止,输出信号为VCC-0.7V,这个0.7V就是上面NPN三极管BE间的导通压降 当输入信号…

Spring Bean 作用域的定义

在 Spring 配置中,我们可以通过 scope 属性来定义 Spring Bean 的作用域,可以接受 5 个内建的值,分别代表 5 种作用域类型,下面给大家详细总结一下: 1、singleton,用来定义一个 Bean 为单例,也…

【MATLAB第50期】基于MATLAB的RELM-LOO多输入单输出回归分类预测算法与RELM及ELM进行对比

【MATLAB第50期】基于MATLAB的RELM-LOO多输入单输出回归&分类预测算法与RELM及ELM进行对比 引言 RELM-LOO即通过LOO计算效率方法对其RELM模型正则化C系数进行寻优。 对于进化算法寻优来说, 结果更稳定。 可参考以下文献: [1] Shao Z , Er M J , W…

小红书测评类产品种草文案怎么写?品牌方必看

小红书逐渐成为了越来越多年轻人购物和分享的主流平台。测评类产品的种草文案尤为重要,因为它可以帮助消费者更好地了解产品的性能、使用方法以及适用场景,从而为购物决策提供参考。这个时候将某个产品植入进去,就会更容易被用户所接受&#…

C++高级编程01

目录 1、双冒号作用域运算符 2、namespace命名空间 3、using声明以及using编译指令 using 声明 4、C对C语言的增强 4、const链接属性 5、const分配内存情况 6、尽量用const代替define 7、引用 1、双冒号作用域运算符 ::代表作用域 如果前面什么都不添加 代表全局作用…

K8S资源控制器管理

资源控制器 1 资源控制器1.1 控制基础1.1.1 控制原理1.1.2 控制对象 1.2 标签选择器1.2.1 标签基础1.2.2 标签选择器 1.3 副本控制器1.3.1 RC&RS1.3.2 Deploy基础1.3.3 Deploy进阶1.3.4 DaemonSet1.3.5 任务控制器 1.4 监视控制器1.4.1 metrics服务1.4.2 HPA实践 1 资源控制…

Git 推送教程

一般 add commit push即可。Git全流程: git init #初始化仓库 git add .文件名 #添加文件,添加全部文件可以直接写. git commit -m "信息" #提交到本地仓库 git remote add origin 远程仓库地址 #链接远程仓库,创建主分支 git p…

【每日一题】2. 两数相加

【每日一题】2. 两数相加 2. 两数相加题目描述解题思路 2. 两数相加 题目描述 给你两个 非空 的链表,表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的,并且每个节点只能存储 一位 数字。 请你将两个数相加,并以相同形式返回一…

MySQL的体系架构

文章目录 前言MySQL的Server层MySQL的存储引擎1)InnoDB 存储引擎2)MyISAM 存储引擎3)Memory 存储引擎 前言 在学习一种事务之前,我们需要先了解事物的基本组成结构,清楚了事物的基本组成结构之后,我们才能…

QCC51XX---chain是什么?

QCC51XX---系统学习目录_嵌入式学习_force的博客-CSDN博客 高通的DSP对很多人来说还是比较难以理解与操作的,DSP里最基本的是要认识音频的处理链路,也就是平台中的chain。他是由多个模块(operator)连接起来的,连接的方法sink和earbud有些不同,这里会从6.x开始sink的chain…

shell判断程序是否运行

一、需求 服务部署在linux上,要求服务器上的服务可以一直保持正常运行 二、问题 在linux上部署的微服务,不知道什么原因过一段时间就自己停掉了,无法启动。 三、解决办法 添加angle守护进程,通过定时执行脚本来判断程序是否运行…