斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

news2024/12/23 19:03:43

6月4日,两名斯坦福大学生Aksh Garg和Siddharth Sharma,承认抄袭清华和面壁智能联合开发的MiniCPM-Llama3-V2.5(以下简称V2.5)多模态大模型事件,并在社交平台公开道歉、删掉开源项目。

该抄袭事件也得到了斯坦福大学AI实验室主任Christopher Manning的认证,表扬了国内大学、企业对开源大模型的贡献,并表示对该事件毫不知情。

V2.5开源地址:https://github.com/OpenBMB/MiniCPM-V?tab=readme-ov-file

图片


两位同学发的道歉信一样

整个抄袭事件全过程

其实昨天这个事情在国内相当炸裂,登上了好几个平台的热搜榜首,「AIGC开放社区」就根据多方已经证实的内容,为大家梳理一下抄袭事件的全过程。

5月29日,斯坦福大学的AI团队宣称,他们开源了一款名叫Llama3-V的多模态模型(https://github.com/mustafaaljadery/llama3v已删除无法访问),只需要500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。

发布没多久,Llama3-V便成为Hugging Face上非常火热的一款开源产品。

6月2日,有开发者质疑Llama3-V抄袭国内清华和面壁智能联合开源的最新项目V2.5,主要抄袭的证据有以下几点。

图片

1)特色功能一样:V2.5的特色功能之一是可以识别“清华简”,这是中国战国时期写在竹子上的一种非常特殊且罕见的中国古文字。

而Llama3-V居然也能识别。但这个训练数据是清华2500多张竹简中扫描下来的,并非是从公开训练数据中提取的。

图片

2)Llama3-V的模型架构、代码、配置文件、分词器基本一样,只是增加了高斯噪声、变量名称不一样而已。

图片

3)重叠度高达87%:为了验证是否抄袭,用户将V2.5与其他几个基于Llama3的多模态模型进行了比较,例如,Bunny-Llama-3-8B-V、Bunny-Llama-3-8B-V,模型的重叠率为0。但与Llama3-V进行比对时,重叠率居然高达87%。

此外,两者还有非常相似的误差分布。Llama3-V和V2.5分别做出了236个和194个错误预测,而重叠部分为182个。如果是原创模型根本不会有如此高的重叠度

图片

4)犯的错误一样:用户将Llama3-V用于测试WebAgent时,居然与V2.5犯的错误一样。但V2.5使用的是内部从未公开过的训练数据,这也再一次证明Llama3-V的抄袭行为。

图片

网上还罗列出了不少抄袭的证据,但上面4点是最致命的,基本都是同一架构、训练数据才能犯的错误Llama3-V居然全中了。

相当于两个人的脸型、眼睛、鼻子、嘴巴几乎一模一样,只是你的头发比我多一些,难道就不认我这个秃头兄弟了吗~

斯坦福AI实验室主任证实

起初这个抄袭事件并没有引起太大关注,但随着证据越来越多被实锤,就连斯坦福大学AI实验室主任Christopher Manning也下场道歉了,表示,犯了错误就要勇于承!

同时表扬了清华大学对开源项目的贡献,而他自己对该事件毫不知情。但是有人指出,这位教授在6月3日是知道该事件的。

图片

两位学生迫于各界压力,昨天在社交平台进行了公开道歉,但是态度并不是很诚恳。首先,他们居然使用了同样的道歉信,难道不需要仔细说明一下你在这个项目的角色、最初想法以及为什么要这么做吗?

图片

还有一个就是甩锅,两位公开道歉的学生表示,他们只是负责该模型的社区宣传,实际写代码的是一位叫Mustafa Aljadery的。

图片

这就更严重了,既然你们只是负责宣传,那为啥在作者栏那里加上自己的名字呢?在宣发的时候难道不验证一下论文和项目吗?并且表示对V2.5这个开源项目毫不知情。

都是成年人,既然犯错了,就应该像个爷们一样勇敢承担起来,下次改过就可以了。如果试图继续掩盖,只会越描越黑。

这个抄袭事件也折射出了我国在AI芯片制裁的大背景下对大模型开发、训练的无奈,没有超强GPU集群支撑,只能从算法、脚骨、训练数据去打磨。

同时我们的大模型开源生态也被低估了,通义千问、面壁智能、百川智能等一大批优秀的开源项目已经获得了世界的认可并迅速崛起。

图片

本文素材来源网络、斯坦福社交平台,如有侵权请联系删除

END

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1789258.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计算机毕业设计】302微信小程序的充电桩管理系统

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…

「漏洞复现」用友NC pagesServlet SQL注入漏洞(XVE-2024-13067)

0x01 免责声明 请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,作者不为此承担任何责任。工具来自网络,安全性自测,如有侵权请联系删…

LangChain Agent 最新教程详解及示例学习

LangChain Agent的终极指南,本教程是您使用 Python 创建第一个agent的重要指南,请立即开始你的 LLM 开发之旅。 一、什么是LangChain Agent(代理) LangChain中代理背后的想法是利用语言模型以及要执行的一系列操作。代理正在使用…

`THREE.BufferGeometry` 是 Three.js 中一个强大的类,用于表示几何体数据。

demo案例 THREE.BufferGeometry 是 Three.js 中一个强大的类,用于表示几何体数据。与传统的 THREE.Geometry 类相比,它使用缓冲区来存储顶点数据,从而在性能上有显著的提升。以下是 THREE.BufferGeometry 的详细说明,包括其输入参…

ARM服务器在云手机中可以提供哪些支持

ARM服务器作为云手机的底层支撑,在很多社媒APP或者电商APP平台都有着很多看不见的功劳,可以说ARM扮演着至关重要的底层支持角色; 首先,ARM 服务器为云手机提供了强大的计算能力基础。云手机需要处理大量的数据和复杂的运算&#x…

Sentinel不使用控制台基于注解限流,热点参数限流

目录 一、maven依赖 二、控制台 三、基于注解限流 四、热点参数限流 五、使用JMeter验证 一、maven依赖 需要注意,使用的版本需要和你的SpringBoot版本匹配!! Spring-Cloud直接添加如下依赖即可,baba已经帮你指定好版本了。…

沃尔玛、美客多跨境平台自养号全攻略:防关联环境系统搭建与养号技巧

在沃尔玛、美客多等跨境平台进行自养号的过程中,环境系统的选择和账号的养育是至关重要的。以下是我对这两个方面的经验和技巧的总结: 环境系统: 市面上有很多环境系统可供选择,但质量参差不齐。为了实现足够高的伪装度&#xff…

服务器数据恢复—raid5阵列上分配的卷被删除后重建如何恢复被删除卷的数据?

服务器存储数据恢复环境: 某品牌FlexStorage P5730服务器存储,存储中有一组由24块硬盘组建的RAID5阵列,包括1块热备硬盘。 服务器存储故障: 存储中的2个卷被删除,删除之后重建了一个新卷。需要恢复之前删除的一个卷的数…

高舒适性气膜网球馆的注意事项—轻空间

气膜网球馆以其高舒适性、智能恒温等特点,成为现代体育场馆的新宠。在国家提倡全民健身的背景下,各地气膜网球馆如雨后春笋般涌现。然而,在建设和使用气膜网球馆时,需要特别注意以下几点: 1. 避免随意拆装 气膜网球馆…

Three.js——tween动画、光线投射拾取、加载.obj/.mtl外部文件、使用相机控制器

个人简介 👀个人主页: 前端杂货铺 ⚡开源项目: rich-vue3 (基于 Vue3 TS Pinia Element Plus Spring全家桶 MySQL) 🙋‍♂️学习方向: 主攻前端方向,正逐渐往全干发展 &#x1…

[数据集][目标检测]剪刀石头布检测数据集VOC+YOLO格式1973张3类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):1973 标注数量(xml文件个数):1973 标注数量(txt文件个数):1973 标注…

SpringBoot接口防抖(防重复提交)

SpringBoot接口防抖(防重复提交) 概念 Spring Boot接口防抖(Debouncing)的概念是指在处理请求时,通过一定的机制来防止用户频繁触发同一接口请求,以防止重复提交或频繁请求的情况发生。 在Web应用中&…

Jupyter Notebook 切换虚拟环境

具体流程: 1. 查看当前jupyter notebook的环境: 从上面可看出当前jupyter只有一个python 3的环境。 2、 在终端中切换至想要添加的环境: 2.1 激活你要添加的环境 conda activate sf 2.2 在当前环境中安装ipykernel conda install ipyke…

手把手教你【如何使用Vue3+Spring Boot实现一个视频点播功能】

一、简介 本项目是一个实际的视频点播应用,采用了Vue3和Spring Boot作为主要技术栈。旨在帮助开发者通过学习和参考实现思路来掌握相关知识。它主要解决了阿里云视频点播服务的接入、视频基础信息管理以及上传视频后获取视频ID等关键流程,涉及前后端交互…

【最新支持】OpenCV实验大师C++ SDK支持YOLOv10了推理了

学习《OpenCV应用开发:入门、进阶与工程化实践》一书 做真正的OpenCV开发者,从入门到入职,一步到位! OpenCV实验大师C SDK YOLO系列模型推理SDK 支持 YOLOv5、YOLOv8、YOLOv10系列网络从推理与部署 基于OpenCV DNN 与OpenVINO实…

Echarts 在指定部分做文字标记

文章目录 需求分析1. demo12. demo22. demo3 定位解决需求 实现在Echarts的折线图中,相同Y值的两点之间显示’abc’ 分析 1. demo1 使用 ECharts 的 markLine 功能来在相邻两个点之间添加标记。其中,我们通过设置标记的 yAxis 和 label 来控制标记的位置和显示内容。最后…

前端 CSS 经典:3D Hover Effect 效果

前言&#xff1a;有趣的 3D Hover Effect 效果&#xff0c;通过 js 监听鼠标移动&#xff0c;动态赋值 rotateX&#xff0c;rotateY 的旋转度来实现。 效果图&#xff1a; 代码实现&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta …

【NoSQL数据库】Redis简介

Redis Redis简介 Redis关系型数据库和非关系型数据库Redis 简介redis速度快的原因 Redis 配置Linux 源码安装redis命令工具 关系型数据库和非关系型数据库 关系型数据库&#xff08;Relational Database&#xff09;和非关系型数据库&#xff08;Non-Relational Database&…

在仓库新建分支之后,Vscode里面看不到

问题描述 在仓库新建了分支 但是在Vscode里面看不到这个新建的分支 解决 参考文章&#xff1a;http://t.csdnimg.cn/V92a3 在终端输入&#xff1a;git remote update origin --prune 命令解释 git remote update origin --prune 是一个 Git 命令&#xff0c;用于更新远程…

小猪APP分发:让APP封装变得如此简单

你是否曾经在开发完一款APP后&#xff0c;为了封装、分发而头疼不已&#xff1f;别担心&#xff0c;小猪APP分发来拯救你了&#xff01;这款神器不仅能让你的工作变得更加高效&#xff0c;还能让你的APP在各大平台上顺利分发。 小猪APP封装www.ppzhu.net APP封装的挑战 开发一…