新火种AI|倒反天罡!美国名校斯坦福AI团队抄袭中国大模型

news2025/1/23 13:01:28

作者:一号

编辑:美美

中国大模型被抄袭,怎么不算是某种层面上的国际认可呢?

5月29日,斯坦福大学的一个AI研究团队发布了一个名为「Llama3V」的模型,号称只要 500 美元就能训练出一个 SOTA 多模态模型,且效果比肩 GPT-4V、Gemini Ultra 与 Claude Opus 。

论文作者一共有三位,分别是Mustafa Aljaddery、Aksh Garg、Siddharth Sharma,其中两位来自斯坦福,并且集齐了特斯拉、SpaceX、亚马逊还有牛津大学等各种机构的相关背景,在外人看来,这是典型的业界大牛。所以宣布发布这个模型的推文很快浏览量就超过了30万,这个项目也冲到了Hugging Face的首页,而且别人试用了一下,效果是真的不错。

但是这个大模型最近却“删库跑路”了,怎么回事呢?

美国名校居然抄袭中国大模型?

在Llama3V发布后没几天,在X平台还有Hugging Face上就出现了一些怀疑的声音。有人认为,Llama3V实际上是“套壳”了面壁智能在5月中旬发布的8B 多模态小模型 MiniCPM-Llama3-V 2.5,但并没有在Llama3V的工作中表达过任何对 MiniCPM-Llama3-V 2.5的致敬和感谢。

面壁智能是一家中国AI大模型公司,其核心团队成员包括来自清华大学自然语言处理与社会人文计算实验室 (THUNLP)的成员,如 CEO 李大海、联合创始人刘知远等。

对此,这个斯坦福AI团队回应称,他们「只是使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」,并「在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作」。然而求锤得锤,随着好心网友的深挖,发现这两个模型的模型结构、代码、配置文件,简直一模一样,只是改了变量名而已。

但是,网友摆出证据质疑Llama3V团队后,团队采取的做法却是删评删库,不少跟这个项目相关的网页,不管是GitHub还是Hugging Face,统统都变成了404。摆证据不听,那网友就找到的事件的另一当事方,也就是面壁智能那里,把一系列的证据都亮了出来。

面壁智能一看,就让这两个模型做了测试,发现这两个模型「不仅正确的地方一模一样,连错误的地方也一模一样」,这如果还是巧合就有点说不过去了。随后他们找到了一个关键性证据,那就是识别清华简。这个实际上是MiniCPM-Llama3-V 2.5的特有功能之一。

清华简是一种非常罕见、在战国时期写在竹子上的中国古代文字。他们在训练的时候,使用的图像是从最近出土的文物中扫描得来的,而面壁智能进行了标注。因此,可以说,除了面壁智能,其他的大模型基本上并不会具备这一功能。况且Llama3V还是美国团队研发的,按理说应该并不会特意去做这一个功能。但是,实际上,Llama3V和MiniCPM-Llama3-V 2.5的识别情况极其相似,这基本就是实锤了。

证据面前,认错态度却很迷

种种证据面前,斯坦福的这个团队依旧不承认抄袭,而是选择下架了几乎所有与Llama3V相关的项目,但却做了下面的声明:

非常感谢那些在评论中指出与之前研究相似之处的人。

我们意识到我们的架构非常类似于OpenBMB的“MiniCPM-Llama3-V 2.5,他们在实现上比我们抢先一步。

我们已经删除了关于作者的原始模型。

但随后又光速滑跪,项目其中的两位作者Siddharth Sharma以及Aksh Garg和另一位作者,来自南加利福尼亚大学的Mustafa Aljadery切割,指责其为项目编写了代码,但没有告知她们有关面壁智能的事,他们两个人更多只是帮助他推广这个模型。

这让不少网友嘲讽,靠发发推文推广下就能成为项目作者之一,这名头来得也太简单了。因此,斯坦度人工智能实验室主任Christopher Manning下场开喷,说这是“典型的不承认自己错误!”

对此,面壁智能CEO在昨天回应称“也是一种受到国际团队认可的方式”,首席科学家刘知远也表示,“该团队三人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉”。

中国大模型缺少国际团队认可

尽管本次事件具有极大的戏剧性,但实际上,这个事件之所以能引起人们的注意,主要是因为Llama3V不仅有名校名企的背书,而且确实拥有不错的实力,但这也引起了人们的反思。

谷歌DeepMind研究员、ViT作者Lucas Beyer提到,Llama3-V是抄的,但成本低于500美元,效果却能直追Gemini、GPT-4的开源模型确实存在,那就是面壁智能的MiniCPM-Llama3-V 2.5,然而,相比起Llama3V,MiniCPM得到的关注要少得多。主要原因似乎是这样的模型出自中国实验室,而非常春藤盟校。

而Hugging Face的负责人Omar Sanseviero也说,社区一直在忽视中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。

包括Qwen、Yi、DeepSeek、Yuan、WizardLM、ChatGLM、CogVLM、Baichuan、InternLM、OpenBMB、Skywork、ChatTTS、Ernie、HunyunDiT等等。

的确,从大模型竞技场上来看,中国的大模型实际上表现并不差,例如来自零一万物的Yi-VL-Plus在模型一对一PK的视觉大模型竞技场中排名第五,超过了谷歌的Gemini Pro Vision,智谱AI和清华合作的CogVLM也跻身前十。而在其他项目的比试中,中国大模型也往往榜上有名。

即使具备这样的实力,但国产大模型不仅在国际上不受待见,在国内也常常深陷舆论泥淖,被贴上了“别人一开源,我们就自主”还有“套壳”等标签。而这次事件,可以很好地说明,实际上,中国大模型中也有一些出色的,尽管面对国际领先模型仍有显著差距,但中国大模型已经从以前的nobody,成长为了AI领取的关键推动者之一,一些关于中国大模型的成见需要被打破。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1789380.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

精酿啤酒新风尚,FENDI CLUB盛宴启幕,品质生活触手可及

随着现代人对生活品质的追求日益提升,精酿啤酒作为一种新兴的生活方式,正逐渐引领潮流。在这个背景下,FENDI CLUB的盛宴盛大开启,为广大消费者带来了一场别具一格的品质生活体验。 一、精酿啤酒的崛起 精酿啤酒以其独特的口感、…

手机卡不缴纳违约金就不给注销?实用的处理方法大全!

我手机卡都不用了,为何不能注销?而且要缴纳违约金?简直是无法无天!小编在回复粉丝问题的时候,经常遇到这种情况,现在就给大家系统整理下如何处理这个问题,希望能帮助到大家! 在处理不…

段子照进现实!裁员裁到大动脉,理想被传召回被裁员工…?

你一定看过类似这样的段子吧!「公司高层换血,各个部门丢裁了个遍,终于要对财务下手,财务总监走之前,让公司补了六百万税」 还有类似这样的:「某公司裁员把一个销售主管裁了,那销售上午刚谈了个1…

vue动态加载组件import引入组件找不到组件(Error: Cannot find module)

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 http://218.75.87.38:9666/ 更多nbcio-boot功能请看演示系统 gitee源代码地址 后端代码: h…

【杂谈】AIGC之Stable Diffusion:AI绘画的魔法

Stable Diffusion:AI绘画的魔法 引言 在AI的世界里,Stable Diffusion就像一位魔法师,它能够将我们脑海中的幻想,用画笔一一描绘出来。今天,就让我们一探这位魔法师的奥秘,看看它是如何从无到有&#xff0…

Java驱动的工程项目管理系统:实现高效协作与精准管理

在工程行业的现代管理实践中,有效地协同工作和信息共享对于提高工作效率和降低成本至关重要。本文将深入探讨一款基于Java技术的工程项目管理系统,该系统采用前后端分离的架构,功能全面,旨在满足不同角色的需求,从项目…

【一小时学会Charles抓包详细教程】Charles 弱网测试与实战篇 (10)

🚀 个人主页 极客小俊 ✍🏻 作者简介:程序猿、设计师、技术分享 🐋 希望大家多多支持, 我们一起学习和进步! 🏅 欢迎评论 ❤️点赞💬评论 📂收藏 📂加关注 Charles 弱网测…

Message forwarding mechanism (消息转发机制)

iOS的消息转发机制 iOS的消息转发机制是在消息发送给对象时,找不到对应的实例方法的情况下启动的。消息转发允许对象在运行时处理无法识别的消息,提供了一种动态的、灵活的消息处理方式。 消息转发机制主要分为三个阶段: 动态方法解析快速…

基于振弦采集仪的土木工程安全监测技术研究

基于振弦采集仪的土木工程安全监测技术研究 随着土木工程的发展,安全监测成为了非常重要的一部分。土木工程的安全监测旨在及早发现结构的变形、位移、振动等异常情况,以便及时采取措施进行修复或加固,从而保障工程的安全运行。振弦采集仪作…

2024第26届大湾区国际电机博览会暨发展论坛

2024第二十六届大湾区国际电机博览会 暨发展论坛 2024第26届大湾区国际电机博览会暨发展论坛 The 26th Greater Bay Area International Motor Expo and Development Forum 时间:2024年12月4-6日 地址:深圳国际会展中心(宝安新馆&#x…

【Vue】普通组件的注册使用-全局注册

文章目录 一、使用步骤二、练习 一、使用步骤 步骤 创建.vue组件&#xff08;三个组成部分&#xff09;main.js中进行全局注册 使用方式 当成HTML标签直接使用 <组件名></组件名> 注意 组件名规范 —> 大驼峰命名法&#xff0c; 如 HmHeader 技巧&#xf…

zdppy_api 中间件请求原理详解

单个中间件的逻辑 整体执行流程&#xff1a; 1、客户端发起请求2、中间件拦截请求&#xff0c;在请求开始之前执行业务逻辑3、API服务接收到中间件处理之后的请求&#xff0c;和数据库交互&#xff0c;请求数据4、数据库返回数据5、API处理数据库的数据&#xff0c;然后给客户…

【线性代数】SVDPCA

用最直观的方式告诉你&#xff1a;什么是主成分分析PCA_哔哩哔哩_bilibili 奇异值分解singular value decomposition&#xff0c;SVD principal component analysis,PCA 降维操作 pca就是降维后使得信息损失最小 投影在坐标轴上的点越分散&#xff0c;信息保留越多 pca的实现…

Springboot二屯村钓鱼场管理系统的设计-计算机毕业设计源码58167

摘 要 在互联网时代的来临&#xff0c;电子商务的骤起&#xff0c;一时间网络进行购物这一形式备受欢迎&#xff0c;到现在&#xff0c;网购更是普及。现如今各个行业也通过网购的方式来进行拓展业务&#xff0c;增加企业的知名度以及提升业绩&#xff0c;满足了用户像网购一样…

懒人开发者的福音,轻松开发应用无需搭建服务!

近日&#xff0c;一款轰动开发圈的神器正以“太硬核了&#xff01;疯传开发圈&#xff01;”的口碑迅速走红&#xff0c;那就是Memfire Cloud&#xff01;这款一站式开发应用&#xff0c;不仅让懒人开发者尽享便利&#xff0c;更为开发者们带来了前所未有的开发体验。 对于懒人…

windows操作系统提权之服务提权实战rottenpotato

RottenPotato&#xff1a; 将服务帐户本地提权至SYSTEM load incognito list_tokens –u upload /home/kali/Desktop rottenpotato.exe . execute -Hc -f rottenpotato.exe impersonate_token "NT AUTHORITY\SYSTEM" load incognito 这条命令用于加载 Metasploi…

【安装笔记-20240529-Windows-Wireshark 网络协议分析工具】

安装笔记-系列文章目录 安装笔记-20240529-Windows-Wireshark 网络协议分析工具 文章目录 安装笔记-系列文章目录安装笔记-20240529-Windows-Wireshark 网络协议分析工具 前言一、软件介绍名称&#xff1a;Wireshark主页官方介绍 二、安装步骤测试版本&#xff1a;Wireshark-4…

力扣11. 盛最多水的容器

给定一个长度为 n 的整数数组 height 。有 n 条垂线&#xff0c;第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线&#xff0c;使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明&#xff1a;你不能倾斜容器。 示例 …

vscode编译文件夹下所有文件的配置(包含插件和 .json 文件)

文章目录 我所使用的插件.json 文件配置1. c_cpp_properties.json2. launch.json3. settings.json4. tasks.json 如何运行 我所使用的插件 红框中的五个插件是必备的&#xff0c;其中 Code Runner 插件可以在写完一个 .c 或 .cpp 文件后&#xff0c;按下 Crtl R 快捷键快速编…

Zoom | saas企业分销裂变的典范

提到视频通讯&#xff0c;相信大家不会陌生&#xff0c;国外有Skype、Google meeting、Facetime&#xff0c;国内有腾讯会议、钉钉&#xff0c;为什么在如此众多竞争对手的情况下&#xff0c;Zoom能够一马当先&#xff0c;成为行业先锋&#xff1f; 一、公司简介 Zoom是集视频…