中国大模型站起来了!甚至被美国团队反向抄袭

news2024/12/26 21:00:15

一直以来,美国是公认的AI领域强者,我国AI技术虽然差不多,但始终落人一步。然而,近日斯坦福团队的AI模型却被指控抄袭中国AI模型,这下许多人都坐不住了。

被实锤抄袭的,是斯坦福大学AI团队,他们在世界最大AI开源社区——HuggingFace上发布了一款多模态大模型,名为Llama3-V。该模型凭着低成本、高性能的优点,一经推出,火爆全网。

低成本是有多低呢?500美元即可训练一个,500美元什么概念,3000多块人民币,也就一部普通手机的价格,就能训练一个在多项基准测试中性能堪比GPT-4的模型,而且这个模型还要比那些一流顶尖模型小上100倍。

这样一个小而强,还便宜的开源模型,谁看了不热血沸腾夸上几句?所以它在推特上不停被转发,热度飞升至HuggingFace Trending 前5。

热度一起,便有人发觉不对劲,怎么这么眼熟呢?仔细一看,这跟清华系大模型创企面壁智能刚发布的MiniCPM-Llama3-V 2.5好像啊,但是该模型并没有提到任何有关清华大模型的参考或其他信息。

此时,该斯坦福团队还在嘴硬,声称没有抄袭,只是使用了一下下MiniCPM-Llama3-V 2.5的分词器。

看热闹的大家开始逐渐较真,证据越挖越多,除了构架和代码方面的相似证据,还有人发现团队成员在HuggingFace上直接导入清华大模型并改名Llama3-V。

如果硬说上面的证据都只是一系列巧合,那么Llama3-V拥有清华大模型MiniCPM-Llama3-V 2.5独有的识别“清华简”的能力总不能洗了吧。

清华简识别能力是基于非公开数据集训练的,该数据集由清华系团队逐字扫描标注,其他模型除非复制粘贴清华大模型,否则不可能有同样的能力,然而Llama3-V还真有这个能力,甚至出错都跟清华系大模型一模一样。

抄袭问题彻底实锤,斯坦福团队嘴硬无效,开始道歉并试图辩解。他们光速删库,其中两位成员还公开声明他们从头到尾都没接触过代码,甚至看都没看过,言下之意是虽然他们署名了,但此事与他们无关。

另一边的受害者面壁智能倒是很礼貌地回应了此事:他们深表遗憾,一方面认为这是受到了国际认可,另一方面更希望大家共建开放、合作、有信任地社区环境。希望团队工作被认可但不希望以这种方式被认可。

无独有偶,谷歌人工智能Gemini Pro曾声称自己是文心一言(百度大模型),让人目瞪口呆的同时还怀疑谷歌是不是也抄了中国大模型?谷歌光速修复,另有人出面解释,谷歌可能在训练时参考了文心一言的数据。

去年,OpenAI 早期投资人 Vinod Khosla还吐槽美国的开源模型都会被中国抄袭,这下回旋镖是打到自己身上了。一向被认为是落后的中国大模型却在被一直声称领先的美国团队抄袭,莫非如今地位已然反转?来看看美国AI大佬们怎么说。

斯坦福自己家的 Christopher David Manning一边指责抄袭行为一边赞扬中国开源模型的优秀。谷歌家的Lucas Beyer则在为中国模型优秀但大家却并不关注而感到遗憾。事件发生地开源AI社区HuggingFace也有负责人出来表示,中国团队做了很多令人惊奇的工作,然而总是被大家忽视。

近日的2024年人工智能向善全球峰会上,ChatGPT之父Sam Altman指出中国正积极训练大量模型,并预测中国将发展出具有自身特色的大语言模型,还会占据重要地位。

所以说,我们的AI实力不容小觑,大家也不必唯美国论,毕竟他们也在抄袭我们呢。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1814566.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

WWDC 2024及其AI功能的引入对中国用户和开发者的影响

WWDC(Apple Worldwide Developers Conference)是苹果公司一年一度的重要活动,吸引了全球开发者的关注。WWDC 2024引入了许多新技术和功能,尤其是AI功能的加入,引发了广泛讨论。本文将深入探讨中国开发者如何看待WWDC 2…

四川赤橙宏海商务信息咨询有限公司揭秘抖音电商新风口

在数字化浪潮席卷全球的今天,电商行业作为新时代经济的生力军,正以前所未有的速度发展。作为抖音电商服务的佼佼者,四川赤橙宏海商务信息咨询有限公司凭借其专业的服务团队和前瞻的市场洞察,不断刷新行业纪录,助力商家…

docker安装rabbitmq和延迟插件(不废话版)

1.下载镜像 docker pull rabbitmq:3.8-management 2.启动 docker run -e RABBITMQ_DEFAULT_USERlicoos -e RABBITMQ_DEFAULT_PASSlicoosrabbitmq -v mq-plugins:/plugins --name mq --hostname mq -p 15672:15672 -p 5672:5672 -d rabbitmq:3.8-management 3.下载对…

跨海交流丨台湾混凝土行业参访团与上海思伟软件共筑“智慧砼厂”梦 !

每一次跨越地域的握手 都是行业革新与智慧交融的序曲 台湾优质混凝土参访团 2024年5月29日,财团法人台湾营建研究院院长吕良正先生,率领着由61名行业精英组成的台湾商砼参访团,跨越海峡抵达上海,开展了一场连接两岸的学习交流活动…

苹果的股票都飙升7%了,谷歌仍在建议你往披萨上加胶水|TodayAI

最近,谷歌(Google)的人工智能再次引发了一场笑话。这次,它建议用户在披萨上添加胶水,引起了广泛关注和讨论。事情的起因源自一位互联网传奇人物Katie Notopoulos,她实际上制作并食用了一个胶水披萨&#xf…

【源码】2024最新陪诊小程序uniapp+thinkphp

20 2024最新陪诊小程序uniappthinkphp资源来源:52codes.cc 20最新陪诊小程序uniappthinkphp 简介:随着社会逐渐步进入老龄化越来越多的老年人或者不经常去医院的用户对于医院繁琐的流程很是苦劳于是陪诊这个行业开始兴起。小白陪诊开发理念&#xff0…

PS2045L-ASEMI低Low VF肖特基PS2045L

编辑:ll PS2045L-ASEMI低Low VF肖特基PS2045L 型号:PS2045L 品牌:ASEMI 封装:TO-277 最大平均正向电流(IF):20A 最大循环峰值反向电压(VRRM):45V 最大…

CVE-2019-20933-influxdb未授权访问-vulhub

1.原理 参考:https://blog.csdn.net/tqlisno1/article/details/109110644 InfluxDB 未授权访问 漏洞复现_influxdb未授权访问复现-CSDN博客 InfluxDB 是一个开源分布式时序、时间和指标数据库,使用 Go 语言编写,无需外部依赖。其设计目标是…

铝合金板件加工迎来3D视觉新时代

在制造业的浩瀚星空中,铝合金板件加工一直以其轻质、高强度、耐腐蚀的特性,扮演着举足轻重的角色。然而,随着市场竞争的加剧和产品需求的多样化,传统的加工方式已难以满足现代制造业对高效率、高精度的追求。在这个关键时刻&#…

【Java】解决Java报错:ArithmeticException during Division

文章目录 引言一、ArithmeticException的定义与概述1. 什么是ArithmeticException?2. ArithmeticException的常见触发场景3. 示例代码 二、解决方案1. 检查除数是否为零2. 使用异常处理3. 使用浮点数除法4. 使用自定义方法进行安全除法 三、最佳实践1. 始终检查除数…

RAG实操教程,LangChain + Llama2 | 创造你的个人LLM

本文将逐步指导您创建自己的RAG(检索增强生成)系统,使您能够上传自己的PDF文件并向LLM询问有关PDF的信息。本教程侧重于图中蓝色部分,即暂时不涉及Gradio(想了解已接入Gradio的,请参考官网)。相…

计算机网络-BGP路由优选原则四-优选AS_Path属性值最短的路由

一、优选AS_Path属性值最短的路由 AS_Path:这是BGP中最重要的属性之一,它记录了路由信息经过的所有自治系统。AS_Path属性帮助接收路由信息的路由器了解该路由的来源和路径。AS_Path由一系列的自治系统号组成,这些自治系统号代表了路由信息在…

SAP PP学习笔记17 - MTS(Make-to-Stock) 按库存生产 的策略70,策略59

上几章讲了几种策略,策略10,11,30,40。 SAP PP学习笔记14 - MTS(Make-to-Stock) 按库存生产(策略10),以及生产计划的概要-CSDN博客 SAP PP学习笔记15 - MTS(Make-to-St…

架构设计-跨域问题的根源及解决方式

前面文章《架构设计-web项目中跨域问题涉及到的后端和前端配置》中说明了处理跨域问题的一种方式,本文详细说明下产生跨域问题的原因及处理方式。 一、产生跨域问题的原因: 浏览器的同源策略:这是跨域问题的根本原因。同源策略是浏览器对Jav…

C语言 sizeof 和 strlen

目录 一、sizeof 和 strlen 的区别 a.sizeof b.strlen c.sizeof与strlen的区别 二、数组和指针笔试题解析(32位环境) a.一维数组( int a[ ] { 1 , 2 , 3 , 4 } ) b.字符数组 (char arr[ ] {a , b , c , d , e , f }) ( char arr[ …

吴恩达2022机器学习专项课程C2W3:实验Lab_01模型评估与选择

这里写目录标题 导入模块与实验环境配置回归1.构建并可视化数据集2.分割数据集3.重新绘制数据集3.特征缩放4.评估模型:计算训练集的误差5.评估模型:计算交叉验证集的误差 添加多项式1.构建多项式特征集2.缩放特征3.使用标准化的计训练集和交叉验证集&…

[next.js]移动端调试vconsole

一般最简单的调试方式当然是使用vconsole来输出想要的数据啦; next.js如果想使用的话需要在客户端环境里调用才行(服务端直接看cmd控制台就够了); 先安装vconsole npm i -D vconsolenext.js不像react cli或者vue一样有一个main.…

Python学习从0开始——Kaggle计算机视觉001

Python学习从0开始——Kaggle计算机视觉001 一、卷积分类器1.分类器2.训练分类器3.使用 二、卷积和RELU1.特征提取2.带卷积的过滤器定义3.激活:4.用ReLU检测5.使用 三、最大池化1.最大池压缩2.使用3.平移不变性 四、滑动窗口1.介绍2.步长3.边界4.使用 五、自定义Con…

[linux]如何跟踪linux 内核运行的流程呢

前面已经可以把内核编译出来,但是作为技术狗想看到内核是怎么运行的怎么办? 内核很多代码都是C语言写的,那简单,添加2行代码: include/linux/printk.h 529和530原来的: #define pr_info(fmt, ...) \ …

Vue07-MVVM模型

一、MVVM模型的定义 M:模型(model):对应data中的数据;V:视图(view):模版;VM:视图模型(ViewModel)Vue的实例对象。 Vue.js…