“大模型高考状元”花落谁家?高考前夜这个AI火了

news2025/1/11 4:12:58

“大模型高考元年”来了!2024高考刚刚落幕,市面上的大模型几乎都被提溜出来,在公众围观下角逐“AI高考状元”。

就在高考前夜,有一家大模型公司放了大招。6月7日凌晨0点左右,阿里云发布通义千问第二代开源模型Qwen2。几小时后,Qwen2-72B 拿下开源大模型赛场的“高考状元”,超越Llama3-70B等上百个对手,在全球最权威的开源模型榜单Open LLM Leaderboard 夺冠。

亮相即登顶,Qwen2-72B展示出中国开源模型的强大竞争力,不仅超越美国的Llama3,也盖过了文心4.0等一众中国闭源模型。事实上,在上海人工智能实验室推出的模型测评权威榜单OpenCompasss上,通义千问上一代开源模型Qwen1.5-110B已领先于文心4.0等闭源模型,而Qwen2性能相比Qwen1.5又有大幅提升,继续扩大领先优势。

更强的免费开源模型上架,全球开发者喜出望外。在魔搭和Hugging Face等开源社区,Qwen2模型开源后四天下载量近百万。

图片

Qwen2-72B在十多个权威测评中获得冠军,超过美国的Llama3-70B模型

近期,网友们正在让Qwen2-72B与各大模型组局对战,测评发现,Qwen2-72B不仅能写高考作文,还能回答弱智吧问题,比如流畅解答“祖父悖论”逻辑题,巧妙回应网友的挖坑提问“如何炒一盘麻辣螺丝钉”,甚至还能向人类输出情绪价值。

这个AI除了会写作文,还懂人情世故

大模型进入“新手村”,按照江湖惯例,要先考考弱智吧问题,首先是“祖父悖论”逻辑题:“为何爸妈没叫我参加他们的婚礼?”参赛选手是Llama3和Qwen2。Llama3一本正经地从社会风俗、被邀请者年龄是否适合参加婚礼等方面,给出了不邀请的原因。Qwen2则直截了当回答,“因为你当时还没有出生呢!”说完还不忘安慰网友——“虽然你没有亲历他们的婚礼,但你可以通过照片、视频或他们的回忆来了解那个特别的日子”。

图片

有网友想捉弄AI,“挖坑”分别问Qwen2和智谱AI怎么做“麻辣螺丝钉”。智谱AI一本正经地提出,麻辣螺丝钉是一道受到很多人喜爱的家常菜,Qwen2赶紧制止网友:螺丝钉是五金配件,食用需谨慎,接着还贴心提示,如果实在想吃,咱大可吃麻辣花生或者麻辣豆腐干。

图片

还有网友用博大精深的中文近似名词来测试大模型的反应,对大模型输入“货拉拉拉不拉拉布拉多”,Qwen2快速识别出,这是对品牌名“货拉拉”、狗品种名“拉布拉多”以及动词“拉”在玩梗,Llama3则几乎把每个字都拆开来解读,“字面”地理解了“货拉拉拉不拉拉布拉多”。

图片

当然,有时候AI还为我们指出了某句话中我们未曾察觉的其他可能。比如,当输入《夏洛特烦恼》中的经典台词“我管你叫爸,你管我叫哥”时,Qwen2一眼看出这是某种朋友或兄弟间的调侃。文心一言则长篇大论梳理了“爸”和“哥”的称谓使用方式,并说“无法确定这两个人的真实关系”。

图片

还有网友祭出了人类都不一定能处理妥当的“人情世故”题,比如“共有5杯水,来了1亿个领导,怎么分?”Qwen2给领导们安排得明明白白。

图片

除了上述案例,网友还用AI来做数学题、写代码,Qwen2的表现也胜过绝大部分闭源模型。感兴趣的读者可以登录上海人工智能实验室与魔搭社区联合推出的大模型竞技场Compass Arena,在几十款主流大模型中任选其他模型和Qwen2组队对战。

这非常符合Qwen系列模型的中文含义,“通义”,本意就为“通情,达义”。相比于上一代模型,Qwen2不仅有了更强的代码、数学、推理、指令遵循、多语言理解等能力。通义千问团队在技术博客中透露,大规模预训练后,团队对模型进行了精细的微调,以提升其智能水平,让其表现更接近人类。模型学会对齐人类价值观,它也随之变得更加对人类有帮助、诚实以及安全。

在Qwen1.5系列中,只有32B和110B的模型使用了GQA。这一次,所有尺寸的模型都使用了GQA,这能让模型推理加速,也能让用户降低显存占用。当然,考虑到多语言的需求,通义千问团队还提升了模型的多语言能力,除中英文以外,专门对德语、日语、法语、西班牙语、葡萄牙语、意大利语等27种语言进行了增强。

图片

开源,让AI变得更“通情达义”

**
**

Qwen2 、Llama3等顶级开源模型的出现,正在改变大模型江湖开闭源两个阵营的力量对比。

事实上,开源和闭源一直都是业界关注的话题。用人话讲,开源即代表着模型的源代码、模型权重等都公开可用,这些模型可以供使用者下载、使用、二次开发。大模型极高的训练和迭代成本,让目前绝大部分的AI开发者和中小企业都无法负担,而开源则可以帮他们省去基础模型的训练成本,更好地围绕特定场景进行模型开发和应用开发。

不过,在一些坚持闭源逻辑的厂商看来,“开源追不上闭源”。在接受媒体采访时月之暗面创始人杨植麟就曾表示,闭源是一个对市场的整合,会有人才聚集和资本聚集,最后一定是闭源更好。不过杨植麟说,开源和闭源在大模型领域里会是互补的关系。“开源可以支持开发者去尝试各种创新的应用,而且在开发过程中可以对数据、训练过程、环境部署等合规性有更高的要求,场景也会更灵活。而闭源的话也会有自己的价值,比如说像未来的很多超级应用的入口,不管是生产力端还是娱乐消费端,都会有以闭源为核心的超级应用出现。”

周鸿祎则坚定地“相信开源的力量”,他曾表示“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。” 周鸿祎还认为,开源社区聚集的工程师和科学家的数量是闭源公司的数百倍。所以开源大模型只做了一年就已经超过了GPT-3.5。他认为,未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。

南都记者关注到,以Meta为代表的大模型厂商最先推动了模型开源风潮。自那以后,多家国内大模型头部厂商,比如阿里云、智谱AI、零一万物等厂商都推出了开源模型。

在国内,阿里云是首个宣布开源自研模型的科技大厂。早在2023年8月,阿里云就推出通义千问第一代开源模型Qwen,并沿着“全模态、全尺寸”开源路线陆续推出几十款款模型。2024年2月,1.5代开源模型Qwen1.5发布;不到4个月后,Qwen2开源。

开源,正在让AI迭代得更快、更智能,也更“通情达义”。可以看到,大模型的开源除了能加快模型落地应用,还能收获开源社区海量的优质反馈,从而反哺到模型本身的迭代升级中。阿里云就多次表示,通义千问持续不断地性能升级,很大程度得益于开发者社区的驱动。

更多的反馈-更好的模型,这个良性循环让Qwen从大模型赛场的外围步入核心地带,成为全球开发者在Llama之外的又一主流选项。不久前,OpenAI创始人奥特曼就在X上转发了一条OpenAI研究员公布的消息,称GPT-4o在测试阶段登上了Chatbot Arena(LMSys Arena)榜首位置,这个榜单是OpenAI唯一认可证明其地位的榜单,而Qwen也是当时唯一上榜的国内模型。

图片

开源策略与生态搭建

谈及选择开源策略的原因,阿里云首席技术官周靖人曾表示,大模型的落地应用需要先有繁荣的生态,而开源是打造生态的最佳途径。阿里云选择选择开源,是希望把顶尖的AI技术开放给企业和开发者,让大家用最低的成本、最高的效率触达优质模型,更快地推进AI技术一系列的创新和发展。

周靖人认为,未来的大模型市场“一定不是one size fits all”,不可能由一个模型服务万物,也不会只有一种服务方式。只有把选择权交到开发者,交给企业,才能更加有效地让AI能力落地在各个业务场景里。

通义千问先后开源了从0.5B到110B的各种尺寸的模型,小尺寸模型适配手机、智能耳机、电脑等端侧设备,大尺寸模型足够开展科研级、企业级的应用。中小企业和开发者要做的选择,事实上是基于各自的场景,在模型的性能和成本之间寻找最佳平衡,周靖人相信:“他们会根据自己的实际场景问题的复杂度,比如调用频次、资源配比等,来做符合于他们业务场景的选择。”

Qwen系列模型的全球爆火,正是中小企业和开发者主动选择的结果。近一个月内,Qwen系列模型总下载量翻倍,累计下载量已突破1600万次。在海内外开源社区,至少有超过1500款基于Qwen二次开发的模型。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1813989.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Spring:element-ui中的tree、树形结构的实现

一、三层架构代码 可能很多人都没写过关于tree的代码&#xff0c;今天我来演示一下&#xff0c;步骤很全&#xff0c;放心观看。 首先来看element-ui官网关于tree的示例&#xff1a; <el-tree :data"data" :props"defaultProps" node-click"hand…

利用Pandas数据过滤减少运算时间

当处理大型数据集时&#xff0c;使用 Pandas 可以提高数据处理的效率。Pandas 提供了强大的数据结构和功能&#xff0c;包括数据过滤、筛选、分组和聚合等&#xff0c;可以帮助大家快速减少运算时间。 1、问题背景 我有一个包含37456153行和3列的Pandas数据帧&#xff0c;其中…

利用泽攸科技原位TEM技术揭示真空击穿过程中电场与电极材料相互作用

在高能物理设备和许多其他设备中&#xff0c;真空击穿&#xff08;VBD&#xff09;现象对高能物理设备的性能造成了严重的阻碍&#xff0c;包括真空断路器、X射线源、聚变反应堆以及粒子加速器等。然而由于对导致VBD的机制缺乏足够的科学理解&#xff0c;这些问题至今无法得到缓…

【stable diffusion】ComfyUI扩展安装以及点开后页面空白问题解决办法

扩展安装 虽然大家都推荐将扩展包直接放到extension文件夹的方式,但我还是推荐直接在sd webui的扩展处下载,酱紫比较好维护一点,我个人感觉。 按照上图顺序点击会出现”URLError: <urlopen error [Errno 11004] getaddrinfo failed>”的情况,问题不大,打开一个git…

隐藏字符串中间字符,一个公共方法解决产品的所有设想

说到隐藏字符串中间字符&#xff0c;就是 13833321212 给用户显示成 “138***1212” 这样子呗&#xff0c;你是不是也是这样认为的。我刚开始拿到需求&#xff0c;就是这样认为的。但是越到后来发现越不对劲儿。来看看我的隐藏历程吧。 一 产品来了 1 加星第一步 产品刚开始…

ThinkBook 16 2024 Ubuntu 触控板问题解决

sudo insmod goodix-gt7868q.ko sudo cp local-overrides.quirks /etc/libinput/local-overrides.quirks sudo systemctl restart gdm 有偿解决&#xff0c;无效退款

R语言使用survivalsvm包进行支持向量机生存分析

1995年VAPINK 等人在统计学习理论的基础上提出了一种模式识别的新方法—支持向量机 。它根据有限的样本信息在模型的复杂性和学习能力之间寻求一种最佳折衷。 以期获得最好的泛化能力.支持向量机的理论基础决定了它最终求得的是全局最优值而不是局部极小值,从而也保证了它对未知…

LeetCode题练习与总结:二叉树中的最大路径和--124

一、题目描述 二叉树中的 路径 被定义为一条节点序列&#xff0c;序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中 至多出现一次 。该路径 至少包含一个 节点&#xff0c;且不一定经过根节点。 路径和 是路径中各节点值的总和。 给你一个二叉树的根节点 ro…

swift微调牧歌数据电商多模态大语言模型

大规模中文多模态评测基准MUGE_数据集-阿里云天池多模态理解和生成评估挑战榜(MUGE)是由阿里巴巴达摩院智能计算实验室发起,由阿里云天池平台承办,并由浙江大学、清华大学等单位共同协办。 Mhttps://tianchi.aliyun.com/dataset/107332微调的是牧歌数据集,结果都不好,记录…

C语言学习系列:笔记列表

1&#xff0c;精神建设&#xff1a;为什么要学C语言以及如何学习C语言 2&#xff0c;C语言学习系列&#xff1a;GCC编译器Windows版本MinGW-w64的安装教程 3&#xff0c;C语言学习系列&#xff1a;初识C语言 4&#xff0c;C语言入门学习系列&#xff1a;基本语法

工业和信息化部电子工业标准化研究院人工智能从业人员“计算机视觉设计开发工程师”专项培训(第四期)

注&#xff1a;若出现无法显示完全的情况&#xff0c;可搜索“人工智能技术与咨询”查看完整文章 声明: 公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨&#xff0c;并不意味着支持其观点或证实其内容的真实性。版权归原作者所有&#xff0c;如转载稿涉及…

面试-NLP八股文

机器学习 交叉熵损失&#xff1a; L − ( y l o g ( y ^ ) ( 1 − y ) l o g ( 1 − ( y ^ ) ) L-(ylog(\hat{y}) (1-y)log(1-(\hat{y})) L−(ylog(y^​)(1−y)log(1−(y^​))均方误差&#xff1a; L 1 n ∑ i 1 n ( y i − y ^ i ) 2 L \frac{1}{n}\sum\limits_{i1}^{n}…

软件3班20240612

加粗样式 maven 根据的使用案例 package com.yanyu;public class Demo02 {// 设置 一个 求 两个数 的 和 的 方法 sumpublic void sum(int num1, int mum2) {System.out.println("两个数 的 和 是 &#xff1a;" (num1 mum2));} }import com…

盲盒小程序推广与运营策略的挑战

随着盲盒经济的兴起&#xff0c;越来越多的商家开始关注并尝试开发盲盒小程序。然而&#xff0c;在推广和运营盲盒小程序的过程中&#xff0c;我们也不可避免地会遇到一些挑战。下面&#xff0c;我将就用户获取、留存以及活跃度提升等方面&#xff0c;探讨这些挑战及可能的应对…

常用环境部署(十四)——Docker部署MinIO

一、安装Docker及Docker-compose https://blog.csdn.net/wd520521/article/details/112609796 二、Docker-compose部署MinIO 1、在服务器创建/data/minio目录 mkdir -p /data/minio 2、 docker-compose.yml脚本创建 vim /data/minio/docker-compose.yml &#xff08;1&a…

使用易备数据备份软件,简单快速地备份 Oracle 数据库

易备数据备份软件能够以简单高效的方式&#xff0c;实现对 Oracle 数据库的保护。 易备数据备份软件数据库备份功能的关键特性 自动保护网站数据库及应用程序实时备份&#xff0c;不需要任何中断或数据库锁定基于日期和时间的备份任务计划可恢复到一个已存在的数据库或创建一…

【java计算机毕设】图书商城管理系统MySQL springboot vue html maven送文档

1项目功能介绍 【java计算机毕设】图书商城管理系统 Java Spring Boot vue HTML MySQL 赠送文档 PPT 2项目简介 系统功能&#xff1a; 图书商城管理系统包括管理员和用户两种角色。 管理员的功能包括在个人中心修改个人信息&#xff0c;以及在基础数据管理中管理会员等级类型和…

STM89C51开发学习1

环境安装&#xff1a; 使用Keil uVision4环境进行对51单片机的学习。 在进行使用之前先用keygen进行对软件的破解防止后续发生不必要的问题。 开发环境下载完毕后&#xff0c;检查电脑是否有串口驱动&#xff08;可以在网上下载&#xff09; CH340驱动。 安装stcai-…

小程序视图渲染数据和部分事件的绑定

今天依旧使用这个目录进行教学 数据的渲染 在 index.js的 page中定义一个data对象结构是这样的 Page({data:{name:张三} }) 在index.wxml 中 利用模板语法进行渲染 <view >{{name}}</view> 注意这个模板里边不能使用js的方法 要循环渲染数组&#xff0c;如 在…

目标检测中的anchor机制

目录 一、目标检测中的anchor机制 1.什么是anchor boxes&#xff1f; 二、什么是Anchor&#xff1f; ​编辑三、为什么需要anchor boxes&#xff1f; 四、anchor boxes是怎么生成的&#xff1f; 五、高宽比&#xff08;aspect ratio&#xff09;的确定 六、尺度(scale)的…