阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

news2026/2/15 16:46:10

6月27日凌晨，全球著名开源平台huggingface（笑脸）的联合创始人兼首席执行官Clem在社交平台宣布，阿里最新开源的Qwen2-72B指令微调版本，成为开源模型排行榜第一名。

他表示，为了提供全新的开源大模型排行榜，使用了300块H100对目前全球100多个主流开源大模型，例如，Qwen2、Llama-3、mixtral、Phi-3等，在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。

重新评估的原因是，目前开发者太注重排行榜的名次，在训练过程中使用了很多评估集的数据，并且之前的评估流程对于那些模型来说太简单了，所以，本次给这些模型加大了难度，想看看它们的真正实力。

结果显示，阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者，中国在全球开源大模型领域处于领导地位。

Qwen-2开源地址：https://huggingface.co/Qwen/Qwen2-72B-Instruct

根据排行榜的数据显示，Meta开源的Llama-3-70B指令微调版本位列第2；阿里的Qwen2-72B基础版本排名第3；Mistralai的Mixtral-8x22B指令微调版本排名第4；

微软最新开源的小参数模型Phi-3-Medium-4K 14B排名第五，这说明小参数模型经过高质量数据集的预训练，同样能实现媲美大参数模型的能力。

中国零一万物最新开源的Yi-1.5-34B-Chat版本排在了第六名；知名大模型平台Cohere开源带RAG功能的Command R+ 104B排名第7；

英伟达开源的Smaug-72B-v0.1曾经排名第一，但在新的排行榜只有第8名；第9和第10名，全部都是阿里之前开源的Qwen1.5基础和Chat版本。

所以，全新排行榜的前10名竞争非常激烈，很多都是当过之前排行榜第一名的高手，相当于大模型界的“华山论剑”。

阿里开源的4款大模型傲视群雄，无愧于“中神通”的名号，这也充分说明中国对全球开源大模型的重要贡献以及领导地位。

对于这个排名结果，StabilityAI的研究总监，19岁便获得博士学位的Tanishq表示，他很早就说过中国在开源大模型领域非常有竞争力，除了Qwen2，还有零一万物、InternLM、Deepsseek等很多知名的开源模型。

关于中国在开源大模型领域处于落后状态简直可笑，相反，他们却处于领导者地位。

对于阿里Qwen-2取得如此高的成绩，确实让很多人感到惊讶，但事实结果就是这样。

他们也把希望寄托在Meta身上了，赶紧发布点新模型和Qwen-2再来一次大PK。

其实，不只是huggingface，曾经就有人发布过ElyzaTasks100性能评测，Qwen2-72B的指令微调版本也是性能最高的开源大模型，仅次于OpenAI的GPT-4o，高于谷歌的Gemini1.5Pro。

其实在与OpenAI、Anthropic这两家著名闭源大模型平台进行PK时，Qwen2-72B指令微调版本也丝毫不落下风，也是中国唯一进入美国评估标准前10的国内公司。

希望阿里砥砺前行，更上一层楼。期待未来发布更多高性能的开源大模型，造福全人类。

END

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1869623.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

KubeCon 香港：移动云与云猿生联合议题《在没有专用 Operator 的情况下管理数据库集群》

KubeCon 香港：移动云与云猿生联合议题《在没有专用 Operator 的情况下管理数据库集群》

KubeCon CloudNativeCon 开源峰会 AI_dev 中国大会将于 2024 年 8 月 21 日至 23 日在香港举行。来自全球的云原生技术专家与爱好者在这里相会，探讨云原生领域的技术创新与最佳实践。此外，本次 KubeCon CloudNativeCon 和开源峰会将与 AI_dev&#x…

阅读更多...

使用ESP32开发一款chat机器人

使用ESP32开发一款chat机器人

目的：使用语音对话的方式实现和ai机器人对话，核心硬件如下主板： ESP32S3 语音（拾音器-麦克风）：INMP441全向麦克风模块购买记录： https://oshwhub.com/shukkkk/esp32s3_tft_mp3

阅读更多...

隧道管廊人员定位系统的应用与发展

隧道管廊人员定位系统的应用与发展

随着城市建设的不断发展，地下管廊和隧道工程的规模和数量也在快速增长。隧道工程处于复杂、封闭的环境中，人员的安全管理成为一项重要任务。隧道管廊人员定位系统作为一种先进的技术手段，可以实时追踪人员位置，提供实时监控和安全…

阅读更多...

clip系列改进Lseg、 group ViT、ViLD、Glip

clip系列改进Lseg、 group ViT、ViLD、Glip

Lseg 在clip后面加一个分割head，然后用分割数据集有监督训练。textencoder使用clip，frozen住。 group ViT 与Lseg不同，借鉴了clip做了真正的无监督学习。具体的通过group block来做的。使用学习的N个group token（可以理解为聚类…

阅读更多...

数字社交的领航者：解析Facebook的引领作用

数字社交的领航者：解析Facebook的引领作用

在当今数字化社会中，社交网络已经成为了人们日常生活不可或缺的一部分。而在众多社交平台中，Facebook凭借其巨大的用户基础和创新的技术应用，被公认为数字社交领域的领航者之一。本文将深入解析Facebook在数字社交中的引领作用，探…

阅读更多...

Eclipse代码编辑器自主配色

Eclipse代码编辑器自主配色

1. 打开 Eclipse 的设置 - Java - Editor - Syntax Coloring 2. 自定义各种类型的颜色，例如： 1. Interface 勾选，设置为紫色 2. Class 勾选，设置为淡蓝色 3. Abstract classes 勾选，有自己默认的颜色 …

阅读更多...

Web渗透：文件包含漏洞（part.1）

Web渗透：文件包含漏洞（part.1）

"文件包含漏洞"（File Inclusion Vulnerability）是一种常见的Web应用程序漏洞，攻击者可以通过这个漏洞在目标系统上包含或执行任意文件。主要有两种类型的文件包含漏洞： 本地文件包含（Local File Inclusion, …

阅读更多...

Django（根据Models中模型类反向生成数据库表）—— python篇

Django（根据Models中模型类反向生成数据库表）—— python篇

一、数据库的配置 1、 django默认支持 sqlite，mysql, oracle,postgresql数据库。 sqlite：django默认使用sqlite的数据库，默认自带sqlite的数据库驱动 , 引擎名称：django.db.backends.sqlite3 mysql：引擎名称&#xff…

阅读更多...

克服指标管理痛点，实现数据价值最大化

克服指标管理痛点，实现数据价值最大化

在当下的企业管理中，由于数据量的激增，管理方式逐渐从基于经验转向基于数据。在此过程中，我们能够通过数据探查业务情况、分析数据，从而获取更优的决策支持数据。这通常通过数据报表或分析平台来实现，对于临时性场景&a…

阅读更多...

基于YOLOv10的车辆统计跟踪与车速计算应用

基于YOLOv10的车辆统计跟踪与车速计算应用

文章目录 1、前言2、安装运行环境3、下载v10s模型4、代码实现5、代码详读5.1、导入必要的库5.2、识别车辆5.3、读取视频文件5.4、创建视频写入器5.5、车速计算5.6、统计车辆5.7、应用跟踪5.8、视频处理 6、目标检测系列文章 1、前言在智能交通系统（ITS&#xff09…

阅读更多...

Does a vector database maintain pre-vector chunked data for RAG systems?

Does a vector database maintain pre-vector chunked data for RAG systems?

题意：一个向量数据库是否为RAG系统维护预向量化分块数据？ 问题背景： I believe that when using an LLM with a Retrieval-Augmented Generation (RAG) approach, the results retrieved from a vector search must ultimately be presented…

阅读更多...

提升用户转化率秘诀！Xinstall的H5拉起应用技术让您领先一步！

提升用户转化率秘诀！Xinstall的H5拉起应用技术让您领先一步！

在移动互联网时代，App的推广和运营面临着诸多挑战。其中，H5页面如何高效、便捷地拉起应用，成为了一个亟待解决的问题。今天，我们就来谈谈如何利用Xinstall品牌，轻松解决这一痛点，提升用户体验，助…

阅读更多...

ONLYOFFICE桌面编辑器8.1：办公体验新升级

ONLYOFFICE桌面编辑器8.1：办公体验新升级

引入当今时代办公三件套已经成为我们日常生活中不可或缺的一部分了，但是说到办公软件不知道大家会首先想到那些产品 office 亦或是 WPS。最近也发布了 8.1 新版本，更新了一些新功能今天我们就来评测评测。文章目录引入一、ONLYOFFICE 是什么&#xff…

阅读更多...

java基于ssm+jsp 仓库智能仓储系统

java基于ssm+jsp 仓库智能仓储系统

1管理员功能模块管理员登录，通过填写用户名、密码等信息，输入完成后选择登录即可进入智能仓储系统 ，如图1所示。图1管理员登录界面图智能仓储系统 ，在智能仓储系统可以查看个人中心、公告信息管理、员工管理、供应商管理、商…

阅读更多...

大模型技术的应用场景

大模型技术的应用场景

大模型技术（Large Language Model，LLM）是指具有大量参数和训练数据的神经网络模型，它能够学习语言的统计规律，并生成与人类书写的文本相似的文本。大模型技术在近年来取得了重大进展，并开始在各种领域得到应…

阅读更多...

reactjs18 中使用@reduxjs/toolkit同步异步数据的使用

reactjs18 中使用@reduxjs/toolkit同步异步数据的使用

react18 中使用@reduxjs/toolkit 1.安装依赖包 yarn add @reduxjs/toolkit react-redux2.创建 store 根目录下面创建 store 文件夹，然后创建 index.js 文件。 import {configureStore } from "@reduxjs/toolkit"; import {counterReducer } from "./feature…

阅读更多...

OpenCloudOS开源的操作系统

OpenCloudOS开源的操作系统

OpenCloudOS 是一款开源的操作系统，致力于提供高性能、稳定和安全的操作系统环境，以满足现代计算和应用程序的需求。它结合了现代操作系统设计的最新技术和实践，为开发者和企业提供了一个强大的平台。本文将详细介绍 OpenCloudOS 的背景、特性…

阅读更多...

抖音营销新策略：MessageBox与HubSpot集成，引领企业获客新潮流

抖音营销新策略：MessageBox与HubSpot集成，引领企业获客新潮流

在全球数字化浪潮中，抖音以其独特的短视频形式、庞大的用户群体和高度互动性，成为了企业出海战略中不可或缺的一环。抖音营销不仅仅是简单的内容发布和互动，它更是一种深度策略和创新思维的体现。今天将深入探讨抖音营销的核心价值、应用场景…

阅读更多...

git基本使用（二）：git分支的操作命令

git基本使用（二）：git分支的操作命令

Git 的多分支管理是指在同一个仓库中创建和管理多个分支，每个分支可以独立开发，互不干扰。分支是 Git 中的一种强大功能，允许开发人员同时在多个不同的功能、修复或实验上工作，而不会影响主分支或其他分支。通过多分支管理&#x…

阅读更多...

svn怎么新建分支，切换分支

svn怎么新建分支，切换分支

在当前分支下，点svn右键，选择分支/标记在选择远端地址时，点右边更多选项，打开远端版本库。找到对应的分支上级位置，点击确定填写新分支名称，我这儿是将分支建在了branches下，分支名称为V1.1 填…

阅读更多...

推荐文章

最新文章