权威！IDC《中国大模型市场主流产品评估，2024》报告发布

权威！IDC《中国大模型市场主流产品评估，2024》报告发布

news2026/2/13 0:46:15

6月12日，国际数据公司 IDC 发布《中国大模型市场主流产品评估，2024》，从基础能力到应用能力 7 大维度对 11 家大模型厂商的 16 款市场主流产品进行实测。

结果显示，百度位于第一梯队，是唯一一家在7大维度上均为优势厂商的企业。

在这里插入图片描述

这份实测报告不同于以往的评测榜单：

IDC 此次采取实测的方式，成立产品测试团队、邀请外部专家团队，在审核委员会的监督下，保证了评估结果的真实度。
测试的全面性——涵盖众多厂商。IDC 列出的厂商里，有国外厂商如 OpenAI；国内厂商包括阿里、商汤、科大讯飞、百川、智谱、昆仑万维等 11 家大模型厂商的 16 款产品参与了本次评估。
测试的全面性——测试题目涵盖众多维度。IDC 测试题目分为基础能力和应用能力两个大类共 7 个维度：基础能力包括问答理解类、推理类、创作表达类、数学类、代码类；应用能力主要包含 toC 通用场景类和 toB 特定行业类，每一类单独计分。

图注：IDC 题目类型
IDC 采取实测的方式，成立产品测试团队，通过多个维度对基础大模型及相关产品进行评测，并邀请外部专家团队深入分析各个产品答案准确性、合理性等，在审核委员会的监督下，最终得出各厂商的评估结果，供用户选型参考。

从 IDC 报告的结果来看：

第一梯队：百度文心一言 4.0、文心一格以及 OpenAI 、阿里、商汤、科大讯飞发布的大模型产品；
第二梯队：百川、智谱、昆仑万维；
第三梯队：联汇、云知声、云从科技。

在这里插入图片描述

再细分来看，在 IDC 评测的 7 个维度上：

百度文心大模型在7个维度上都被列为优势厂商，可以说是一位全能选手。
阿里获得 6 项优势维度，排名第二。
OpenAI GPT-4 和商汤获得 5 项优势维度，排名第三。

在这里插入图片描述

图：IDC 咨询发布的基础大模型产品实测结果

结果显示，百度旗下生成式AI产品文心一言和文心一格在问答理解类、推理类、创作表达类、数学类、代码类的基础能力，toC通用场景类、toB特定行业类的应用能力等7大维度均具备领先优势。

基础能力评测

在基础能力评测中，大模型产品在问答理解类、推理类和创作表达类的成熟度较高。但在数学类和代码类这两个基础能力维度上得分率整体较低。

问答理解类：百度、GPT-4、阿里、商汤被列为优势厂商。值得注意的是，在安全陷阱这个细分维度，只有百度文心大模型入选优势厂商。

这类题目主要考察模型理解和回答人类问题的能力，IDC 从常识、专业知识、多语言、多模态、角色扮演 + 多轮对话、安全陷阱进行考察。

推理类：百度在归纳推理、类比推理两项指标上入选优势厂商。

推理类题目主要考察大模型基于已知信息推出新结论的思维方式。

创作表达类：百度在内容创作、生成质量和速度等方面展现出优势。

创作表达类主要考察大模型识别和理解文本创作、区别不同的语言风格，生成高质量的的内容。

数学类：百度大模型在数学类任务上体现出较强的体系化思维、逻辑思维和抽象思维能力。GPT4、商汤、智谱、百川在高等数学细类中被列为优势厂商。

数学类评测，要求大模型不仅需要逻辑推理能力，还需要对问题有很好的解析和理解、抽象出各个问题的逻辑关系，最后给出准确的答案。

代码类：其下所有 6 个细分维度中，百度均入围优势厂商，在代码生成、编程翻译、代码补全、代码纠错等多个方面表现优异。

代码能力是评估大模型理解、逻辑、推理、生成等综合能力的体现，其已成为程序员辅助编程的必备助手。

应用能力评测

应用能力评测主要评估大模型产品在办公工具、生活助手等toC通用场景类和toB特定行业类的表现。

toC通用场景类：入选的厂商非常少，但百度在办公工具和生活助手这两项指标上均入选。
toB特定行业类：百度、GPT-4、阿里和商汤被列为优势厂商。其中，百度文心大模型已经在金融、法律、科研等多个行业落地。GPT-4 在工业、零售电商等落地较好。

值得一提的是，最近在中文大模型测评基准SuperCLUE中，成为首个超越GPT-4 Turbo的国产大模型——商汤「日日新 5.0」（SenseChat V5），被 IDC 列为第一梯队，“日日新5.0”及AI产品「商量」、「秒画」在基础能力方面表现出色：

基础能力评测

在问答理解方面，其常识、专业知识表现突出，助力用户准确获取信息；
在推理方面，其情感推理、逻辑推理、归纳推理等能力优越，可以帮助人更加深入地理解事物，发现新的问题和解决方案；
在创作表达方面，其内容文字创作&创意等细分维度具备优势，产品成熟度高；
在数学方面，处理高中数学、高等数学等高阶数学题目时表现突出；
在代码方面，其生成代码文档能力具备优势；

应用能力评测

在应用方面，IDC 报告指出商汤“日日新5.0”大模型体系及产品在面向toB行业、解决行业的实际应用问题的能力具备优势，尤其是在咨询服务（财报分析&市场分析）、互联网/媒体营销、零售/电商、医疗等toB特定行业。

在这里插入图片描述

IDC认为，从2024年二季度开始，中国市场迎来了一波基础大模型及产品的更新升级。

IDC 中国大模型产品测试团队表示，2024年产业界更加关注大模型和生成式AI的落地，技术供应商需持续优化生成质量，提高生成速度并降低大模型使用成本，加快大模型技术的应用与普及。
在这里插入图片描述

欢迎各位关注我的个人微信公众号：HsuDan，我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1835159.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

如何定位报错: indexSelectLargeIndex:... Assertion `srcIndex ＜ srcSelectDimSize` fail

如何定位报错: indexSelectLargeIndex:... Assertion `srcIndex ＜ srcSelectDimSize` fail

文章目录 1. 背景2. 准备工作2.1 debug工具2.2 设置准备工作 3. 开启 debug 1. 背景在使用 cuda 在 gpu 计算的过程中，出现索引超过最大长度。 indexSelectLargeIndex:... Assertion srcIndex < srcSelectDimSize fail通常这种时候堆栈底部还伴随以下报错&…

阅读更多...

【太原理工大学】软件系统安全—分析题

【太原理工大学】软件系统安全—分析题

OK了，又是毫无准备的一场仗，我真是ありがとうございます凸^o^凸根据前几年传下来的信息，所谓“分析”，就是让你根据情节自行设计，例如如何设计表单等，这类多从实验中出，王老师强调好好做实验一…

阅读更多...

浏览器加速播放视频技巧

浏览器加速播放视频技巧

当我们看网页中的视频时，想加速播放，但是选项最高只能2倍速时，还想再加快播放如何操作？ 此时我们可以按F12打开浏览器开发者选项，然后点击控制台，在浏览器输入如下代码： document.querySelecto…

阅读更多...

数据结构---排序算法

数据结构---排序算法

个人介绍 hello hello~ ，这里是 code袁~💖💖 ，欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 🦁作者简介：一名喜欢分享和记录学习的…

阅读更多...

Hype4.0 for Mac软件下载-Hype for Mac HTML5 创作工具下载附加详细安装步骤

Hype4.0 for Mac软件下载-Hype for Mac HTML5 创作工具下载附加详细安装步骤

Hype 4 Pro Mac正式版是款功能实用的动画创作工具。Hype 4 Pro Mac最新版可以帮您轻松创建令人惊叹的动画和交互式网页内容。并且Hype 4 Pro Mac还可被设计师用来创建动画，为网页、信息图形、演示文稿、数字杂志、广告、iBooks、教育内容、应用程序原型、作品集、动…

阅读更多...

基于Spring+Vue的前后端分离的计算器

基于Spring+Vue的前后端分离的计算器

麻雀虽小，五脏俱全该项目已部署上线：http://calculator.wushf.top/ 并通过Gitee Go流水线实现持续部署。需求分析表达式求值支持加减乘除四则运算、支持高精度获取日志 Api文档定义前后端分离，人不分离通过Apifox定义接口细节&#…

阅读更多...

scratch3编程02-使用克隆来编写小游戏

scratch3编程02-使用克隆来编写小游戏

目录 1，游戏效果 2，游戏代码块 1）玩家 2）障碍物 3）箭头 4）关卡图片 3，scratch文件 1，游戏效果使用克隆在这个游戏中： 程序开始：只要点击“…

阅读更多...

和服务器建立联系——6.10山大软院项目实训1

和服务器建立联系——6.10山大软院项目实训1

下面介绍我如何在自己的项目中，根据aigc组的接口（如下图），在Unity中和服务器建立联系并发出接受请求的： 这是一个通过HTTP POST方法调用的接口，需要发送JSON格式的数据。在Unity中实现这样的功能&#xff0…

阅读更多...

[AI Google] TimesFM：AI预测股市价格，能否助我财务自由？

[AI Google] TimesFM：AI预测股市价格，能否助我财务自由？

今天我偶然发现了一个名为TimesFM的模型，它能够预测时间序列数据。于是我心中冒出了一个大胆的想法：如果这个模型可以预测股票价格，那么我是否能借此成为股神呢？ 介绍 TimesFM（时间序列基础模型）是由谷歌…

阅读更多...

基于Spring Boot+VUE旅游管理系统

基于Spring Boot+VUE旅游管理系统

1管理员功能模块管理员通过点击后台管理，进入页面可以输入用户名、密码、角色进行登录相对应操作，如图1所示。图1管理员登录界面管理员通过点击后台管理，进入页面可以填写首页、个人中心、用户管理、旅游方案管理、旅游购买管理、系统管…

阅读更多...

华为---RIP路由协议的汇总

华为---RIP路由协议的汇总

8.3 RIP路由协议的汇总 8.3.1 原理概述当网络中路由器的路由条目非常多时，可以通过路由汇总(又称路由汇聚或路由聚合)来减少路由条目数，加快路由收敛时间和增强网络稳定性。路由汇总的原理是，同一个自然网段内的不同子网的路由在向外(其他…

阅读更多...

【接口自动化测试】第一节.接口自动化测试基础和框架介绍

【接口自动化测试】第一节.接口自动化测试基础和框架介绍

文章目录前言一、接口自动化基础 1.1 接口自动化基础介绍 1.2 接口自动化测试流程 1.3 选取自动化测试用例 1.4 搭建自动化测试环境二、接口自动化测试框架 2.1 接口自动化框架设计思路 2.2 定义项目目录结构总结前言一、接口自动化基础 1.1…

阅读更多...

企业中没有有效的PMC管理会是什么样子？

企业中没有有效的PMC管理会是什么样子？

众所周知，有效的产品物料控制（PMC）管理对于企业的稳健发展至关重要。然而，如果企业忽视了PMC的重要性，或者其管理不到位，那么企业将面临一系列严重的问题，从生产线混乱到效益滑坡，甚…

阅读更多...

16. 一个I/O项目：构建命令行程序（上）

16. 一个I/O项目：构建命令行程序（上）

标题一、功能二、接受命令行参数三、读取文件四、重构改进模块性和错误处理4.1 二进制项目的关注分离4.2 提取参数解析器4.3 创建一个Config的构造函数4.4 传参错误处理4.5 从main中提取逻辑4.6 将代码拆分进crate 一、功能 grep 最简单的使用场景是在特定文件中搜索指定字…

阅读更多...

大模型应用实战2——大模型知识体系、GLM4的function calling功能及agents开发

大模型应用实战2——大模型知识体系、GLM4的function calling功能及agents开发

前面通过glm4作为引子，现在来谈大模型知识体系结构是怎么样的两个研究方向：开发特定的agents/强化大模型在某个领域的能力，后一个的大致方法如下图 GLM4的function calling功能： 需要解决的问题：不能解决大数运算&a…

阅读更多...

香港优才计划是坑人的吗？申请的人都在说……

香港优才计划是坑人的吗？申请的人都在说……

大家好啊！最近看到超多小伙伴私信我说申请香港优才被“坑”了，被割了一波韭菜🌿心疼你们！作为一个通过这个计划顺利移民香港的老司机🚗，我必须出来吐槽一下，并且把我的成功经验分享给大家&#…

阅读更多...

天锐绿盾 | -公司电脑文件防泄密软件

天锐绿盾 | -公司电脑文件防泄密软件

天锐绿盾是一款专为企业设计的电脑文件防泄密系统，它结合了多种安全功能，旨在从源头上保障企业数据的安全。 www.drhchina.com 以下是关于天锐绿盾的详细介绍： 一、产品概述天锐绿盾，又名绿盾信息安全管理软件，是一…

阅读更多...

【达梦数据库】typeorm+node.js+达梦数据库返回自增列值

【达梦数据库】typeorm+node.js+达梦数据库返回自增列值

1.配置环境，下载依赖包 typeorm init --name test22 --database mysql typeorm-dm，uuid,typeorm2,修改连接信息修改src/ data-source.ts 文件连接dm，可参考刚刚安装typeorm-dm 模块中的 README.md 3.修改自增信息 /* 修改前*/PrimaryGen…

阅读更多...

FileZilla证书过期，导致FileZilla Client联不上，或者老断开的处理

FileZilla证书过期，导致FileZilla Client联不上，或者老断开的处理

1、先到服务器上去重新生成一下证书，并且覆盖掉老的证书。edit--settings 输入信息，并且确认生成新的证书： 2、Client连接的时候，弹出证书信任，点击确认。这样第一次连接，然后访问目录全都是好的&#xff…

阅读更多...

解决此平台不支持虚拟化的 Intel VT-x/EPT故障问题

解决此平台不支持虚拟化的 Intel VT-x/EPT故障问题

一、问题描述当我们在VMware Workstation虚拟机上【启用】虚拟系统（如：Windows10）所在的虚【拟机设置】【处理器】【虚拟化引擎】下面的【虚拟化 Intel VT-x/EPT 或AMD-V/RVI(V)】内容后，在启动虚拟系统时，虚拟系统无法启动，且弹出【此平台不支持虚拟化的 Intel VT-x/EP…

阅读更多...

推荐文章

最新文章