多模态学习实战手册：读懂CompassRank榜单的评测指标！

多模态学习实战手册：读懂CompassRank榜单的评测指标！

news2026/2/15 17:46:45

1. 前言

榜单链接：CompassRank

CompassRank 是一个中立且全面的性能榜单，作为大模型评测体系 OpenCompass2.0 中各类榜单的承载平台。它覆盖多领域、多任务下的模型性能，并定期更新，以提供动态的行业洞察。

CompassRank 保持中立性，不受任何商业利益干扰，并依托于 CompassKit 工具链体系中的各类评测手段，确保了其客观性。这个平台旨在帮助从业者理解技术深意，优化模型选择，并对大模型的技术创新提供坚实的技术支撑

编辑

2. 整体指标

Method: 这列通常表示模型的名称和训练方法，包括模型架构、训练策略和可能的微调技术。
Time: 在这个上下文中，时间可能指的是模型训练或推理的时间，但具体信息需要查看详细页面以获取准确数据。
Params: 模型的参数数量，以百万（M）或十亿（B）为单位，表示模型的复杂度。
Language Model: 语言大模型，如InternLM2、QwenLM等
Vision Model: 视觉大模型如CLIP ViT-L/14、EVA-02-5B等
Avg. Rank: 模型在所有列出的测试集上的平均排名，数值越小表示整体性能越好。
Avg. Score: 模型在所有测试集上的平均得分，高分表示模型性能更优。

3. MMBench

MMBench Test: MMBench测试集，一个多模态基准，用

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1564913.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Springboot集成knife4j (swagger)

Springboot集成knife4j (swagger)

1、添加依赖在pom.xml 文件中添加 knife4j-spring-boot-starter 的依赖 <dependency> <groupId>com.github.xiaoymin</groupId> <artifactId>knife4j-spring-boot-starter</artifactId> <version>3.0.3</version> </depe…

阅读更多...

D-迷恋网游（遇到过的题，做个笔记）

D-迷恋网游（遇到过的题，做个笔记）

我的代码： #include <iostream> using namespace std; int main() {int a, b, c; //a表示内向，b表示外向，c表示无所谓cin >> a >> b >> c; //读入数 if (b % 3 0 || 3-b % 3 < c) //如果外向的人能够3人组成…

阅读更多...

大数据学习第十二天（mysql不会的查询1）

大数据学习第十二天（mysql不会的查询1）

1、数据 /*创建部门表*/ CREATE TABLE dept( deptno INT PRIMARY KEY, dname VARCHAR(50) comment 部门名称, loc VARCHAR(50) comment 工作地点 ); /*创建雇员表*/ CREATE TABLE emp( empno INT PRIMARY KEY, ena…

阅读更多...

C++语言学习（三）——内联函数、auto、for循环、nullptr

C++语言学习（三）——内联函数、auto、for循环、nullptr

1. 内联函数 （1）概念以inline修饰的函数叫做内联函数，编译时C编译器会在调用内联函数的地方展开，没有函数调用建立栈帧的开销，内联函数提升程序运行的效率。内联函数是一种编译器指令，用于告诉编译器…

阅读更多...

操作系统—读者-写者问题及Peterson算法实现

操作系统—读者-写者问题及Peterson算法实现

文章目录 I.读者-写者问题1.读者-写者问题和分析2.读者—写者问题基本解法3.饥饿现象和解决方案总结 II.Peterson算法实现1.Peterson算法问题与分析(1).如何无锁访问临界区呢？(2).Peterson算法的基本逻辑(3).写对方/自己进程号的区别是？ 2.只包含意向的解…

阅读更多...

软考高级架构师：存储管理-磁盘管理概念和例题

软考高级架构师：存储管理-磁盘管理概念和例题

作者：明明如月学长， CSDN 博客专家，大厂高级 Java 工程师，《性能优化方法论》作者、《解锁大厂思维：剖析《阿里巴巴Java开发手册》》、《再学经典：《Effective Java》独家解析》专栏作者。热门文章推荐&am…

阅读更多...

GD32F470_MPU-6050模块三轴加速度陀螺仪6DOF模块有代码原理图 GY-521模块移植

GD32F470_MPU-6050模块三轴加速度陀螺仪6DOF模块有代码原理图 GY-521模块移植

2.13 MPU6050六轴传感器 MPU6050 是 InvenSense 公司推出的整合性 6 轴运动处理组件，其内部整合了 3 轴陀螺仪和 3 轴加速度传感器，并且含有一个IIC 接口， 可用于连接外部磁力传感器，并利用自带的数字运动处理器（DMP: …

阅读更多...

基于ssm的寝室管理系统（java项目+文档+源码）

基于ssm的寝室管理系统（java项目+文档+源码）

风定落花生，歌声逐流水，大家好我是风歌，混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的寝室管理系统。项目源码以及部署相关请联系风歌，文末附上联系信息。项目简介： 寝室管理系统设计的主要使用者分为…

阅读更多...

参数传值机制

参数传值机制

在 Java 中，方法的所有参数都是 “传值” 的基本类型：数值的拷贝引用类型：引用的拷贝方法内部改变参数对象的状态（修改某属性），改变将反映到原始对象上因为方法内部和外部引用的是同一个对象方法内部…

阅读更多...

探索广告行业业务模型的创新与发展

探索广告行业业务模型的创新与发展

标随着数字化时代的到来，广告行业正经历着前所未有的变革和发展。在这个充满挑战和机遇的时代，广告公司和从业者们正在探索各种创新的业务模型，以适应市场的变化并取得成功。本文将深入探讨广告行业的业务模型，探索创新与发展的路…

阅读更多...

华为交换机配置指引（包含安全配置部分）以 S5735S-L48T4S-A1 配置为例

华为交换机配置指引（包含安全配置部分）以 S5735S-L48T4S-A1 配置为例

华为S5735S-L48T4S-A1 是一款千兆以太网交换机：端口结构: 48个10/100/1000BASE-T以太网端口和4个千兆SFP光接口供电方式: 交流电源背板带宽: 432Gbps包转发率: 87/166Mpps机箱高度: 1U重量: 2.76kg（不含包材）功耗: 典型功耗为43.3W接口: 48个10/100/1000BASE-T以太网电接口…

阅读更多...

Python-VBA编程500例-029(入门级)

Python-VBA编程500例-029(入门级)

连续字符段索引(Index of Consecutive Character Segments)在实际应用中具有多种场景。常见的应用场景有： 1、文本分析：在文本处理和分析中，连续字符段索引可以用于识别重复的字符序列或模式。这些模式可能对于理解文本的结构、风格或特定含…

阅读更多...

详解人工智能（概念、发展、机遇与挑战）

详解人工智能（概念、发展、机遇与挑战）

前言人工智能（Artificial Intelligence，简称AI）是一门新兴的技术科学，是指通过模拟、延伸和扩展人类智能的理论、方法、技术和应用系统，以实现对人类认知、决策、规划、学习、交流、创造等智能行为的模拟、延伸和扩展…

阅读更多...

Golang并发模型-Pipeline模型、Fan-in Fan-out模型

Golang并发模型-Pipeline模型、Fan-in Fan-out模型

这段时间由于项目的需要，本人正在研究关于如何优雅的进行go的并发，以下是结合资料和视频的结果，文末会给出参考资料 Go语言的并发模型主要通过goroutine和channel实现，通过这个我们可以更有效地使用IO和CPU 这里我们围绕生成一个…

阅读更多...

vtk实现多条曲线多条航迹轨迹用不同颜色区分不同曲线

vtk实现多条曲线多条航迹轨迹用不同颜色区分不同曲线

vtk实现多条曲线多条航迹轨迹用不同颜色区分不同曲线说明(废话)实现说明(废话) 通过vtk9.2绘制多条三维曲线，让每条曲线不同颜色。实现以上只是测试效果定义了一个Qvector m_colors，并在构造函数中赋值。在箭头处调用，也就是上图最…

阅读更多...

使用docker部署MongoDB数据库

使用docker部署MongoDB数据库

最近由于工作需要搭建MongoDB数据库：将解析的车端采集的数据写入到数据库，由于MongoDB高可用、海量扩展、灵活数据的模型，因此选用MongoDB数据库；由于现公司只有服务器，因此考虑容器化部署MongoDB数据，特此…

阅读更多...

clickhouse sql使用2

clickhouse sql使用2

1、多条件选择 multiIf(cond_1, then_1, cond_2, then_2, …, else) select multiIf(true,0,1) 当第一条件不成立看第二条件判断第一个参数条件参数，第二参数条件成立时走 2、clickhouse 在计算时候长出现NaN和Infinity异常处理 isNaN()和isInfinite()处理

阅读更多...

数据结构栈和堆列

数据结构栈和堆列

目录栈： 栈的概念： 栈的实现： 栈接口的实现： 1.初始化栈： 2.入栈： 3.出栈： 4. 获取栈顶元素： 5.获取栈中有效数据的个数： 6.检测栈是否为空，如果为…

阅读更多...

rocketmq管理工具rocketmq-console安装

rocketmq管理工具rocketmq-console安装

rocketmq-console是一个图形化管理控制台，提供Broker集群状态查看，Topic管理，Producer、Consumer状态展示，消息查询等常用功能，这个功能在安装好RocketMQ后需要额外单独安装、运行。中文文档地址：https:/…

阅读更多...

基于模糊PID控制器的的无刷直流电机速度控制simulink建模与仿真

基于模糊PID控制器的的无刷直流电机速度控制simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1无刷直流电机模型与速度控制 4.2 模糊PID控制器设计 5.完整工程文件 1.课题概述基于模糊PID控制器的的无刷直流电机速度控制simulink建模与仿真。基于模糊PID控制器的无刷直流电机（Brus…

阅读更多...

推荐文章

最新文章