【AIGC评测体系】大模型评测指标集

【AIGC评测体系】大模型评测指标集

news2026/2/15 5:54:00

大模型评测指标集

- （☆）SuperCLUE
- （1）SuperCLUE-V（中文原生多模态理解测评基准）
- （2）SuperCLUE-Auto（汽车大模型测评基准）
- （3）AIGVBench-T2V（文生视频基准测评）
- （4）SuperCLUE-Coder（代码助手测评基准）
- （5）SuperCLUE-RAG（中文原生检索增强生成测评基准）
- （6）SuperCLUE-Agent（Agent能力测评基准）
- （7）SuperCLUE-Image（中文原生文生图测评基准）

（☆）SuperCLUE

CLUE官网： https://www.CLUEBenchmarks.com
SuperCLUE排行榜网站： https://www.superclueai.com
Github地址： https://github.com/CLUEbenchmark/SuperCLUE

Panda

（1）SuperCLUE-V（中文原生多模态理解测评基准）

推荐文章： SuperCLUE-V: 中文原生多模态理解测评基准
项目地址： https://github.com/CLUEbenchmark/SuperCLUE-V

Panda

（2）SuperCLUE-Auto（汽车大模型测评基准）

推荐文章： SuperCLUE-Auto：首个汽车行业中文大模型测评基准发布
项目地址： https://github.com/CLUEbenchmark/SuperCLUE-auto

Panda

（3）AIGVBench-T2V（文生视频基准测评）

推荐文章： AIGVBench文生视频测评首期结果公布，1000个AI视频对比，最高72.9分，Luma仅第3
AIGVBench登录页： www.AIGVBench.com

Panda

（4）SuperCLUE-Coder（代码助手测评基准）

推荐文章： 代码助手测评」启动，SC-Coder测评方案公布

Panda

（5）SuperCLUE-RAG（中文原生检索增强生成测评基准）

推荐文章： 中文RAG检索增强生成榜单出炉！仅有一家刚刚及格
项目地址： https://github.com/CLUEbenchmark/SuperCLUE-RAG

Panda

（6）SuperCLUE-Agent（Agent能力测评基准）

推荐文章： SuperCLUE-Agent: Agent智能体中文原生任务能力测评基准
项目地址： https://github.com/CLUEbenchmark/SuperCLUE-Agent

Panda

（7）SuperCLUE-Image（中文原生文生图测评基准）

推荐文章： 文生图大模型基准测评首期榜单公布，DALL-E 3取得最高76.94分
项目地址： https://github.com/CLUEbenchmark/SuperCLUE-Image

Panda

Panda

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1887900.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

昇思25天学习打卡营第6天|关于函数与神经网络梯度相关技术探讨

昇思25天学习打卡营第6天|关于函数与神经网络梯度相关技术探讨

目录 Python 库及 MindSpore 相关模块和类的导入函数与计算图微分函数与梯度计算 Stop Gradient Auxiliary data 神经网络梯度计算 Python 库及 MindSpore 相关模块和类的导入 Python 中的 numpy 库被成功导入，并简称为 np。numpy 在科学计算领域应用广泛&#x…

阅读更多...

借教室（题解）

借教室（题解）

P1083 [NOIP2012 提高组] 借教室 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 思路：二分前缀和我们将和质检员那题差不多，只需要将候选人二分即可 #include<bits/stdc.h> using namespace std; #define int long long int n,m; int r[100000…

阅读更多...

精准检测，守护安全：可燃气体报警器检测范围探讨

精准检测，守护安全：可燃气体报警器检测范围探讨

随着工业化进程的加快，易燃易爆气体的使用日益普遍，其安全隐患也愈发凸显。可燃气体报警器作为一种重要的安全监测设备，能够在气体泄漏时及时发出警报，预防火灾和爆炸事故的发生。在这篇文章中，佰德将对可燃气体报警…

阅读更多...

Docker搭建MySQL双主复制详细教程

Docker搭建MySQL双主复制详细教程

在此之前需要提前安装好Docker和 Docker Compose 。一、创建目录首先创建一个本地数据挂载目录。 mkdir -p master1-data master2-data二、编写docker-compose.yml version: 3.7services:mysql-master1:image: mysql:5.7.36container_name: mysql-master1environment:MYSQL_…

阅读更多...

$自动驾驶---Motion Planning之多段五次多项式$

自动驾驶---Motion Planning之多段五次多项式

1 前言在之前的博客系列文章中和读者朋友们聊过Apollo的 Motion Planning方案：《自动驾驶---Motion Planning之LaneChange》《自动驾驶---Motion Planning之Path Boundary》《自动驾驶---Motion Planning之Speed Boundary》《自动驾驶---Motion Planning之轨迹Path优化》…

阅读更多...

Python中解决os.listdir命令读取文件乱序问题方法

Python中解决os.listdir命令读取文件乱序问题方法

Python中使用对话框批量打开文件时出现乱序问题的解决方法一、问题描述二、os.listdir读取文件乱序问题解决方法欢迎学习交流！ 邮箱： z…1…6.com 网站： https://zephyrhours.github.io/ 一、问题描述有时候为了方便，我们在进…

阅读更多...

Hadoop-08-HDFS集群基础知识命令行上机实操 hadoop fs 分布式文件系统读写原理读流程与写流程基本语法上传下载拷贝移动文件

Hadoop-08-HDFS集群基础知识命令行上机实操 hadoop fs 分布式文件系统读写原理读流程与写流程基本语法上传下载拷贝移动文件

章节内容上一节完成： HDFS的简介内容HDFS基础原理HDFS读文件流程HDFS写文件流程背景介绍这里是三台公网云服务器，每台 2C4G，搭建一个Hadoop的学习环境，供我学习。之前已经在 VM 虚拟机上搭建过一次，但是没留下…

阅读更多...

从零开始学量化~Ptrade使用教程——安装与登录

从零开始学量化~Ptrade使用教程——安装与登录

PTrade交易系统是一款高净值和机构投资者专业投资软件，为用户提供普通交易、篮子交易、日内回转交易、算法交易、量化投研/回测/实盘等各种交易工具，满足用户的各种交易需求和交易场景，帮助用户提高交易效率。运行环境及安装操作系统&…

阅读更多...

OFDM技术概述8——FBMC

OFDM技术概述8——FBMC

Filter bank multicarrier(FBMC，滤波器组多载波)，是一种类似于OFDM的调制方式，用滤波器抑制子载波的旁瓣大小，使用FFT/IFFT或多相滤波器实现，其应用于5G的主要优势： 子载波信号带限，带外泄漏小…

阅读更多...

5.（vue3.x+vite）水平垂直居中实现方式

5.（vue3.x+vite）水平垂直居中实现方式

前端技术社区总目录（订阅之前请先查看该博客）示例效果介绍（1）父级元素设置position:relative；子级元素设置：position:absolute;left:50%;top:50%;transform: translate(-50%,-50%); 兼容性较好（1）父级元素设置弹性盒子：display:flex;justify-content:center; a…

阅读更多...

LabVIEW幅频特性测试系统

LabVIEW幅频特性测试系统

使用LabVIEW软件开发的幅频特性测试系统。该系统整合了Agilent 83732B信号源与Agilent 8563EC频谱仪，通过LabVIEW编程实现自动控制和数据处理，提供了成本效益高、操作简便的解决方案，有效替代了昂贵的专用仪器，提高了测试效率和设…

阅读更多...

library source does not match the bytecode for class SpringApplication

library source does not match the bytecode for class SpringApplication

library source does not match the bytecode for class SpringApplication 问题描述：springboot源码点进去然后download source后提示标题内容。spring版本5.2.8.RELEASE，springboot版本2.7.18 解决方法：把spring版本改为与boot版本对应的6.…

阅读更多...

如何快速去除视频里面的水印字幕等信息？（内附工具）

如何快速去除视频里面的水印字幕等信息？（内附工具）

环境： VSR 需要独显 GPU:N 4070TI 12G 问题描述： 如何快速去除视频里面的水印字幕等信息？ 解决方案： 1.打开AI工具VSR，打了要处理的视频 2.右侧滑块调整绿色选框，选中要去的字幕或者水印这次测试右…

阅读更多...

维克日记 v0.4.2：开发者友好的数字化笔记工具

维克日记 v0.4.2：开发者友好的数字化笔记工具

维克日记，专为技术开发者和笔记爱好者设计的数字化笔记工具，以其强大的功能和灵活的配置赢得了用户的好评。软件采用Markdown语法，提供实时预览功能，让您的笔记编辑更加高效和直观。维克日记的用户界面简洁而功能齐全，…

阅读更多...

k8s 中间件

k8s 中间件

1. zookeeper 是的，Zookeeper 和 Kafka 经常一起使用，Zookeeper 在 Kafka 中扮演了关键角色。以下是 Zookeeper 和 Kafka 在实际项目中的结合使用及其作用的详细说明。项目背景假设我们有一个分布式数据处理系统，该系统需要高吞吐量的实…

阅读更多...

Webpack: 剖析插件基本形态与架构逻辑

Webpack: 剖析插件基本形态与架构逻辑

概述 Webpack 对外提供了 Loader 与 Plugin 两种扩展方式，其中 Loader 职责比较单一，开发方法比较简单容易理解；Plugin 则功能强大，借助 Webpack 数量庞大的 Hook，我们几乎能改写 Webpack 所有特性，但也伴…

阅读更多...

改变图像中特定区域的颜色

改变图像中特定区域的颜色

背景与原理再训练施工即系模型中，发现大量施工机械都是黄色的，我需要把它们换成蓝色的，以增强模型使用可靠性。目前没有尝试深度学习算法，只是简单的进行了处理。核心目的：通过人工标注与opencv的结合&#xff0…

阅读更多...

Cybervadis认证是什么？

Cybervadis认证是什么？

Cybervadis认证是一种全面且深入的网络安全评估和认证服务，旨在帮助组织提高其网络安全实践的成熟度，并有效应对不断变化的网络威胁和攻击。以下是关于Cybervadis认证的一些关键信息： 认证目的： 评估和验证组织在网络安全方面的能…

阅读更多...

使用目标检测模型YOLO V10 OBB进行旋转目标的检测：训练自己的数据集（基于卫星和无人机的农业大棚数据集）

使用目标检测模型YOLO V10 OBB进行旋转目标的检测：训练自己的数据集（基于卫星和无人机的农业大棚数据集）

这个是在YOLO V10源码的基础上实现的。我只是在源码的基础上做了些许的改动。 YOLO V10源码：YOLO V10源码 YOLOv10是清华大学的研究人员在Ultralytics Python包的基础上，引入了一种新的实时目标检测方法，解决了YOLO 以前版本在后处理和模型架…

阅读更多...

计组_虚拟存储器

计组_虚拟存储器

2024.06.09：计算机组成原理学习笔记第11节虚拟存储器* 1.1 分页思想1.1.1 虚拟地址/逻辑地址1.1.2 主存地址/物理地址1.1.3 页表1.1.4 分页方式的缺陷 1.2 分段思想1.2.1 虚拟地址/逻辑地址1.2.2 主存地址/物理地址1.2.3 段表 1.3 段页式思想1.3.1 虚拟地址/逻辑地…

阅读更多...

推荐文章

最新文章