书生·浦语大模型（学习笔记-9）OpenCompass 大模型评测实战

书生·浦语大模型（学习笔记-9）OpenCompass 大模型评测实战

news2025/7/5 15:07:32

目录

一、评测实现双赢

二、评测遇到的问题

三、如何评测大模型（大概总结4大类方法）

四、评测工具链及流水线

五、实战评测

GPU的环境安装

查看支持的数据集和模型

启动评测(会缺少protibuf库，提前安装）

测评结果

一、评测实现双赢

二、评测遇到的问题

三、如何评测大模型（大概总结4大类方法）

个人使用的比较多，这个也是用户能够直观、直接的感觉大模型好坏的一个方法

四、评测工具链及流水线

五、实战评测

GPU的环境安装

studio-conda -o internlm-base -t opencompass
source activate opencompass
git clone -b 0.2.4 https://github.com/open-compass/opencompass
cd opencompass
pip install -e .

下载数据集

pip install -r requirements.txt

解压评测数据集到 data/ 处

cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/
unzip OpenCompassData-core-20231110.zip

查看支持的数据集和模型

启动评测(会缺少protibuf库，提前安装）

python run.py --datasets ceval_gen --hf-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --tokenizer-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --tokenizer-kwargs padding_side='left' truncation='left' trust_remote_code=True --model-kwargs trust_remote_code=True device_map='auto' --max-seq-len 1024 --max-out-len 16 --batch-size 2 --num-gpus 1 --debug

测评结果

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1637680.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【linux学习指南】linux 环境搭建

【linux学习指南】linux 环境搭建

文章目录 📝前言🌠 云服务器的选择🌠阿里云🌠腾讯云🌠华为云 🌠使用 XShell 远程登陆到 Linux🌉下载 XShell 🌠查看 Linux 主机 ip🌉 XShell 下的复制粘贴🌉 …

阅读更多...

Linux下安装snaphu

Linux下安装snaphu

1、官网下载安装包 2、解压，移动文件夹到/usr/local/下 3、在/usr/local/下创建man，在man下创建man1文件夹 4、进入到snaphu的src文件夹里，执行sudo make，如果报错在这个 Makefile 中，-arch x86_64 是 macOS 特定的…

阅读更多...

ai口语软件有合适的吗？分享4款！

ai口语软件有合适的吗？分享4款！

在全球化日益深入的今天，英语作为国际通用语言，其重要性不言而喻。然而，传统的英语学习方式往往枯燥无味，难以持续。幸运的是，随着人工智能技术的快速发展，AI英语口语软件应运而生，为语言学习者…

阅读更多...

PHP算命源码_最新测算塔罗源码_可以运营

PHP算命源码_最新测算塔罗源码_可以运营

众筹商城源码众筹商品平台商城加共识元富之路网上商城众筹前端是编译后的，后端PHP，带商城运行截图源码贡献 https://githubs.xyz/boot?app39 部分数据库表 CREATE TABLE ti_shopro_store (id int(11) NOT NULL AUTO_INCREMENT COMMENT ID,nam…

阅读更多...

区块链论文总结速读--CCF B会议 ICDCS 2023 共8篇

区块链论文总结速读--CCF B会议 ICDCS 2023 共8篇

Conference：IEEE 43rd International Conference on Distributed Computing Systems (ICDCS) CCF level：CCF B Categories：Computer Architecture/Parallel and Distributed Computing/Storage Systems 计算机体系结构/并行与分布计算/存储…

阅读更多...

网络应用层之(6)L2TP协议详解

网络应用层之(6)L2TP协议详解

网络应用层之(6)L2TP协议 Author: Once Day Date: 2024年5月1日一位热衷于Linux学习和开发的菜鸟，试图谱写一场冒险之旅，也许终点只是一场白日梦… 漫漫长路，有人对你微笑过嘛… 全系列文档可参考专栏：通信网络技术_Once-Day的…

阅读更多...

全国产化BMC子卡详细介绍

全国产化BMC子卡详细介绍

一款基于全国产的BMC子卡，可实现ChMC/IPMC功能。子卡遵循IPMI 1.5/2.0协议规范，也支持客制OEM命令。子卡可获取载板板卡环境信息，板卡属性信息和板卡状态信息等，其中包括温度、电压、电流等信息；FRU、系统版本、CPU型号…

阅读更多...

Kubernetes 弃用Docker后 Kubelet切换到Containerd

Kubernetes 弃用Docker后 Kubelet切换到Containerd

containerd 是一个高级容器运行时，又名容器管理器。简单来说，它是一个守护进程，在单个主机上管理完整的容器生命周期：创建、启动、停止容器、拉取和存储镜像、配置挂载、网络等。 containerd 旨在轻松嵌入到更大的系统中。Docke…

阅读更多...

Python数据分析系列（二）：python基础

Python数据分析系列（二）：python基础

文章目录前言一、条件语句1、if 语句2、else 语句3、elif 语句4、条件嵌套练习题二、循环语句1、for循环2、while循环3、循环中的break/continue和else、passbreakcontinueelsepass4、循环与递归练习题三、python函数1、自定义函数2、lambda函数（匿名函数）3、常用标准库函数…

阅读更多...

YOLOv5训练结果分析

YOLOv5训练结果分析

本文的目的是帮助理解每次训练后，在runs/train文件夹下出现的一系列文件，并探索如何评估准确率以及模型的好坏。一.混淆矩阵—confusion_matrix.png 毕设跑的train有混淆矩阵，但是有点扯，需要跑一下鸟类的验证一下(待验证) 1.概…

阅读更多...

吴恩达2022机器学习专项课程(一）8.2 解决过拟合

吴恩达2022机器学习专项课程(一）8.2 解决过拟合

目录解决过拟合（一）：增加数据解决过拟合（二）：减少特征特征选择缺点解决过拟合（三）：正则化总结解决过拟合（一）：增加数据收集更多训…

阅读更多...

python web开发开源规范

python web开发开源规范

Hello , 大家好。首先在五一假期给所有劳动者创造者们送上祝福， 本文聊聊我对python web开源相关的规范 PEP 8 Python编程风格指南:PEP 8是Python编程的官方风格指南，提供了关于代码格式、命名规范、注释等方面的建议。遵循PEP 8可以使代码更易于阅读和…

阅读更多...

Spring Data JPA数据批量插入、批量更新真的用对了吗

Spring Data JPA数据批量插入、批量更新真的用对了吗

Spring Data JPA系列 1、SpringBoot集成JPA及基本使用 2、Spring Data JPA Criteria查询、部分字段查询 3、Spring Data JPA数据批量插入、批量更新真的用对了吗前言在前两篇文章已经介绍过，在使用Spring Data JPA时，DAO层的Respository通过继承J…

阅读更多...

【PHP】安装指定版本Composer

【PHP】安装指定版本Composer

1、下载指定版本composer.phar文件：https://github.com/composer/composer/releases 2、将下载的文件添加到全局路径： sudo mv composer.phar /usr/local/bin/composer 3、赋予权限： sudo chmod x /usr/local/bin/composer 4、查看compos…

阅读更多...

Android 文件传输

Android 文件传输

经常写adb命令传文件，结果发现Android studio有自带的文件管理器，可以上传下载文件。

阅读更多...

模型剪枝-Network Slimming算法分析

模型剪枝-Network Slimming算法分析

代码见文末论文地址：Learning Efficient Convolutional Networks through Network Slimming ICCV 2017 Open Access Repository 1.概述由于边缘设备的限制，在模型的部署中经常受到模型大小、运行内存、计算量的限制。之前的方法要么只能解决其中一个…

阅读更多...

hdc不是内部或外部命令，也不是可运行的程序或批处理文件。【鸿蒙报错已解决】

hdc不是内部或外部命令，也不是可运行的程序或批处理文件。【鸿蒙报错已解决】

文章目录项目场景：问题描述原因分析：解决方案：此Bug解决方案总结Bug解决方案寄语项目场景：最近遇到了这个问题，看到网上也有人在询问这个问题，实操了很多网上的解决方案发现并不能解决这个Bug，所以我在解决这个问题后，总结了自己和其他人的解决经验，进行了整理，写…

阅读更多...

翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构深度学习二

翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构深度学习二

合集 ChatGPT 通过图形化的方式来理解 Transformer 架构翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构深度学习一翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构深度学习二翻译: 什么是ChatGPT 通过图形化的方式来理解 Transformer 架构深…

阅读更多...

2024年五一杯高校数学建模竞赛（A题）|钢板切割问题 | 建模解析，小鹿学长带队指引全代码文章与思路

2024年五一杯高校数学建模竞赛（A题）|钢板切割问题 | 建模解析，小鹿学长带队指引全代码文章与思路

我是鹿鹿学长，就读于上海交通大学，截至目前已经帮200人完成了建模与思路的构建的处理了～ 本篇文章是鹿鹿学长经过深度思考，独辟蹊径，通过路径优化解决钢板切割问题。结合贪心算法，Floyd-Warshall等多元算法…

阅读更多...

【开发技巧 | 第一篇】Typora快捷键方式给字体添加颜色

【开发技巧 | 第一篇】Typora快捷键方式给字体添加颜色

文章目录 1.Typora快捷键方式给字体添加颜色1.1下载并安装AutoHotkey1.2新建ahk脚本文件1.3运行ahk脚本文件1.4小结 1.Typora快捷键方式给字体添加颜色 1.1下载并安装AutoHotkey 点击下载: https://autohotkey.com/download/ahk-install.exe下载安装包，执行安装&a…

阅读更多...

推荐文章

最新文章