Mistral 7B 比Llama 2更好的开源大模型 (一)

news2024/12/23 13:59:52

Mistral 7B 简介

Mistral 7B

Mistral 7B 是一个 7.3B 参数模型:

  • 在所有基准测试中优于 Llama 2 13B
  • 在许多基准测试中优于 Llama 1 34B
  • 接近 CodeLlama 7B 的代码性能,同时保持擅长英语任务
  • 使用分组查询注意力 (GQA) 加快推理速度
  • 使用滑动窗口注意力 (SWA) 以更低的成本处理更长的序列

性能细节

将 Mistral 7B 与 Llama 2 系列进行比较,运行所有模型评估,以便进行公平比较。
在这里插入图片描述

Mistral 7B 和不同 Llama 模型在各种基准测试中的性能。Mistral 7B 在所有指标上都明显优于 Llama 2 13B,与 Llama 34B 相当,在代码和推理基准方面也非常出色。

基准测试按其主题分类:

  • 常识推理: 0-shot average of Hellaswag, Winogrande, PIQA, SIQA, OpenbookQA, ARC-Easy, ARC-Challenge, and CommonsenseQA.
  • 世界知识: 5-shot average of NaturalQuestions and TriviaQA.
  • 阅读理解: 0-shot average of BoolQ and QuAC.
  • 数学 : Average of 8-shot GSM8K with maj@8 and 4-shot MATH with maj@4

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1202186.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

创意卡片制作

效果展示 CSS 知识点 box-shadow 属性灵活运用background 属性的 linear-gradient 值灵活运用 页面整体结构 <div class"container"><div class"card"><div class"icon"><ion-icon name"rocket-outline">&…

BAT 批处理指令总结

目录 一. 前言 二. 常用指令 2.1. HELP 2.2. REM 和 :: 2.3. ECHO 和 @ 2.4. PAUSE 2.5. ERRORLEVEL 2.6. TITLE 2.7. COLOR 2.8. GOTO 和 : 2.9. FIND 2.10. START 2.11. ASSOC 和 FTYPE 2.12. PUSHD 和 POPD 2.13. CALL 2.14. SHIFT 2.15. IF 2.15.1. IF […

第二篇:cocos-shader 入门三

YAML yaml语言主要用于声明整个着色器程序的流程。包含了顶点着色器程序的名字、片元着色器程序的名字、渲染技术&#xff08;混合、深度测试、模板测试等&#xff09;、Uniform 变量等。 uniform 变量 #include <cc-local> #include <cc-global> #include<…

微服务 Spring Cloud 6,用了这么多年Docker容器,殊不知你还有这么多弯弯绕

目录 一、神之容器 Docker二、Docker架构图1、Docker Client 客户端2、Docker Daemon 守护进程3、镜像&#xff08;Image&#xff09;4、Docker Driver 驱动模块5、Docker Graph内部数据库6、Docker Libcontainer函数库7、Docker Container 容器实例 三、Docker安装1、卸载Dock…

前端基础------margin上下传递

1&#xff0c;出现的原因及解决方法 ◼ margin-top传递 如果块级元素的顶部线和块级父元素的顶部线重叠&#xff0c;那么这个块级元素的margin-top值会传递给父元素 ◼ margin-bottom传递 如果块级元素的底部线和块级父元素的底部线重叠&#xff0c;并且父元素的高度是…

计算机毕设 推荐系统设计与实现 协同过滤推荐算法

文章目录 0 前言简介常见推荐算法协同过滤分解矩阵聚类深度学习 协同过滤原理系统设计示例代码(py) 系统展示系统界面推荐效果 最后 0 前言 &#x1f525; 这两年开始毕业设计和毕业答辩的要求和难度不断提升&#xff0c;传统的毕设题目缺少创新和亮点&#xff0c;往往达不到毕…

PM2.5数据-省份、城市、区县(1998-2021年)

PM2.5是指直径小于或等于2.5微米的颗粒物&#xff0c;能深入人体呼吸系统&#xff0c;对人体健康产生重大影响。该份数据是关于中国省市县PM2.5的数据集&#xff0c;是根据Atmospheric Composition Analysis Group的PM2.5数据进行整理得到的面板数据。记录了中国各省、市、县的…

ESP32 BLE特征值示例

键盘特征值初始化示例 void BleKeyboard::begin(void) {BLEDevice::init(deviceName);BLEServer* pServer BLEDevice::createServer();pServer->setCallbacks(this);hid new BLEHIDDevice(pServer);inputKeyboard hid->inputReport(KEYBOARD_ID); // <-- input R…

媒体软文投放的流程与媒体平台的选择

海内外媒体软文&#xff1a;助力信息传播与品牌建设 在当今数字化时代&#xff0c;企业如何在庞大的信息海洋中脱颖而出&#xff0c;成为品牌建设的领军者&#xff1f;媒体软文投放无疑是一项强大的策略&#xff0c;通过选择合适的平台&#xff0c;精准投放&#xff0c;可以实…

软件推荐目录——按类划分

之前的文章中&#xff0c;博主介绍过诸多实用的软件&#xff0c;今天博主就继续来泛总结一下电脑常用的功能里&#xff0c;有哪些天花板级别存在的软件呢。 1. 浏览器 在之前的文章中&#xff0c;学长已经详细介绍过优秀的浏览器产品&#xff0c;还是同样的套路&#xff1a;外网…

蓝桥杯每日一题2023.11.13

题目描述 蓝桥杯大赛历届真题 - C 语言 B 组 - 蓝桥云课 (lanqiao.cn) 题目分析 由于每次吹灭的蜡烛与年龄相同故我们想到使用前缀和可以让我们求出各个区间的和&#xff0c;我们将每个区间都枚举一遍&#xff0c;如果符合要求就输出区间开始的位置&#xff08;答案&#xff…

专业开源人员的需求仍在增长

Linux 基金会执行总监根据 Dice.com 的一项调查结果表示&#xff1a;「开源正变得越来越专业化&#xff0c;各大公司都在寻求具备这方面技能的专业型人才。」网上有研究分析了两组「2017 年度开源工作调查与报告」&#xff0c;主要分析结果如下&#xff1a; 89% 的招聘人员表示…

机带RAM:16G(可用2G)

文章目录 机带RAM 16G&#xff08;可用2G&#xff09;一 、问题描述二、解决办法2.1 最大内存设置 2.2 系统激活重启 机带RAM 16G&#xff08;可用2G&#xff09; 一 、问题描述 戴尔商务计算机 Windows11系统 16GB内存 之前一直是正常使用的&#xff0c;突然有一天内存占用率…

【杂记】WinServer 2019解决net3.5无法安装问题

1. 问题描述 由于QA环境中的OSCE V16服务端是部署在虚拟机Windows Server 2019上&#xff0c;当进行数据库的迁移操作时&#xff0c;操作系统会提示缺少.NET Framework 3.5组件(SQL Server数据库系统的运行需要依靠.NET Framework 3.5&#xff0c;但是Windows Server2019默认情…

【rl-agents代码学习】01——总体框架

文章目录 rl-agent Get startInstallationUsageMonitoring 具体代码 学习一下rl-agents的项目结构以及代码实现思路。 source: https://github.com/eleurent/rl-agents rl-agent Get start Installation pip install --user githttps://github.com/eleurent/rl-agentsUsage…

第一章:线性查找

系列文章目录 文章目录 系列文章目录前言一、线性查找二、实现查找算法三、循环不变量四、复杂度分析五、常见复杂度六、测试算法性能总结 前言 从线性查找入手算法。 一、线性查找 线性查找目的在线性数据结构中一个一个查找目标元素输入数组和目标元素输出目标元素所在的索…

LCA

定义 最近公共祖先简称 LCA&#xff08;Lowest Common Ancestor&#xff09;。两个节点的最近公共祖先&#xff0c;就是这两个点的公共祖先里面&#xff0c;离根最远的那个。 性质 如果 不为 的祖先并且 不为 的祖先&#xff0c;那么 分别处于 的两棵不同子树中&#…

Clickhouse学习笔记(13)—— Materialize MySQL引擎

该引擎用于监听 binlog 事件&#xff0c;类似于canal、Maxwell等组件 ClickHouse 20.8.2.3 版本新增加了 MaterializeMySQL 的 database 引擎&#xff0c;该 database 能映射到 MySQL中的某个database &#xff0c;并自动在ClickHouse中创建对应ReplacingMergeTree。 ClickHous…

【Python Opencv】图片与视频的操作

文章目录 前言一、opencv图片1.1 读取图像1.2 显示图像1.3 写入图像1.4 示例代码 二、Opencv视频2.1 从相机捕获视频获取摄像头一帧一帧读取显示图片VideoCapture 中的get和set函数示例代码 2.2 从文件播放视频示例代码 2.3 保存视频示例代码 总结 前言 在计算机视觉和图像处理…

As Const:一个被低估的 TypeScript 特性

目录 理解 as const TypeScript的期望与现实 解决方案&#xff1a;as const 与 object.freeze 的比较 一个配合 as const 的更清洁的 go to root 函数 使用 as const 提取对象值 基于Vue3.0的优秀低代码项目 你有没有感觉 TypeScript中可能有一些被低估但却非常有用的工…