世界排名第二的大语言模型,你听说过吗?

news2024/11/16 20:35:00

前言:

在介绍这个大语言模型之前,我们需要先来回顾一个事情,大家应该都知道,在去年 11 月,OpenAI 经历了 CEO Altman 被解雇(后又重返)的风波。而微软作为OpenAI的最大股东,直至Altman被解雇前的几分钟才得知消息,所以实质上微软对于OpenAI内部是没有任何的决策权的。也是在这件事情之后,微软在OpenAI内部设立了一个无权利的观察席位,以便及时获知OpenAI的内部消息。那么我们今天要说的就是这个大语言模型,同样也被微软投资,并且微软成功将其收编,进一步的完善了其Azure云平台。与OpenAI不同的是,微软拥有这个大语言模型的部分股权,但具体多少尚不可知。


所以,我们今天要介绍的这个大语言模型,就是被誉为【欧洲版“OpenAI”】的Mistral Large

Mistral AI于2023年5月由前Meta Platforms和Alphabet的研究员Arthur Mensch(目前担任CEO)、Guillaume Lample和Timothee Lacroix联合创办。这家初创企业成立仅四周便成功筹得1.13亿美元的种子资金,初步估值达到2.6亿美元。仅成立六个月,Mistral AI在A轮融资中募集资金高达4.15亿美元,公司估值急剧上升至20亿美元,增长了逾七倍。值得一提的是,当时公司的团队规模还不超过22人。

试用链接:Sign in


Mistral Large是Mistral AI发布的最新旗舰产品,并且推出对标 ChatGPT 的对话产品:Le Chat,Mistral AI 将获得 OpenAI 同等待遇,直接将模型资源放在微软云当中售卖,成为第二家在微软 Azure 云平台上提供商业 AI 模型的公司。

根据Mistral AI CEO Arthur Mensch透漏,Mistral Large的开发成本不到2200万美元,但是需要特别指出的是,Mistral之前的产品是开源的,但是跟微软合作之后推出的新产品就又不开源了,这不禁让人联想到OpenAI,Mistral AI 是否走上了 OpenAI 开源再闭源的老路?

在其官网首页介绍“Mistral Large 是我们新的尖端文本生成模型。它达到顶级推理能力。它可用于复杂的多语言 推理任务,包括文本理解、转换和代码生成。”


下面我们来看一下Mistral 自己公布的基准测试数据

1.推理和知识

在一系列广泛的常识、推理和知识测试中,与其他顶尖的大型语言模型(LLM)进行了比较,这些测试包括MMLU(大规模多任务语言理解测量)、HellaSwag(10次射击)、WinoGrande(5次射击)、Arc挑战(5次射击)、Arc挑战(25次射击)、TriviaQA(5次射击)和TruthfulQA。

2.多语种能力

Mistral Large具有本地的多语种能力。它强烈 在HellaSwag、Arc Challenge和MMLU基准测试中,优于LLaMA 2 70B 法语、德语、西班牙语和意大利语。 

3.数学与编码

Mistral Large 不仅在语言方面展现出了卓越的才能,同时在数学和编程领域表现的逻辑思维能力也同样出色。

Mistral Large 可以自行部署在其环境中,并能够获取模型的权重数据。在 Azure AI 的服务中,Mistral Large 的费用结构是:每千个输出token的成本为0.024美元,而每千个输入token的费用是0.008美元。与此相比,具有128K上下文窗口的GPT-4 Turbo的定价策略是:每千个输出token的价格为0.03美元,输入则为每千个token 0.01美元。


目前可以直接用微软账号登陆Mistral Large(免费),下面我们来使用一下看看:

这里我提出了一个需求:

帮我编写一个。500字的小故事

主题:

环保与科技的结合

故事背景:

在一个未来的世界里,地球面临严重的环境危机。人类依赖高科技解决方案来挽救濒临崩溃的生态系统。

主要角色:

艾米:一个年轻的环境科学家,擅长生物工程。

罗伯:艾米的机器人助手,具有先进的数据分析和实地操作能力。

萨菲亚:一颗拥有自我意识的超级计算机,负责监控和管理全球生态平衡。

编写的故事内容可以说是非常的详细了,Mistral Large的默认回复状态为英文,于是在完成回答之后,我让他帮我翻译成中文。

这里比较有意思的是,当它在执行翻译任务的过程中,发现我要求的中文字数是500字,已经超过了我的要求,然后会询问我是否需要继续翻译,或者是简化内容,以满足我的要求。这点,我感觉ChatGPT好像是做不到的哦~

Mistral Large是一个纯文本的AI模型,因此它不具备像ChatGPT和Claude那样的多模态功能。

总结一下Mistral Large的特点

  1. 多语言流利度和文化理解: Mistral Large 在多个主要语言——英语、法语、西班牙语、德语及意大利语方面展现出天然的流利度。不仅如此,它还对这些语言的语法结构和文化背景有着细腻的理解,能够处理复杂的语言任务和文化相关的细节。

  2. 宽广的上下文窗口: 通过其32K token 的上下文窗口,Mistral Large 能够从大型文档中精确地提取并回忆信息。这种能力使其在处理长篇幅的文本或需要大量背景信息的任务时表现卓越。

  3. 精确的指令遵循能力: Mistral Large 能够精确地遵循开发者给出的指令,使其能够根据特定的需求定制审核政策。这一特点被 Mistral AI 用于为其产品Le Chat 设定系统级的审核标准,确保内容的质量和安全性。

  4. 内置的函数调用能力: Mistral Large 天然具备函数调用功能,这一点,结合在 la Plateforme 上实施的限制性输出模式,不仅简化了应用开发过程,还使得技术栈的现代化能够在更广泛的范围内实现规模化,从而提高开发效率和应用性能。


好啦,今天的介绍到这里就结束啦,如果你们也对Mistral Large感兴趣的话,可以直接戳前面的链接去使用哦,目前是免费使用的状态,白嫖(非常香)还不快去!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1508557.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【DAY10 软考中级备考笔记】数据结构 图

数据结构 图 3月11日 – 天气:晴 晚上无线网络突然不能用了,花费好久弄这个,耽误了一些时间 1. 图的定义 这里需要注意完全图的定义,以及完全图的边数 这里需要注意连通图和连通分量的概念。 2. 图的存储结构 图有两种存储结构&a…

PortSwigger 基于dom的漏洞-利用 DOM 破坏来启用 XSS

进入实验随意进入一篇博客 我们可以尝试随意提交一些恶意代码看看会发生什么 很显然我们提交成功了但是我们的恶意代码貌似被过滤了 查看源码发现这里有一个过滤框架 我们打开源码分析 function loadComments(postCommentPath) {let xhr new XMLHttpRequest();xhr.onreadys…

植物病害识别:YOLO水稻病害识别/分类数据集(2000多张,2个类别,yolo标注)

YOLO水稻病害识别/分类数据集,包含疾病和正常2类,共2000多张图像,yolo标注完整,可直接训练。 适用于CV项目,毕设,科研,实验等 需要此数据集或其他任何数据集请私信

基于单片机的视觉导航小车设计

目 录 摘 要 I Abstract II 引 言 1 1 总体方案设计 3 1.1 方案论证 3 1.2 项目总体设计 3 2 项目硬件设计 4 2.1 主控模块设计 4 2.1.1单片机选型 4 2.1.2 STM32F103RCT6芯片 4 2.2单片机最小系统电路 5 2.3电机驱动模块设计 7 2.4红外模块设计 8 2.5红外遥控模块设计 9 2.6超…

Logseq电脑端+安卓端同步gitee或github

文章目录 0.初衷1.电脑端1.1 新建仓库1.2 克隆项目,生成秘钥1.3 添加图谱,选择文件目录,我是原本就有笔记,所以会如下所示。1.4 下载脚本文件1.5赋权限 (windows可跳过)1.6 修改脚本命令1.7 logseq设置同步…

Docker命令大全与实例详解

本文旨在汇总和深入解析日常工作与学习中频繁接触到的Docker核心命令,通过实例演示来巩固记忆,以便读者在实际操作中迅速查阅和高效运用。Docker作为一种轻量级容器技术,已经成为现代应用部署与管理的重要工具。本文将涵盖从基本的Docker环境…

公网ip和局域网ip

什么是公网IP? 公网,俗称外网,又被叫做互联网,是连接不同地区局域网或者城域网计算机的通信的远程网络。通常可以跨接很大的物理范围,连接多个地区、城市和国家提供远距离通信,形成全球性的互联网络。因此…

MySQL临时表创建出错(OS errno 13 - Permission denied)

一个客户向我抱怨:在MySQL查询小表没有问题,查询大表出错,下面是他发给我的出错的部分截屏(客户的表名被我隐藏了)。 这里的给出的信息已经比较明显了,是向/tmp目录中创建临时表失败(临时表的路…

555经典电路

1、555介绍: 555 定时器是一种模拟和数字功能相结合的中规模集成器件。一般用双极性工艺制作的称为 555,用 CMOS 工艺制作的称为 7555,除单定时器外,还有对应的双定时器 556/7556。555 定时器的电源电压范围宽,可在 4…

YoLo进化史《A COMPREHENSIVE REVIEW OF YOLO: FROM YOLOV1 TOYOLOV8 AND BEYOND》

Abstract YOLO已成为机器人、无人驾驶汽车和视频监控应用的核心实时目标检测系统。我们对YOLO的发展进行了全面的分析,研究了从最初的YOLO到YOLOv8的每次迭代中的创新和贡献。我们首先描述标准指标和后处理;然后,我们讨论了网络架构的主要变化和每个模型…

工具篇--分布式定时任务springBoot--elasticjob简单使用(1)

文章目录 前言一、elasticjob 介绍:二、elasticjob 使用:2.1 部署zookeeper:2.2 引入库2.2 定义任务:2.3 任务执行:2.4 任务执行控制台输出: 三、elasticjob 启动错误:3.1 KeeperErrorCode Ope…

数据结构->双向链表带你体验开火车(哨兵)与拼接火车(应用)厢的乐趣

✅作者简介:大家好,我是橘橙黄又青,一个想要与大家共同进步的男人😉😉 🍎个人主页:橘橙黄又青-CSDN博客 目的:学习双向带头链表的增,删,查,销毁…

Vue+SpringBoot打造个人健康管理系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 健康档案模块2.2 体检档案模块2.3 健康咨询模块 三、系统展示四、核心代码4.1 查询健康档案4.2 新增健康档案4.3 查询体检档案4.4 新增体检档案4.5 新增健康咨询 五、免责说明 一、摘要 1.1 项目介绍 基于JAVAVueSpri…

PyTorch 源码解读之 torch.cuda.amp: 自动混合精度详解

PyTorch 源码解读之 torch.cuda.amp: 自动混合精度详解 Nvidia 在 Volta 架构中引入 Tensor Core 单元,来支持 FP32 和 FP16 混合精度计算。也在 2018 年提出一个 PyTorch 拓展 apex,来支持模型参数自动混合精度训练。自动混合精度(Automati…

2024.03.11作业

1. 提示并输入一个字符串&#xff0c;统计该字符串中大写小写字母个数&#xff0c;数字个数&#xff0c;空格个数以及其他字符个数&#xff0c;要求使用c风格字符串完成 #include <iostream> #include <string>using namespace std;int main() {cout << &qu…

蓝桥杯2023年第十四届Java省赛真题-矩形总面积

题目描述 平面上有个两个矩形 R1 和 R2&#xff0c;它们各边都与坐标轴平行。设 (x1, y1) 和(x2, y2) 依次是 R1 的左下角和右上角坐标&#xff0c;(x3, y3) 和 (x4, y4) 依次是 R2 的左下角和右上角坐标&#xff0c;请你计算 R1 和 R2 的总面积是多少&#xff1f; 注意&…

设计模式深度解析:工厂方法模式与抽象工厂模式的深度对比

​&#x1f308; 个人主页&#xff1a;danci_ &#x1f525; 系列专栏&#xff1a;《设计模式》 &#x1f4aa;&#x1f3fb; 制定明确可量化的目标&#xff0c;坚持默默的做事。 探索设计模式的魅力&#xff1a;工厂方法模式文章浏览阅读17k次&#xff0c;点赞105次&#xff0…

根据xlsx文件第一列的网址爬虫(selenium)

seleniumXpath 在与该ipynb文件同文件下新增一个111.xlsx&#xff0c;第一列放一堆需要爬虫的同样式网页 然后使用seleniumXpath爬虫 from selenium import webdriver from selenium.webdriver.common.by import By import openpyxl import timedef crawl_data(driver, url)…

2024年零基础自学网络安全/Web安全,看这一篇就够了

作为一个安全从业人员&#xff0c;我自知web安全的概念太过于宽泛&#xff0c;我本人了解的也并不够精深&#xff0c;还需要继续学习。 但又不想新入行的人走弯路&#xff0c;所以今天随手写写关于web安全的内容&#xff0c;希望对初次遇到web安全问题的同学提供帮助&#xff…

334.递增的三元子序列

题目&#xff1a;给你一个整数数组 nums &#xff0c;判断这个数组中是否存在长度为 3 的递增子序列。 如果存在这样的三元组下标 (i, j, k) 且满足 i < j < k &#xff0c;使得 nums[i] < nums[j] < nums[k] &#xff0c;返回 true &#xff1b;否则&#xff0c;…