前言:
在介绍这个大语言模型之前,我们需要先来回顾一个事情,大家应该都知道,在去年 11 月,OpenAI 经历了 CEO Altman 被解雇(后又重返)的风波。而微软作为OpenAI的最大股东,直至Altman被解雇前的几分钟才得知消息,所以实质上微软对于OpenAI内部是没有任何的决策权的。也是在这件事情之后,微软在OpenAI内部设立了一个无权利的观察席位,以便及时获知OpenAI的内部消息。那么我们今天要说的就是这个大语言模型,同样也被微软投资,并且微软成功将其收编,进一步的完善了其Azure云平台。与OpenAI不同的是,微软拥有这个大语言模型的部分股权,但具体多少尚不可知。
所以,我们今天要介绍的这个大语言模型,就是被誉为【欧洲版“OpenAI”】的Mistral Large
Mistral AI于2023年5月由前Meta Platforms和Alphabet的研究员Arthur Mensch(目前担任CEO)、Guillaume Lample和Timothee Lacroix联合创办。这家初创企业成立仅四周便成功筹得1.13亿美元的种子资金,初步估值达到2.6亿美元。仅成立六个月,Mistral AI在A轮融资中募集资金高达4.15亿美元,公司估值急剧上升至20亿美元,增长了逾七倍。值得一提的是,当时公司的团队规模还不超过22人。
试用链接:Sign in
Mistral Large是Mistral AI发布的最新旗舰产品,并且推出对标 ChatGPT 的对话产品:Le Chat,Mistral AI 将获得 OpenAI 同等待遇,直接将模型资源放在微软云当中售卖,成为第二家在微软 Azure 云平台上提供商业 AI 模型的公司。
根据Mistral AI CEO Arthur Mensch透漏,Mistral Large的开发成本不到2200万美元,但是需要特别指出的是,Mistral之前的产品是开源的,但是跟微软合作之后推出的新产品就又不开源了,这不禁让人联想到OpenAI,Mistral AI 是否走上了 OpenAI 开源再闭源的老路?
在其官网首页介绍“Mistral Large 是我们新的尖端文本生成模型。它达到顶级推理能力。它可用于复杂的多语言 推理任务,包括文本理解、转换和代码生成。”
下面我们来看一下Mistral 自己公布的基准测试数据
1.推理和知识
在一系列广泛的常识、推理和知识测试中,与其他顶尖的大型语言模型(LLM)进行了比较,这些测试包括MMLU(大规模多任务语言理解测量)、HellaSwag(10次射击)、WinoGrande(5次射击)、Arc挑战(5次射击)、Arc挑战(25次射击)、TriviaQA(5次射击)和TruthfulQA。
2.多语种能力
Mistral Large具有本地的多语种能力。它强烈 在HellaSwag、Arc Challenge和MMLU基准测试中,优于LLaMA 2 70B 法语、德语、西班牙语和意大利语。
3.数学与编码
Mistral Large 不仅在语言方面展现出了卓越的才能,同时在数学和编程领域表现的逻辑思维能力也同样出色。
Mistral Large 可以自行部署在其环境中,并能够获取模型的权重数据。在 Azure AI 的服务中,Mistral Large 的费用结构是:每千个输出token的成本为0.024美元,而每千个输入token的费用是0.008美元。与此相比,具有128K上下文窗口的GPT-4 Turbo的定价策略是:每千个输出token的价格为0.03美元,输入则为每千个token 0.01美元。
目前可以直接用微软账号登陆Mistral Large(免费),下面我们来使用一下看看:
这里我提出了一个需求:
帮我编写一个。500字的小故事
主题:
环保与科技的结合
故事背景:
在一个未来的世界里,地球面临严重的环境危机。人类依赖高科技解决方案来挽救濒临崩溃的生态系统。
主要角色:
艾米:一个年轻的环境科学家,擅长生物工程。
罗伯:艾米的机器人助手,具有先进的数据分析和实地操作能力。
萨菲亚:一颗拥有自我意识的超级计算机,负责监控和管理全球生态平衡。
编写的故事内容可以说是非常的详细了,Mistral Large的默认回复状态为英文,于是在完成回答之后,我让他帮我翻译成中文。
这里比较有意思的是,当它在执行翻译任务的过程中,发现我要求的中文字数是500字,已经超过了我的要求,然后会询问我是否需要继续翻译,或者是简化内容,以满足我的要求。这点,我感觉ChatGPT好像是做不到的哦~
Mistral Large是一个纯文本的AI模型,因此它不具备像ChatGPT和Claude那样的多模态功能。
总结一下Mistral Large的特点
-
多语言流利度和文化理解: Mistral Large 在多个主要语言——英语、法语、西班牙语、德语及意大利语方面展现出天然的流利度。不仅如此,它还对这些语言的语法结构和文化背景有着细腻的理解,能够处理复杂的语言任务和文化相关的细节。
-
宽广的上下文窗口: 通过其32K token 的上下文窗口,Mistral Large 能够从大型文档中精确地提取并回忆信息。这种能力使其在处理长篇幅的文本或需要大量背景信息的任务时表现卓越。
-
精确的指令遵循能力: Mistral Large 能够精确地遵循开发者给出的指令,使其能够根据特定的需求定制审核政策。这一特点被 Mistral AI 用于为其产品Le Chat 设定系统级的审核标准,确保内容的质量和安全性。
-
内置的函数调用能力: Mistral Large 天然具备函数调用功能,这一点,结合在 la Plateforme 上实施的限制性输出模式,不仅简化了应用开发过程,还使得技术栈的现代化能够在更广泛的范围内实现规模化,从而提高开发效率和应用性能。
好啦,今天的介绍到这里就结束啦,如果你们也对Mistral Large感兴趣的话,可以直接戳前面的链接去使用哦,目前是免费使用的状态,白嫖(非常香)还不快去!