新火种AI|微软扶持下一个OpenAI?Mistral AI新模型对标GPT-4,上线即挤爆

news2025/1/23 15:13:34

作者:一号

编辑:美美

OpenAI的大金主微软,还想缔造“下一个OpenAI”。

周一晚间,成立仅9个月的Mistral AI正式发布了最强力的旗舰模型Mistral Large。和此前他们所推出的一系列模型不同,Mistral AI本次发布的版本性能更强,体量也更大,直接对标OpenAI的GPT-4。

在目前所有能够通过API访问的大模型中,Mistral Large排名第二,仅次于“当红明星”GPT-4,并且和GPT-4一样,是唯二在MMLU考试中拿到了80分以上的。

而且随着Mistral Large上线,Mistral AI还推出了名为Le Chat的聊天机器人,对标ChatGPT,大有复制OpenAI成功道路的意图。即便有微软Azure算力资源的加持,Le Chat的服务器还是被挤爆了。

忘了初心,开源变闭源?

早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因为其强大的性能,还有令人意外的开源而名噪一时。使得不少的大模型初创企业不再对标Llama2这个开源模型,而是转而将Mistral旗下的模型作为直接竞争对手。这一次Mistral Large的横空出世,自然引人注目。

从性能上来说,尽管Mistral Large在参数量上还比不上GPT-4,但在一些关键性能上,它还是能够和GPT-4一战的,可以说,已经是当前业内前三的地位。

在推理准确性上,Mistral Large也已经超过了Claude 2、Gemini 1.0 Pro、GPT-3.5等一众为人所熟知的大模型,并且它还支持32k token的上下文窗口,支持精确指令,自带函数调用能力。在推理速度上,Mistral Large甚至还超过了GPT-4还有谷歌刚推出不久的Gemini Pro。

但有眼尖的网友发现,Mistral修改了网站内容,删除了所有提及开源社区义务的内容,这让不少开源大模型爱好者开始担心,Mistral AI也会像OpenAI一样,从开放走向封闭。

不过据媒体对Mistral CEO的采访,未来他们依旧会坚持开源理念,但与此同时,也会推出性能最为强大的闭源模型来参与商业竞争。

从诞生之初,就充满传奇光环

谁能想到,今天这个逼近GPT-4的模型,是来自一家仅仅成立9个月的法国公司。

Mistral AI的创始人Arthur Mensch在1993年时出生于法国。在巴黎综合理工学院和巴黎高等师范学院学习期间,他结识了后来成为Mistral AI联合创始人的Timothée Lacroix和Guillaume Lample。而后两位都曾在Meta AI团队工作过,其中Lample还领导了LLaMA模型的开发。在那时,全球范围内具备构建、训练和优化大型语言模型(LLM)专业经验的人才不超过100人。

Arthur Mensch本人也颇有实力。他在2020年初便加入了谷歌,成为了DeepMind的研究员,专注于提高AI和机器学习系统的效率。在那里,他参与开发了大型语言模型,并以主要作者的身份发表了著名的“Chinchilla论文”,该研究重新定义了人们对AI模型大小、训练数据量及其性能之间关系的认识。

然而随着AI竞赛的升温,Mensch对于大公司AI实验室减少与研究社区分享研究成果的做法感到失望。他所在的团队从一个10人的小团队迅速扩大到70人的大团队,但他觉得在大型科技公司中开发不透明的技术过于官僚化,于是决定离开。

2023年初,他离开了谷歌,和前文所提到的Lacroix和Lample一起创立了Mistral AI。他们的目标是通过更加高效的方法构建和部署AI模型,并坚持开源模型的原则,希望让每个人对自己使用的AI有更多的控制权。

在种子轮融资时,Mistral AI的故事更具传奇色彩:一个6人团队凭借着7页PPT就拿到了8亿欧元的融资。而当前公司的估值已经达到了20亿美元,涨了七倍多。尽管与美国的竞争者相比,所获得的资金并不算多,但他们的目标是成为AI领域中最节省资本的公司。

微软想要打造下一个OpenAI?

在Mistral Large以令人惊喜的性能收获目光之时,微软CEO纳德拉宣布,微软已经和Mistral AI建立了多年合作伙伴关系。这也是微软继OpenAI之后,又再一次地把“真金白银”投给了AI圈的另一家顶流模型公司。

人们不禁怀疑,微软这是想要打造“下一个OpenAI”?

根据公告,微软和Mistral AI的合作将集中在以下三个关键领域:

超算基础结构:微软将通过Azure AI超算基础结构支持Mistral AI,用于AI训练和推理工作负载。

扩展市场:微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务(MaaS)向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外,模型目录还提供了多种开源和商业模型。

人工智能研发:微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。

毫无疑问,除了OpenAI之外,微软还想给自己的Azure云服务吸引更多客户。并且,微软两头下注,实际上很可能是想要分散风险,并且期望获得更大的影响力。

去年11月,OpenAI经历了CEO奥特曼被解雇而后又重返的董事会风波。而作为OpenAI的最大股东,微软直到消息公布之前的5到10分钟才从OpenAI那里得到消息。尽管在这场风波之后,微软设法在控制 OpenAI 的非营利性董事会中获得了一个无投票权的观察员席位,这让他们对OpenAI的内部运作有了更多的了解,但在一些重大决策上,微软依旧没有投票权。

微软作为OpenAI的最大金主,显然没在OpenAI的决策上取得与之相对应的影响力。因此,微软想要扶持另一家能够与OpenAI对位的企业也是情理之中。

这一点,在路透社对Mistral AI的采访中也得到了体现,Mistral AI承认,作为交易的一部分,微软将持有该公司少数股权,但并没有透露更多细节。而微软这边则仅仅是证实了其对Mistral的投资,在是否持有该公司股权的问题上,微软给出了否定的回答。而这很可能与微软因向OpenAI提供了巨额资金而受到欧洲和美国监管机构的审查有关。

另外,由于Mistral AI是一家法国公司,在语言支持上也更加偏向于欧洲本土语言,因此微软投资Mistral AI也是想要在欧洲建立起自己的AI影响力,在欧洲AI领域站稳脚跟。

与美国不同,欧洲许多国家对AI的态度偏保守,持批判性看法,尤其是数据保护方面。因此投资一家欧洲本土的AI企业,打造一家“欧洲版OpenAI”,也许能够更让人放心。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1474626.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TikTok矩阵系统的功能展示:深入解析与源代码分享!

今天我来和大家说说TikTok矩阵系统,在当今数字化时代,社交媒体平台已成为人们获取信息、交流思想和娱乐放松的重要渠道,其中,TikTok作为一款全球知名的短视频社交平台,凭借其独特的创意内容和强大的算法推荐系统&#…

有效防止CDN网站被溯源ip的教程

如何反溯源隐藏自己的源IP防止溯源? 还有些大牛会进行渗透攻击、CC攻击,溯源打服务器,各式各样的,防不胜防。所以很多站长套起了cdn,比起cdn提供的加速效果,更多的站长可能还是为了保护那可怜弱小的源站ip…

Docker(运维工具)—— 学习笔记

快速构建、运行、管理应用的工具 一、安装docker 参考Install Docker Engine on Ubuntu | Docker Docs 二、快速入门 1、镜像和容器 docker镜像可以做到忽略操作系统的差异,跨平台运行,忽略安装的差异 当我们利用Docker安装应用时,Dock…

关于机器学习梯度下降法以及牛顿法公式符号的解释

如下图,是公式 如上图红线画出的部分,就是梯度下降法的符号,或者说,是 J(theta) 损失函数的一阶导数 整个公式看起来,就是 theta_new theta_old - (一阶导数/二阶导数)

算法day01_ 27. 移除元素、977.有序数组的平方

推荐阅读 从零开始学数组:深入浅出,带你掌握核心要点 初探二分法 再探二分法 系统的纪录一下刷算法的过程,之前一直断断续续的刷题,半途而废,现在重新开始。话不多说,开冲! 27.移除元素 题目 给…

Maven编译报processing instruction can not have PITarget with reserveld xml name

在java项目中,平时我们会执行mvn clean package命令来编译我们的java项目,可是博主今天执行编译时突然报了 processing instruction can not have PITarget with reserveld xml name 这个错,网上也说法不一,但是绝大绝大部分是因…

(二十)devops持续集成开发——使用jenkins的docker插件完成docker项目的流水线发布

前言 本节内容主要介绍jenkins如何集成docker插件,完成docker项目的流水线发布,在前面的章节中我们也介绍过docker项目的发布,可直接通过shell命令调用本地的docker服务完成docker项目的发布,本节内容我们使用docker插件来完成do…

LeetCode--代码详解 43.字符串相乘

43.字符串相乘 题目 给定两个以字符串形式表示的非负整数 num1 和 num2,返回 num1 和 num2 的乘积,它们的乘积也表示为字符串形式。 注意:不能使用任何内置的 BigInteger 库或直接将输入转换为整数。 示例 1: 输入: num1 "2",…

ARM系列 -- 虚拟化(四)

今天来看看虚拟中断。 在一个非虚拟化的系统中,操作系统可以直接访问GIC的寄存器,并且处理GIC的物理中断接口(physical interrupt interface)。 但是在一个虚拟化的系统中,不是这样。Guest OS并不知道它运行在虚拟系…

ETH网络中的账户

ETH网络中的账户 Externally owned accounts (EOA) - 外部账户 由用户控制,我们导入助记词创建的账户就属于此类账户。 Contract accounts (smart contracts) - 合约账户 合约账户由以太坊虚拟机执行的代码控制。它也被称为智能合约。合约帐户有相关的代码和数据存…

防火墙的内容安全

目录 1. 内容安全 1.1 IAE引擎 DPI---深度包检测技术 DFI---深度流检测技术 结论(优缺点): 1.2 入侵防御(检测)(IPS) IPS的优势: 入侵检测的方法: 入侵检测的流程 签名 查看预定义签名的内容 新建自定义签名 入侵防御的检测…

uniapp android 原生插件开发-测试流程

前言 最近公司要求研究一下 uniapp 的 android 原生插件的开发,为以后的工作做准备。这篇文章记录一下自己的学习过程,也帮助一下有同样需求的同学们 : ) 一、下载安装Hbuilder X , Android studio(相关的安装配置过程网上有很多,…

width:100%和width:auto有啥区别

项目中使用了with属性,突然好奇auto 和 100% 的区别,特地搜索实践总结了一下观点 一、 width属性介绍二、 代码带入三、 分析比较四、 总结 一、 width属性介绍 width 属性用于设置元素的宽度。width 默认设置内容区域的宽度,但如果 box-siz…

XXE 漏洞简单研究

近期在做个基础的 web 常见漏洞的 ppt,主要参考 OWASP TOP 10 2017RC2,此版本中增加了 XXE 攻击,所以自己简单的研究下 XXE 攻击。XXE(XML External Entity)XML 外部实体,当前端和后端通信数据采用 xml&…

2. Kubernetes 核心数据结构

1. Group、Version、Resource 核心数据结构 理解 Kubernetes 核心数据结构,在阅读源码时可以事半功倍并能够深刻理解 Kubernetes 核心设计。在整个 Kubernetes 体系架构中,资源是 Kubernetes 最重要的概念,可以说 Kubernetes 的生态系统都围…

28. 找出字符串中第一个匹配项的下标(力扣LeetCode)

文章目录 28. 找出字符串中第一个匹配项的下标题目描述暴力KMP算法 28. 找出字符串中第一个匹配项的下标 题目描述 给你两个字符串 haystack 和 needle ,请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标(下标从 0 开始)。…

【PHP】Workerman开源应用容器的GatewayWorker 与 iOS-OC对接

Workerman 开源高性能PHP应用容器 workerman是一款开源高性能PHP应用容器,它大大突破了传统PHP应用范围,被广泛的用于互联网、即时通讯、APP开发、硬件通讯、智能家居、物联网等领域的开发。 PHPSocket.io PHP版本的socket.io,具有良好的客户端兼容性,常用于即时通讯领域…

在CentOS上使用Docker搭建Halo博客并实现远程访问的详细指南

🌈个人主页:聆风吟 🔥系列专栏:网络奇遇记、数据结构 🔖少年有梦不应止于心动,更要付诸行动。 文章目录 📋前言一. Docker部署Halo1.1 检查Docker版本1.2 在Docker中部署Halo 二. Linux安装Cpol…

亚信安慧AntDB数据库与流式处理的有机融合

流式处理的概念 2001年9月11日,美国世贸大楼被袭击,美国国防部第一次将“主动预警”纳入国防的宏观战略规划。而IBM作为当时全球最大的IT公司,承担了大量基础支撑软件研发的任务。其中2009年正式发布的IBM InfoSphere Streams,就是…

文献阅读:秀丽隐杆线虫的神经肽能连接组

文献介绍 「文献题目」 The neuropeptidergic connectome of C. elegans 「研究团队」 William Schafer(MRC分子生物学实验室) 「发表时间」 2023-11-15 「发表期刊」 Neuron 「影响因子」 16.2 「DOI」 10.1016/j.neuron.2023.09.043 摘要 人们正在…