【编者按】总部位于巴黎的人工智能初创公司 Mistral AI 成立仅一年,就被誉为现有大模型巨头的有力挑战者。
今年 2 月,Mistral AI 正式发布了旗舰级大模型 Mistral Large,直接对标 OpenAI 的 GPT-4;几周前,Mistral AI 发布了其新一代开源语言模型 Mixtral 8x22B,声称实现了最高的开源性能和效率。
该公司首席执行官兼联合创始人 Arthur Mensch 以及其他两位联合创始人 Guillaume Lample 和 Timothée Lacroix 在回到法国创办 Mistral 之前,分别任职于 Google DeepMind 和 Meta,后来因意识到生成式人工智能在欧洲的绝佳机会,辞职选择创业。
日前,Mensch 在接受麦肯锡高级主管 Eric Hazan 和 Stéphane Bout 采访时,详细介绍了 Mistral 的开源战略、欧洲如何在人工智能竞赛中竞争,以及人工智能将如何改变工作场所。部分核心观点如下:
人类在人工智能的进程中仍然非常重要,我们应该将生成式人工智能工具视为提高生产力和创造力的一种方式。
大型语言模型和生成式人工智能就像一种新的编程语言,它更加抽象,也更容易被人类语言所控制。
人们将专注于其他模型无法完成且永远不会被取代的工作,其中包括人际关系管理、发散思维、创造性思维和发明新想法。
三五年后,我们所做的工作应该比现在的工作更有意义。
语言问题可能在一定程度上阻碍了欧洲生成式人工智能的发展。
开源模型的部分价值在于,它可以帮助客户创建更便宜、更快速、更好的应用程序。
图|Mistral AI 首席执行官兼联合创始人 Arthur Mensch
学术头条在不改变原文大意的情况下,做了简单的编译。内容如下:
Eric Hazan:能否向我们介绍一下您创建 Mistral AI 的历程?是什么促使您创办了这家公司?
Arthur Mensch:当然可以,我是科学家出生。我拥有机器学习和功能性磁共振成像专业的博士学位,之后在数学专业做了两年博士后研究。之后我加入了Google DeepMind,我在那里从事了两年半的大型语言模型(LLMs)研究,大约一年前离开了。
Eric Hazan:是什么让您进入生成式人工智能领域的?
Arthur Mensch: 我想我是被典型的研究偶然性带到那里的。我当时正在研究深度学习,因此产生了浓厚的兴趣。我就此写了一篇论文,但随后又回到数学研究领域,一待就是两年。我加入 DeepMind 时,有一个研究深度学习的小团队,当我做了一些有趣的工作来改进流程时,我的兴趣又被点燃了。
Eric Hazan:在共同创办 Mistral AI 公司的过程中,有什么趣闻轶事想与我们分享?
Arthur Mensch: 我和联合创始人 Guillaume Lample、Timothée Lacroix 从学生时代就认识,已经有十年了。我在 DeepMind 工作,Guillaume 和 Thimothée 在 Meta 工作,我们三人都在硅谷生活和工作并研究深度学习。当我们看到生成式人工智能领域正在加速发展时,我们意识到,这是一个在法国创建公司并加快创建先进大型语言模型进程的绝佳机会。
Eric Hazan:换个更宽泛的问题,你认为人类在人工智能的进程中处于什么位置?
Arthur Mensch:人类仍然非常重要。我们应该将生成式人工智能工具视为提高生产力和创造力的一种方式。通常情况下,生成式人工智能工具只有在正确提示的情况下才能生成有趣的内容,或者创建一个足够聪明的应用程序。
无论是开发者还是创新者,都需要做大量的工作,才能真正产生可操作且有价值的结果。除了功能更强大之外,它与传统的文字编辑器并无太大区别。但你确实应该将它视为一种生产力工具和创建新应用程序的途径。因此,在这种情况下,大型语言模型和生成式人工智能就像一种新的编程语言,它更加抽象,也更容易被人类语言所控制。
Eric Hazan:这是下一个问题的绝佳切入点。您认为我们的生活,尤其是我们的工作方式在未来三到五年内会发生怎样的变化?
Arthur Mensch:我认为,对于许多琐碎的工作来说,一些工具将赋予我们力量,它们要么可以帮助我们完成这些工作,要么可以帮助我们更快地完成这些工作。这意味着我们将能够专注于其他模型无法完成且永远不会被取代的工作,其中包括人际关系管理、发散思维、创造性思维和发明新想法。一般来说,三五年后我们所做的工作应该比现在的工作更有意义。
Eric Hazan:让我们换个话题,具体谈谈 Mistral,您如何解释自己在生成式人工智能领域的发展速度?
Arthur Mensch:我想谈两点。首先,我们拥有一支非常强大的团队,他们经验丰富,能够在很短的时间内完成生产和交付。这并不是一件容易的事,但这就是我们能够在短短四个月内完成模型发布的原因。
我们之所以能以如此快的速度为人所知并获得一定的知名度,与我们从一开始就采用的开源策略密不可分。这创造了巨大的需求,从采用指标来看,我们基本上领先于那些已经存在了五年的公司。这一战略发挥了很好的作用,我们现在正利用这一战略为我们的产品提供反馈。
Eric Hazan:在复杂的环境中,所有的人工智能公司似乎都很相似,是什么让 Mistral 与众不同?
Arthur Mensch:Mistral 的与众不同之处在于我们的便携式解决方案,它可以通过我们的应用编程接口 (API) 作为软件即服务 (SaaS) 与任何云提供商一起使用。您可以访问云上的类似 API,也可以访问我们的 API。最重要的是,它可以作为一个平台进行部署。
因此,如果你有一个私有云,你想对工作负载进行大量定制,或者你在企业内部运行,我们基本上是唯一的解决方案。这一切都与我们乐于广泛分享我们的技术有关—— 这也是我们乐于分享开源技术的原因。
一般来说,我们的价值主张有三个方面。首先是部署的灵活性和平台的可移植性,允许用户在虚拟私有云(VPC)、内部部署和云中部署。其次是价值,因为我们的模型在价格方面定位非常准确,而且它们的运行速度非常快,性能达到顶级水平。第三是定制化,当我们提供模型时,我们会对模型权重进行授权,因此客户的技术团队可以随意修改这些权重,我们计划很快通过服务来支持这一点。
Eric Hazan:Mistral 对开源模型有很强的承诺。你认为它们能加快价值的采用和创造吗?
Arthur Mensch:当然,我认为这是一种基础架构技术,可以被转换成任何类型的应用。我们确实相信,应用制造商需要创造差异化,也需要深入掌握技术。而做到这一点的唯一途径就是能够访问整个堆栈。发起这场运动的方法就是让人们相信,我们的开源模式可以让他们创建更便宜、更快速、更好的应用程序,这就是我们的起点。
在过去的六个月里,我们已经开始看到一些成果,因为许多公司意识到,他们可以将工作负载从闭源 API 转移到开源模型。我们现在推出了商业模式,这些模式的部署和交付就像开源模式一样具有完全透明的访问权限——这为我们的客户带来了很多价值。
Eric Hazan:现在我请 Stéphane 谈谈欧洲背景下的生成式人工智能。
Stéphane Bout:我们注意到全球范围内出现了大量的人工智能投资和激烈的研发竞争。与其他地区相比,欧洲如何才能保持独特性和竞争力?
Arthur Mensch:首先要牢记的是,这是一款基础设施软件,通常需要一些支持和与团队的互动。因此,我们建议欧洲客户与在性能方面具有竞争力的本地公司合作。很明显,这也是一种创造更多本地参与、塑造我们产品的路线图并产生一些非常有价值的支持的方式。
第二个方面,我认为可能在一定程度上阻碍了欧洲生成式人工智能的发展,那就是语言问题。所有最早的人工智能公司在美国成立,主要用英语工作。我们正在用我们的模型来解决这个问题,使它们在法语、德语和其他欧洲语言方面更加强大。
作为一家欧洲公司,我们意识到了语言问题,这对我们来说非常重要,比美国公司重要得多。与美国的另一个重要区别是,欧洲的公共云普及率较低。仍有很多欧洲企业没有使用公共云,这往往有很好的理由。因此,我们在私有云和企业内部部署方面的产品确实能引起这些客户的共鸣。
Stéphane Bout:在全球人工智能市场中,欧洲的主要优势和可能存在的弱点是什么?
Arthur Mensch:作为一个地区,欧洲人才济济,来自许多国家的许多人在数学和计算机科学方面都很强。这对 Mistral 来说是一个巨大的推动力,对客户来说也是一个巨大的推动力,因为客户通常都拥有强大的团队。
一个弱点是欧洲仍然是一个较为分散的市场。欧洲没有美国那样的技术生态系统,在那里,向其他技术公司销售产品是显而易见的。法国和欧洲其他国家也有一些科技公司,但它们之间的联系不如美国紧密。
原文作者:
Stéphane Bout,Eric Hazan
原文链接:
https://www.mckinsey.com/featured-insights/lifting-europes-ambition/videos-and-podcasts/creating-a-european-ai-unicorn-interview-with-arthur-mensch-ceo-of-mistral-ai