生成式AI时代的新基础设施

news2025/1/10 3:04:17

生成式人工智能席卷了科技行业。 2023 年第一季度,随着数亿用户采用 ChatGPT 和 GitHub CoPilot 等应用程序,对新一代 AI 初创公司的投资高达 1.7B 美元。 技术领先的公司正在争先恐后地制定自己的生成式AI策略,许多公司都在努力将应用程序投入生产。 即使是最前沿的工程团队也面临着以安全、可靠和经济高效的方式培训、部署和保护生成式 AI 模型的挑战。

用于生成式人工智能的新基础设施技术栈正在出现。 我们看到了这一领域的新初创公司的巨大机遇,特别是那些解决与将模型部署到生产、数据管理和模型评估相关的高成本的公司。

推荐:用 NSDT编辑器 快速搭建可编程3D场景

1、生成式AI的新基础设施

在这里插入图片描述

2、基础模型

基础模型(Foundation Models)在海量数据集上进行训练并执行广泛的任务。 开发人员使用基础模型作为强大的生成式 AI 应用程序(例如 ChatGPT)的基础。
在这里插入图片描述

选择基础模型时的一个关键考虑因素是开源与闭源,下面是每种模式的优缺点。

开源:

  • 优点:开源模型更容易定制,为训练数据提供更高的透明度,并让用户更好地控制成本、输出、隐私和安全。
  • 缺点:开源模型可能需要更多的工作来准备部署,并且还需要更多的微调和培训。 虽然开源模型的设置成本可能更高,但从规模上看,与闭源模型相比,公司对成本有更多的控制力,闭源模型的使用情况很难预测,成本可能会失控。

闭源:

  • 优点:闭源模型通常提供托管基础设施和计算环境(例如 GPT-4)。 他们还可能提供生态系统扩展来扩展模型功能,例如 OpenAI 的 ChatGPT 插件。 闭源模型还可以提供更多“开箱即用”的功能和价值,因为它们是预先训练的并且通常可以通过 API 访问。
  • 缺点:闭源模型是黑匣子,因此用户对其训练数据了解甚少,从而难以解释和调整输出。 供应商锁定还会导致成本难以控制——例如,GPT-4 的使用按提示和完成收费。

我们认为开源对于构建生成式AO应用程序的企业团队来说将是更具吸引力的选择。 正如两位谷歌研究人员所指出的那样,开源模型在社区驱动的创新、成本管理和信任方面具有优势。

3、微调及训练

微调(Fine Tuning)是通过在精选数据集上进行训练来调整现有模型参数的过程,从而为特定用例构建“专业知识”。

通过允许开发人员利用预先训练的大型模型,微调可以提高性能、减少训练时间和成本。

有多种选项可用于微调预训练模型,包括 TensorFlow 和 Pytorch 等开源框架以及 MosiacML 等安全的端到端解决方案。 我们想要强调用于微调的标签工具的重要性—干净、精心策划的数据集可以加快训练过程并提高准确性!

最近,我们看到了很多围绕特定领域的生成式AI模型的活动。 彭博社推出了 BloombergGPT,这是其专有的LLM,用金融行业特定数据进行训练。 Hippocratic 是一家初创公司,建立了自己的LLM,用医疗保健数据训练,为面向消费者的应用程序提供支持,该公司从 Andreessen Horowitz 和 General Catalyst 秘密筹集了 5000 万美元。 Synteny AI 正在构建一个针对蛋白质之间的结合亲和力进行训练的模型,以推动更好的药物发现。 我们认为现有企业处于有利位置,可以根据自己的专有数据微调强大的模型并建立自己的人工智能优势。

4、数据存储和检索

用于长期内存和数据检索的存储是复杂且成本高昂的基础设施挑战,为初创公司提供了构建更有效解决方案的机会。 矢量数据库已成为模型训练以及随后的检索和推荐系统的强大解决方案。 这使得矢量数据库成为最热门的生成式AI基础之一:

在这里插入图片描述

矢量数据库可用于支持各种应用程序,包括语义搜索(一种数据搜索技术)、相似性搜索(使用共享特征查找相似数据)和推荐系统。 它们还赋予模型长期记忆,这有助于减少幻觉(人工智能做出的自信反应,但训练数据无法证明其合理性)。

我们在这里看到了很多创新机会。 无法保证当前从数据库进行语义搜索和检索的方法将继续是最高效(速度和成本)和最有效(覆盖范围)的方法; Cohere 最近发布了其 Rerank 端点—一种无需迁移到矢量数据库的搜索和检索系统。 我们还看到团队使用LLM作为附加到向量数据库的推理引擎。 我们很高兴看到数据存储和检索类别的发展以及更多初创公司的出现。

5、模型监督:监控、可观察性和可解释性

监督相关的三个术语经常互换使用,但是,它们描述了在生产期间和之后评估模型的不同步骤。 监控涉及跟踪性能,包括识别故障、中断和停机时间。 可观察性是理解性能好坏或评估系统健康状况的过程。 最后,可解释性是关于解读输出—例如,解释模型为何做出某个决定。

监督是更传统的 MLOps 堆栈的主要内容,现有企业(例如 Arize)已经开始为部署生成式 AI 模型的团队构建产品。 然而,黑盒、闭源模型可能很难监督,并且在无法访问训练数据的情况下很难解释幻觉。 最近的 YC 批次催生了多家公司来应对这些挑战,包括 Helicone 和 Vellum,这凸显了该领域的早期发展。 值得注意的是,两者都将信息重点放在跟踪延迟和使用情况上,这表明成本仍然是生成式AI团队建设的最大痛点。

6、模型安全、安保和合规性

随着公司将生成式AI模型投入生产,模型的安全性和合规性将变得越来越重要。 为了让企业信任生成式AI模型,他们需要一套工具来准确评估模型的公平性、偏见和毒性(生成不安全或仇恨内容)。 我们还相信,部署模型的团队将需要帮助他们实现自己的护栏的工具。

企业客户还深切关注敏感数据提取、训练数据中毒、训练数据(尤其是第三方敏感数据)泄露等威胁。 值得注意的是,Arthur AI 最近发布了其新产品 Arthur Shield,这是第一个针对 LLM 的防火墙,可防止即时注入(使用恶意输入操纵输出)、数据泄露和有毒语言生成等功能。

在这里插入图片描述

我们看到了合规中间件的巨大机遇。 公司需要确保其生成式AI应用程序不会违反合规标准(版权、SOC-2、GDPR 等)。 这对于金融和医疗保健等严格监管行业的团队建设尤其重要。 我们很高兴看到初创公司以及现有企业的创新—例如,我们的牛仔公司 Drata 处于有利地位,可以集成或构建生成式 AI 模型合规性的功能。

7、结束语

我们相信,生成式AI将为公司带来巨大的效率提升,并在基础设施领域创造巨大的新公司机会。 采用的两个最大瓶颈是成本和安全性。 拥有这些核心价值支柱的基础设施初创公司将处于成功的有利地位。

我们还看到开源在生成式AI基础设施中发挥着重要作用。 使用这种模式的初创公司将更容易获得用户的信任,并从开源社区的创新和支持中受益。


原文链接:生成式AI的新基础设施栈 — BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/984804.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于Java+SpringBoot+Vue前后端分离校园资产管理设计和实现

博主介绍:✌全网粉丝30W,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

45位主播带货破亿,单日热销100w+单,8月榜单有哪些看点?

根据抖音官方数据,截至2021年1月,抖音在全球范围内的日活用户已经超过7亿。 从娱乐到学习,从社交到购物,抖音成为了人们生活中不可或缺的一部分。 那么,8月有哪些主播表现突出,哪些商品在畅销,哪…

【内存管理】C与C++的内存管理异同点

C/C程序内存区域划分 栈又称堆栈:存放非静态局部变量/函数参数/返回值等等,栈是向下增长的。内存映射段:高效的I/O映射方式,用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存,做进程间通信。堆&…

NATAPP使用详细教程(免费隧道内网映射)

NATAPP - https://natapp.cn/tunnel/lists NATAPP 在开发时可能会有将自己开发的机器上的应用提供到公网上进行访问,但是并不想通过注册域名、搭建服务器;由此可以使用natapp(内网穿透) 购买免费隧道 修改隧道配置 看自己的web…

RTMP流媒体服务器EasyDSS视频点播平台在不关闭防火墙的情况下平稳部署的具体步骤

EasyDSS视频直播点播平台提供了视频转码、点播、直播、推拉流、录像、回放等功能,可应用在AR、VR、无人机推流、虚拟直播、教育培训、远程会议等多样化的场景中。 通常我们在部署EasyDSS时都建议用户关闭防火墙的,但是也有无需关闭防火墙的部署办法&…

4、nginx 配置实例-反向代理

文章目录 4、nginx 配置实例-反向代理4.1 反向代理实例一4.1.1 实验代码 4.3 反向代理实例二4.3.1 实验代码 【尚硅谷】尚硅谷Nginx教程由浅入深 志不强者智不达;言不信者行不果。 4、nginx 配置实例-反向代理 4.1 反向代理实例一 实现效果:使用 nginx…

为什么有的测试员路越走越窄?原因在这里

常常在思考:同样背景,同样学历的人,为什么有的人路越走越宽,而有的人路越走越窄? 不能简单归结于性格和运气,看似偶然实则必然。 不善学习 学习才能使我们内心强壮,充满自信。 然而&#xff…

[machine Learning]强化学习

强化学习和前面提到的几种预测模型都不一样,reinforcement learning更多时候使用在控制一些东西上,在算法的本质上很接近我们曾经学过的DFS求最短路径. 强化学习经常用在一些游戏ai的训练,以及一些比如火星登陆器,月球登陆器等等工程领域,强化学习的内容很简单,本质就是获取状…

C++信息学奥赛1191:流感传染

一开始的代码自己运行测试代码怎么测试都是正确&#xff0c;但是一直提示答案错误 #include <iostream> using namespace std; int main() {int n;cin >> n;char arr[n][n];for (int i 0; i < n; i){for (int j 0; j < n; j){cin >> arr[i][j];}}in…

Netty—EventLoop

文章目录 一、EventLoopGroup 是什么&#xff1f;&#x1f914;️二、NioEventLoop 有哪些重要组成部分&#xff1f;&#x1f50d;三、NioEventLoop 的 thread 在何时启动&#xff1f;三、 run() 方法中线程在干嘛&#xff1f; 一、EventLoopGroup 是什么&#xff1f;&#x1f…

纯源码程序的执行

QT Creator本身是个IDE安装的时候根据自己需要配置的又有对应的编译器&#xff0c;因此编写普通的程序也不再话下。 选择Non-Qt Project工程&#xff0c;并在右侧根据自己的需要选择C应用还是C应用 新工程中工程管理文件和代码如下&#xff1a; 执行结果如下

驱动开发--day2

实现三盏灯的控制&#xff0c;编写应用程序测试 head.h #ifndef __HEAD_H__ #define __HEAD_H__#define LED1_MODER 0X50006000 #define LED1_ODR 0X50006014 #define LED1_RCC 0X50000A28#define LED2_MODER 0X50007000 #define LED2_ODR 0X50007014#endif mychrdev.c #inc…

浅谈数据治理中的智能数据目录

在数字化转型的战略实施中&#xff0c;很多企业都在搭建自己的业务、数据及人工智能的中台。在同这些企业合作和交流中&#xff0c;越来越体会到数据目录是中台建设的核心和基础。为了更好地提供数据服务&#xff0c;发挥数据价值&#xff0c;用户需要先理解数据和信任数据。 企…

c高级day2(9.7)shell脚本

作业: 写一个1.sh脚本&#xff0c;将以下内容放到脚本中&#xff1a; 在家目录下创建目录文件&#xff0c;dir 在dir下创建dir1和dir2 把当前目录下的所有文件拷贝到dir1中&#xff0c; 把当前目录下的所有脚本文件拷贝到dir2中 把dir2打包并压缩为dir2.tar.xz 再把dir2…

基于docker环境的tomcat开启远程调试

背景&#xff1a; Tomcat部署在docker环境中&#xff0c;使用rancher来进行管理&#xff0c;需要对其进行远程调试。 操作步骤&#xff1a; 1.将容器中的catalina.sh映射出来&#xff0c;便于对其修改&#xff0c;添加远程调试相关参数。 注意&#xff1a;/data/produce2201…

【计算机网络】HTTP(下)

本文承接上文的代码进行改造&#xff0c;上文链接&#xff1a;HTTP上 文章目录 1. 实现网站跳转实现 自己的网站跳转 2. 请求方法(get) && 响应方法(post)GET方法POST方法GET与POST的应用场景 3. HTTP状态码在自己设计的代码中发现4043开头的状态码(重定向状态码)永久…

“交叉轮”轮融资后,哪吒汽车能否脚踏“风火轮”续写逆袭故事?

2023年的新能源汽车江湖&#xff0c;烟波浩渺的水面下暗潮汹涌。 从特斯拉年初打响降价第一枪&#xff0c;降价潮至今未见尾声。9月刚至&#xff0c;小鹏汽车、零跑汽车又推出了调价政策。 这一背景下&#xff0c;车企内卷加剧是必然。年初&#xff0c;哪吒汽车联合创始人、C…

2019 ICPC香港站 G. Game Design

Problem - G - Codeforces 问题描述&#xff1a;怪物只能在树叶子节点出生&#xff0c;向上走&#xff0c;可以花费一个值在一个节点建防御塔&#xff0c;防御塔会阻碍怪物向上走。最小花费可以让根节点无法被怪物走到的一个造塔方法算是一个方案。现给定方案数&#xff0c;让…

MaskVO: Self-Supervised Visual Odometry with a Learnable Dynamic Mask 论文阅读

论文信息 题目&#xff1a;MaskVO: Self-Supervised Visual Odometry with a Learnable Dynamic Mask 作者&#xff1a;Weihao Xuan, Ruijie Ren, Siyuan Wu, Changhao Chen 时间&#xff1a;2022 来源&#xff1a; IEEE/SICE International Symposium on System Integration …

Kubernetes(k8s)部署高可用多主多从的Redis集群

Kubernetes部署高可用多主多从的Redis集群 环境准备准备Kubernetes准备存储类 部署redis准备一个命名空间命令创建yaml文件创建&#xff08;推荐&#xff09; 准备redis配置文件准备部署statefulset的资源清单文件执行文件完成部署初始化集群 环境准备 准备Kubernetes 首先你…