一次性把“AI 原生应用技术栈”说明白

news2025/1/18 14:03:34

AI 当前有多火爆不用介绍了,随着各个厂商的努力,也慢慢浮现了有价值的应用,以及为更好的服务 AI 原始应用准备的各种平台产品。今天这篇简单介绍下当前业界最新的 AI 原生应用技术栈。

特别声明:AI 技术还在快速发展过程中,本文内容随时会过时

同时,百度智能云云数据库特惠专场开始!热销规格新用户免费使用,欢迎参与!

整体架构

简单画了一下目前 AI 原始应用技术栈的逻辑图,分好几层,接下来展开讲一下图中标识的①~⑤。

① 大模型

AI 这次火爆,应该感谢OpenAI,ChatGPT 让大家看到 AGI 的希望。大模型技术还是 OpenAI 的 GPT 4.0 最领先。提供模型的有云厂商和创业公司。

  • 国内大模型主要有:

    • RNIE 4.0(文心一言),百度出品

    • 通义千问,阿里出品

    • 盘古大模型,华为出品

    • 星火大模型,科大讯飞出品

    • Baichuan 3,王小川创业公司百川智能

    • abab 6.5,MiniMax出品

    • GLM-130B,智谱 AI

    • Kimi, 月之暗面(Moonshot AI)出品,主推 2C 应用 Kimi,长文本有特色

    • Yi-34B,零一万物,李开复老师创业公司

  • 海外大模型主要有

    • GPT 4.0,OpenAI 出品,背后金主爸爸是微软

    • Google Gemini 1.5,刚刚Google next 2024大会发布

    • Claude 3,背后金主爸爸是 AWS

    • Llama-3,meta 开源,开源最强模型

阿里巴巴董事长蔡崇信在一个公开访谈中提到,国内整体实力比海外差,至少1~2 年以上,国内大公司创业公司卷模型的多,卷应用的少,相反海外创业公司卷应用更多。从而看出两边商业环境,思路差距还是比较大。

② Model Builder

图片

Model builder 主要是大模型部署,精调,推理服务部署等一系列工具链,让用户很容易把大模型用起来。

主要还是云厂商提供这块的服务,关于这部分的功能划分不完全一样。

  • 百度智能云 Model builder,复制模型管理,评估优化,提供模型调用,包括推理服务部署等。

  • AWS Bedrock 负责基础大模型提供服务

  • Google Vertex AI ,包含了三部分功能,Model Garden,Model Builder,Agent Builder等等,是一个大的品牌。

  • Azure 主要有两块服务:

    • OpenAI Service,提供 GPT4,GPT3.5,Embedding 等模型服务

    • Azure AI Studio 第三方模型服务,如 Llama

③向量数据库

生成式人工智能技术发展带动了大规模预训练模型的广泛应用,向量数据库成为了整个发展链条中的重要一环。人工智能和机器学习可以将非结构化数据(文本,图像,视频等)转换成数学上的向量表示。向量数据库正是一种专门用于存储和检索向量数据的数据库,向量数据库实现对向量的处理从而实现了非结构化数据的检索和相似性计算。对于大模型来说,向量数据库意味着更高效、更精准的模型应用。

借着大模型崛起这股东风,众多向量数据库厂商也获得了资本的青睐。去年上半年,荷兰 AI 原生向量数据库厂商 Weaviate 获得 5000 万美元 B 轮融资;美国明星向量数据库厂商 Pinecone 宣布筹集了 1 亿美元的 B 轮融资。这些资本驻足的背后,是向量数据库的关注度已经达到了前所未有的高度。

那么,向量数据库为何会受到如此高的关注?那就要从向量数据库对于大模型的助益来说起。

大语言模型存在知识更新不及时、会产生幻觉、无法具备特定行业或私有知识,以及难以实现安全回答等问题。通过引入向量存储模块作为大语言模型的长期记忆体,通过向量存储模块中数据的反馈和干预,能够以较低的成本解决上述问题。

正是由于向量数据库在大模型应用中的显著优势,越来越多的厂商开始推出自家的向量数据库产品。

  • 国内

    • 百度向量数据库

    • 腾讯向量数据库

    • 开源的 milvus(商业产品 zilliz)

  • 海外

    • pinecone

 

④Agent builder & ⑤App builder

Agent 智能体是个时髦概念,吴恩达最近的预测通过智能设计,用 GPT 3.5 就能达到 4.0 的效果。AI Agent 和大模型的区别在于,大模型与人类之间的交互是基于 prompt 实现的,用户 prompt 是否清晰明确会影响大模型回答的效果。而AI Agent的工作仅需给定一个目标,它就能够针对目标独立思考并做出行动。从原理上说,AI Agent的核心驱动力是大模型,在此基础上增加规划(Planning)、记忆(Memory)和工具使用(Tool Use)三个关键组件。 App builder 的范围要更大一些,帮助开发者和应用构建 App,Agent 理论上是一种 App。不过现在能直接通过工具就能构建的 App 类型还比较少,前面比较流行的低代码平台,本质也是帮助用户构建企业里面流程管理 App,也是其中一种。

  • 国内典型的有

    • 百度有 Agent builder,主要是 2C 的 Agent 多一些,还有 App builder 做 2B 的方向。

    • 字节 coze

    • google 在 Vertex AI 也包含了 Agent builder

  • 这类的builder 核心提供三个能力

    • 工作流编排:方便用户比较快的把业务逻辑进行编排,基本不用开发或者很少的开发就可以完成一个 App 的业务。

    • 各类的插件:比如各种 Embedding 模型,向量插件,搜索插件等等,用于工作流编排

    • 一键发布的到分发渠道的能力:构建了 App 要发布到各类平台,市场让用户可以下载使用,Builder 一般也提供这个打通的能力。

上层的应用现在有各类的助手如文心一言,字节豆包,kimi 等等,就不展开讲了,后面单独来开一篇介绍。

好了,今天对 AI 原始技术栈就简单介绍这些。大模型如火如荼,相关技术日新月异,有兴趣的同学还可以看我前面的一些文章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1712428.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MongoDB分片集群容灾方案

MongoDB分片集群容灾方案 1. 集群同步工具介绍1.1 第三方数据同步工具mongoshake1.2 官方同步工具mongosync 2. 工具对比2.1 数据一致性2.2 稳定性和可靠性2.3 维护成本 3. 总结 1. 集群同步工具介绍 最近客户咨询MongoDB分片集群市面上主流的容灾方案,所以抽空整理…

使用vanna实现Text2SQL

这节一起用vanna来实现自然语言转SQL,之前的大模型一直停留在问答阶段,答案基本都是大模型提供的,至多是加点本地知识库,tet,pdf等文档,丰富大模型的内容,但是想要大模型与一些管理系统对接还是…

大白话70个你必须知道的AI重要概念

本文按英文起首字母顺序,整理了70个常用的生成式AI领域常用概念,试图以大白话进行诠释,如果你不求甚解、但也求略解的话,欢迎收藏。第一部分从A到I,第二部分从L到P,第三部分从Q到Z。 A 1 Agents: 代理人。…

如何利用短链接巧妙避开多渠道推广大坑

在当下,推广渠道多样化对企业来说,那可是机遇与大坑并存!多渠道推广的重要性大家都懂,但为啥说有坑呢?一旦企业开启多渠道推广模式,就得面对大量人力物力的投入,可要是区分不了各个渠道的推广效…

[ARM-2D 专题] 1.开始:基本工程搭建,编译和开发环境配置问题解决

要开始使用ARM-2D,前期两个准备工作需要完成: 一块mcu内核为cortex-M的板子,带显示屏(彩色TFT屏,分辨率建议320x240或以上,带TP更佳)。基于这个板子可以正常运行的keil MDK的工程。 好了&#…

面试必备:应对 “为什么离职” 的万能回答

使用PC端的朋友,请将页面缩小到最小比例,阅读最佳! 面试官问到你为什么从上一家公司离职时,你会怎么回答?这个问题我觉得很有意思,也很有必要去探讨一下。 很多专业人士都会建议你,最好不要直接…

怎么看自己电脑的配置?提升电脑的使用效率

了解自己电脑的配置是非常重要的,它可以帮助您了解电脑的性能水平,从而更好地选择适合的软件和游戏,或者进行系统升级和维护。然而,许多用户可能不知道怎么看自己电脑的配置信息。本文将介绍三种简单的方法,帮助您轻松…

TPK系列——2W 3KVDC 隔离单,双输出 DC/DC 电源模块

TPK系列是一款2W并且有高隔离电压要求的理想产品,工业级温度范围–40℃到 105℃,在此温度范围内都可以稳定输出2W,并且效率非常高,高达89%,同时负载调整率非常低,对于有输出电压精度有要求的地方特别合适&a…

Netty SSL双向验证

Netty SSL双向验证 1. 环境说明2. 生成证书2.1. 创建根证书 密钥证书2.2. 生成请求证书密钥2.3. 生成csr请求证书2.4. ca证书对server.csr、client.csr签发生成x509证书2.5. 请求证书PKCS#8编码2.6. 输出文件 3. Java代码3.1. Server端3.2. Client端3.3. 证书存放 4. 运行效果4…

走进数字艺术的世界:一种创新的艺术表达方式

进入数字时代,计算机将我们生活的方方面面都进行了转化。当然艺术领域也不例外。随着数字技术和计算机程序的发展和普及,“数字艺术”的概念应试而生。那么,所谓的数字艺术到底是什么呢?数字艺术的作用是什么?新手如何…

Java基础:异常(三)

Java基础:异常(三) 文章目录 Java基础:异常(三)1. Java异常体系1.1 错误的分类1.2 异常的分类 2. 异常的捕获与处理2.1 try-catch2.2 finally 3. 异常的抛出4. 自定义异常 1. Java异常体系 Java的异常体系是…

醒图及国际版 v9.9.9/v3.9.0 解锁会员(让照片栩栩如生的神奇应用)

介绍 醒图App是一款专业的照片编辑工具,旨在帮助用户高效地处理和优化照片,使其更加引人注目。这款应用程序配备了多样化的功能,包括图像增强、滤镜应用以及色彩调整等,以满足各种编辑需求。其设计了一个直观的用户界面&#xff…

C# yolov8 TensorRT +ByteTrack Demo

C# yolov8 TensorRT ByteTrack Demo 目录 效果 说明 项目 代码 Form2.cs YoloV8.cs ByteTracker.cs 下载 参考 效果 说明 环境 NVIDIA GeForce RTX 4060 Laptop GPU cuda12.1cudnn 8.8.1TensorRT-8.6.1.6 版本和我不一致的需要重新编译TensorRtExtern.dll&…

保姆教程系列:小白也能看懂的 Linux 挂载磁盘实操

!!!是的没错,胖友们,保姆教程系列又更新了!!! 文章目录 前言简介一、磁盘分区二、文件系统三、实际操作1. 使用lsblk命令查看新加入的磁盘信息2. 使用fdisk或者cfdisk分区新磁盘&am…

工业制造企业为什么要进行数字化转型

人人都在谈数字化转型,政府谈数字化策略方针,企业谈数字化转型方案,员工谈数字化提效工具。互联网企业在谈,工业企业也在谈。 在这种大趋势下,作为一个从事TOB行业十年的老兵,今天就来给大家讲讲&#xff…

【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程

【RLHF个人笔记】RLHF:Reinforcement Learning from Human Feedback具体过程 RLHF训练的三个步骤步骤1:收集数据与有监督训练策略步骤2:收集数据训练奖励模型步骤3:结合奖励模型利用强化学习算法如PPO算法来优化策略 参考内容 RLHF训练的三个…

236. 二叉树的最近公共祖先(C++)

文章目录 前言一、题目介绍二、解决方案三、优化总结 前言 在本篇文章中我们将会讲解二叉树中极为经典的题目236. 二叉树的最近公共祖先 一、题目介绍 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的…

BLE蓝牙模块在虚拟车钥匙上的运用—开启无钥匙驾驶新时代

随着科技的不断发展,人们对汽车的智能化需求也日益增长。在这个背景下,BLE蓝牙模块在虚拟车钥匙上的运用应运而生,为消费者带来更加便捷、智能的出行体验。本文将从以下几个方面阐述BLE蓝牙模块在虚拟车钥匙上的应用。   一、什么是BLE蓝牙…

精酿啤酒:品质与口感在啤酒行业竞争中的竞争优势

在啤酒行业中,竞争激烈,品牌众多。要想在竞争中脱颖而出,需要具备与众不同的竞争优势。对于Fendi club啤酒而言,其卓着的品质和与众不同的口感成为了其在竞争中取胜的关键。 品质是啤酒行业竞争中的核心要素。Fendi club啤酒在原料…

Redis中的数据结构与内部编码

本篇文章主要是对 Redis 常见的数据结构进行讲解,同时还对其所对应的不同的内部编码进行讲解。希望本篇文章会对你有所帮助。 文章目录 一、五大数据结构 二、数据结构对应的编码方式 String hash list set zset 🙋‍♂️ 作者:Ggggggtm &…