面向 “大模型” 的未来服务架构设计

news2025/1/13 10:22:53

文章目录

    • 大模型热潮
    • 大模型落地
      • 服务设计 or 重构
      • 未来的服务架构
          • 微服务化
          • 分层化
        • 大模型应用架构
          • 架构设计图
          • 架构 Demo 实现
    • 小结
    • 附录

大模型热潮

在这里插入图片描述

今年的互联网赛道中 “顶流” 非大模型莫属。 科技部新一代人工智能发展研究中心 5 月底发布的《中国人工智能大模型地图研究报告》显示,我国 10 亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。

百度的文心一言 ,阿里的通义千问、讯飞星火大模型、智谱AI的ChatGLM 等纷纷发布。此后,美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏,一场围绕大模型的 “军备竞赛” 已趋白热化。

大模型落地

ChatGPT 掀起 AI 热之后,微软已经成为这股浪潮中最重要的企业之一。不仅因为其是 OpenAI 的大股东,或者推出 AI 加持的 New Bing。

在这里插入图片描述

更重要的是:作为全球第一大操作系统服务商、全球第一大办公软件开发商,以及全球第二大云服务商,微软更是提出 “旗下全部产品将和大模型组件融合,全面拥抱大模型落地。

中关村论坛2023上,李彦宏以《大模型改变世界》为题,也提出 “百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构….“

毫不客气的预测,未来的服务将会全部面向或依托 “大模型” 提供产品服务。

那么面向未来 “大模型” 的服务应该如何设计或重构呢/?

服务设计 or 重构

为支持 “大模型” 调用,服务需要重新定位,成为 “底座” 。这里的底座,可理解为 “大模型” 的落脚点:目标数据的吞吐。
在这里插入图片描述

强悍的 “大模型” ,重新定义人机交互。 在短时间内分析出用户的诉求,并针对诉求去提供目标服务。现行的,通过用户手动触发 App 静态接口的交互模式被打破,变成了通过 “大模型” AI 化分析诉求后,进行单个或多个目标服务接口的触发,最终汇总、裁剪各服务响应数据,进行服务功能产出。

举个例子:在地图场景中,
客A:帮我规划一下十一北京旅游路线…
地图:北京景点 -> 十一天气 -> 景点评分 -> 景点间合适的浏览顺序编排 -> …

基于这种交互的特征、并结合 云原生中 分布式、微服务等多种技术概念,我们可以对服务进行重构升级或重新设计。

未来的服务架构

微服务化

为了支撑未来 “大模型” 的交互模式,满足各种任意的服务装配、拼装。我们需要将服务进行最小粒度封装,这也延续了微服务的核心思想。

分层化

这里需要注意的是,现行的交互模式依旧存在。我们要用最小的成本,兼并支撑两种交互模式。那就需要引入 “分层” 的设计思路,将不同的交互模式进行抽象、分化为不同的逻辑层。

这里介绍一种模式,如下:

大模型应用架构

架构模式分为 入口层、大模型结果调用层、协议层、业务内聚层、数据访问层、微服务调用层。

架构设计图

在这里插入图片描述

如上图中各逻辑层:

  • 入口层
    • 完成中间件的注册任务,为后续服务功能提供基础能力支撑。包含
      • 接口 token 鉴权【Sign加盐模式】、
      • 服务异常捕获【Panic Recover 中间件:捕获服务异常,防止主程序 panic】、
      • 监控服务注册【Prometheus 指标采集】、
      • 日志中间件【初始化日志功能,打印访问日志 Access_log 】、
      • Mesh 服务注册【Proxyless Service Mesh 进行流量熔断限流、防调用雪崩…】
  • 大模型调用层
    • 为大模型提供 “底座” 能力,基于大模型的产出结果,提供对应服务的 API 调用能力。包含 复合、单协议 两种服务粒度协议
  • 协议层
    • 包含复合协议、单协议两种类型,为业务、大模型调用提供内容数据输出。
      • 单协议,针对服务最小粒度封装的 API 接口
      • 复合协议,针对多服务进行拼装后,封装的 API 接口
  • 业务内聚层
    • 为复合协议对应的服务聚合层。在此层进行多个服务的串/并编排,对外提供服务聚合数据
  • 数据裁剪层
    • 在服务调用层之上,是对每个服务的请求、响应 数据的独立封装
  • 微服务调用层
    • 基于多种通信协议,完成服务调用
  • 另外分别为 Util 和 Tool 部分
    • 贯穿服务,提供公共能力及可观测、稳定性相关的能力支撑
架构 Demo 实现
//篇幅有限,见后续博文

小结

在竞争日益激烈、全球复杂多变的现状下,企业、团队只有掌握先机,提前布局,才会成为最终的胜者,拥有绝对的敏捷竞争力!

附录

  • 五分钟搭建基于 Prometheus + Grafana 实时监控系统
  • 千万级入口服务[Gateway]框架设计(三:分层模式)
  • 云原生应用架构的迁移 一 :增量迁移范式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/739652.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

极米H6 4K光学变焦版 打造全新4K观影体验

随着时代的发展,拥有家用智能投影的家庭也越来越多了。当下许多家用投影仪都搭载了智能系统,内含大量片源。另外,投影仪还可以通过不同接口接入不同的设备,如游戏机、电脑、U盘等。只需要一台投影便可以实现在线追剧、听歌、游戏、…

ZER-10-EP-L350C-224叠加式比例溢流阀放大器

ZER-06-EP-L105C-224、ZER-06-EP-L210C-224、ZER-06-EP-L350C-224、ZER-10-EP-L105C-224、ZER-10-EP-L210C-224、ZER-10-EP-L350C-224叠加式比例溢流阀由主阀体和溢流阀、阀插件、佰业比例放大器组成,标准叠加安装接口,与换向阀等配合使用,便…

【ELK企业级日志分析系统】安装与部署ELK详解

ELK 企业级日志分析系统 1.ELK概述1.1 ELK简介1.2 可以添加的其它组件1.3 filebeat结合logstash带来好处1.4 为什么要使用ELK?1.5 完整日志系统基本特征 2.ELK的工作原理3.部署ELK集群3.1 安装Elasticsearch3.2 安装Elasticsearch-head插件3.3 安装ELK Logstash3.4 安装ELK Ki…

HO49-二叉树的最近公共祖先

leetcode原题链接:二叉树的最近公共祖先 题目描述 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点 p、q,最近公共祖先表示为一个节点 x,满足 x 是 p、q 的…

Linux中的GO更新与冲突

发行版:CentOS GO更新 在使用go get安装某模块时,报错: ../../pkg/mod/golang.org/x/sysv0.5.0/unix/syscall.go:83:16: undefined: unsafe.Slice ../../pkg/mod/golang.org/x/sysv0.5.0/unix/syscall_linux.go:2271:9: undefined: unsafe.…

Verilog学习笔记5:简单的加法器

代码&#xff1a; //加法器 timescale 1ns/10ps module add( a, b, y ); input a; input b; output[1:0] y;assign yab;endmodule //testbench module add_tb; reg a; reg b; wire[1:0] y;add add(.a(a),.b(b),.y(y));initial begina<0;b<0;#10 a<1;b<0;#10 a&l…

SpringMVC 中的视图如何渲染模型数据

SpringMVC 中的视图如何渲染模型数据 SpringMVC 是一个基于 Spring 框架的 Web 框架&#xff0c;它提供了一种方便的方式来处理 HTTP 请求和响应。在 SpringMVC 中&#xff0c;视图是用来渲染模型数据的组件&#xff0c;它们负责将模型数据转换为 HTML、JSON、XML 等格式的响应…

风沙文字粒子制作

目录 一、导入素材 二、合成介绍 三、文字合成新建和制作 四、文字动画合成新建和制作 五、风沙文字消失合成的新建和制作 六、风沙文字消失合成制作完成 七、制作风沙文字出现合成 风沙文字粒子效果如下&#xff1a; AE模板风沙文字粒子宣传片片头片尾 一、导入素材 打…

Windows server 2012服务器远程桌面登录时出现错误提示:“由于没有远程桌面授权服务器可以提供许可证,远程会话被中断

简单粗暴&#xff1a; Windows server 2012服务器远程桌面登录时出现错误提示&#xff1a;“由于没有远程桌面授权服务器可以提供许可证&#xff0c;远程会话被中断。请跟服务器管理员联系 使用 mstsc /admin /v:目标ip 来强制登录服务器&#xff0c;但只能是管理员身份…

最简单的大屏可视化解决方案---autofit.js

在工作开发当中&#xff0c;我们避免不了要去做大屏。那么做大屏其实最难的点和最核心的问题就是适配&#xff0c; 下面为大家介绍最好用的大屏解决方案——autofit.js。 “一行代码搞定&#xff0c;开袋即食&#xff01;&#xff01;&#xff01;” 效果图展示&#xff0c;…

第4章-面向对象编程(上)

1. 面向过程与面向对象 面向过程 面向对象 2. 面向对象的思想概述 类(Class)和对象(Object)是面向对象的核心概念 类是对一类事物的描述&#xff0c;是抽象的、概念上的定义对象是实际存在的该类事物的每个个体&#xff0c;因而也称为实例(instance)属性&#xff1a;对应类…

Microsoft Remote Desktop for mac安装教程

适用于Mac的Microsoft远程桌面测试版&#xff01;Microsoft Remote Desktop Beta for Mac是一种远程工具&#xff0c;允许用户从Mac远程访问基于Windows的计算机。使用此工具&#xff0c;用户可以随时随地使用Mac连接到远程桌面、应用程序和资源。 Microsoft Remote Desktop B…

分享一下快速搭建IntelliJ IDEA开发环境的完整教程

目录 第一步&#xff1a;安装jdk&#xff0c;推荐安装jdk1.8 第二步&#xff1a;安装Maven 第三步&#xff1a;配置环境变量 1、jdk环境变量配置 2、maven环境变量配置 第四步&#xff1a;修改Maven仓库的地址 第五步&#xff1a;修改idea设置 IntelliJ IDEA是我们Java程…

云原生之深入解析K8S 1.24的高可用环境部署

一、Kubernetes 1.24 版本发布及重磅改动 2022 年 5 月 3 日&#xff0c;Kubernetes 1.24 正式发布&#xff0c;在新版本中&#xff0c;可以看到 Kubernetes 作为容器编排的事实标准&#xff0c;正愈发变得成熟&#xff0c;有 12 项功能都更新到了稳定版本&#xff0c;同时引入…

如何在windows上安装Openssl环境

首先在链接下载openssl安装版 openssl windows 我选择的是肥一点的版本 然后就是按向导步骤安装。 安装完后&#xff0c;首先要先设置下环境变量 我安装的路径是 C:\Program Files\OpenSSL-Win64\bin接下来&#xff0c;我以我的windows11为例说明&#xff0c; 在任务栏开始…

快使用双截棍 | 低码之数据模型 元服务开发的奇门武器

中国武术博大精深&#xff0c;刀枪棍棒层出不穷。从中国古代流传下来的一件奇门武器&#xff0c;软中带硬&#xff0c;柔中有钢&#xff0c;名叫双节棍&#xff0c;又名双截棍。双截棍短小精悍&#xff0c;携带方便&#xff0c;普通人也可以打出160斤以上的力道&#xff0c;威力…

【项目一】IO库对比、文件操作

文章目录 1.17 标准C库IO函数和Linux系统IO函数对比1.18 虚拟地址空间1.19 文件描述符1.20 open打开文件1.20 open创建文件1.22 read、write函数1.23 lseek函数1.24 stat、lstat函数1.25 使用stat函数模拟实现 ls -l 命令1.26 文件属性操作函数1.27 目录操作函数1.28 目录遍历函…

linux 乱码

在 Linux 中遇到乱码问题通常是由于字符编码不正确导致的。以下是几种常见的乱码情况以及相应的解决方法&#xff1a; 1、终端乱码&#xff1a;如果在终端中出现了乱码&#xff0c;可以尝试以下方法来解决&#xff1a; 检查终端的字符编码设置&#xff1a;确保终端的字符编码…

18 MFC TCP和UDP 网络通信

文章目录 TCP服务器TCP客户端UDP 服务器UDP客户端MFC TCP通信TCP服务器TCP 客户端 MFC UDP通信 TCP服务器 #include <stdio.h> #include <WinSock2.h> #pragma comment(lib,"ws2_32.lib") //包含静态库/* .obj .lib 文件 组合打包成 .exe */int main()…

申请和注销设备号的方法

一、Linux内核对设备的分类 linux的文件种类&#xff1a; -&#xff1a;普通文件 d&#xff1a;目录文件 p&#xff1a;管道文件 s&#xff1a;本地socket文件 l&#xff1a;链接文件 c&#xff1a;字符设备 b&#xff1a;块设备 Linux内核按驱动程序实现模型框架的不…