开源模型应用落地-工具使用篇-SLB(二)

news2024/11/27 4:36:11

一、前言

    通过学习"开源模型应用落地"系列文章,我们成功地建立了一个完整可实施的AI交付流程。现在,我们要引入负载均衡,以提高我们的AI服务的性能和故障转移能力。本文将详细介绍如何使用腾讯云的负载均衡技术来将我们的AI服务部署为一个集群。


二、术语

2.1、负载均衡

    负载均衡(Load Balancing)是一种技术,旨在在计算机、网络或其他资源上均匀分配工作负载,以提高系统的性能、可靠性和可扩展性。

    在计算机网络中,负载均衡通常用于分配网络流量或请求到多个服务器上,以避免单个服务器过载而导致性能下降或系统故障。通过将工作负载分发到多个服务器上,负载均衡确保每个服务器都能够处理适量的请求,从而提高整个系统的响应能力。

2.2、硬件负载均衡

    是一种使用专门的物理设备(硬件负载均衡器)来实现负载均衡的技术。与软件负载均衡相比,硬件负载均衡器是一种专用硬件设备,具有更高的处理能力和性能。

    硬件负载均衡器通常位于网络中央位置,作为服务器和客户端之间的中间层。其主要功能是在多个服务器之间分发网络流量或请求,以确保负载均衡和高可用性。

硬件负载均衡器具有以下特点和优势:

  • 高性能:硬件负载均衡器通常具有专门的硬件加速器和优化算法,能够处理大量的网络流量和请求,提供快速响应和高吞吐量。
  • 可扩展性:通过添加更多的服务器和负载均衡器,硬件负载均衡器可以轻松扩展以适应不断增长的流量和负载需求。
  • 可靠性:硬件负载均衡器通常具有冗余和故障转移机制,以确保在单个负载均衡器故障时仍然保持系统的可用性。
  • 安全性:硬件负载均衡器可以提供一些安全功能,如防火墙、DDoS(分布式拒绝服务攻击)防护等,以增强系统的安全性。
  • 管理和监控:硬件负载均衡器通常提供简单易用的管理界面和丰富的监控工具,使管理员能够轻松配置和监控负载均衡器的性能和状态。

2.3、软件负载均衡

    是一种使用软件来实现负载均衡的技术。它在计算机系统中通过运行在普通服务器上的负载均衡软件来分发工作负载,以实现请求的均衡分配和系统性能的提升。

软件负载均衡通常采用以下几种方式来实现:

  • 软件负载均衡器:通过在一组服务器上运行负载均衡软件,该软件可以基于特定的算法(如轮询、最小连接等)将请求分发到不同的服务器上。负载均衡软件可以动态地监测服务器的负载情况,并根据负载情况进行动态调整,以实现负载均衡。
  • 反向代理服务器:反向代理服务器是一种位于客户端和服务器之间的服务器,它接收来自客户端的请求,并代表客户端向后端服务器发送请求。反向代理服务器可以使用负载均衡算法将请求分发到多个后端服务器上,以实现负载均衡。
  • 虚拟IP(VIP)或虚拟服务器:通过使用虚拟IP或虚拟服务器,多个服务器可以共享同一个IP地址或域名,客户端的请求将被分发到这些服务器中的一个。这种方式可以通过软件来实现负载均衡,将请求分发到不同的服务器上。

2.4、负载均衡算法

负载均衡可以使用多种算法来决定如何分配工作负载。常见的负载均衡算法包括:

  1. 轮询(Round Robin):按照顺序将请求依次分发到每个服务器,确保每个服务器都有机会处理请求。
  2. 最少连接(Least Connection):将请求分配给当前连接数最少的服务器,以确保负载更均衡。
  3. IP哈希(IP Hash):根据客户端的IP地址将请求分发到特定的服务器,以确保相同IP地址的请求始终被分配到同一台服务器上。
  4. 加权轮询(Weighted Round Robin):给每个服务器分配一个权重值,根据权重值决定分发请求的比例,使处理能力更强的服务器获得更多的请求。
  5. 动态负载均衡:根据服务器的实时负载情况动态地调整请求的分发策略,以适应不同负载情况下的最佳性能。

2.5、SLB

    是负载均衡(Server Load Balancing)的缩写,是一种网络技术和架构,用于将请求或流量分发到多个服务器上,以实现负载均衡和提高系统的性能、可靠性和可扩展性。

    SLB通常由一个负载均衡器(Load Balancer)和多个后端服务器(Backend Servers)组成。负载均衡器是位于客户端和后端服务器之间的中间设备,它接收来自客户端的请求并根据特定的算法将请求分发到后端服务器上。负载均衡器还监视后端服务器的状态和负载情况,并根据配置策略动态调整请求分发,以实现负载均衡。


三、使用方式

3.1、架构示意图

    这里的SLB部署在内网,位于业务服务和AI服务的中间,作为AI服务的入口,为AI服务提供集群化部署的能力

3.2、进入腾讯云控制台入口

访问地址:https://cloud.tencent.com/

点击右上角 -》控制台

3.3、按需选择登录方式

3.4、进入负载均衡管控界面

在搜索框输入“SLB”或者“负载均衡”,点击“负载均衡”入口

3.5、按需选择实例

建议跟云服务器处于一样的实例下面

3.6、新建实例

3.7、选择配置

计费模式:建议选择按量计费,成本会更低

地域:建议跟云服务器实例一致

网络类型:此处部署在内网(PS:App的入口处网络类型是公网)

所属网络:可以复用已有的网络或新建网络

实例规格:选择共享性即可满足(共享型负载均衡实例每分钟并发连接数50,000,每秒新建连接数5,000,每秒查询数5,000)

所属项目:默认项目或者自定义均可

标签和实例名:按需设置

勾选服务协议后点击立即购买

3.8、配置监听器

在实例管理列表中,选择刚刚购买的实例,点击操作中的配置监听器菜单

按需配置“HTTP/HTTPS监听器”或者“TCP/UDP/TCP SSL/QUIC监听器

此处接入AI服务,选择TCP监听器

点击新建 -》填写基本配置(PS:8999是对外服务的端口地址)

配置健康检查(PS:9999是AI服务的端口)

高级选项可以根据实际业务情况进行调整

配置会话保持(PS:AI服务是无状态的,不需要保持会话)

点击“提交”按钮完成监听器配置

3.9、调用

完成监听器配置之后,可以在“实例管理”列表处查看到SLB对应的VIP,并修改测试页面的连接信息,调整为VIP和对应的监听端口

3.10、监控

在“实例管理”列表处 -》选择对应的SLB实例 -》选择“监控”


四、附带说明

4.1、本篇以腾讯云的负责均衡服务作为掏砖引玉的入门介绍,对于其他的云服务商,也是大致的流程

4.2、建议开启删除保护,避免出现误操作的情况

4.3、公网类型的SLB(即网络入口),建议接入Web应用防火墙

4.4、在日志中心可以查询具体的访问日志信息以及仪表盘的大盘信息

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1456569.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网页脚本 bilibili004:字幕展示添加下载功能实现

效果 按钮显示 按钮hover 按钮点击 代码实现 在main函数中添加下载逻辑 getVideoName().then((resultObject) > {// 处理异步的Promise对象,https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Promise/thenaddDownloadButt…

Fiddler与wireshark使用

Fiddler解决三个问题 1、SSL证书打勾,解析https请求 2、响应回来乱码,不是中文 3、想及时中止一下,查看实时的日志 4、搜索对应的关键字 问题1解决方案: 标签栏Tools下 找到https,全部打勾 Actions里面 第一个 t…

沁恒CH32V30X学习笔记00--芯片概述

芯片概述 资源 系统框图 V303时钟树 V305/V307时钟 RISC-V4F 处理器 单精度浮点运算 处理器内部以模块化管理, 包含快速可编程中断控制器(PFIC) 内存保护 分支预测模式 扩展指令支持等单元 小端数据模式 多级硬件中断堆栈&#

ChatGPT实战100例 - (17) 用ChatGPT实现音频长度测量和音量调整

文章目录 ChatGPT实战100例 - (17) 用ChatGPT实现音频长度测量和音量调整获取音频长度pydub获取音频长度获取时长精确到秒格式设定 mutagen获取音频长度 调整音量视频音量调整注意事项 ChatGPT实战100例 - (17) 用ChatGPT实现音频长度测量和音量调整 老王媳妇说上次那个pip挺好…

『运维备忘录』之 SSH 命令详解

运维人员不仅要熟悉操作系统、服务器、网络等知识,甚至对于开发相关的也要有所了解。很多运维工作者可能一时半会记不住那么多命令、代码、方法、原理或者用法等等。这里我将结合自身工作,持续给大家更新运维工作所需要接触到的知识点,希望大…

OpenAI最新模型Sora到底有多强?眼见为实的真实世界即将成为过去!

文章目录 1. 写在前面2. 什么是Sora?3. Sora的技术原理 【作者主页】:吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作! 【作者推荐】:对JS逆向感…

Linux-文件文件夹相关命令

目录 常见命令 1. 创建空目录:mkdir 文件夹名 2. 删除空目录:rmdir 文件夹名 3. 创建多级目录:mkdir -p 123/abc 4. 删除非空文件 rm -rf 文件夹名 5. 创建文件: touch 文件名.后缀 / vi 文件名.后缀 6. 删除文件&#x…

挑战杯 基于GRU的 电影评论情感分析 - python 深度学习 情感分类

文章目录 1 前言1.1 项目介绍 2 情感分类介绍3 数据集4 实现4.1 数据预处理4.2 构建网络4.3 训练模型4.4 模型评估4.5 模型预测 5 最后 1 前言 🔥 优质竞赛项目系列,今天要分享的是 基于GRU的 电影评论情感分析 该项目较为新颖,适合作为竞…

Spring Boot java -jar --spring.profiles.active=dev 失效问题

之前动态部署修改配置文件的情况不多&#xff0c;所以也没注意过&#xff0c;这个问题今天困扰了好久&#xff0c;经过多方查询后得到了解决办法 直接上代码 <profiles><profile><!-- 本地开发环境 --><id>dev</id><properties><profi…

Codeforces Global Round 6

CF1266A Competitive Programmer 题目 给出n个数,问对于每个数,是否可以将这个数的数位重新组合(可以有前导零), 使其可以被60整除,若可以,则输出red,否则,输出cyan 分析 首先来看被60整除需要满足什么条件&#xff0c;因为602*3*10&#x…

2024年 前端JavaScript入门到精通 第一天 笔记

主要讲解JavaScript核心知识&#xff0c;包含最新ES6语法&#xff0c;从基础到API再到高级。让你一边学习一边练习&#xff0c;重点知识及时实践&#xff0c;同时每天安排大量作业&#xff0c;加深记忆&#xff0c;巩固学习成果。 1.1 基本软件与准备工作 1.2 JavaScript 案例 …

Spring MVC(基于 Spring4.x)基础学习

一、SpringMVC概述 二、SpringMVC的HelloWorld 三、使用RequestMapping映射请求 四、映射请求参数&请求头 五、处理模型数据 六、视图和视图解析器 七、RESTful CRUD 八、SpringMVC表单标签&处理静态资源 九、数据转换&数据格式化&数据校验 十、处理JSON:使用…

微信小程序:实现微信小程序应用首页开发 (本地生活首页)

文章目录 小程序应用页面开发1、创建项目并配置项目目录结构配置导航栏效果三、配置 tabBar 效果四、轮播图实现4.1 创建轮播图数据容器4.2 定义一个请求轮播图数据的接口4.3 页面加载调用 数据请求接口 五、九宫格实现5.1 获取九宫格数据5.2 结构和样式的完善六、图片布局实现…

MyBatisPlus 整合 SpringBoot 遇见的问题

【异常】&#xff1a;Cause: java.sql.SQLSyntaxErrorException: Unknown column ‘udf1’ in ‘field list’… SQL: SELECT id,oper_id,btch_id,udf1, FROM scan_cyber Cause: java.sql.SQLSyntaxErrorException: Unknown column ‘udf1’ in ‘field list’; ,"messag…

Python 实现 RSI 指标计算:股票技术分析的利器系列(4)

Python 实现 RSI 指标计算&#xff1a;股票技术分析的利器系列&#xff08;4&#xff09; 介绍算法解释 代码rolling函数介绍计算LCshift函数语法&#xff1a;参数&#xff1a;返回值&#xff1a; 计算涨跌幅函数MAX介绍语法&#xff1a;参数&#xff1a;返回值&#xff1a;示例…

小米4A路由器如何刷OpenWRT并结合内网穿透实现公网远程访问

文章目录 推荐前言1. 安装Python和需要的库2. 使用 OpenWRTInvasion 破解路由器3. 备份当前分区并刷入新的Breed4. 安装cpolar内网穿透4.1 注册账号4.2 下载cpolar客户端4.3 登录cpolar web ui管理界面4.4 创建公网地址 5. 固定公网地址访问 推荐 前些天发现了一个巨牛的人工智…

USB-C音频转接器:实现边充电边听歌的新选择 | LDR6020P

随着科技浪潮的推进&#xff0c;Type-C接口已逐渐成为电子设备的主流选择&#xff0c;以其正反随意插、高速传输和强大功能等独特优势&#xff0c;在日常生活中占据越来越重要的地位。而Type-C音频转接器&#xff0c;作为连接Type-C接口与音频设备的桥梁&#xff0c;正引领着音…

Springboot集成activiti,低代码整合平台,智慧审批,前端vue

一、项目形式 springbootvueactiviti集成了activiti在线编辑器&#xff0c;快速开发平台&#xff0c;可插拔工作流服务。 二、项目介绍 本项目拥有用户管理&#xff0c;部门管理&#xff0c;代码生成&#xff0c;系统监管&#xff0c;报表&#xff0c;大屏展示&#xff0c;业…

什么样的服务器是高性能服务器?

首先&#xff0c;高性能服务器应具备高处理能力。随着业务的不断扩展和数据量的爆炸性增长&#xff0c;高性能服务器需要具备强大的计算能力&#xff0c;能够快速处理各种复杂的业务和数据。这要求高性能服务器采用先进的处理器技术&#xff0c;如多核处理器、GPU加速等&#x…

Java 学习和实践笔记(14)

OOP :面向对象编程&#xff0c;object oriented programming. 用表格就可以很好地理解类、对象、属性、以及动作这些概念。 一个表&#xff08;结构&#xff09;就对应一个类&#xff08;结构&#xff09;。所以凡叫什么类&#xff0c;自己就在心里把它叫什么表。反过来&…