近年GDC服务器分享合集(三): 《Sky光·遇》实现百万在线:一种云原生的扩容方法

news2025/1/12 21:51:11

如今,游戏行业对于云原生技术的使用越来越广泛。特别是那些拥有海量玩家在线的游戏,使用云原生技术可以轻松做到高可用、弹性扩容和降低成本。在GDC 2022上,来自《Sky光·遇》项目的工程师分享了相关的经验——《《Sky光·遇》实现百万在线:一种云原生的扩容方法》(Sky’s Journey to 1MM CCU: A Cloud Native Approach To Scaling)。PPT可点击链接获取。

请添加图片描述

《Sky光·遇》是著名华人游戏设计师陈星汉的作品。这位才华横溢的游戏设计师曾经依靠《风之旅人》获得过GDC 2013年度游戏大奖。《Sky光·遇》是他旗下的Thatgamecompany在手游领域的第一次尝试。

分享者在TGC工作了两年,目前领导微服务架构和云平台开发,在此之前有6年的软件工程师经验。

在这里插入图片描述

100万在线峰值就像是《Sky光·遇》山顶上最高的建筑顶端,到达这个目标前有很多有挑战性的问题需要解决,例如:

  1. 有限的工程资源。
  2. 遗留架构。
  3. 单点应用:包括非分布式的Erlang、6千行的Postgres函数、同步API(读写强一致性、HTTP Post通信)。
  4. 功能有限的游戏引擎。
  5. 单一的Postgres分片。
  6. 缺少持续集成(CI)、持续部署(CD)。

在这里插入图片描述

PostgreSQL:简称Postgres,一种常见的关系型数据库,具有丰富的数据类型和强大的索引,在国外应用比国内更多。
CI:持续集成(Continuous Integration),意为多名开发者并行开发不同功能时,可以频繁将代码合并而互不影响工作。
CD:持续部署(Continuous Deployment),意为基于工具实现代码从构建、测试到部署上线的自动化全流程。

他们的解决方案有:

  1. 划分微服务:包括高QPS的NoSQL、MongoDB按特性分片、分布式事务、命令查询职责分离(CQRS)、异步API。
  2. 引入基于事件的系统:Kafka、最终一致性。
  3. 改进游戏引擎:包括引入Gameplay工程师、非关键资源调用静默失败、核心游戏循环使用同步API、非核心游戏循环使用异步API、通过WebSocket处理局部更新。

在这里插入图片描述

CQRS:命令查询职责分离(Command Query Responsibility Segregation),一种读写分离的架构模式,将请求API分为读(查询)和写(命令)两种不同类型。

分享者刚接手项目时,遗留架构是这样的:

  1. 开发、QA、产品都在同一个虚拟私有云(VPC)中。缺点是不同应用环境没有隔离,不安全且容易出错。
  2. 每个可用区(AZ)只有一个子网(Subnet)。问题是没有做公有私有子网分离,部分对内服务也能被外部访问,不安全。
  3. 部分应用部署在单AZ上,部分应用横跨多个AZ。缺点是单AZ无法保证高可靠性。

在这里插入图片描述

云服务中的三个概念:
Region:区域。提供云服务的一个物理区域,用户就近接入,通常一个Region包含多个AZ。
AZ:可用区(Availability Zone)。一个资源隔离和容错区域,是一个或多个物理中心的集合。为了高可用性,一个Region中通常包含多个AZ,从而做到同城物理容灾。
VPC:虚拟私有云(Virtual Private Cloud)。面向租户的私有虚拟网络环境,VPC之间相互隔离。VPC一般位于同一个Region中,但可能横跨多个AZ。

为了解决原有架构中的问题,新的基础设施平台被设计成包括如下特性:

  1. 云原生:快速迭代。
  2. 高可用性:跨多个AZ。
  3. GitOps:使用Git 来管理基础架构和应用配置,是实现DevOps的一种方式。
  4. 开源软件(FOSS):使用开源软件来做云诊断。
  5. 被管理的服务:DB、计算以及合作方。

在这里插入图片描述

新的基础设施平台如下图所示,可以看出它具有原架构所没有的几个优点:

  1. 每个环境一个VPC,开发、QA和产品彼此隔离。
  2. 每个AZ下都有公有和私有子网,公有子网对外,私有子网对内。
  3. 所有应用都部署在多个AZ上。
  4. 每套环境中都有独立的数据层和事件总线。

在这里插入图片描述

位于新基础设施平台上的应用架构有如下特点:

  1. 云原生。
  2. 厂商中立:各种厂商的同类产品可以自由替换。
  3. 十二要素应用(The Twelve-Factor App):定义了应用开发应遵循的原则。
  4. 六边形架构(Hexagonal Architecture):使得组件之间可以自由替换,并且在开发组规模扩大时方便协同工作。

在这里插入图片描述

The Twelve-Factor App:十二要素应用,又名12-Factor,它定义了一个优雅的、适应云环境的互联网应用在设计过程中,需要遵循的一些基本原则。具体可参见它的官网。
Hexagonal Architecture:六边形架构,也称为端口适配器架构(Ports and Adapters Architecture),是一种软件设计模式,旨在将业务逻辑与技术实现分离开来,从而使系统更易于测试、维护和演化。

使用微服务并使用容器部署,会带来如下优点:

  1. 单独的仓库及数据库。
  2. 提升可测试性和可维护性。
  3. 方便快速部署。
  4. 清晰的代码责任划分。
  5. 方便使用不同的技术栈:例如在客户支持系统中使用了ExpressJS。

在这里插入图片描述

CQRS可以保证读写分离,主节点负责写,从节点负责读,这样有助于降低主节点的压力。数据一致性方面,保证强一致性写和弱一致性读。

在这里插入图片描述

再来谈谈分布式事务。分布式事务本质上是对于多个DB的写,希望整体保证ACID特性。一种实现方式是通过多次调用和重试,但这样是不可靠的。另一种实现方式是两阶段提交(Two-Phase Commit),它能保证强一致性,但是会阻塞而且较慢,所以并不推荐。分享者推荐的实现是使用Saga,它具有稍弱的一致性,但是非阻塞而且执行速度快,能保证最终的数据一致性。

在这里插入图片描述

Saga是一种补偿事务,它的运行逻辑是:将分布式事务看作一组事务组成的事务链,链中的每一个正向事务操作,都对应一个可逆的事务操作。Saga 事务协调器负责按照顺序执行事务链中的分支事务,分支事务执行完毕,即释放资源。如果某个分支事务失败了,则按照反方向执行事务补偿操作。

以下是使用Saga处理收件箱中物品赎回的示意图:

在这里插入图片描述

微服务需要有效的监测手段,大致可分为数据监测、分布式追踪、日志三类。分别有不同的开源工具可供使用。

在这里插入图片描述

还需要持续地对线上服务做性能剖析,包括对CPU、堆和协程。这样有助于定位问题,发现线上性能瓶颈。

在这里插入图片描述

最终,《Sky光·遇》团队实现了支撑100万在线的目标。同时收获了一套易扩容、快迭代、一键部署、占用人力少的新架构。

在这里插入图片描述

在分享最后,分享者谈了他对微服务的理解。有种观点认为,微服务是万能的,不管什么服务,只要去拆可以了。他认为这样会容易掉入陷阱,因为微服务也会增加架构复杂度,而且很多大型单点应用并不适合拆分成分布式。正确的做法应该是传统方式和微服务的结合,既有大型单点应用,也有若干微服务,根据实际情况来灵活处理。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/608051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

黑马Redis视频教程高级篇(一:分布式缓存)

目录 分布式缓存 一、Redis持久化 1.1、RDB持久化 1.1.1、执行时机 1.1.2、RDB原理 1.1.3、小结 1.2、OF持久化 1.2.1、AOF原理 1.2.2、OF配置 1.2.3、AOF文件重写 1.3、RDB与AOF对比 二、Redis主从 2.1、搭建主从架构 2.1.1、集群结构 2.1.2、准备实例和配置 …

基于springboot汽车站车辆运管系统java+vue

本汽车站车辆运管系统管理员可以管理个人中心,业务管理,站务管理,人力资源管理,办公司管理,财务管理。因而具有一定的实用性。本站是一个B/S模式系统,采用springboot框架,MYSQL数据库设计开发&a…

模型的细分和简化

​ 细分 本质为引入更多三角形 loop细分 对于新的顶点如何计算:下图中白点位置计算 对于旧的顶点位置计算 Catmull-Clark细分 对于非四边形的图形细分方法:不断将非四边形进行细分即可 下图中橙色:非四边形面的重心坐标;紫色&…

程序员必须了解的消息队列之王-Kafka

1. Kafka概述 1.1 定义 Kafka 是由 Apache 软件基金会开发的一个开源流处理平台。 Kafka 是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 1.2 消息队列 1.2.1 传统消息队列的应用场景 1.2.2 为什…

路径规划算法:基于共生生物优化的路径规划算法- 附代码

路径规划算法:基于共生生物优化的路径规划算法- 附代码 文章目录 路径规划算法:基于共生生物优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要:本文主要介绍利用智能优化…

深度相机和彩色相机对齐(d2c)

一般商用的rgbd相机的sdk自带d2c的api,但是LZ还是想利用空闲时间理解下其原理。 第一步:标定彩色相机和深度相机。 分别采集若干张彩色摄像头和红外摄像头(对于带有红外摄像头进行深度测量的深度摄像头,红外摄像头和深度摄像头其实…

mysql ssh隧道连接内网mysql

通过SSH隧道连接MySQL数据库 一.背景 问题所在:MySQL被运用于越来越多的业务中,在关键业务中对数据安全性的要求也更高,数据安全如果只靠MySQL应用层面显然是不够的,虽然说MySQL实现的登录机制基本不存在泄露密码的风险&#xf…

冈萨雷斯DIP第11章知识点

文章目录 11.3 边界特征描述子11.4 区域特征描述子11.4.3 纹理11.4.4 矩不变量 11.6 整体图像特征11.6.1 哈里斯-斯蒂芬斯 角检测器11.6.2 最大稳定极值区域 特征检测:在图像、区域或者边界中发现特征;特征描述:将定量属性分配给检测到的特征…

冈萨雷斯DIP第3章知识点

文章目录 3.1 背景3.2 一些基本的灰度变换函数3.2.1 图像反转3.2.2 对数变换3.2.3 幂律伽马变换3.2.4 分段线性变换函数 3.3 直方图处理3.3.1 直方图均衡化3.3.2 直方图匹配(规定化)3.3.3 局部直方图处理3.3.4 使用直方图统计量增强图像 3.4 空间滤波基础…

期末sql_server复习枯燥?乏味?一文带你轻松击破sql壁垒!

🎬 博客主页:博主链接 🎥 本文由 M malloc 原创,首发于 CSDN🙉 🎄 学习专栏推荐:LeetCode刷题集! 🏅 欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指…

leetcode197. 上升的温度

【题目】 下面是某公司每天的营业额,表名为“日销”。“日期”这一列的数据类型是日期类型(date)。 请找出所有比前一天(昨天)营业额更高的数据。(前一天的意思,如果“当天”是1月,“…

在腾讯干软件测试5年,5月无情被辞,想给划水的兄弟提个醒

前段时间,一个认识了好几年在大厂工作做软件测试的朋友,年近30了,却被大厂以“人员优化”的名义无情被辞,据他说,有一个月散伙饭都吃了好几顿…… 在很多企业,都有KPI考核,然后在此基础上还会弄…

[自学记录03|百人计划]移动端GPU的TB(D)R架构基础

一、专有名词解释 1.System on Chip(Soc) Soc是把CPU、GPU、内存、通信基带、GPS模块等等整合在一起的芯片的称呼。常见有A系Soc(苹果),骁龙Soc(高通),麒麟Soc(华为&am…

【人工智能】— 监督学习、分类问题、决策树、信息增益

【人工智能】— 监督学习、分类问题、决策树、线性分类器、K近邻、回归问题、交叉验证 监督学习 - 正式设置符号表示假设选择学习目标预测 分类Decision Trees 决策树建立决策树分类模型的流程如何建立决策树? 决策树学习表达能力决策树学习信息论在决策树学习中的应用特征选择…

Koa学习2:路由与数据库连接

路由 安装 npm i koa-router基本功能 定义路由:koa-router提供了一种简单的方式来定义路由,我们可以根据请求的方法和路径来定义不同的路由。 处理请求:koa-router可以帮助我们处理请求,当请求匹配到对应的路由时,k…

人工智能轨道交通行业周刊-第47期(2023.5.29-6.4)

本期关键词:郑州智慧地铁、货运安全监控、激光炮、6C系统、越行站、ChatGPT原理 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro轨…

SparkSQL文件格式和压缩算法是否支持Split

大数据支持Split的目的是为了能并行处理任务,可以将文件拆分成多个文件块处理。如果不支持Split的话,只能用一个任务处理单个文件。 能否支持Split受到文件格式和压缩算法的双重限制,大部分文件的读取都是可以支持Split,极少数压缩…

每日学术速递5.29

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Custom-Edit: Text-Guided Image Editing with Customized Diffusion Models(CVPR 2023) 标题:自定义编辑:使用自定义扩散模型进行文本引导图像编辑 作者&a…

部署rabbitmq3.10.6详细步骤

RabbitMQ简介 RabbitMQ是Erlang开发的,集群非常方便,因为Erlang天生就是分布式语言,但其本身并不支持负载均衡,支持高并发,支持可扩展。支持AJAX,持久化,用于在分布式系统中存储转发消息&#x…

八、Git分支和版本号的简介

1、Git分支介绍 分支在Git中相对较难,分支就是科幻电影里面的平行宇宙,如果两个平行宇宙互不干扰,那对现在的你也没啥影响。不过,在某个时间点,两个平行宇宙合并了,我们就需要处理一些问题了! 2…