从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践

news2024/11/23 19:10:22

原文来源: https://tidb.net/blog/a38c72a4

本文作者:骏伯网络 唐帆,PingCAP 贺美存

骏伯网络简介

广州骏伯网络是一家以数据驱动的科技公司,聚焦移动互联网营销服务,坚持以客户为中心,深耕 APP、运营商、金融保险等行业,以解决客户营销痛点为目标,为客户提供全链路营销服务。骏伯网络于 2015 年挂牌新三板,连续 5 年入选广州未来独角兽企业,已累计为超过 1000 家企业、超过 1600 款产品提供推广服务,长期与头部 APP、三大运营商以及知名金融产品进行合作,具备丰富的客户资源。

导读

骏伯网络是一家聚焦移动互联网营销服务的公司,综合运营管理平台是其核心业务系统,包括营销系统、订单、支付以及与外部系统的交互服务接口。为满足多元化的业务发展需求,降低系统间交互链路的复杂性,提升业务连续性,以及实现降本增效的整体规划,骏伯网络选择将 TiDB 作为综合运营管理平台的底层数据库。经过上线实践证明,TiDB 为骏伯在业务连续性、性能提升、数据资源整合、降本增效等方面带来了显著价值。未来,骏伯将扩展 TiDB 在数据分析类业务场景中的应用,提升数据实时分析能力,加快业务创新的步伐。

业务痛点与数据库技术选型

1. 业务简介、现状和痛点

综合运营管理平台是骏伯最核心的业务系统,主要覆盖营销、渠道、媒介、创意等业务部门,底层数据库包含 OLTP、OLAP 两种,业务系统主要包含营销、订单和信息展现三部分。订单数据均会回流到订单服务模块,订单成功后会推送到下单流程,同时可以在平台中及时查看订单信息。

综合运营管理平台应用架构图:

image.png

整套应用由 40 多个微服务组成,底层数据库采用 20 多套 MySQL 主备高可用架构,部署在 4 台物理服务器上,主备交叉部署的模式。大数据分析平台采用 Hadoop 生态,数据分析模式为 T+1 的离线模式。

综合运营管理平台是一套面向互联网用户的实时交易系统,对可靠性和性能要求较高。物理服务器的硬件故障会对生产运维和业务连续性造成较大的挑战和影响,各套数据库相对相互独立,需要实现跨库的数据实时共享。

2. 技术选型要求

为了配合系统改造,解决业务连续性、数据扩展能力、资源利用率和性能等生产环境面对的痛点,骏伯启动了对国内多家头部原生分布式数据库的测试选型,具体的要求包括:

业务连续性

任何硬件单点故障对数据库集群无影响,在无人工干预的情况下,业务能够持续对外提供正常服务。数据库应具备原生分布式高可用能力,可根据业务重要性灵活设定数据副本数,具备异地灾备能力,可满足机房级高可用要求。

数据扩展能力

满足企业快速的业务变化需求,支持横向扩展能力,对业务无入侵性。数据库采用松耦合的存算分离架构,按需灵活扩展计算或存储能力,数据可自动重平衡,通过节点扩展实现性能的线性增长。

应用透明迁移能力

数据库可兼容和延续现有的应用架构和代码,提供数据在线的透明迁移能力,降低应用改造和迁移难度。

数据实时压缩能力

数据库应具备库内实时在线的压缩能力,在性能不受影响的前提下,节省数据存储的成本。

数据可恢复性

数据库需提供物理和逻辑备份,支持可选对象粒度的全量和增量备份,可将集群恢复到任何时间点。在数据误操作的情况下,提供闪回能力。

经过多轮对比测试和业务场景的验证,TiDB 满足了本次技术选型的所有指标。骏伯网络选择将 TiDB 作为综合运营管理平台的底层数据库。

TiDB 在骏伯网络综合运营管理平台的应用

从整体数据规模、业务访问请求、资源高可用等维度考虑,我们制定了详细的部署方案。结合现有应用和数据库情况,我们设计了分批业务迁移计划,历时 3 个月成功完成了所有应用的平滑迁移和部署。在主中心部署一套包含 4 台物理服务器的 TiDB 集群,用于支撑综合运营管理平台。主中心集群通过 BR 完成数据库备份任务。MySQL 数据的迁移工作由 DM 组件完成,以确保数据迁移的顺利进行。未来,我们计划在异地构建一套单副本的集群,通过 TiCDC 组件搭建数据容灾的演练环境,从而实现异地灾备。

系统架构图:

image.png

目前所有应用模块已成功迁移到 TiDB 集群上,第一批迁移的业务已经稳定运行超过半年。系统在业务高峰期经历了验证,并成功应对了单服务器硬件异常故障对业务连续性保障的实际考验,完全实现了项目最初规划的目标。 业务峰值流量 QPS 大于 10K,活跃连接数 400 左右,且平均响应延时低于 200ms

应用价值

结合系统的实际运行效果,总结 TiDB 为骏伯网络带来的收益如下:

保障业务连续性

TiDB 原生多副本能力避免了任何单点硬件故障,为业务提供无感知的保障能力。通过跨数据中心集群灾备能力保障机房级的故障影响,充分保障业务的连续性。

降低资源和运维投入

TiDB 内置的数据实时压缩能力,保障数据三副本的高可用。集群整体资源较原有 MySQL 主备集群实现了 20% 的成本降低。过去需要运维 20 多套 MySQL,现在只需要运维一套 TiDB 集群,整体运维投入大幅下降。

数据的实时汇聚和查询能力提升

通过 TiDB 原生分布式和透明扩展能力,将原有 20 多套 MySQL 主备库归集到一套 TiDB 集群内,实现多业务系统的数据实时汇聚、实时查询和数据实时变现能力。

应用迁移透明,业务无侵入

通过 DM 工具实现从 MySQL 到 TiDB 的平滑迁移。TiDB 对 MySQL 的兼容能力和业务无入侵性,对应用迁移改造成本极低,在保障性能的基础上实现了应用的无缝迁移。目前,已成功完成 20 多套库的应用透明迁移。

未来展望

骏伯网络致力于成为一家以数据服务为目标的企业,将数据服务视为核心竞争力。近年来,业务对数据服务能力提出了更高的要求:从 T+1 的离线数据分析转变为 T+0 的实时分析效果。然而,企业现有的 Hadoop 生态框架已无法满足新业务的数据分析需求,主要表现在技术栈复杂、开发运维成本高、数据实时服务能力弱等方面。

在 2024 年的计划中,我们旨在构建一套以 TiDB 为底座的数据实时分析平台,以实现对数据的实时加工和统一服务能力。通过结合现有的 Hadoop 框架,我们将打造一套流批一体化的数据湖平台,从而加速企业数字化能力的提升。这一举措旨在有效解决技术栈复杂性、降低开发运维成本,并增强数据的实时服务能力,以更好地满足业务发展对数据实时分析和实时变现的要求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1431926.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据学习之Redis,十大数据类型的具体应用(四)

3.8 Redis基数统计(HyperLogLog) 需求 统计某个网站的UV、统计某个文章的UV 什么是UV unique Visitor ,独立访客,一般理解为客户端IP 大规模的防止作弊,需要去重复统计独立访客 比如IP同样就认为是同一个客户 需要去…

sqli.labs靶场(29到40关)

29、第二十九关 id1 id1 尝试发现是单引号闭合, -1 union select 1,2,3-- -1 union select 1,2,database()-- -1 union select 1,2,(select group_concat(table_name) from information_schema.tables where table_schemasecurity)-- -1 union select 1,2,(select…

国内最全的Spring Boot系列之七

• 阿里巴巴前高级研发工程师 • 三家千万级互联网企业技术顾问 • MBTI/盖洛普技术专家 • 厦门某高校外聘教师 • 51CTO特约合作讲师 • 网易云课堂签约讲师 •《深入理解设计模式》作者 一转眼马上要过年了,回首2023年,感觉自己无所事事、碌碌无…

python爬虫5

1.selenium交互 无页面浏览器速度更快 #配置好的自己不用管 from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionschrome_options Options()chrome_options.add_argument(‐‐headless)chrome_options.add_argument(‐‐disable‐gpu)# path…

编程效率的跃升之路

编程是一门需要大量的时间和精力投入的技能,提高编程效率则是一个需要不断学习和实践的过程。结合笔者写bug多年的经验,一些学习建议和资源和大家share下。 一、编程如何提效: 熟悉开发工具:掌握常用的开发工具,如集…

flutter抓包绕过

lutter的证书校验 起因: 最近工作上让做个app的复测,把apk发我后,开始尝试挂代理抓包,结果发现抓不到 为是证书没弄好,想着前几天不是刚导入了吗(雾)。又重新导入了下还是不行。然后各种lsp模…

OJ_找位置

题干 代码 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<vector> #include<algorithm> #include<map> using namespace std;int main() {char str[200] { 0 };scanf("%s", str);map<char, vector<int>> times…

ROS入门之通信机制及常用API

文章目录 前言一、话题通信1.话题通信理论2.话题通信常用API&#x1f357;发布者advertisepublish &#x1f356;订阅者subscribe 3.自定义msg 二、服务通信1.服务通信理论2.服务通信常用API&#x1f386;服务端advertiseService &#x1f387;客户端serviceClientros::service…

[大厂实践] Pinterest通用计算平台实践

Pinterest平台团队开发实现了名为PinCompute的高性能通用计算平台&#xff0c;支持Pinterest的大量异构用例和服务。本文介绍了团队在开发这一平台过程中的经验和实践&#xff0c;对于其他平台团队来说&#xff0c;具有很好的参考意义。原文: PinCompute: A Kubernetes Backed …

RabbitMQ面试必备:基本概念、组件原理、消息传递模型,一网打尽。解密高可用性、负载均衡,深入了解安全性配置和性能优化

一、RabbitMQ的基本概念&#xff1a; 1.什么是消息队列&#xff1f; 消息队列是一种在分布式系统中用于在不同组件之间传递消息的通信机制。它允许应用程序和服务通过异步方式进行通信&#xff0c;提高了系统的可伸缩性和松耦合性。消息队列通常包括生产者&#xff08;Produc…

node-sass版本与NodeJS版本不匹配的问题

npm install 报错如下 npm ERR! code 1 npm ERR! path D:\Project\git_Product\YYYY\user\node_modules\node-sass npm ERR! command failed npm ERR! command C:\WINDOWS\system32\cmd.exe /d /s /c node scripts/build.js 问题原因 node-sass 与 node 版本不匹配 卸载Node…

PM圆桌派:同事不愿意告诉你的职场套路有哪些?

职场是社会的缩影&#xff0c;想要崭露头角&#xff0c;获得更多升职加薪的机会&#xff0c;就不要做着和多数人一样的事情&#xff0c;却期待着不一样的结果。 职场上有很多潜在的规则&#xff0c;要会做事&#xff0c;也要会说话&#xff0c;更要会做人。如果不懂规则&#…

day43_jdbc

今日内容 0 复习昨日 1 SQL注入问题 2 PreparedStatement 3 完成CRUD练习 4 ORM 5 DBUtil (properties) 6 事务操作 0 复习昨日 已经找人提问… 1 SQL注入 1.1 什么是SQL注入 用户输入的数据中有SQL关键词,导致在执行SQL语句时出现一些不正常的情况.这就是SQL注入! 出现SQL注入…

springcloud-gateway升级版本allowedOrigins要改allowedOriginPatterns

前言 报错: java.lang.IllegalArgumentException: When allowCredentials is true,allowedOrigins cannot contain the special value "*"since that cannot be set on the "Access-Control-Allow-Origin"response header. To allow credentials to a se…

AI大模型专题:OWASP大语言模型应用程序十大风险V1.0

今天分享的是AI大模型系列深度研究报告&#xff1a;《AI大模型专题&#xff1a;OWASP大语言模型应用程序十大风险V1.0》。 &#xff08;报告出品方&#xff1a;OWASP&#xff09; 报告共计&#xff1a;14页 LM01:2023_ 提示词注入 描述&#xff1a;提示词注入包括绕过过滤器…

【Linux】解决:为什么重复创建同一个【进程pid会变化,而ppid父进程id不变?】

前言 大家好吖&#xff0c;欢迎来到 YY 滴Linux 系列 &#xff0c;热烈欢迎&#xff01; 本章主要内容面向接触过Linux的老铁 主要内容含&#xff1a; 欢迎订阅 YY滴C专栏&#xff01;更多干货持续更新&#xff01;以下是传送门&#xff01; YY的《C》专栏YY的《C11》专栏YY的…

Java八大常用排序算法

1冒泡排序 对于冒泡排序相信我们都比较熟悉了&#xff0c;其核心思想就是相邻元素两两比较&#xff0c;把较大的元素放到后面&#xff0c;在一轮比较完成之后&#xff0c;最大的元素就位于最后一个位置了&#xff0c;就好像是气泡&#xff0c;慢慢的浮出了水面一样 Jave 实现 …

解决IntellIJ Idea内存不足

突然有一天我在IDEA打开两个项目时&#xff0c;发生了报错&#xff0c;说我内存不足&#xff0c;我这电脑内存16G怎么会内存不足。下面是我的解决方案。 IntelliJ IDEA 报告内存不足的原因通常与以下几个因素有关&#xff1a; 项目规模较大&#xff1a;如果您正在开发的项目非…

Linux 配置路由转发功能测试

测试Linux配置路由转发功能。 参考 手把手带你将 Linux 主机配置为静态路由器tcpdump详解&实战 环境 操作系统 Centos7.9 网络环境 1. 三台主机的网卡 enp0s5 均在 10.211.55.0/24 网段&#xff0c;且网络可以通讯 centos7-18的IP 10.211.55.18&#xff0c;作为路由…

【退役之重学前端】vite, vue3, vue-router, vuex, ES6学习日记

学习使用vitevue3的所遇问题总结&#xff08;2024年2月1日&#xff09; 组件中使用<script>标签忘记加 setup 这会导致Navbar 没有暴露出来&#xff0c;导致使用不了&#xff0c;出现以下报错 这是因为&#xff0c;如果不用setup&#xff0c;就得使用 export default…