从 Snowflake 到 Databend Cloud:全球游戏平台借助 Databend 实现实时数据处理

news2025/3/20 11:45:34

导读:某全球游戏平台为全球数百万玩家提供实时的技能型游戏体验与无缝的实时互动。对该游戏平台而言,保持数据的实时更新和实时分析,对提升玩家互动和留存率至关重要。他们在使用 Snowflake 进行实时数据摄取和分析时遇到了重大挑战,且成本居高不下。为了更高效地实现实时数据分析,该平台从 Snowflake 迁移到 Databend Cloud,成本降低了 50%,实现了具有秒级任务支持的实时数据 ELT 过程,提供实时数据洞察。

某游戏公司是一家全球游戏平台,擅长为全球数百万玩家提供实时的技能型游戏体验。同时,该游戏公司还在广告、支付和玩家互动领域走在前沿,开发出先进的解决方案,确保其多款热门游戏能够实现无缝的实时互动。

这家全球游戏公司使用 Amazon Aurora 来存储实时的用户活动、广告事件和财务数据。这些数据再以 JSON 文件的形式导出到 S3 Bucket,并被导入 Snowflake 作为原始数据表。利用 Snowflake 的流和任务功能,将包括玩家操作、游戏内购买和匹配详情在内的数据,转化为多个精细化的数据表。对该游戏平台而言,在 Snowflake 中保持数据的准确和实时更新,对提升玩家互动和留存率至关重要,可以确保游戏体验的流畅和及时响应。

Snowflake 在处理实时数据时面临的挑战:云计算成本急剧上升

该游戏平台在使用 Snowflake 进行实时数据摄取和分析时遇到了重大挑战。平台需要实时处理从 Aurora 二进制日志生成到 S3 上的 JSON 文件中的用户数据。然而,Snowflake 在实现亚秒级的数据摄取和转换方面表现不佳,但这对于更新原始数据表和维护实时用户活动流至关重要。

此外,Snowflake 的定价模型在处理此类任务时显得不够实用,它对任务等云服务收取了过高的费用。由于没有直接支持亚秒级任务的 SQL 功能,该游戏平台被迫使用分钟级的任务和 SQL 脚本,导致成本大幅上升。这种无法实时处理数据的限制,造成了数据分析的空白,影响了他们对客户参与度和广告效果的有效评估。

更为重要的是,即使已经是大容量的企业客户,他们也未能得到 Snowflake 足够的官方支持。有一次在向 Snowflake 提交工单后,技术人员等待了四个小时后才收到回复,虽然很快解决了问题,但业务却影响了四个小时以上。

为了降低成本、更高效地利用资源和得到更好的专业服务支持,该平台决定从 Snowflake 迁移到 Databend Cloud。

这家全球游戏平台公司最初在 GitHub 上发现了 Databend Cloud,对 Databend 提出的 Snowflake 开源替代方案产生了浓厚的兴趣。他们对 Databend Cloud 支持熟悉的 SQL 语法和强大的流处理与任务功能印象深刻。其中,特别吸引他们的是 Databend 在数据摄取、转换和分析方面承诺的 10 倍性能提升以及亚秒级任务支持。Databend Cloud 清晰且更具成本效益的定价模型完美契合了公司的需求和目标。

数据的实时导入

Databend Cloud 在 AWS 上提供 Serverless 数据云服务,支持强大的 SQL 功能,并提供了完整的 TPC-H 基准测试。产品特性还包括事务处理和 Python/JS 编写的用户定义函数(UDF),以及支持多种 DML(数据操作语言)操作,如插入、更新和合并等。

该游戏平台仅用了三周时间就将数千个涉及数据摄取、变更数据捕获(CDC)、转换和仪表板的 SQL 查询迁移到 Databend Cloud。由于 Databend Cloud 与 Snowflake 的 SQL 语法兼容,这一迁移过程非常顺利。

为数据需求提供可靠且可预测的定价方案

Databend Cloud 基于计算与存储分离架构,并提供分钟级的自动挂起和恢复功能,大幅降低了成本。与 Snowflake 不同的是,后者的任务调度服务可能占总成本的 50%,且这部分成本不透明无法预估,而 Databend Cloud 提供了更简单且可预测的定价模式。

使用 Databend Cloud 后,公司的成本降低了 50%,这得益于 Databend Cloud 清晰且一致的定价模式。这种透明性使游戏平台能够高效地管理和预测每月的数据管理费用。他们成功地将大量历史数据迁移到 Databend Cloud,实现了每月处理多达 1000 亿行数据,并且所有成本都是完全透明的。这一转变使他们能够为客户提供全面且实时的业务洞察,而无需担心意外的财务负担。

该游戏平台技术负责人表示:“我们对 Databend 提供的快速且可靠的服务深表感谢,产品在数据流处理方面的出色表现显然处于行业领先地位。经过顺利的为期三周的整合,我们的平台将 Databend 引入我们的生产系统。感谢所有参与此项目的人的辛勤付出。我们期待看到 Databend 的不断成长,并取得更大的成就!”

轻松优化实时数据处理流程

Databend Cloud 提供强大的流处理和任务执行能力,为客户带来卓越的性能和易用性。该游戏平台通过 Databend Cloud 高效地将大量数据摄取到一个原始表中,并利用多个流无缝分发和转换这些数据,使用外部 UDF 满足各种业务需求。

借助 Databend Cloud,该平台实现了每秒摄取 10,000 行数据的稳定速率,并能安排亚秒级的任务执行,提供实时洞察。这使他们每月能够处理和分析 1000 亿行数据,大大提升了数据操作效率,推动了更好的业务成果。如今,该平台享受着可靠且高效的实时数据处理,使他们能够专注于提供卓越的游戏体验,并 更精细化 地做出数据驱动的决策

用户收益

  • 得益于 Databend Cloud 与 Snowflake 高度相似的 SQL 语法,以及任务、流处理和多表数据操作的全面支持,该游戏平台从 Snowflake 迁移到 Databend Cloud 的过程非常简单,团队几乎无需额外学习即可上手。
  • Databend Cloud 实现了真正意义上的实时 ETL,提供秒级甚至亚秒级的数据处理能力,让游戏平台实现了实时数据分析,推动了游戏业务的快速发展。
  • 使用 Databend Cloud 后,游戏平台运营成本显著下降,性价比大幅提升,达到有效的降本增效目标。
  • Databend Cloud 提供贴心、快速的专属技术支持服务,让客户安心专注于自身业务的创新和发展。

关于 Databend

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式湖仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

👨‍💻‍ Databend Cloud:databend.cn

📖 Databend 文档:docs.databend.com

💻 Wechat:Databend

✨ GitHub:github.com/databendlab…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2318345.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker搭建MySQL主从服务器

一、在主机上创建MySQL配置文件——my.cnf master服务器配置文件路径:/data/docker/containers/mysql-cluster-master/conf.d/my.cnf slave服务器配置文件路径: /data/docker/containers/mysql-cluster-master/conf.d/my.cnf master服务配置文件内容 …

C语言每日一练——day_12(最后一天)

引言 针对初学者,每日练习几个题,快速上手C语言。第十二天。(最后一天,完结散花啦) 采用在线OJ的形式 什么是在线OJ? 在线判题系统(英语:Online Judge,缩写OJ&#xff0…

10、STL中的unordered_map使用方法

一、了解 1、unordered_map(哈希) unordered_map是借用哈希表实现的关联容器。 访问键值对O(1),最坏情况O(n),例如哈希冲突严重时。【n是一个哈希桶的元素数量】 unordered_map特性 键值对存储&#xff…

本地部署deepseek-r1建立向量知识库和知识库检索实践【代码】

目录 一、本地部署DS 二、建立本地知识库 1.安装python和必要的库 2.设置主目录工作区 3.编写文档解析脚本 4.构建向量数据库 三、基于DS,使用本地知识库检索 本地部署DS,其实非常简单,我写了一篇操作记录,我终于本地部署了DeepSeek-R1(图文全过程)-CSDN博客 安装…

监控视频联网平台在智慧水利中的应用

随着智慧城市建设的深入推进,智慧水利作为其中的重要组成部分,正逐步实现数字化、智能化和网络化转型。在这一过程中,监控视频联网平台凭借其高效的数据采集、传输与分析能力,成为智慧水利建设的关键技术支撑。以下是监控视频联网…

深入解析素数筛法:从埃氏筛到欧拉筛的算法思想与实现

素数筛法是一种用于高效生成素数的算法。常见的素数筛法包括埃拉托斯特尼筛法(埃氏筛)和欧拉筛(线性筛)。下面我们将详细讲解这两种筛法的思想: 一、 埃拉托斯特尼筛法(埃氏筛) 思想&#xff1…

ubuntu20.04系统没有WiFi图标解决方案_安装Intel网卡驱动

文章目录 1. wifi网卡配置1.1 安装intel官方网卡驱动backport1.1.1 第四步可能会出现问题 1.2 ubuntu官方的驱动1.3 重启 1. wifi网卡配置 我的电脑是华硕天选4(i7,4060),网卡型号intel ax201 ax211 ax210通用。 参考文章&#…

网络编程---多客户端服务器

写一个服务器和两个客户端 运行服务器和2个客户端,实现聊天功能 客户端1 和 客户端2 进行聊天 客户端1将聊天数据发送给服务器 服务器将聊天数据转发给客户端2 要求: 服务器使用 select 模型实现 客户端1使用 poll 模型实现 客户端2使用 多线程实现…

LeetCode 2614.对角线上的质数:遍历(质数判断)

【LetMeFly】2614.对角线上的质数:遍历(质数判断) 力扣题目链接:https://leetcode.cn/problems/prime-in-diagonal/ 给你一个下标从 0 开始的二维整数数组 nums 。 返回位于 nums 至少一条 对角线 上的最大 质数 。如果任一对角线上均不存在质数&…

红日靶场(二)——个人笔记

靶场搭建 新增VMnet2网卡 **web:**需要配置两张网卡,分别是外网出访NAT模式和内网域环境仅主机模式下的VMnet2网卡。 **PC:**跟web一样,也是需要配置两张网卡,分别是外网出访NAT模式和内网域环境仅主机模式下的VMn…

实时视频分析的破局之道:蓝耘 MaaS 如何与海螺 AI 视频实现高效协同

一、蓝耘 MaaS 平台:AI 模型全生命周期管理的智能引擎 蓝耘 MaaS(Model-as-a-Service)平台是由蓝耘科技推出的 AI 模型全生命周期管理平台,专注于为企业和开发者提供从模型训练、推理到部署的一站式解决方案。依托云原生架构、高…

走进Java:String字符串的基本使用

❀❀❀ 大佬求个关注吧~祝您开心每一天 ❀❀❀ 目录 一、什么是String 二、如何定义一个String 1. 用双引号定义 2. 通过构造函数定义 三、String中的一些常用方法 1 字符串比较 1.1 字符串使用 1.2 字符串使用equals() 1.3 使用 equalsIgnoreCase() 1.4 cpmpareTo…

python系列之元组(Tuple)

不为失败找理由,只为成功找方法。所有的不甘,因为还心存梦想,所以在你放弃之前,好好拼一把,只怕心老,不怕路长。 python系列之元组(Turple) 一、元组是什么?——给新手的…

破解验证码新利器:基于百度OCR与captcha-killer-modified插件的免费调用教程

破解验证码新利器:基于百度OCR与captcha-killer-modified插件的免费调用教程 引言 免责声明: 本文提供的信息仅供参考,不承担因操作产生的任何损失。读者需自行判断内容适用性,并遵守法律法规。作者不鼓励非法行为,保…

批量删除 PPT 中的所有图片、某张指定图片或者所有二维码图片

PPT 文档中的图片如何删除呢?相信很多小伙伴或碰到类似的需求。比如我们需要删除 PPT 文档中的某一张图片或者某张二维码图片,如果每一页都有这张图片,或者有很多 ppt 都有同一张要删除的图片,我们应该怎么快速的完成删除呢&#…

大模型开发(六):LoRA项目——新媒体评论智能分类与信息抽取系统

LoRA项目——新媒体评论智能分类与信息抽取系统 0 前言1 项目介绍1.1 项目功能1.2 技术原理1.3 软硬件环境1.4 项目结构 2 数据介绍与处理2.1 数据集介绍2.2 数据处理2.3 数据导入器 3 模型训练3.1 配置文件3.2 工具函数3.3 模型训练3.4 模型评估 4 模型推理 0 前言 微调里面&…

mysql-innodb存储引擎主键索引叶子结点数据结构(非单纯的双向链表)

我们应该清楚行记录是放在页中的。 compact行记录格式: 主要介绍几个比较重要的参数 heap_no: 页号 record_type: 0 表示普通类型(叶子结点),1表示B树的非叶子节点 ,2 表示最小记录&#xff…

物联网为什么用MQTT不用 HTTP 或 UDP?

先来两个代码对比,上传温度数据给服务器。 MQTT代码示例 // MQTT 客户端连接到 MQTT 服务器 mqttClient.connect("mqtt://broker.server.com:8883", clientId) // 订阅特定主题 mqttClient.subscribe("sensor/data", qos1) // …

Vmware中的centos7连接上网

有很多刚刚开始配置了centos7,然后发现不能上网现在来解决这个问题。 测试能不能上网 先还原这个设置,如果没有动过的话就不用,连接模式是NAT模式 然后进去设置网络环境,记得是用超级用户设置 vi /etc/sysconfig/network-script…

【AI知识】常见的优化器及其原理:梯度下降、动量梯度下降、AdaGrad、RMSProp、Adam、AdamW

常见的优化器 梯度下降(Gradient Descent, GD)局部最小值、全局最小值和鞍点凸函数和非凸函数动量梯度下降(Momentum)自适应学习率优化器AdaGrad(Adaptive Gradient Algorithm)​RMSProp(Root M…