亚马逊云科技Serverless构建的实时数仓解决方案,助力猎豹降低30%成本

news2025/1/31 22:55:43

也许你也听过这样一句话:“21世纪什么最贵?人才!”当数字经济全面席卷而来,这个问题的答案不可置否地变为了“数据”。通过数据分析获取近乎实时的洞察,以驱动业务的全流程,是企业数字化转型的必经之路。借助亚马逊云科技Serverless数据分析服务构建的端到端实时数仓解决方案,猎豹移动旗下的App用户埋点分析负载上的成本节省相较于之前减少30%,成功构建实时数仓。

 

机会从数据中攫取机会

各类企业所管理的数据正在经历爆炸式增长。IDC研究表明,2022年到2024年三年间创建的数据量将超过过去30年创建的所有数据量,随着生成式AI技术的出现,更将进一步促进数据分析领域的高速发展。拥有数据对于企业来说是“双刃剑”,在积累大量数据的同时,通过聚合数据进行深入挖掘分析,用数据来驱动业务,用数据来支撑决策、用数据来推动业务和商业模式创新、推动业务流程优化,进而实现降本增效,才是重中之重。而猎豹移动就是这条路上的先行者。

猎豹移动(NYSE:CMCM)成立于2010年11月,公司致力于“在人机共存的世界里,用科技让生活更美好”。当前,猎豹移动正在从移动互联网向以AI驱动的产业互联网进行战略升级,以安全工具+AI机器人场景为核心,构建覆盖工具应用、移动娱乐、人工智能、机器人等行业企业在内的猎豹生态。

猎豹移动与亚马逊云科技的合作由来已久,早在2012年,猎豹移动就将海外推出的移动应用App Clean Master运行在亚马逊云科技上。2023年初,猎豹移动在海外发布了全新应用程序,并将其相关数据发送到猎豹移动的分析系统中,该系统基于一家云服务提供商的自有数据库产品和分析工具搭建,猎豹移动的运营团队可通过直接查询原有数据库进行业务分析。

但随着用户数据量的不断增加、数据复杂度的不断上升,原有云供应商的数据分析架构暴露出了以下问题:

  1. 第一,原数据库的计价模式是基于猎豹移动的运营团队和BI人员直接对数仓进行操作,而由于原有数据库的计价模式,该数据库产品是基于实际计算量和扫描量进行计费,而客户团队本身撰写查询语句的水平参差不齐,难以避免会出现浪费计算量和扫描量的查询语句,因此会造成成本不可控的风险。
  2. 第二,原数据库不能保证所有日志在一天内都会被摄取到数据库中,也无法保证实时摄入,当数据规模较大时,仅可以保证T+3,也就是说当天的数据内容,只有在摄入3天之后才能保证当天数据都可以在数据库中查询到,无法实现T+0或近实时工作负载。此外,原数据库行数每日超过2亿行时,还可能会出现丢失日志的问题,这为猎豹移动应用的推进带来了很大的压力。

因此,基于与亚马逊云科技建立的长久友好合作关系,猎豹移动将用户行为数据分析工作负载的迁移任务交到了亚马逊云科技手中。

解决方案利用Amazon Redshift流式摄取构建实时数仓

亚马逊云科技根据客户特点和需求,迅速构建了基于Amazon Redshift的无服务器数据分析解决方案,客户采用此解决方案进行PoC验证测试,测试结果显示,该解决方案可以解决猎豹移动的所有问题。自此,客户决定将他们的整个用户行为分析工作负载迁移到亚马逊云科技上。

 

保障数据完整性,实现海量数据量级的近实时分析能力

该解决方案通过将Nginx日志推送到Vector然后发送至Amazon Kinesis Data Streams中,并通过Amazon Lambda函数从Amazon Kinesis Data Streams中消化流式数据,运行ETL进程,并将处理后的数据存储在Amazon S3中,并通过Amazon S3再次触发第二个Amazon Lambda函数将数据复制到Amazon Redshift云数据仓库中。流式摄取可以帮助用户以极低延迟,在几秒钟内将数百MB数据摄取到Amazon Redshift云数据仓库集群,丢失数据的可能性大大降低。此外,该解决方案提供了新的近实时数据分析能力,这种流式数据使用方式,查询速度从原有的“T+3”级别的按天计算的数据查询,到现在的分钟级别,实现了指数级的性能提升。

从容应对动态负载且成本可控,尽在Serverless

Amazon Redshift Serverless是Amazon Redshift Serverless的无服务器版,作为一种快速、可扩展、安全且完全托管的云数据仓库,可从容应对动态工作负载。Amazon Redshift可以帮助用户通过标准SQL语言简单、经济地分析各类数据,实现高达3倍的性能价格比,它不仅可以基于自身内部表进行数据分析,还可以查询Amazon S3中的数据,Amazon Redshift与Amazon S3可以无缝结合,实现部分智能湖仓架构。针对于客户担心的成本问题,Amazon Redshift Serverless版只需为数据仓库在活动时消耗的计算容量付费,并且客户可以根据RPU(Redshift处理单元)设置Base和Max指标,去控制数据仓库的性能和成本,从而实现高度成本可控。

数据分析师和数据工程师友好的查询编辑器

Amazon Redshift Query Editor v2.0是一款基于Web的SQL客户端应用程序,可以使用它在Amazon Redshift数据仓库上创作和运行查询。客户可以选择使用图表直观显示查询结果,并通过与团队成员共享查询来进行协作。该编辑器支持一次运行多条SQL语句,并允许在结果窗格的单独选项卡中查看每条语句的结果。不管是数据分析师或数据工程师,猎豹移动的团队成员都可以在查询中使用会话变量和临时表,此外,Amazon Redshift Query Editor v2.0支持运行长时间运行的查询,而不必让浏览器窗口保持打开状态,稍后在24小时内检索结果。

成果迁移后的全栈无服务器数据分析实现30%成本降低

更灵活、更易用的数据分析

通过亚马逊云科技Serverless无服务器数据分析解决方案,猎豹移动将批处理分析能力进一步拓展为近实时分析能力,并以低延迟高吞吐量的方式访问自己存储在数据仓库中的流式数据。

成本可控下的极致性价比

无服务器架构下的数据分析工作负载真正做到了极致性价比,Amazon Redshift无服务器自动扩展功能便于我们利用Amazon Redshift的速度从容应对甚至是最为动态的工作负载,并且仅需按实际使用量付费。在客户预期未来将处理的每天20TB新日志时,数据摄取部分的成本比原有云供应商的解决方案更成本友好。“迁移到基于亚马逊云科技Serverless产品构建的实时数仓后,该App团队在用户分析负载上的成本节省相较于之前减少30%。”猎豹移动技术总监韩峰说。

坚持客户拥有和控制数据的理念,提供数据全生命周期加密保护

亚马逊云科技严格遵循客户拥有和控制数据的理念,因而,猎豹移动对自己的数据拥有完整控制权,可以用任何想用的方式管理私有数据。亚马逊云科技提供了复杂的技术和物理措施来防止未经授权的访问,并以超高的数据隐私和安全标准构建数据相关服务。此外,亚马逊云科技还提供数据全生命周期的加密服务,涵盖了数据的存储、传输以及使用各个环节。

此次Serverless数据库迁移只是猎豹移动和亚马逊云科技在该领域的初次尝试。未来,猎豹移动将对之前的应用做逐步迁移,并计划将更多新的应用负载直接原生构建在亚马逊云科技上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/631548.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【网络编程】计算机网络基础知识总结 | 运输层 |TCP协议

文章目录 前言一、计算机网络层次结构二、网络层三、运输层3.1、TCP/IP协议介绍3.2、端口(协议端口号)3.3、套接字3.4、TCP实现原理3.4.1、TCP的特点3.4.2、停止等待协议3.4.3、滑动窗口协议3.4.4、拥塞控制3.4.5、TCP连接的三个阶段 3.5、UDP实现原理 前…

day50_mybatis

今日内容 0 复习昨日 一、分页插件 二、ORM映射【重点】 三、多表联查 【重点】 四、动态SQL 【重点】 五、$和# 零、复习昨日 mybatis orm框架,作用于持久层,高效开发,只关注sql,其他不用关心 思考MyBatis到底帮你省了哪些事情? jdbc第四步sql自己编写之外,其他mybatis都做了…

C++标准库模板(STL)-输入/输出库

C 包含两个输入/输出库:现代的、基于流的 I/O 库和 C 风格 I/O 函数的标准集合。 基于流的 I/O 基于流的输入/输出库围绕抽象的输入/输出设备组织。这些抽象设备允许相同代码处理对文件、内存流或随即进行任意操作(例如压缩)的自定义适配器…

编译原理 | 课程设计 — PL/0编译程序语法分析

1、任务描述 基于第二章的词法分析程序,使用C/C语言编写PL/0编译程序的语法分析程序。 2、编程要求 完成上述编程任务,将C/C语言源程序复制粘贴到右侧代码编辑器,点击“评测”按钮,运行程序,系统会自动进行结果对比。 …

CoreDX DDS应用开发指南(4)DDS实体h和主题

6 DDS实体 DDS标准定义了一个体系结构,该体系结构表示构成DDS API实体的面向对象模型。这些实体充当中间件和应用软件之间的接口。为了开发支持DDS的应用程序,开发人员必须创建、交互并销毁这些DDS实体。 本章概述了DDS实体和相关概念。 6.1 DDS实体层次结构 构成DDS API的主…

马斯克最大的挑战是什么?

“硅谷钢铁侠”马斯克,最大的挑战是什么? 有纠错反馈循环,并保持这个循环 我们常说的“迭代”,就是打造“反馈系统” 趣讲大白话:需要一面不扭曲的镜子 【趣讲信息科技192期】 **************************** 2017年&a…

通过浏览器,将webp格式图片转jpg格式

概述 我们网络上下载的图片,很多的是webp格式的图片,而目前支持这种图片格式的软件较少,比如Windows 照片查看器,是不能直接打开图片的。安装其他专业图像软件又麻烦。 因此,本文介绍利用电脑常用的软件,…

运营-20.产品社区化和内容化

产品社区化和内容化 为什么现在很多产品都在往社区化、内容化发展? 1.拓展产品线,满足用户的多元需求 分享、交流、炫耀、虚荣,这些是人类永恒的情感需求,社区是一个能很好的满足这些需求的工具; 2.打造归属感&…

TiDB亿级数据亚秒响应查询Dashboard使用

目录 1 集群概况1.1 QPS1.1.1 延迟1.1.2 Top SQL 语句1.1.3 最近的慢查询 2 集群信息2.1 实例列表2.1.1 表格列解释2.1.2 实例状态解释 2.2 主机列表2.2.1 表格列解释 2.3 SQL语句分析2.3.1 执行列表页2.3.2 执行详情页面 2.4 慢查询2.4.1 慢查询列表页2.4.2 查看执行详情 2.5 …

2023-06-10 Untiy进阶 C#知识补充1——.Net介绍

文章目录 一、.Net 介绍二、.Net 跨语言的实现三、.Net 跨平台的实现(一).Net Framework(二).Net Core(三)Mono 四、总结 一、.Net 介绍 ​ 微软的 .Net 既不是编程语言也不是框架,是类似于互联…

Tomcat部署和优化

文章目录 Tomcat概述Tomcat的核心组件Tomcat的功能组件结构Container 结构分析Tomcat 请求过程: Tomcat 服务部署Tomcat 虚拟主机配置HTTP 请求过程 Tomcat优化常用的优化相关参数如下 Tomcat概述 Tomcat 是 Java 语言开发的,Tomcat 服务器是一个免费的…

Spring高手之路4——深度解析Spring内置作用域及其在实践中的应用

文章目录 1. Spring的内置作用域2. singleton作用域2.1 singleton作用域的定义和用途2.2 singleton作用域线程安全问题 3. prototype作用域3.1 prototype作用域的定义和用途3.2 prototype作用域在开发中的例子 4. request作用域(了解)5. session作用域&a…

002docker 安装

官网安装https://docs.docker.com/engine/install/ 系统要求 Centos7 Linux 内核:官方建议 3.10 以上查看Linux内核版本 用于打印当前系统的相关信息(内核版本号,硬件架构,主机名称和操作系统类型等 cat /proc/version uname -a 更新YUM源 生产环境中此步操作…

Spring Cloud Feign实战

概述 Feign是一种声明式、模板化的HTTP Client,目标是使编写Java HTTP Client变得更简单。Feign通过使用Jersey和CXF等工具实现一个HTTP Client,用于构建REST或SOAP的服务。Feign还支持用户基于常用的HTTP工具包(OkHTTP、HTTPComponents&…

2023网安面试题170道,轻松应对面试

最近有不少小伙伴跑来咨询: 想找网络安全工作,应该要怎么进行技术面试准备? 工作不到 2 年,想跳槽看下机会,有没有相关的面试题呢? 为了更好地帮助大家高薪就业,今天就给大家分享两份网络安全工…

仙境传说ro:如何在地图上刷怪教程

仙境传说ro:如何在地图上刷怪教程 大家好我是艾西,在仙境传说这个游戏中我们知道了怎么创建NPC添加商品售卖后,那么对于游戏的怪肯定也得有自己的想法以及对游戏的设定以及理解,今天我跟大家分享的是怎么在地图中刷怪教程。 我们…

STL——string、vector、deque容器

初识STL **STL的基本概念****vector容器存放内置数据类型****vector容器中存放自定义数据类型****vector容器嵌套vector容器****string容器——构造函数****string容器——赋值操作****string容器——字符串拼接****string容器——字符串的查找和替换****string容器——字符串比…

人工智能该如何学习?详细的AI学习

Yan-英杰的主页 悟已往之不谏 知来者之可追 C程序员,2024届电子信息研究生 1.TomChat 地址:https://www.ridderchat.com/ 该网站非常简介好看,界面看着很舒服,可以帮助你快速编写、编辑和讨论代码。 2.强大的AI辅助 链接…

模拟实现strstr函数,通俗易懂!!!

函数介绍 函数声明 函数声明&#xff1a;char *strstr(const char *str1, const char *str2) 头 文 件&#xff1a;#include <string.h> 返 回 值&#xff1a; 返回值为char * 类型&#xff08; 返回指向 str1 中第一次出现的 str2 的指针&#xff09;&#xff1b…

Webots R2021a教程

文章目录 Windows安装设置中文打开世界添加贴图 为外部控制器配置Anaconda解决报错&#xff1a;CondaSSLError: Encountered an SSL error. Most likely a certificate verification issue.调用Python API Windows 安装 进入下载页面 https://github.com/cyberbotics/webots/r…