携手!Kyligence 支持 Amazon EMR Serverless,赋能云上企业降本增效

news2024/11/29 0:50:41

近日,Kyligence 与亚马逊云科技宣布 Kyligence Cloud 4.6 正式支持 Amazon EMR Serverless,共同助力企业构建高效、低成本云上数据分析。今天,我们将为大家介绍 Kyligence Cloud 4.6 如何通过集成 Amazon EMR Serverless  提供端到端的云上数据管理和分析的整体解决方案,从而简化部署和运营,降低总体拥有成本(TCO),进一步缩短数据湖的价值实现时间。

1. 关于 Amazon EMR Serverless

Amazon EMR Serverless 是亚马逊云推出的无服务化 Spark 集群托管服务,可自动预置、扩展应用程序所需的计算和内存资源,同时集成了基于开源分析框架(例如 Apache Spark 和 Apache Hive )的机器学习程序。由于无需再进行任何有关集群的调整、运维、优化、安全保障以及管理等工作,Amazon EMR Serverless 使得数据工程师和分析师能够进一步在其工作中实现降本增效。 

2. 关于 OLAP

OLAP 是一种在海量数据之上快速应答各类分析查询的技术,通过将大型或多个数据集上卷为一个多维数据库(OLAP cube)、支持从各个维度对数据进行“切片和切块”,从而提供了预计算、复杂数据建模及多维分析等功能,提升查询体验。尽管 OLAP 工具已经成功应用于各行各业,但仍面临诸多挑战:

  • 重度依赖 IT 资源:传统的 OLAP 工具需要复杂的基础架构来运行大规模数据计算,因此需要一个庞大的 IT 团队负责运维,影响整体成本。
  • 大量的计算资源:传统的 OLAP 工具需要一系列的数据处理和转换动作才能得到结果,因此需要大量的计算资源。OLAP 工具的响应速度严重依赖于计算资源的充足性,计算能力的缺乏会大幅降低它的灵活性。因此,数据分析师往往只能基于较小的数据集展开工作,无法自助分析所有数据。
  • 云资源使用效率低下:当在云端进行大规模的数据建模计算时,成本估算工具会估算并部署相应的计算资源。但这些资源的利用率往往不是很高,资源的使用效率低下。

通过集成 Amazon EMR Serverless,各类 OLAP 工具可以将 Amazon EMR Serverless 作为无服务器计算资源池来完成数据处理作业,简化和提升用户体验。

3. Kyligence Cloud X 亚马逊云

Kyligence 是亚马逊云科技的 ISV 合作伙伴,通过提供智能多维数据库平台帮助企业简化数据湖上的多维数据分析。作为一个云原生的 OLAP 平台,Kyligence Cloud 通过集成 Amazon EMR Serverless 自动提供 Spark 来运行索引和构建作业,用户可以体验 Kyligence 结合 Amazon EMR Serverless 后的所有功能和优势。

Kyligence 支持无缝对接各种亚马逊云平台的原生数据源,例如 Amazon S3、Amazon Redshift 和 Amazon RDS,以充分利用您在亚马逊云上的数据,构建全面的亚马逊云大数据解决方案。在数据建模时,Kyligence 会使用 Amazon S3 来存储预先计算的数据,并支持高并发查询。Kyligence 还支持无缝对接 Tableau、Microsoft Power BI 及 Microsoft Excel 等业内流行的商业智能(BI)工具,以及丰富的内置数据可视化和自助服务工具。

 Kyligence Cloud 在亚马逊云平台上的架构

4. Kyligence Cloud 在亚马逊云平台为您带来的优势

通过支持亚马逊云平台,Kyligence Cloud 将为您带来以下优势:

  • 高性能:借助亚马逊云平台的全球基础设施和 Amazon EMR 的分布式计算能力,Kyligence 打造了一个可扩展且经济高效的高性能 OLAP 引擎,助力您的多维分析。同时支持关键数据应用和大规模交互式分析、PB 量级上的亚秒级查询响应时间,还提供了优异的高并发访问性能。
  • 自动扩展: Kyligence Cloud 支持计算资源的一键扩展,随着工作负载的减少,集群规模可以自动缩减,在优化成本的同时,保证卓越的服务稳定性。
  • 高兼容性:Kyligence Cloud 提供丰富的 API 接口(ODBC、JDBC、Rest API、Python 客户端)和标准 ANSI-SQL 及 XMLA/MDX 接口,可轻松与业内流行的分析工具集成,如 Tableau、Microsoft Excel、Microsoft Power BI 以及 Python 等数据科学工具。
  • 安全性和可靠性:借助 Amazon S3、Amazon RDS、Kyligence 企业级安全特性及亚马逊云平台身份和访问管理(IAM)支持,Kyligence Cloud 针对用户的亚马逊云平台服务和资源提供了全方位的访问控制,同时支持对数据模型、表格及单元格的多级访问控制,以保障数据安全和信息隐私。
  • 支持一键部署:Kyligence Cloud 平台已经登陆 AWS Marketplace。该项部署基于 AWS CloudFormation 模板和参数设置自动完成。Kyligence 执行自动化的集群运维管理和基于规则的集群弹性伸缩,彻底解放 IT 管理员和云基建团队的生产力。此外,您也可通过 Kyligence Cloud Portal 门户网快速部署。

5. Amazon EMR Serverless 如何与OLAP 集成

通过集成 Amazon EMR Serverless 服务,Kyligence Cloud 提供开箱即用的 Apache Spark 托管服务。Kyligence 引擎可以将计算任务下发给 Amazon EMR Serverless 中的 Apache Spark。借助 Amazon EMR Serverless 提供的自动按需预置和扩展功能,Kyligence 还可快速满足任何数据量下不断变化的处理需求。

Kyligence Cloud 与 Amazon EMR Serverless 的集成方式

6.强强联合:Kyligence Cloud + Amazon EMR Serverless

在之前的版本中,Kyligence 会在 Amazon EC2 上部署和维护自己的 Spark 集群,以处理多维模型预计算,用户需要自行构建监控和报警系统来保证 Spark 集群的可观测性及稳定性。

现在,通过集成 Amazon EMR Serverless,Kyligence 为用户提供了一种在亚马逊云平台上运行云分析的降本增效方式:

  • 简化云上部署 :借助托管服务,Kyligence Cloud 用户无需考虑底层基础架构和资源的生命周期, 从而大幅降低应用程序的复杂性,并简化 Kyligence Cloud 的部署。
  • 提升云上性能:得益于 Amazon EMR Serverless 精细化的扩展策略,Kyligence Cloud 支持更快地启动和回收资源。根据 Kyligence 的性能基准测试,与用于索引构建的开源 Spark 集群相比,集成  Amazon EMR Serverless 后,Kyligence 的性能提升了15%20%
  • 降低运维难度:通过支持 Amazon EMR Serverless 的各项功能,运维人员无需了解底层分析框架,即可轻松维护计算资源的容量和运行状态。
  • 优化云端成本:Amazon EMR Serverless 精细化的扩展策略,可自动识别应用程序所需的资源,在任务启动后分配所需资源,并在任务完成后释放。您只需为应用程序使用的资源付费,降低云端的总体拥有成本(TCO)。

通过集成 Amazon EMR Serverless 的托管和可扩展服务,Kyligence 通过较为简单的技术架构为用户带来了更优异的大数据自助分析体验。得益于这一解决方案,您现在可以专注于业务需求,而无需再去关注底层复杂的技术实现。

 

欢迎访问 Kyligence 官方网站 https://cn.kyligence.io/ 申请 1对1 免费演示或 30 天免费试用。您只需在部署期间在构建集群页签中选择 Serverless Spark 选项(如上图所示),即可体验 Amazon EMR Serverless。

关于 Kyligence

上海跬智信息技术有限公司 (Kyligence) 由 Apache Kylin 创始团队于 2016 年创办,致力于打造下一代企业级智能多维数据库,为企业简化数据湖上的多维数据分析(OLAP)。通过 AI 增强的高性能分析引擎、统一 SQL 服务接口、业务语义层等功能,Kyligence 提供成本最优的多维数据分析能力,支撑企业商务智能(BI)分析、灵活查询和互联网级数据服务等多类应用场景,助力企业构建更可靠的指标体系,释放业务自助分析潜力。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售等行业客户,包括建设银行、浦发银行、招商银行、平安银行、宁波银行、太平洋保险、中国银联、上汽、Costa、UBS、MetLife 等全球知名企业,并和微软、亚马逊、华为、Tableau 等技术领导者达成全球合作伙伴关系。目前公司已经在上海、北京、深圳、厦门、武汉及美国的硅谷、纽约、西雅图等开设分公司或办事机构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/26647.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

字节给我狠狠上了一课:危机来的时候你连准备时间都没有~

各大互联网公司的接连裁员,政策限制的行业接连消失,让今年的求职雪上加霜,想躺平却没有资本,还有人说软件测试岗位饱和了,对此很多求职者深信不疑,因为投出去的简历回复的越来越少了。甚至还有不少大厂直接…

shell的test命令和两种参数获取方式,详解getopts以及eval、exec、export、read、shift内置命令

一、linux里while [-n “$1”]这里的-n是什么意思? -n str,字符串不为null,长度大于零while [ -n “$1” ] 第一个参数不为空,返回TRUE执行while循环do … done 二、Shell test 命令 Shell中的 test 命令用于检查某个条件是否成立&#x…

【web渗透思路】敏感信息泄露(网站+用户+服务器)

目录 一、信息泄露示例 1、示例: 二、泄露方式 1、原理: 三、泄露危害 1、危害: 四、泄露挖掘 1、爬虫文件 2、目录信息 3、越权访问 4、开发注释、js文件 5、错误提示 6、调试信息 7、备份等目录文件 8、配置不安全 9、版本控…

数字集成电路设计(五、仿真验证与 Testbench 编写)(五)

文章目录9. 编译预处理语句9.1 仿真时间标度10. Verilog HDL测试方法简介9. 编译预处理语句 这些在C语言中都有涉及,但是在硬件描述语言中相对用的不是特别多,比如说include,在语言用的特别多,但是在硬件描述语言很少include&…

【每天学习一点新知识】OWSAP TOP10

OWASP OWASP开放式Web应用程序安全项目(open web application security project)每年会通过确定企业面临的最严重的10类威胁,以此提高人们对Web应用程序安全的关注度。 2021年 A01 失效的访问控制 未对通过身份验证的用户实施恰当的访问控…

裸辞4个月,面试了30家公司,终于找到理想工作了

上半年裁员,下半年裸辞,有不少人高呼裸辞后躺平真的好快乐!但也有很多人,裸辞后的生活五味杂陈。 面试30次终于找到心仪工作 因为工作压力大、领导PUA等各种原因,今年2月下旬我从一家互联网小厂裸辞,没想…

APS高级排产在冶金行业的应用

冶金工业是指对金属矿物的勘探、开采、精选、冶炼、以及轧制成材的工业部门。包括黑色冶金工业(即钢铁工业)和有色冶金工业两大类。随着业务量的不断扩大,仅具有传统的ERP系统和人工生产调度已逐渐不能满足精益生产改进的要求。建立高效的精益生产计划模型及其对应的…

Nginx模块开发之http handler实现流量统计(入门篇)

Nginx模块开发之http handler实现流量统计一、Nginx模块之http handler简介二、Nginx handler模块开发2.1、示例代码2.2、编写config文件2.3、编译模块到Nginx源码中2.4、修改conf文件2.5、执行效果三、Nginx的热更新总结后言一、Nginx模块之http handler简介 当nginx解析conf…

计算机毕业设计之java+ssm手机综合类门户网站

项目介绍 手机综合类门户网站采用ssm框架和eclipse编辑器、MySQL数据库设计并实现的,主要包括系统手机评测管理模块、文章管理模块、手机新闻管理、所有评论管理、登录模块、和退出模块等多个模块。 管理员的登录模块:管理员登录系统对本系统其他管理模块进行管理。…

2016-2021年各省高考分数线

2016-2021年各省高考分数线 包含各省市不同招生类别的高考分数线,包括普通本科、特殊类型招生、艺术类本科、体育类本科、普通专科的分数线。 普通高等学校招生全国统一考试(Nationwide Unified Examination for Admissions to General Universities a…

网络防火墙入门

防火墙的作用? 防止从外向内的网络入侵行为的策略。后来,防火墙不但用于防范外网,例如:对企业内网的 DoS 攻击或非法访问等,也开始防范从内部网络向互联网泄露信息、把内部网络作为攻击跳板等行为。 什么是代理服务器…

Hash表(哈希表、散列表)

哈希表 概念 为什么需要哈希表 静态查找表与动态查找表中,为了查找某关键字值等于某个值的记录,都要经过一系列的关键字进行比较,以确定待查记录的储存位置或查找失败,查找的时间总是与比较次数有关 什么是哈希表 哈希表&…

[附源码]java毕业设计校园征兵及退役复原管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

视听杂志视听杂志社视听编辑部2022年第11期目录

专题:对外传播 共塑与去精英化:国家形象建构的实践创新——基于纪录片《柴米油盐之上》的多模态分析 董星雨;程欣;刘苏情; 3-7《视听》投稿:cnqikantg126.com 网络赋权下抖音国际版TikTok的海外传播策略探析 吴梦玲; 7-10 以画对话&#xff…

m3u8 文件格式详解

简介 M3U8 是 Unicode 版本的 M3U,用 UTF-8 编码。"M3U" 和 "M3U8" 文件都是苹果公司使用的 HTTP Live Streaming(HLS) 协议格式的基础,这种协议格式可以在 iPhone 和 Macbook 等设备播放。上述文字定义来自于…

一文玩转Java 泛型知识

✅作者简介:热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏:前端开发者…

青岛品质水稻共养 国稻种芯·中国水稻节:山东西海岸收获季

青岛品质水稻共养 国稻种芯中国水稻节:山东西海岸收获季 半岛全媒体记者 孟达 新闻中国采编网 中国新闻采编网 谋定研究中国智库网 中国农民丰收节国际贸易促进会 国稻种芯中国水稻节 中国三农智库网-功能性农业农业大健康大会报道:山东青岛西海岸新区王…

发了3000个短视频作品才总结出的9点快速破播放的技巧

大家好,我是我赢助手,专注于自媒体短视频去水印、去重和文案提取运营。 今天给大家分享下发了3000个短视频作品才总结出的9点快速破播放的技巧: 1、前期养号: 新号创建前7天不要急着发作品,刷兴趣标签养号,能让账号…

【机器学习】数据驱动方法在电网稳定分析应用浅谈

目录 一、数据驱动概述 二、数据驱动特点 三、数据驱动与其他方法对比 四、总结 五、参考文献 一、数据驱动概述 数据驱动在电力系统稳定分析中的应用,主要目标是从电网运行数据角度建立电力系统稳定分析模型,以数据之间的关联性分析视角挖掘电力系…

MySQL数据库期末考试试题及参考答案(08)

版权声明 本文原创作者:谷哥的小弟作者博客地址:http://blog.csdn.net/lfdfhl 一、 填空题 MySQL用户变量由符号____和变量名组成。MySQL中____循环语句会无条件执行一次语句列表。DELIMITER语句可以设置MySQL的____。MySQL中打开游标使用____关键字。…