[实时计算flink]应用场景

news2024/11/25 16:36:49

本文将以部门场景和技术领域场景为例,为您介绍实时计算Flink版的大数据是实时化场景。

背景信息

作为流式计算引擎,Flink可以广泛应用于实时数据处理领域,例如ECS在线服务日志,IoT场景下传感器数据等。同时Flink还能订阅云上数据库RDS、PolarDB等关系型数据库中Binlog的更新,并利用DataHub、SLS、Kafka等产品将实时数据收集到实时计算产品中进行分析和处理。最终,分析结果可写入不同的数据服务中,例如MaxCompute、MaxCompute-Hologres交互式分析、人工智能平台 PAI、Elasticsearch等,以提高数据利用率,满足业务需求。

解决方案

部门场景

从企业部门职能的角度,可以将实时计算Flink版划分为以下场景:

department

  • 业务部门:实时风控、实时推荐、搜索引擎的实时索引构建等。

  • 数据部门:实时数仓、实时报表、实时大屏等。

  • 运维部门:实时监控、实时异常检测和预警、全链路Debug等。

技术领域

从技术领域的角度,实时计算Flink版主要用于以下场景:

实时ETL和数据流

实时ETL和数据流的目的是实时地把数据从A点投递到B点。在投递的过程中可能添加数据清洗和集成的工作,例如实时构建搜索系统的索引、实时数仓中的ETL过程等。

ETL

实时数据分析

数据分析指的是根据业务目标,从原始数据中抽取对应信息并整合的过程。例如,查看每天销量前10的商品、仓库平均周转时间、文档平均单击率、推送打开率等。实时数据分析则是上述过程的实时化,通常在终端体现为实时报表或实时大屏。

Realtime Analysis

事件驱动应用

事件驱动应用是对一系列订阅事件进行处理或作出响应的系统。事件驱动应用通常需要依赖内部状态,例如欺诈检测、风控系统、运维异常检测系统等。当用户行为触发某些风险控制点时,系统会捕获这个事件,并根据用户当前和之前的行为进行分析,决定是否对用户进行风险控制。

Evnet Oriented

风控监测系统

实时计算Flink版可以处理复杂的流处理和批处理任务,也提供了强大的API,执行复杂的数学计算并执行复杂事件处理规则,帮助企业对实时数据进行实时分析,提高企业的风控能力。例如检测APP中的点击行为、识别IoT数据流不规则变化等。

阿里云实时计算Flink全托管产品的功能点和价值,以及和开源Flink的对比优势。

类型

功能

描述

价值

性能与成本

兼容性

全面兼容开源Flink,包括各层API、参数配置及SQL语法等。

更好的引擎性能和更细粒度资源配置使得整体TCO优于开源,且灵活的付费模式以及智能扩缩容,进一步提高了资源使用的精细程度。

核心性能提升

  • GeminiStateBackend是阿里自研的后端存储系统,采用全新的架构和数据结构设计,支持存储计算分离,摆脱了状态数据的本地盘存储限制,并且还支持KV分离,从而大幅提升双流或多流Join作业的效率。此外,GeminiStateBackend还能自适应参数调优,消除了手动调参的烦恼。在Nexmark流计算标准性能测试中,性能是开源Flink的2倍左右,详情请参见企业级状态后端存储介绍和性能白皮书(Nexmark性能测试)。

  • SQL引擎在兼容开源Flink语法的同时增加了一系列优化,包括但不限于算子的状态结构优化、计算层延迟物化、Codegen增强,以及针对Join场景如维表Cache增强、数据倾斜,流Join Minibatch优化、精细化的状态设置等,实现CPU、内存利用率的提升及状态存储用量的降低。

资源利用率提升

您可以根据业务负载进行弹性扩缩容,详情请参见动态扩缩容与参数动态更新。

您可以配置智能调优,无人值守自动监控并调整作业资源分配,并可以在指定时间段应用对应的资源计划,帮助您平稳顺利地度过业务洪峰,同时最大程度的节省成本,详情请参见配置自动调优。

您可以进行细粒度资源管理,支持SQL算子级别的精细化资源(CPU和Memory)配置,大规模作业资源利用率提升100%,详情请参见配置作业资源。

付费类型

您可以根据自身业务特点,选择包年包月或者按量付费,详情请参见计费项。

特色能力

数据实时入湖入仓

支持整库实时同步、分库分表实时同步和表结构变更实时同步,详情请参见数据同步模板。

可以更加高效便捷地对包含分库分表等架构的业务数据库、消息中间件中的数据进行实时的入湖入仓。

实时风控场景能力

企业级复杂事件处理(CEP)支持作业无需重启动态可配置规则,实现在线实时风控等场景的不间断生产级能力,详情请参见复杂事件处理(CEP)语句。

应用于实时营销、实时风控、安全态势感知等领域,提升开发效率和大规模数据处理能力,同时保证业务连续性。

上下游数据连接(Connector)

  • 涵盖阿里云产品和开源社区30+主流引擎,涉及数据库、消息中间件、数据仓库、湖格式、文件系统等多种上下游存储,详情请参见支持的连接器。

  • 支持特有数据模拟Connector贴近业务含义的测试数据。

  • 相对开源版本,Connector也有诸多易用性和稳定性提升。

  • 可以按需自定义注册Connector对接各种外部存储系统。

您无需自己开发对接各种上下游生态,并操心稳定性和性能。

开发效率

作业开发

多语言支持:一站式开发管理平台,包括SQL、Java、Scala和Python语言。

您无需自己搭建或者对接开源。Flink SQL简单易懂,整体开发环境上手便捷。

多版本支持:支持主流Flink版本,包括多版本作业代码比较和回滚,详情请参见管理作业版本。

提供元数据管理:您可以通过Catalog连接常见的上下游组件(例如MySQL、Hive、Hologres、DLF和Kafka等),进行统一元数据管理与使用,详情请参见管理元数据。

自定义函数:您可以方便地管理和使用自定义函数,详情请参见管理自定义函数(UDF)。

代码模板:提供20多个Flink SQL通用场景的模板,帮助您快速了解如何使用Flink SQL构建作业代码,详情请参见代码模板。

代码调试

测试数据管理:支持线上采样和模拟测试数据管理,方便构建测试流程,详情请参见作业调试。

程序员、甚至是数据分析师都可以完成调试和上线的动作,大幅减少调试测试成本,提高作业上线速度和质量。

快速运行调试:基于Session集群实现作业秒级启停,大幅提高作业调试效率。

中间结果展示:支持中间结果展示,提高复杂SQL的调试效率。

开发生产隔离:开发调试过程不影响生产作业和数据。

运维管理

监控告警

丰富的指标监控和维度聚合,便于排查作业延迟、数据倾斜、反压等问题,详情请参见监控指标说明。

大幅提高系统稳定性,减少运维工作量,降低调优的难度。精细化资源管理,大幅度降低成本。提供原厂高可用服务保障。

通过钉钉、邮件、短信、电话等途径进行及时告警,并可对接企业内部统一监控告警系统(Prometheus),详情请参见自定义监控指标及上报渠道。

问题分析与诊断

动态修改作业的配置,无需启停即可对日志Level、火焰图是否开启等配置进行在线调整。

对于反压、Job异常、TM失联等常见问题提供智能化诊断和快速日志定位分析,给出调优或者修改建议,并联动自动调优能力帮助您定位问题,详情请参见作业智能诊断。

高可用保障

原厂运维服务兜底,SLA 99.9%保证。

全链路自动容错能力,支持JobManager容错,系统无单点,更稳定。

提供更快速的非全局(单点)容错恢复能力,在数据一致性和业务连续性间提供灵活平衡。

状态管理

提供完整的系统检查点和作业快照生命周期管理,提供状态兼容性检查和状态数据迁移,以最大可能地复用原来的状态数据。

企业安全

空间隔离

支持租户级和项目级的资源和代码隔离,满足跨团队协作需求。

提供了企业多部门协同工作互不干扰的能力,安全可控地满足企业内控外审要求。

访问控制

与阿里云账号体系打通,支持多角色的访问控制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2207671.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

进程的那些事--进程间的通信(重点说明管道和共享内存)

目录 前言 一、初始进程间通信 二、管道 1.匿名管道 2.命名管道 三、共享内存 四、消息队列(了解) 五、信号量(了解) 前言 提示:这里可以添加本文要记录的大概内容: 进程是一个能够独立运行&#…

什么情况下数据库和缓存不一致?

首先,在非并发的场景中,出现不一致的问题大家都能比较容易的理解,因为缓存的操作和数据库的操作是存在一定的时间差的。而生两个操作是没办法保证原子些的,也就是说,是有可能一个操作功,一个操作失败的。所…

C语言-数据结构 折半查找

在折半查找中,刚开始学可能会在下标处产生困惑,例如奇数个长度的数组怎么处理,偶数个长度的数组怎么处理,不需要修改代码吗?并且下标我从1开始算和0开始算影响代码吗?其实都可以用一样的代码,产…

【含文档】基于Springboot+Vue的失物招领系统(含源码+数据库+lw)

1.开发环境 开发系统:Windows10/11 架构模式:MVC/前后端分离 JDK版本: Java JDK1.8 开发工具:IDEA 数据库版本: mysql5.7或8.0 数据库可视化工具: navicat 服务器: SpringBoot自带 apache tomcat 主要技术: Java,Springboot,mybatis,mysql,vue 2.视频演示地址 3.功能 系统定…

如何替换OCP节点(一):使用oat | OceanBase应用实践

前言: OceanBase Cloud Platform(简称OCP),是 OceanBase数据库的专属企业级数据库管理平台。 在实际生产环境中,OCP的安装通常是第一步,先搭建OCP平台,进而依赖OCP来创建、管理和监控我们的生…

docker升级mysql

一、首选备份原数据库所有数据 二、在Docker中查看正在运行的MySQL容器名称,可以使用以下命令: docker ps --filter "namemysql" 三、查看当前docker中正在运行mysql的版本 docker exec -it qgz-mysql mysql -V 可以看到当前运行的版本是8.…

数据传输——差错控制

一、检错纠错 1、通信链路不是完全理想的,在传输的过程中可能会产生比特差错。 2、误码率:传输错误的比特占所传输比特总数的比率。 3、检错:能自动发现差错。 4、纠错:不仅能发现差错而且能自动纠正差错。 5、码字(codeword…

Selenium打开外部应用程序的弹窗处理

问题 selenium自动化操作页面跳转到外部应用程序进行下载等操作,各种窗口处理方式无法解决 原因 该窗口属于浏览器窗口,与访问页面无关(已经脱离页面操作层面) 解决 selenium启动浏览器时,对浏览器进行相关窗口设…

Elasticsearch的安装与配置

注意:elasticsearch 禁止安装在/root路径下! 1、创建用户组 groupadd elastic 2、创建用户 useradd es -d /home/es -g elastic echo es | passwd es --stdin 3、给新创建的用户进行授权 chown -R es:elastic /home/es chmod -R 775 /home/es 4…

sklearn机器学习实战——支持向量机四种核函数分类任务全过程(附完整代码和结果图)

sklearn机器学习实战——支持向量机四种核函数分类任务全过程(附完整代码和结果图) 关于作者 作者:小白熊 作者简介:精通python、matlab、c#语言,擅长机器学习,深度学习,机器视觉,目…

Nginx反向代理配置与负载均衡配置

简介:整理自黑马程序员苍穹外卖的第11节 nginx是什么? nginx的好处 nginx反向代理配置方式 nginx负载均衡的配置方式 nginx负责均衡策略

等保2.0测评 — WebSphere 中间件

查看版本信息: 登录websphere管理平台首页就能看到版本信息 可以进入\usr\IBM\WebSphere\AppServer\bin 下执行./versionInfo.sh查看版本 一、身份鉴别 a)应对登录的用户进行身份标识和鉴别,身份标识具有唯一性,身份鉴别信息具有…

如何使用printf实现整齐美观的输出?

在编程中,尤其是在涉及控制台输出的应用场景中,我们需要让输出的信息更加整齐美观。printf 是 C 语言中用于格式化输出的强大工具之一。通过合理的格式化控制符,我们可以轻松地控制输出的宽度、对齐方式、填充字符等,从而达到整齐…

RiproV9.0主题wordpress主题免扩展可二开PJ版/WordPress博客主题Ripro全解密无后门版本

🔥🎉 全新RiPro9.0开源版发布 —— 探索无限可能🚀🌐 今天,我很高兴能与大家分享一个重磅资源——RiPro9.0开源版!这不是一个普通的版本,而是一个经过精心打磨、全面解密的力作。🔍…

使用KEIL5,不复位MCU,调试到程序运行到卡住之处

文章目录 前言步骤1步骤2步骤3步骤4步骤5 前言 经常有朋友在开发中遇到这样的窘境,当单片机程序运行异常以后,由于调试信息做得并不是很全面,导致相应的问题场景非常难分析。当时的你肯定会叹息道:“要是我一直插着仿真器就好了,…

【Concept Sliders】通过拖到滑块来精确控制特定图像特征

Concept Sliders 是一种用于扩散模型(如 Stable Diffusion)的LoRA 适配器,允许用户在图像生成过程中对特定概念进行精细控制。与依赖提示词生成图像的传统方法不同,Concept Sliders 通过引入可调整的“滑块”,用户可以…

前端读取本地表格数据

vue3tsvite 无后端提供数据的情况下,前端读取本地表格数据,并将数据放入页面结构中 展示在网页中 记得先安装npm install xlsx 目录 read_xlsx.ts import * as XLSX from xlsx; //将行,列转换 function transformSheets(sheets: { [key: string]: any })…

技术架构的演进之路

技术架构的演进之路 我们以电商系统的技术架构发展为例 文章目录 1. 单体架构2. 应用数据分离架构3. 应用服务集群架构4. 读写分离、主从分离架构5. 冷热分离架构6. 垂直分库架构7. 微服务架构8. 容器编排架构 1. 单体架构 在前期用户访问量很少的时候,没有对性能、安全等提出…

自然语言处理(NLP)论文数量的十年趋势:2014-2024

引言 近年来,自然语言处理(NLP)已成为人工智能(AI)和数据科学领域中的关键技术之一。随着数据规模的不断扩大和计算能力的提升,NLP技术从学术研究走向了广泛的实际应用。通过观察过去十年(2014…

uniapp中添加colorUI的过程

1、先将colorUI文件粘到项目中去 2、common中添加两个文件 3、App文件中引入这两个文件