XL-LightHouse 与 Flink 和 ClickHouse 流式大数据统计系统

news2024/11/28 20:58:22

一个Flink任务只能并行处理一个或少数几个数据流,而XL-LightHouse一个任务可以并行处理数万个、几十万个数据流;

一个Flink任务只能实现一个或少数几个数据指标,而XL-LightHouse单个任务就能支撑大批量、数以万计的数据指标。

1、XL-LightHouse :

  •  1、再也不需要用 Flink、Spark、ClickHouse 或者基于 Redis 这种臃肿笨重的方案跑数了;
  •  2、再也不需要疲于应付对个人价值提升没有多大益处的数据统计需求了,能够帮助您从琐碎反复的数据统计需求中抽身出来,从而专注于对个人提升、对企业发展更有价值的事情;
  •  3、轻松帮您实现任意细粒度的监控指标,是您监控服务运行状况,排查各类业务数据波动、指标异常类问题的好帮手;
  •  4、培养数据思维,辅助您将所从事的工作建立数据指标体系,量化工作产出,做专业严谨的职场人,创造更大的个人价值;

2、流式统计虽然是属于流式计算的一种计算形式

        流式统计无外乎Count运算、Sum运算、Bitcount运算(count distinct)、Max运算、Min运算、Avg运算、Seq运算(时序数据)、Dimens运算(维度划分)、Limit运算(topN/lastN)

3、Flink用于流式统计存在缺陷

3-1、资源利用率低

Flink的资源利用率低要从两个角度来看,一个是集群运行的拓扑结构,另一个是Flink任务执行的特性。

3-2、运算性能低

3-3、接入成本较高

(1)、Flink面向专业的大数据研发人员,大量统计指标的实现需要耗费大量的研发成本。
(2)、由于Flink自身在流式统计领域的基础功能并不完善,所以很多场景下都需要研发人员依据统计任务的数据量、统计周期的粒度、数据倾斜状况等因素进行特定的优化。所以使用Flink实现很多相类似的功能,由于数据量差异、统计周期的不同,程序的实现方式也可能截然不同

3-4、运维成本高、运算资源成本高

对比XL-LightHouse,Flink的运维成本更高,体现在几个方面:
(1)、实现相同的流式统计需求,Flink集群规模要明显大于XL-LightHouse的集群规模,导致运维成本增加。
(2)、由于Flink集群面向专业的研发人员,Flink集群的运转是由集群维护人员和Flink任务的研发人员共同参与,如果集群要进行版本升级、集群扩容、日常维护、数据迁移等操作均需要与研发人员事先沟通、达成默契,很多类似版本升级的操作会涉及相关任务的升级改造。如果集群规模庞大、涉及研发人员、相关任务较多的话,那这个过程也必然会耗费了较大的维护成本

4、ClickHouse用于流式统计存在缺陷

  • ClickHouse适用场景的特点
    (1)单个或较少数量的应用场景,且每个应用场景都有海量的数据;
    (2)业务场景有大量的维度字段,可能需要按照十几个甚至几十个以上的维度随意组合进行多维度即席查询操作;
    (3)业务场景有明细查询的需求;
    (4)不同数据源之间可能有join查询的需求;

  • ClickHouse的缺点
    (1)由于每次查询都需要遍历海量数据,所以并发度支持有限;
    (2)由于系统内存储着海量的明细数据,集群规模庞大、结构复杂,维护成本高昂;
    (3)每次查询都要遍历数据,进行实时统计运算,需要耗费的大量的内存和CPU资源;
    (4)数据接入需要进行各种层面的优化,使用门槛较高、面向专业的大数据研发人员使用;
    (5)接入成本高、维护成本高、服务器成本高,使用门槛高,对中小企业不太友好;

5、XL-LightHouse的特性

(1)可以支持高并发查询统计结果

(2)不支持明细查询,如果想要支持明细查询需要借助于其他工具实现

(3)不支持明细查询,如果想要支持明细查询需要借助于其他工具实现

6、应用场景统计

点击量:
1、每5分钟_点击量
2、每5分钟_各ICON_点击量
3、每小时_点击量
4、每小时_各ICON_点击量
5、每天_总点击量
6、每天_各Tab_总点击量
7、每天_各ICON_总点击量

点击UV:
1、每5分钟_点击UV
2、每小时_点击UV
3、每小时_各ICON_点击UV
4、每天_总点击UV
5、每天_各ICON_总点击UV

支付成功订单数据统计

订单量:
1、每10分钟_订单量
2、每10分钟_各商户_订单量
3、每10分钟_各省份_订单量
4、每10分钟_各城市_订单量
5、每小时_订单量
6、每天_订单量
7、每天_各商户_订单量
8、每天_各省份_订单量
9、每天_各城市_订单量
10、每天_各价格区间_订单量
11、每天_各应用场景_订单量

交易金额:
1、每10分钟_成交金额
2、每10分钟_各商户_成交金额top100
3、每10分钟_各省份_成交金额
4、每10分钟_各城市_成交金额
5、每小时_成交金额
6、每小时_各商户_成交金额
7、每天_成交金额
8、每天_各商户_成交金额
9、每天_各省份_成交金额
10、每天_各城市_成交金额
11、每天_各应用场景_成交金额

下单用户数:
1、每10分钟_下单用户数
2、每10分钟_各商户_下单用户数
3、每10分钟_各省份_下单用户数
4、每10分钟_各城市_下单用户数
5、每小时_下单用户数
6、每天_下单用户数
7、每天_各商户_下单用户数
8、每天_各省份_下单用户数
9、每天_各城市_下单用户数
10、每天_各价格区间_下单用户数
11、每天_各应用场景_下单用户数

  • 资讯类场景使用演示 dtstep.com/archives/4262.html
  • 电商类场景使用演示 dtstep.com/archives/4286.html
  • 即时通讯类场景使用演示 dtstep.com/archives/4291.html
  • 技术类场景使用演示 dtstep.com/archives/4298.html

项目地址:

https://github.com/xl-xueling/xl-lighthouse

https://github.com/xl-xueling/xl-lighthouse.git

https://gitee.com/mirrors/XL-LightHouse.git

参考文档:

1、项目介绍
  • dtstep.com/archives/4455.html
2、Git地址
  • https://github.com/xl-xueling/xl-lighthouse.git
  • xl-lighthouse: XL-LightHouse是一套支持大数据量、支持超高并发的通用型流式大数据统计平台,常见的应用场景比如:PV、UV统计,电商销售额统计、日志数据统计、接口调用量、耗时情况等统计,支持多维度统计,支持各种复杂的条件筛选和逻辑判断,一键部署,一行代码接入,轻松实现各种海量数据实时统计,帮助企业以更低的成本快速搭建起数据指标体系,是企业降本增效的好帮手!
3、交流社区
  • DTStep
4、项目设计
  • dtstep.com/archives/4227.html
5、一键部署
  • dtstep.com/archives/4257.html
6、XL-Formula使用
  • dtstep.com/archives/4215.html
7、Web服务操作说明
  • dtstep.com/archives/4233.html
8、Hello World
  • dtstep.com/archives/4301.html
9、适用场景
  • 资讯类场景使用演示 dtstep.com/archives/4262.html
  • 电商类场景使用演示 dtstep.com/archives/4286.html
  • 即时通讯类场景使用演示 dtstep.com/archives/4291.html
  • 技术类场景使用演示 dtstep.com/archives/4298.html
10、版权声明
  • dtstep.com/archives/4206.html
11、使用反馈
  • dtstep.com/community/ldp-issue
12、依赖组件
  • dtstep.com/archives/4445.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/992242.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

005微信小程序云开发API数据库-查询记录-聚合-统计记录数量

文章目录 1.微信小程序云开发API数据库-查询记录案例代码 2.微信小程序云开发API数据库-聚合案例代码 3.微信小程序云开发API数据库-统计记录数量案例代码 1.微信小程序云开发API数据库-查询记录 微信小程序云开发API数据库是一个方便快捷的数据库解决方案,可以让开…

国庆节你会去哪玩? 立即领取国庆专属头像

点击上方蓝字关注我们 立即领取国庆头像 国庆节 国庆节是一个重要的假期,许多人都会选择外出旅游,放松心情,享受美好的时光。以下是一些建议,供您在国庆节期间选择旅游目的地。 迎祖国华诞 愿祖国风调雨顺,国泰民安 国…

进阶C语言-指针的进阶(上)

指针的进阶 📖1.字符指针📖2.指针数组📖3.数组指针🎈3.1 数组指针的定义🎈3.2 &数组名VS数组名🎈3.3 数组指针的使用 📖4.数组参数、指针参数🎈4.1一维数组传参🎈4.2…

[H5动画制作系列] Rectangle Demo 的三种方法

整体要求: 舞台背景为蓝色,大小为:400*400;左上角有一个红色正方形,大小为:200*200,中心点坐标为(0,0) 方法一: 启动Aninmate,用界面绘图工具,做一个单帧静态画面,然后采用Html Canvas发布。 方法二: 启动Aninmate,先做一个单帧,空白帧。然后在空白帧上,填写帧代码。 然…

yolov7简化yaml配置文件

yolov7代码结构简单,效果还好,但是动辄超过70几个模块的配置文件对于想要对网络进行魔改的朋友还是不怎么友好的,使用最小的tiny也有77个模块 代码的整体结构简单,直接将ELAN结构化写成一个类就能像yolov5一样仅仅只有20几个模块&…

优思学院|怎样定义质量?质量的八个维度是什么?

质量是一个广泛而关键的概念,它可以通过多种方式来描述和评估。在商业和制造领域,了解如何区分和评估产品质量的不同维度至关重要。在本文中,我们将讨论产品质量的多维度,并根据哈佛商学院 David A. Garvin(1987&#…

PowerBI依据字段取一列从小到大的第三个值(没三个值取第二个,第二个没有取第一个)

大家在项目业务背景中总能遇到一些比较奇特的需求,我们尽力取解决,下面把这个过程提供出来,供大家参考。步步高升自己技术。PowerBI依据字段取一列从小到大的第三个值(没三个值取第二个,第二个没有取第一个&#xff09…

【数据结构--顺序表】移除元素

题目描述&#xff1a; 代码实现&#xff1a; 1、指针实现 int removeElement(int* nums, int numsSize, int val) {int* dst nums, * src nums;int n1 0,n20;while (n1n2 < numsSize){if (*src ! val){*dst *src;dst;src;n1;//表示src走的步数}else{src;n2;//表示src走…

无涯教程-JavaScript - IMSECH函数

描述 IMSECH函数以x yi或x yj文本格式返回复数的双曲正割。复数的双曲正割被定义为双曲余弦的倒数,即 六(z) 1/cosh(z) 语法 IMSECH (inumber)争论 Argument描述Required/OptionalInumberA complex number for which you want the hyperbolic secant.Required Notes Ex…

我的创作纪念日——你知道这5年我是怎么过的吗?

机缘 第一篇博客记忆犹新&#xff0c;是与CSDN结下了第一缕缘分。 前期的博客都被打上“改进质量”的标签&#xff0c;到后来的高质量文字的撰写&#xff0c;见证了自己撰写能力的一步一步地提高&#xff0c;正可谓不积跬步无以至千里。 如下图所示&#xff1a; 这5年&#…

长城网络靶场第三题

关卡描述&#xff1a;1.oa服务器的内网ip是多少&#xff1f; 先进行ip统计&#xff0c;开始逐渐查看前面几个ip 基本上都是b/s&#xff0c;所以大概率是http&#xff0c;过滤一下ip 第一个ip好像和oa没啥关系 第二个ip一点开就是 oa&#xff0c;应该就是他了。 关卡描述&a…

80 # 图片防盗链

referer 来源&#xff0c;表示这个资源被谁引用过&#xff0c;可以用来做防盗链。 我们新建文件 no-referer.js const fs require("fs"); const path require("path"); const url require("url"); const http require("http");h…

MyBatis原理分析手写持久层框架

目录 1 JDBC操作数据库问题分析2 JDBC问题分析和解决思路3 自定义持久层框架_思路分析3.1 使用JDBC和使用持久层框架区别3.2 核心接口/类重点说明3.3 项目使用端3.4 自定义框架本身3.5 最终手写的持久层框架结构参考 4 自定义持久层框架_编码5 自定义持久层框架优化 1 JDBC操作…

SpotBugs检查java代码:在整数上进行没有起任何实际作用的位操作(INT_VACUOUS_BIT_OPERATION)

https://spotbugs.readthedocs.io/en/latest/bugDescriptions.html#int-vacuous-bit-mask-operation-on-integer-value-int-vacuous-bit-operation 在整数上进行无用的与、异或操作&#xff0c;实质上没有做任何有用的工作。 例如&#xff1a;v & 0xffffffff 再例如&…

企业移动培训考学系统

在这个知识爆炸的时代&#xff0c;无论是职场新人还是经验丰富的老手&#xff0c;不断提升自己的专业技能和知识水平是每个人的必修课。而在这个快节奏的社会&#xff0c;如何高效、轻松地学习成了一个亟待解决的问题。一指通移动培训考学平台&#xff0c;为每一个渴望进步的人…

202329读书笔记|《面纱》——我知道你愚蠢轻佻头脑空虚,然而我爱你。我知道你的企图、你的理想,你势利、庸俗,然而我爱你。

202329读书笔记|《面纱》——我知道你愚蠢轻佻头脑空虚&#xff0c;然而我爱你。我知道你的企图、你的理想&#xff0c;你势利、庸俗&#xff0c;然而我爱你。 因为一段话而读的一本书&#xff1a;【“我知道你愚蠢、轻佻、头脑空虚&#xff0c;然而我爱你。我知道你的企图、你…

测试开发【Mock平台】10基础:拦截器实现Mock功能(一)探索HandlerInterceptor

【Mock平台】为系列测试开发教程&#xff0c;从0到1编码带你一步步使用Spring Boot 和 Antd React框架完成搭建一个测试工具平台&#xff0c;希望作为一个实战项目对各位的测试开发学习之路有帮助&#xff0c;大奇一个专注测试技术干货原创与分享的家伙。 在本系列 Mock 平台开…

代码行统计工具---cloc(Count Lines of Code)

介绍 官网&#xff1a; https://github.com/AlDanial/cloc cloc&#xff08;Count Lines of Code&#xff09;是一个代码行统计工具&#xff0c;可以统计源码中的空白行、注释行、物理行&#xff0c;支持对多种语言的统计。 安装 windows下安装 例如&#xff0c;下载1.98版…

华为云云耀云服务器L实例评测|使用宝塔面板管理服务器,并搭建个人博客网站

作者简介&#xff1a;一名云计算网络运维人员、每天分享网络与运维的技术与干货。 公众号&#xff1a;网络豆 座右铭&#xff1a;低头赶路&#xff0c;敬事如仪 个人主页&#xff1a; 网络豆的主页​​​​​ 目录 前言 介绍&#xff1a; 一.购买使用华为云云耀服务器 …

【Tomcat服务部署及优化】

Tomcat 一、什么是Tomcat?二、Tomcat 核心组件2.1 Tomcat 组件2.3 Container组件的结构2.4 Tomcat 请求过程 三、Tomcat 部署3.1 安装JDK3.2 设置JDK环境变量3.3 安装Tomcat并用supervisor启动解压添加到supervisord服务测试能否通过supervisorctl启动 四、Tomcat的端口和主要…