Flink实时电商数仓（五）

Flink实时电商数仓（五）

news2026/2/14 22:46:30

FlinkSQL的join

Regular join普通join，两条流的数据都时存放在内存的状态中，如果两条流数据都很大，对内存压力很大。
Interval Join: 适合两条流到达时间有先后关系的；一条流的存活时间短，一条流的存活时间长。
Lookup Join：适合主流特别大，从流特别小的情况；主流数据没到达一条，就会去查询从流的每一条数据。主流数据不存储在内存中。
- 语法：主流使用时必须有处理时间，proctime as PROCTIME()
- 在从流表名和别名之间添加 FOR SYSTEM_TIME AS OF c.proc_time
- 参数位置，官网->application Development -> Table API & SQL -> Configuration, 在该网页搜索lookup即可查询到相应参数配置，比如：
  - table.exec.async-lookup.buffer-capacity: 缓冲队列的大小
  - table.exec.async-lookup.output-mode:数据输出的模式，是否有序
  - table.exec.async-lookup.timeout：lookup超时时间

交易域下单事务事实表

在这里插入图片描述

交易事务关联的表总共有四个表
- order_detail
- order_info
- order_detail_activity
- order_detail_coupon
设置ttl状态生存时间，设置网络波动延迟时间为5s
关联四张表获取到订单明细表，order_detail和order_info使用内连接即可，活动和优惠券表使用left join即可。
核心业务编写
- 读取topic_db数据
- 筛选订单详情order_detail表数据
- 筛选订单信息表order_info
- 筛选订单详情活动关联表
- 筛选订单详情优惠券关联表
- 将四张表join合并
- 写出到kafka中：一旦使用了left join，会产生撤回流，此时如果需要将数据写出到kafka，不能使用kafka连接器，必须使用upsert kafka连接器。
  - upsert kafka必须声明主键

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1331994.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

使用office打开word文档时候提示错误：0x426-0x0的解决方案

使用office打开word文档时候提示错误：0x426-0x0的解决方案

在使用office打开word文档时候提示错误：0x426-0x0。如下图： 昨天还用的好好的，怎么今天就不行了？为什么呢？ 更多工作中遇到问题见：凯哥BK 这个错误导致office无法启动通常是由于office软件所依赖的服务无…

阅读更多...

[工具]java_sublime的快速使用

[工具]java_sublime的快速使用

目录使用 : 怎么运行: 调整字体: 使用 : 新建--->写好代码后-->另存为尾缀是.java的文件怎么运行: 在你另存为的目录下cmd调用控制台输入dos指令--->执行javac 文件名.java(有.java尾缀)(编译为.class文件)--->java 文件名(没有.class尾缀设计者认为执行的是…

阅读更多...

【Spring实战】04 Lombok集成及常用注解

【Spring实战】04 Lombok集成及常用注解

文章目录 0. 集成1. Data2. Getter 和 Setter3. NoArgsConstructor，AllArgsConstructor和RequiredArgsConstructor4. ToString5. EqualsAndHashCode6. NonNull7. Builder总结 Lombok 是一款 Java 开发的工具，它通过注解的方式简化了 Java 代码的编写&…

阅读更多...

INFINI Gateway 如何防止大跨度查询

INFINI Gateway 如何防止大跨度查询

背景业务每天生成一个日期后缀的索引，写入当日数据。业务查询有时会查询好多天的数据，导致负载告警。现在想对查询进行限制–只允许查询一天的数据（不限定是哪天），如果想查询多天的数据就走申请。技术分析在每…

阅读更多...

面试题：JVM 对锁都进行了哪些优化？

面试题：JVM 对锁都进行了哪些优化？

文章目录锁优化自旋锁和自适应自旋锁消除锁粗化逃逸分析方法逃逸线程逃逸通过逃逸分析，编译器对代码的优化锁优化 jvm 在加锁的过程中，会采用自旋、自适应、锁消除、锁粗化等优化手段来提升代码执行效率。自旋锁和自适应自旋现在大多的处理器都是…

阅读更多...

OpenSource - SCM服务管理平台

OpenSource - SCM服务管理平台

文章目录官方网址文档下载版本功能解决了哪些问题使用对象优势Linxu版本scm-dev deb服务列表 Windows版本scm-dev 服务列表scm-all 服务列表scm-jdk 服务列表scm-springboot 精简版本服务列表scm-springboot 服务列表scm-tomcat 服务列表 SCM 截图官方网址 https://scm.chus…

阅读更多...

$文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《计及风电不确定性的多场景多时段安全约束机组组合解耦求解方法》$

文章解读与仿真程序复现思路——电力自动化设备EI\CSCD\北大核心《计及风电不确定性的多场景多时段安全约束机组组合解耦求解方法》

这个标题涉及到一种解决在能源系统中考虑风电不确定性的方法。让我们逐步分解这个标题，以便更好地理解其含义： 计及风电不确定性： 这指的是在能源系统中，风力发电的产出具有不确定性。因为风速是难以预测的，风力发电的…

阅读更多...

SpringBoot 3 集成Hive 3

SpringBoot 3 集成Hive 3

前提条件: 运行环境：Hadoop 3.* Hive 3.* MySQL 8 ，如果还未安装相关环境，请参考：Hive 一文读懂 Centos7 安装Hadoop3 单机版本（伪分布式版本） SpringBoot 2 集成Hive 3 pom.xml <?xml ver…

阅读更多...

Yestar成都艺星舒适热玛吉星品沙龙会在蓉成功发布

Yestar成都艺星舒适热玛吉星品沙龙会在蓉成功发布

12月21日，由Yestar成都艺星联合索塔医疗联合举办的“舒适无痛热玛吉星品沙龙会”在院内圆满举行，索塔医疗西区大客户经理肖峰、中国临床事业部刘颖，成都艺星运营部长程燕佳，皮肤科院长朱紫婷、技术院长杨海皎、主任王小琴&#xf…

阅读更多...

小程序radio单选框回显

小程序radio单选框回显

话不多说，效果图如下： 具体代码如下： <radio-group name"radio" bindchange"getSex"><label><radio value"1" checked"{{xingbie1}}" />男</label><label><radio…

阅读更多...

3D数字化系统建设

3D数字化系统建设

以3D可视化、数字化技术为基础，其实，很多传统的系统软件都可以重新做一下。比如：以下这个使用场景：零售门店陈列； 还有，数字化仓储系统，3D数字化供应链系统，3D数字化的生产系统&a…

阅读更多...

网络首发:MTF-CNN-Attention故障识别: 基于马尔可夫场(MTF)和卷积网络(CNN)融合注意力机制的故障识别程序

网络首发:MTF-CNN-Attention故障识别: 基于马尔可夫场(MTF)和卷积网络(CNN)融合注意力机制的故障识别程序

适用平台：Matlab2023版本及以上本程序参考中文EI期刊《电网技术》网络首发文献：《基于马尔可夫转换场与多头注意力机制的电能质量扰动分类方法》，程序注释清晰，干货满满，下面对文章和程序做简要介绍！ 文献…

阅读更多...

实验三：路由器的管理与配置

实验三：路由器的管理与配置

实验目的： 了解路由器的作用熟悉路由器的基本配置方法熟悉Packet Tracer 路由模拟软件的使用实验环境： Windows 10 下的 Cisco Packet Tracer 实验内容： 熟悉Packet Tracer组件搭建实验拓扑实验步骤： 1.连接设备 2.配置IP地…

阅读更多...

柯桥外语学习-俄语零基础入门教学之与衣服有关的词汇

柯桥外语学习-俄语零基础入门教学之与衣服有关的词汇

本期为大家带来的是与衣物有关的相关词汇！ 最近全国大范围降温，大家一定要关注天气预告及时增减衣物，小心不要感冒啦~ 一、服装组成部分领子 воротник 方领 квадрадный воротник 圆领 закругленн…

阅读更多...

数据孤岛：一场数据的独立战争

数据孤岛：一场数据的独立战争

在当今数字化的时代，数据已成为企业和组织最宝贵的资产之一。然而，尽管数据的价值被广泛认可，但数据的分散和孤立问题却仍然存在，这就是所谓的数据孤岛。本文将重点分析什么是数据孤岛、数据孤岛的危害以及解决数据孤岛的传统和创…

阅读更多...

前端工程注入版本号

前端工程注入版本号

文章目录一、前言二、webpack三、vite四、最后一、前言容器化时代，当页面出现问题时，如果你的新版本有可能已经修复了，那样你再排查它就没有意义了。为什么不一定是最新版本呢？一是可能是缓存作祟，二是可能运维成员…

阅读更多...

【DWJ_1703225514】基于Sklearn航空公司服务质量分析

【DWJ_1703225514】基于Sklearn航空公司服务质量分析

【Talk is cheap】 # 导入库 import warnings warnings.filterwarnings(ignore)import pandas as pd import seaborn as sns import matplotlib.pyplot as plt plt.rcParams[font.sans-serif] [SimHei] plt.rcParams[axes.unicode_minus] False %matplotlib inlinefrom skl…

阅读更多...

计算机网络-网络层

计算机网络-网络层

计算机网络-网络层以下笔记整理为哔哩哔哩湖科大教书匠的《计算机网络微课堂》的教学视频。链接：计算机网络微课堂 1. 网络层概述 1.1 网络层的主要任务是实现网络互联，进而实现数据包在各网络之间的传输。 1.2 要实现网络层任务，需要解决…

阅读更多...

PHP函数定义和分类

PHP函数定义和分类

函数的含义和定义格式在PHP中，允许程序员将常用的流程或者变量等组件组织成一个固定的格式实现特定功能，也就是说函数是具有特定功能特定格式的代码段。函数的定义格式如下： function 函数名(参数1，参数2，参数n) {…

阅读更多...

vue前端上传图片到阿里云OSS，超详细上传图片与视频教程

vue前端上传图片到阿里云OSS，超详细上传图片与视频教程

vue前端直传图片与视频到阿里云OSS 1. 简介与日常使用2. 为什么要这么干？是因为我司后端不行吗？？？（确实！）3. vue前端直传的操作4. 如何上传到阿里OSS指定文件夹呢? 1. 简介与日常使用阿里云…

阅读更多...

推荐文章

最新文章