以csv为源 flink 创建paimon 临时表相关 join 操作

以csv为源 flink 创建paimon 临时表相关 join 操作

news2026/2/12 23:23:43

目录

概述
配置
- 关键配置
- 测试
- - 启动 kyuubi
  - 执行配置中的命令
bug解决
- bug01
- bug02
结束

概述

目标：生产中有需要外部源数据做paimon的数据源，生成临时表，以使用与现有正式表做相关统计及 join 操作。

环境：各组件版本如下

kyuubi 1.8.0
flink 1.17.1
paimon 0.5 正式版本
hive 3.1.3

阅读此文前，需涉及前置的知识点如下

kyuubi整合flink yarn application model

配置

概述：临时表 paimon 此版本仅 Flink支持。与外部表一样，临时表只是记录的，而不是由当前Flink SQL会话管理的。如果删除临时表，则不会删除其资源。当 Flink SQL 会话关闭时，临时表也会被丢弃。

如果您想将 Paimon catalog与其他表一起使用，但不想将它们存储在其他的 catalog 中，可以创建一个临时表。下面的关键配置 Flink SQL 创建了一个 Paimon catalog 和一个临时表，并进行了测试。

关键配置

来看一些关键配置，其它配置如有疑问，请参考 kyuubi整合flink yarn application model

CREATE CATALOG paimon_hive WITH (
    'type' = 'paimon',
    'metastore' = 'hive',
    'uri' = 'thrift://10.xx.xx.22:9083',
    'warehouse' = 'hdfs:///data/hive/warehouse/paimon',
    'default-database'='tmp'
);


CREATE TEMPORARY TABLE test (
    UnitId STRING,
    WorkOrder STRING
) WITH (
    'connector' = 'filesystem',
    'path' = 'hdfs:///data/hive/warehouse/tmp/Small.csv',
    'format' = 'csv'
);

SET execution.runtime-mode=batch;

select * from test;

使用的 csv 文件如下，学习时，可以自己创建测试内容
在这里插入图片描述

测试

启动 kyuubi

在这里插入图片描述

执行配置中的命令

执行配置中的命令，几条命令依次执行如下图：
在这里插入图片描述

bug解决

坑随时都有，下面解决一下测试过程的bug。

bug01

来图如下：
在这里插入图片描述
一看缺失类，老套路，看看是哪个包下的，添加至 flink 1.17.1 下面的 lib 下。

bug02

重新启动时，报有重复类，冲突了

这个以前解决过，直接上解决方案。如下图：
在这里插入图片描述
这两个解决之后，就按上文中 测试 流程走就可以了。

结束

以csv为源 flink 创建paimon 临时表相关 join 操作，至此就结束了。如有疑问，欢迎评论区留言。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1312663.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Redis 过期删除策略、内存回收策略、单线程理解

Redis 过期删除策略、内存回收策略、单线程理解

不知从何开始Redis的内存淘汰策略也开始被人问及，卷！真的是太卷了。难不成要我们去阅读Redis源码吗，其实问题的答案，在Redis中的配置文件中全有，不需要你阅读源码、这个东西就是个老八股，估计问这个东西是想…

阅读更多...

微信小程序识别小程序码并传参

微信小程序识别小程序码并传参

一、场景连续看到几个类似关于小程序生成二维码场景的问题，分销的场景和单商品购买的页面居多二、思路 #mermaid-svg-8CjFXSzutuF1OvO8 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-8CjFXSzutuF1…

阅读更多...

中小企业业财融合策略(2)：财务赋能，如何支持业务经营？

中小企业业财融合策略(2)：财务赋能，如何支持业务经营？

上一文《中小企业业财融合(1):把财务从琐碎的凭证处理、核算中解放出来!》，我们提出了财务升级的背景以及必要性，本篇我们就财务赋能，如何支持业务经营？提出一些简要的看法，希望对大家有所帮助。一、财务赋能&#x…

阅读更多...

com.sun.org.apache.xerces.internal.impl.dv.util.Base64

com.sun.org.apache.xerces.internal.impl.dv.util.Base64

com.sun.org.apache.xerces.internal.impl.dv.util.Base64 Access restriction: The type Base64 is not API (restriction on required library D:\Java\jdk1.8.0_341\jre\lib\rt.jar) Maven Update Project 虽然没错误了，但是有警告，好奇？…

阅读更多...

TCL实业，在智能时代风中起舞

TCL实业，在智能时代风中起舞

从惠州的一个磁带厂起步，成长为智能终端、半导体显示、新能源光伏三大业务齐头并进的制造业大鳄，TCL是中国制造业穿越周期的一面旗帜。而作为国内电视品牌中唯一拥有上游供应链自主权的企业，C端用户往往更熟悉那个总是在电视终端领域拿出好产…

阅读更多...

RT-DETR优化：ASF-YOLO提取多尺度特征 | 2023年12月最新成果

RT-DETR优化：ASF-YOLO提取多尺度特征 | 2023年12月最新成果

🚀🚀🚀本文改进： ASF-YOLO一种新的特征融合网络架构，该网络由两个主要的组件网络组成，可以为小目标分割提供互补的信息:(1)SSFF模块，它结合了来自u;(2)TFE模块，它可以捕获小目标的局部精细细节等 🚀🚀🚀YOLOv8改进专栏：http://t.csdnimg.cn/hGhVK 学姐带你学…

阅读更多...

网络协议 - TCP 协议详解

网络协议 - TCP 协议详解

网络协议 - TCP 协议详解简述TCP头格式TCP的状态机数据传输中的Sequence NumberTCP重传机制超时重传机制快速重传机制SACK 方法Duplicate SACK – 重复收到数据的问题示例一：ACK丢包示例二，网络延误 TCP的RTT算法经典算法Karn / Partridge 算法Jacobson…

阅读更多...

记录 | Microsoft Remote Desktop for mac安装

记录 | Microsoft Remote Desktop for mac安装

Microsoft Remote Desktop for mac安装网上一些教程的下载安装老是跳转来跳转去，而且下载了的也不一定适用于 mac， 这里直接提供 Microsoft Remote Desktop for mac 的安装包的下载地址： microsoft-remote-desktop-for-mac

阅读更多...

f盘隐藏的文件夹怎么找出来？介绍几种有效方法

f盘隐藏的文件夹怎么找出来？介绍几种有效方法

在计算机中，我们经常会遇到隐藏的文件或文件夹，在F盘中隐藏的文件夹也不例外。隐藏的文件夹可能是由系统生成的，或者是用户自行设定的隐私文件夹。无论是因为误操作还是出于其他原因，如果你想找出F盘中的隐藏文件夹，本…

阅读更多...

用EXCEL计算NTC、BS、电压等AD参数

用EXCEL计算NTC、BS、电压等AD参数

前言之前计算NTC的AD值算得很麻烦，因为51内核的单片机不支持除法运算，更别说浮点运算了。 EXCEL自动算出参数就显得很方便了。有纰漏请指出，转载请说明。学习交流请发邮件 1280253714qq.com 理论基础参考这篇文章NTC热敏电阻温度采集…

阅读更多...

数据常见的提取和筛选方法

数据常见的提取和筛选方法

平时对于一些不标准的数据，需要提取或者筛选其中的部分数据。本文主要分享一些常用的办法，同时也作为一个笔记的备份。 1. 正则表达式正则表达式比较适合提取有明确类型的数据，比如字母，数字，汉字，日期等…

阅读更多...

从GitHub下载的Android Studio项目，在较新版本AS打开出现版本不兼容问题的解决方法。

从GitHub下载的Android Studio项目，在较新版本AS打开出现版本不兼容问题的解决方法。

在GitHub下载了一个Android Studio计算器项目，打开项目后出现一系列问题，本文简单记录出现的问题及解决方法。 1、Gradle安装目录的路径出现错误问题描述：The specified Gradle installation directory G:\Android\Android Studio\gradle\…

阅读更多...

【腾讯云 HAI 域探秘】释放生产力：基于 HAI 打造团队专属的 AI 编程助手

【腾讯云 HAI 域探秘】释放生产力：基于 HAI 打造团队专属的 AI 编程助手

文章目录前言一、HAI 产品介绍二、HAI 应用场景介绍三、HAI 生产力场景探索：基于 HAI 打造团队专属的 AI 编程助手3.1 申请 HAI 内测资格3.2 购买 HAI 实例3.3 下载 CodeShell-7B-Chat 模型3.4 部署 text-generation-inference(TGI)推理服务3.4.1 下载 text-genera…

阅读更多...

目标检测mAP计算以及coco评价标准

目标检测mAP计算以及coco评价标准

这篇是我对哔哩哔哩up主霹雳吧啦Wz 的视频的文字版学习笔记感谢他对知识的分享讲一下目标检测中的一些常见的指标在我们使用目标检测网络训练时最后在验证集上会得到一个coco的评价列表就像我们图中给的这一系列参数列表一样我们再进一步引入两个概念第一个叫做precisi…

阅读更多...

[已解决]HttpMessageNotReadableException: JSON parse error: Unexpected character:解析JSON时出现异常的问题分析与解决方案

[已解决]HttpMessageNotReadableException: JSON parse error: Unexpected character:解析JSON时出现异常的问题分析与解决方案

🌷🍁 博主 libin9iOak带您 Go to New World.✨🍁 🦄 个人主页——libin9iOak的博客🎐 🐳 《面试题大全》文章图文并茂🦕生动形象🦖简单易学！欢迎大家来踩踩~&#x1f33…

阅读更多...

标书明标的含义与制作要求

一、什么是标书明标？ 在招投标过程中，标书明标是一种常见的招标方式，它是指招标人将招标文件公开进行公示，以吸引投标人参与竞标。在标书明标中，招标文件会明确列出项目的具体要求、投标人的资格条件、技术标准等&…

阅读更多...

docker核心原理——unionfs、namespace、cgroup

docker核心原理——unionfs、namespace、cgroup

docker 核心原理 docker的核心原理其实就是cgroupnamespaceunionfs 组合实现的隔离机制，资源控制等。隔离机制在容器进程启动之前重新挂载它的整个根⽬录“/”，⽤来为容器提供隔离后的执⾏环境⽂件系统通过Linux Namespace 创建隔离，决…

阅读更多...

16--常用类和基础API--06

16--常用类和基础API--06

1、包装类 1.1 包装类概述 Java提供了两个类型系统，基本类型与引用类型，使用基本类型在于效率，然而很多情况，会创建对象使用，因为对象可以做更多的功能，如果想要我们的基本类型像对象一样操作&#xff0c…

阅读更多...

海思平台isp之ccm标定

海思平台isp之ccm标定

文章目录 1、raw图采集2、ccm标定2.1、标定参数配置2.2、标定效果优化2.2.1、优化方式一2.2.2、优化方式二2.2.3、优化方式三1、raw图采集 raw图采集步骤及标准，请参考文章《海思平台isp之ccm标定》。2、ccm标定 2.1、标定参数配置（1）图像基本参数（2）黑电平设置 (…

阅读更多...

商业印刷市场分析：预计2029年将达到53004亿元

商业印刷市场分析：预计2029年将达到53004亿元

商业印刷技术显示了强大的生命力。电子商务的扩张性发展，传统的商务印刷行业也在逐渐的转型。中国印刷业已深度融入全球印刷加工产业链，为国际社会超过50个国家提供印刷包装服务。数据显示，中国印刷业对外加工贸易额已达842亿元。商业印刷是…

阅读更多...

推荐文章

最新文章