「ETL趋势」定时任务自动化导出Excel/CSV,高效归档业务明细数据

news2024/11/15 12:05:20

目录

一、Excel/CSV文件输出应用场景

二、Excel/CSV文件输出的常见问题

三、合同订单数据文件输出实战

1)合同订单数据输出为 CSV 文件

1、建立业务系统数据库、FTP/SFTP 服务器数据连接

2、数据处理

3、输出为文件

4、运行效果查看

2)合同订单数据输出为 EXCEL文件


一、Excel/CSV文件输出应用场景

当数据需要在分享给业务人员查看使用或需要以文件形式备份时,通常为了操作简单、高效、易于兼容,会使用Excel或CSV这种文件格式导出数据,也方便直接进行数据分析处理。

随着业务数据量的指数级增长、数据安全性要求的提高,企业就需要将存储在Oracle、SQL Server、PostgreSQL等数据库的百万级明细数据(如销售订单数据),定时定期以Excel或CSV文件格式上传到FTP/SFTP服务器。

一方面,Excel或CSV文件格式应用广泛,易于共享,兼容性强;

另一方面,FTP/SFTP服务器提供了一个安全、可靠的环境来传输、存储和备份数据,同时支持安全的数据传输协议(特别是SFTP,它是基于SSH的FTP协议,提供了数据加密和认证功能);

另外,在这个过程中,自动化工具(ETL工具)可以替代脚本很容易地将处理后的数据定期上传,人工干预少,提高了数据处理效率和准确性。

二、Excel/CSV文件输出的常见问题

很多业务库系统数据表部分导出存在限制;

手工操作只适用小数据量的文件转换,‌相对繁琐;

脚本编写此类任务时,也常常因为数据量大、数据格式不一致、业务库不许直连等,出现数据丢失(Excel单个sheet行数限制)、任务运行过慢、字段映射方面的报错

如果数据需要清洗整理,想直接导出处理后的数据(如筛选某一季度即将逾期交付的大额订单),涉及多个字段的处理想要“一步到位”,更是难上加难。

针对这样的情况,FineDataLink提供了低代码、高效、方便、稳定性强的解决方案。在定时任务中可以使用「文件输出」算子,将加工后的数据设置好字段映射关系、分隔符、编码后,以Excel或CSV文件形式给业务人员分享使用、以文件形式进行数据归档。

FineDataLink支持思维导图式拖拉拽开发,对非技术人员也很友好;丰富多样的「数据转换」算子,可以在直接导出“定制化”数据;配合数据同步的高性能计算引擎,保证定时传输任务高效运转。

三、合同订单数据文件输出实战

1)合同订单数据输出为 CSV 文件

将处理后的合同订单数据以 CSV 文件的形式,输出到「FTP/SFTP 服务器」中。

1、建立业务系统数据库、FTP/SFTP 服务器数据连接

确定业务系统的数据库,根据数据源配置数据连接。参见:支持的数据源范围

配置 FTP/SFTP 数据连接,并且有该数据连接的使用权限。具体请参见:配置FTP/SFTP数据连接

2、数据处理

新增定时任务,根据数据类型拖入数据输入相关算子,获取要输出的数据。

参考 新增计算列 文档的 2.1-2.4 节内容,在「数据转换」节点中对数据进行处理,若无处理需求可省略该步骤。

3、输出为文件

新增「文件输出」节点,与「新增计算列」算子相连。

将处理好的数据输出到「FTP/SFTP 服务器」中的「文档」文件夹中,文件名为「合同事实表」。

点击右上角「保存」按钮。

4、运行效果查看

点击「保存并运行」按钮,执行任务。执行成功后,可看到 「FTP/SFTP 服务器」的「文档」文件夹中「合同事实表」。

2)合同订单数据输出为 EXCEL文件

基本步骤与【合同订单数据输出为 CSV 文件】一致。

在第三步【输出为文件】中,考虑到数据行数较多时,Excel版本存在行数限制,FineDataLink的「文件输出」算子可以将处理后的数据按照行数拆分为多个文件,避免大数据量出现的报错。(下图设置:每 100 行数据输出为一个 Excel 文件)

FineDataLink是一款低代码/高时效的数据集成平台,它不仅提供了数据清理和数据分析的功能,还能够将清理后的数据快速应用到其他应用程序中。FineDataLink的功能非常强大,可以轻松地连接多种数据源,包括数据库、文件、云存储等,而且支持大数据量。此外,FineDataLink还支持高级数据处理功能,例如数据转换、数据过滤、数据重构、数据集合等。使用FineDataLink可以显著提高团队协作效率,减少数据连接和输出的繁琐步骤,使整个数据处理流程更加高效和便捷。

 了解更多数据仓库与数据集成关干货内容请关注>>>FineDataLink官网

免费试用、获取更多信息,点击了解更多>>>体验FDL功能

往期推荐:

[ETL实战」跨库取数需复杂编程怎么办?推荐这款低代码工具-CSDN博客

增量同步与全量同步:深入解析数据同步的两种策略-CSDN博客

数据同步常用方法和应用场景-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1956821.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构第七讲:栈和队列OJ题

数据结构第七讲:栈和队列OJ题 1.有效的括号2.用队列实现栈3.用栈实现队列4.设计循环队列 1.有效的括号 链接: OJ题目链接 typedef char StackDataType;typedef struct Stack {StackDataType* arr;//使用一个指针来指向开辟的数组int capacity;//保存数组的空间大…

concrt140.dll丢失是什么情况?有效的解决dll!

concrt140.dll文件丢失是电脑中少见的文件,但也会因为某些原因会导致电脑丢失concrt140.dll文件,那么出现这文件的原因是什么呢?出现这样的问题有什么办法可以将concrt140.dll修复呢?一起来看看吧。 为什么会缺失concrt140.dll文件…

前端:数字世界的门面与灵魂

在当今数字化时代,前端作为用户与网站或应用直接交互的界面,其重要性不言而喻。它不仅是信息的展示窗口,更是用户体验(UX)和用户界面(UI)设计的核心。本文将深入剖析前端在整体网站或应用中的重…

vscode 创建QT最简工程

1. 前提条件 qt 安装cmake安装 参考: https://blog.csdn.net/qq_51355375/article/details/139890889vscode 环境配置 参考: https://blog.csdn.net/qq_51355375/article/details/140733495 2. 工程创建 include 放头文件src .cpp 文件CMakeList.tex …

物品租赁小程序论文(设计)开题报告

一、课题的背景和意义 近些年来,随着移动互联网巅峰时期的来临,互联网产业逐渐趋于“小、轻、微”的方向发展,符合轻应用时代特点的各类技术受到了不同领域的广泛关注。在诸多产品中,被誉为“运行着程序的网站”之名的微信小程序…

搭建开发环境

1、安装VMware 参考01【正点原子】ATK-DLRK3568嵌入式Linux系统开发手册V1.2 2、安装ubuntu 参考01【正点原子】ATK-DLRK3568嵌入式Linux系统开发手册V1.2 2.1、Ubuntu 系统设置 root 用户密码 新安装的ubuntu没有设置 root 用户密码,打开终端,输入 sudo passwd root 执…

C#使用NModbus4库创建Modbus TCP Slave(服务器)简单示例

本文续上篇Codesys—标准库ModbusTCP Master(客户端)配合C#的NModbus4库的通讯示例 链接:https://blog.csdn.net/wushangwei2019/article/details/136375234?spm1001.2014.3001.5501 上篇描述在Codesys端的Modbus TCP Master(客户端)的设备添加、IO映射、通讯简单…

机器视觉12-相机

相机 作用: 工业相机 是 机器视觉系统 的重要组成部分 最本质的功能就是通过CCD或CMOS成 像传感器将镜头产生的光信号转变为 有序的电信号,并将这些信息通过相 应接口传送到计算机主机 工业相机分类 目前业内没有对相机进行明确的分类定义, 以下分类是…

svn软件总成全内容

SVN软件总成 概述:本文为经验型文档 目录 D:\安装包\svn软件总成 的目录D:\安装包\svn软件总成\svn-base添加 的目录D:\安装包\svn软件总成\tools 的目录D:\安装包\svn软件总成\tools\sqlite-tools-win32-x86-3360000 的目录D:\安装包\svn软件总成\安装包-----bt lo…

一分钟搞定文件翻译|2024年4款翻译工具,职场达人都在用!

在全球化的大环境下,跨国沟通和协作变得非常普遍。不管是在公司间谈生意,还是跟外国朋友聊天,翻译文件成了我们经常要做的事情。但是一大堆文件和各种各样的语言,怎么才能又快又好地翻译出来,提升工作速度呢&#xff1…

本地部署Whisper Web结合内网穿透实现远程访问本地语音转文本模型

本地部署Whisper Web结合内网穿透实现远程访问本地语音转文本模型 🧑 博主简介:现任阿里巴巴嵌入式技术专家,15年工作经验,深耕嵌入式人工智能领域,精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者&…

分享10个免费的职场办公常用工具网站

在现代职场中,高效办公工具网站的使用可以显著提升工作效率。小编今天就和大家分享10个免费实用且高质量的职场办公常用工具网站。 1.Convertio Convertio是一个万能文件转换工具,支持多种格式之间的转换,包括PDF、Excel、Word等。它操作简…

C#与欧姆龙PLC 通信——fins udp协议

前言 欧姆龙PLC在工控领域占有很大的市场份额,在上位机编程领域,实现上位机和欧姆龙PLC的通信也是必备的技能,上位机和PLC可以通过fins udp和fins tcp协议通信,本文介绍的是fins udp协议,该协议具有传输速度快的特点,为了帮助大家学习fins udp协议,我编写了“欧姆龙Fin…

【从0制作自己的ros导航小车:上、下位机通信篇】上、下位机串口DMA通信

从0制作自己的ros导航小车 前言一、准备工作二、下位机端(STM32)三、上位机端(旭日x3派)四、测试 前言 下位机的电机驱动、轮速读取、偏航角读取都已经完成,接下来就是上下位机的桥梁:串口通信。 使用USB转…

Mysql in 与 exists

在MySQL中,IN和EXISTS都是用于子查询的条件语句,但它们在性能和使用场景上有不同的特点和应用。下面是对它们的详细介绍以及示例说明:

springboot中小型酒店管理系统-计算机毕业设计源码02793

摘要 随着互联网和移动技术的快速发展,酒店行业也面临着巨大的变革和机遇。传统的酒店管理方式存在着信息不透明、预订流程繁琐等问题,无法满足现代消费者对便捷、高效、个性化服务的需求。因此,开发中小型酒店管理系统具有重要的意义。本文旨…

9000字干货:从消息流平台Serverless之路,看Serverless标准演进

本文分享自华为云社区《9000字干货:从消息流平台Serverless之路,看Serverless标准演进》 这是一个最美好的时代。 随着以数字化升级为代表的第四次工业革命浪潮的席卷,企业正在不断地深化运用这一技术,构建一个又一个全连接&…

module AttributeError: ‘matplotlib.cm has no attribute ‘register_cmap‘

使用seaborn或者matplotlib报错: module AttributeError: matplotlib.cm has no attribute register_cmap‘ 这个一般是matplotlib版本变化导致 register_cmap‘函数名称发生了改变,升高或者降低matplotlib版本版本即可。 实验后matplotlib 3.7.3 中不…

【漏洞复现】泛微E-Cology9 WorkPlanService 前台SQL注入

文章目录 0x00 漏洞描述影响范围 0x01 测绘工具0x02 漏洞复现0x03 Nuclei检测脚本0x04 修复建议0x05 免责声明 0x00 漏洞描述 泛微E-Cology9 是泛微网络科技股份有限公司开发的一款高效、灵活、全面的企业信息化办公系统。 泛微E-Cology9 中的 /services/WorkPlanService 接口…

docker一些常用的命令

查看当前正在运行的容器&#xff0c;使用docker ps命令&#xff0c;使用这个命令可以展示出容器列表&#xff0c;记住其中需要的容器id。 docker ps 使用docker exec命令进入容器。该命令的基本语法是&#xff1a;docker exec [选项] <容器名称或ID> <要执行的命令&…