datax数据导入starrocks表报列数量不匹配错误，问题解决思路

news2024/10/6 14:38:06

背景

在做客户数据导入任务的时候，需要将客户oracle的数据通过datax导入到 starrocks的表中，但是datax的配置文件中SQL查找客户数据的列数和要导入的starrocks表的列数都是相同且对应的，但是导入结果就是报了列数不对等的错误，Error: Value count does not match column count. Expect 20, but got 21. Row

如图所示：

解决思路：

对于这类问题，由于查找的列的数量很多，我们并不知道客户那边是哪个字段里面有个什么字符，导致本来是一列的结果被datax误判为两列

首先复制一份datax配置文件，执行如下命令（配置文件名字不一定相同）：cp abc.json abc_test.json

然后修改 abc_test.json 配置文件中的writer，将写到 storrocks表的数据改为输出到控制台中，如图所示：

修改完成以后，开始从客户那边数据查询出来，并将数据导入到一个临时文件test.log中，执行如下命令：python datax.py abc_test.json >test.log 2>&1

之后编辑 test.log文件，执行如下命令：vim test.log，将test.log文件中的开头和结尾非数据部分给删掉

剩下的test.log中全是同步过来的数据部分，然后将每一行列数同步到另外一个临时文件test2.log中，执行如下命令：awk -F '\t' '{print NF}' >test2.log

此时我们再次编辑test2.log，找到不是正常列数对应的行，记录这是第几行

然后在test.log中找到不正常列数的行，查看对应的数据，究竟是那一字段中有特殊字符，例如在客户中发现是字符中同时有 \t 和 \n导致列数不对。

在datax的abc_test.json配置文件中，将查找的SQL，使用替换的方式，将\t和\n分别替换为空格，如图所示：

之后再次测试一遍，执行如下命令：python datax.py abc_test.json >test.log 2>&1

之后编辑 test.log文件，执行如下命令：vim test.log，将test.log文件中的开头和结尾非数据部分给删掉

剩下的test.log中全是同步过来的数据部分，然后将每一行列数同步到另外一个临时文件test2.log中，执行如下命令：awk -F '\t' '{print NF}' >test2.log

此时我们再次编辑test2.log，找到不是正常列数对应的行，直到没有不正常列数对应的行，此时可以正式修改pm_history.json,来进行正常同步数据。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/169755.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

把代码贴进去自动找bug，这个debug神器自动修复仅需几秒

把代码贴进去自动找bug，这个debug神器自动修复仅需几秒

在编写程序时，无论是对于初学者还是对于专业开发人员，都会花费大量时间来调试或修复源代码错误，也就是 Debug。这个过程繁琐复杂，包括 Bug 复现和 Bug 定位等环节。如果有了自动化的 Debug 程序，就可以显著提高编程实…

阅读更多...

网络文件服务器：FileVista 8.9.3 Crack

网络文件服务器：FileVista 8.9.3 Crack

FileVista 用于自托管文件共享的FileVista文件管理器在几分钟内将您的网站变成一个网络文件服务器。在您的网站上与您的客户或员工共享文件。将您的机密文件存储在您自己的服务器上并对其进行完全控制。使您的用户只需使用 Web 浏览器即可从任何地方安全地访问、上传和组织文…

阅读更多...

深度学习入门基础CNN系列——感受野和多输入通道、多输出通道以及批量操作基本概念

深度学习入门基础CNN系列——感受野和多输入通道、多输出通道以及批量操作基本概念

本篇文章主要讲解卷积神经网络中的感受野和通道的基本概念，适合于准备入门深度学习的小白，也可以在学完深度学习后将其作为温习。如果对卷积计算没有概念的可以看本博主的上篇文章深度学习入门基础CNN系列——卷积计算一、感受野（receptive…

阅读更多...

基于Java+SpringBoot+Vue+uniapp微信小程序零食商城系统设计和实现

基于Java+SpringBoot+Vue+uniapp微信小程序零食商城系统设计和实现

博主介绍：✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专…

阅读更多...

【从零开始学习深度学习】47. Pytorch图片样式迁移实战：将一张图片样式迁移至另一张图片，创作自己喜欢风格的图片【含完整源码】

【从零开始学习深度学习】47. Pytorch图片样式迁移实战：将一张图片样式迁移至另一张图片，创作自己喜欢风格的图片【含完整源码】

目录1. 图片样式迁移的方法介绍2. 读取内容图像和样式图像3. 图像的预处理和后处理4. 图像的抽取特征5.1 内容损失5.2 样式损失5.3 总变差损失5.4 损失函数6. 创建和初始化合成图像7. 训练模型并输出合成图像总结本文将介绍如何使用卷积神经网络自动将某图像中的样式应用在另一…

阅读更多...

分享回顾｜新岁序开，2023 和Jina AI共同码梦！

分享回顾｜新岁序开，2023 和Jina AI共同码梦！

在坚持开放协作精神、具备全球影响力的 Jina AI 开源社区，每天都有来自世界各地的开发者来到这里，因为技术产生联结，因为联结产生共创。一直以来，我们都为拥有这样一个全球化、多元化和高速发展的社区而感到自豪和感激&#xff01…

阅读更多...

golang解决跨域问题

golang解决跨域问题

文章目录前言一、跨域问题1.是什么2.跨域的特征（跨域报错）二、解决跨域问题的方法1.golang解决跨域问题2.简单请求3.非简单请求过程分析（复杂请求）:三、状态码设置为200依旧出错前言今天中午在部署golang与vue搭建的一个项目时&…

阅读更多...

JavaWeb开发（三）3.3——Spring Bean详解（基于XML方式）

JavaWeb开发（三）3.3——Spring Bean详解（基于XML方式）

一、Bean的概念由 Spring IoC 容器负责创建、管理所有的Java对象，这些管理的对象称为 Bean，Bean 根据 Spring 配置文件中的信息创建。二、基于XML方式管理bean对象 eg： <?xml version"1.0" encoding"UTF-8"?&…

阅读更多...

JupyterLab，极其强大的 10 个秘密技巧

JupyterLab，极其强大的 10 个秘密技巧

之前一篇文章：整理了上千个 Python 工具库，涵盖24个大方向没想到火了。喜欢的可以看一下。今天我给大家分享一下 Jupyter Lab 的一些内容。 JupyterLab 是 Jupyter 主打的最新数据科学生产工具，某种意义上，它的出现是为了取代…

阅读更多...

瑞芯微的接口结构学习总结

瑞芯微的接口结构学习总结

MPI 接口使用的主要数据结构： 瑞芯微提供的媒体处理软件平台（Media Process Platform，简称 MPP）是适用于瑞芯微芯片系列的通用媒体处理软件平台。该平台对应用软件屏蔽了芯片相关的复杂底层处理，其目的是为了屏蔽不 …

阅读更多...

2022 全球网络黑产常用攻击方法 Top 10

2022 全球网络黑产常用攻击方法 Top 10

近几年，借助互联网产业发展的东风，网络黑产也迎来更加巅峰的状态，不论是从攻击效率，组织规模，亦或是收益变现能力，都在一天天变的成熟完善。根据艾瑞咨询 2020 年发布的《现代网络诈骗分析报告》&#xff0…

阅读更多...

哪些数据库开了全文索引

哪些数据库开了全文索引

大家好，才是真的好。今天我们讨论Domino运维管理问题：哪些数据库开启了全文索引？ 在前面的某些篇章中，我们介绍过什么是Notes应用的全文索引Full Text Index，以下简称FTI。它是Notes库中的单词的文本索引或列表&…

阅读更多...

HTML零基础教程，九大知识点带你玩转前端（下）

HTML零基础教程，九大知识点带你玩转前端（下）

博主：冰小九，新人博主一只，欢迎大佬前来指导冰小九的主页喜欢请给个三连加关注呀，谢谢🌷🌷🌷三连加关注，追文不迷路，你们的支持就是我最大的动力！&#xff0…

阅读更多...

javaAPI操作-Zookeeper

javaAPI操作-Zookeeper

## 4)ZooKeeper JavaAPI 操作 4.1)Curator介绍 •Curator 是 Apache ZooKeeper 的Java客户端库。 •常见的ZooKeeper Java API ： •原生Java API •ZkClient •Curator •Curator 项目的目标是简化 ZooKeeper 客户端的使用。 •Curator 最初是 Netfix 研发的…

阅读更多...

电影购票系统项目实战

电影购票系统项目实战

电影购票系统项目实战电影购票系统简介、项目功能演示。日志框架搭建、系统角色分析首页、登录、商家界面、用户界面实现商家功能-展示详情、影片上架、退出商家功能-影片下架、影片修改用户功能-展示全部影片用户功能-购票功能用户功能-评分功能用户功能-根据片名查询全部影片…

阅读更多...

绝缘手套穿戴智能识别算法 yolov5

绝缘手套穿戴智能识别算法 yolov5

绝缘手套穿戴智能识别算法通过opencvpython深度学习技术，对现场人员是否佩戴绝缘手套进行识别检测，当检测到现场人员违规行为未佩戴绝缘手套时立刻抓拍告警。我们使用YOLO(你只看一次)算法进行对象检测。YOLO是一个聪明的卷积神经网络(CNN)，用…

阅读更多...

初学者C语言练习题-入门

初学者C语言练习题-入门

一、入门 C语言一经出现就以其功能丰富、表达能力强、灵活方便、应用面广等特点迅速在全世界普及和推广。C语言不但执行效率高而且可移植性好，可以用来开发应用软件、驱动、操作系统等。C语言也是其它众多高级语言的鼻祖语言，所以说学习C语言是进入编程世…

阅读更多...

Python SciPy 模块列表

Python SciPy 模块列表

SciPy 模块列表以下列出了 SciPy 常用的一些模块及官网 API 地址：模块名功能参考文档scipy.cluster向量量化cluster APIscipy.constants数学常量constants APIscipy.fft快速傅里叶变换fft APIscipy.integrate积分integrate APIscipy.interpolate插值interpolate API…

阅读更多...

Android自定义控件(八) Android仿招商银行APP手势解锁

Android自定义控件(八) Android仿招商银行APP手势解锁

前言目前大部分APP的登录方式有多种类型，其中手势解锁就是其中比较常见的一种方式，经常使用的招商银行APP（IOS）端的手势解锁体验不错的，就仿照它自定义下手势解锁功能。说明 1、招行APP手势解锁效果 2、绘制分析 …

阅读更多...

【技术推荐】前端JS攻防对抗

【技术推荐】前端JS攻防对抗

简介网络爬虫一直以来是让网站维护人员头痛的事情，即要为搜索引擎开方便之门，提升网站排名、广告引入等，又要面对恶意爬虫做出应对措施，避免数据被非法获取，甚至出售。因此促生出爬虫和反爬虫这场旷日持久的战斗。爬…

阅读更多...

推荐文章

最新文章