2023年第一篇来谈谈效率

news2024/9/22 11:37:16

    晚上临走的时候和同事聊了聊关于效率的问题,暂且称呼为A同学。借着和A同学的这次畅谈记录下这段时间的所负责的数据迁移过程。

     数据迁移的整体内容并不复杂。主要内容如下

     我们在做事情的时候总会遇到这件事情所关联的其他问题。

不要带着情绪去工作

      书写脚本的时候正好赶上了数据部门对数据进行规范调整,以至于趋向于完成的脚本需要重新梳理,重新来一遍。和A同学沟通,我说便是部门与部门之间的KPI问题,甚至部门的KPI可能还有所冲突,以至于年前对于数据部门开展的数据规范治理动作着实有所怨气,毕竟它是我的工作量有所上升,且原本能够一气呵成的流程,还需要通过他们的协助才能搞定。更有甚者,发生了一次消息的摩擦,好在大家也都是明理之人,时至今日,整个数据迁移的工作已趋于完成。

      回顾这次摩擦的经过,实在是了解到一个事实,也是规律。愤怒往往会把人的理智和智慧丢下,只剩下情绪而已。抱有一种有色眼睛看待事情,以至于我忘记了原本系统可以使用的功能(一键拒绝上线单)。外插这次和A同学的讨论,部门与部门都是一个公司的,相互之间的KPI不应该有所冲突,而是整体上是有共同趋势的。其实这次数据部门的数据规范调整也是值得认可的,之前的各种数据确实杂乱无章,管理松散。

     可能是春节期间看了东坡传更加的豁达了,这一个星期自认为个人精神状态不错,没有任何的不快,唯一的不快可能是不能放肆的享受美食吧。且和数据部门打交道,没有任何不快,反而是有问题我直接去找他们,只有一个目标,已最快的速度把事情搞定,且有质量的搞定。

大胆起来,往前冲

    在做一件事情的时候,往往会遇到和这次事情相关的各种问题。在这次数据迁移过程中,发现历史数据存在缺漏的问题,只能从归档备份的MySql重新走一遍流程,写入到Clickhouse里。数据大约有2亿条记录。由于对Spark,Clickhouse的性能相关并不了解,从一开始就担心会遇到内存不足等性能问题。但其实大数据这块还是很不错的,一千万的数据资源充足约摸着10分钟以内就搞定了。以至于迁移起来信心大增。

不以事后者的态度检讨自己

     说起事后者,想起了罗翔老师的一些话,作为女性在面对男性的迫害时,哪怕偶然把男性打到在地,甚至男性也已经无力迫害,女性还是会对男性进行击打,甚至击打成重伤。作为当事者是很难做到反抗成功以后不再对迫害人进行击打的,因为她也不知道迫害人是否有能力在进行迫害。说多了,哈哈哈哈哈。在面对自己曾经的错误时,倒也不必过分的要求自己,俗话说当局者迷,身在其中总是容易被牵着走的。而且尽管以事后者去思考以另一种方式可能把事情做的更好,毕竟只是猜测,哪怕它的概率很小。不能保证你以其他方式做事的时候,不会出现其他的问题。

      在最近这2亿条记录的迁移过程中,自己是分成了15个脚本依次执行。到现在想了一下也是可以写成5个脚本,脚本数量缩小了三倍。但是数量缩小了三倍,但每个脚本承担的任务也便重了,变重了的脚本你能够保证执行起来内存充足,执行不超时吗,也是未必的(到现在我觉得大概率是没有问题的)

有条理有计划还是很值得的

在这次迁移中,自己约摸着是直接开干,边写脚本边遇到一些问题。原本是打算按照ct去拉去数据,写完之后才发现ct压根没有索引,只能一次性的把整张表的数据全部拉取过去,如果有一个清晰的步骤好计划,我想还是能够提高一些效率的。

要不要规划的整体时间

做项目时经常会有项目时间倒排,在做事的时候往往会拖延,是不是应该去设置一个项目时间,去倒推整个数据迁移的节奏,有着数据迁移的节奏之后,便会去思考如何使整个迁移工作更快,在这样的压力下,是不是能够得出最有效率的迁移计划呢?

经验主义害人

写脚本的时候呢,往往倾向于自己的习惯,以至于不思考还能有其他的方式。在执行脚本的时候我,往往需要替换一些数据库表名,其实也可以替换库名。自己之前都是一个表抽取数据,这次涉及到多张表,由于替换的表名较多,以至于替换字典的字符串过长,因此写了两个ods层的迁移脚本,其实完全不必,还有另一种方式仅替换库名就可以了,由于经验,由于习惯当时压根就没想。。。我觉得这也是人脑的懒惰导致的,想要人脑不那么懒惰,只能经常锻炼自己勤思考了。

收尾

能够认真复盘好工作还是挺难的,写到这里感觉像是鸡汤,我想多写几次总会有所进步的。管它什么的,姑且写就是了。

  1. 效率高仅看事情本身。
  2. 效率高要计划清晰
  3. 效率高勤动脑

     

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/196369.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【HBase高级】6. HBase数据结构(下)——LSM树数据结构、布隆过滤器、StoreFiles(HFile)结构

5.3 LSM树数据结构 1、简介 传统关系型数据库,一般都选择使用B树作为索引结构,而在大数据场景下,HBase、Kudu这些存储引擎选择的是LSM树。LSM树,即日志结构合并树(Log-Structured Merge-Tree)。 LSM树主要目标是快速建立索引B树…

redis加锁的几种方法

1. redis加锁分类 redis能用的的加锁命令分表是INCR、SETNX、SET 2. 第一种锁命令INCR 这种加锁的思路是, key 不存在,那么 key 的值会先被初始化为 0 ,然后再执行 INCR 操作进行加一。 然后其它用户在执行 INCR 操作进行加一时,…

3.4 内部类

文章目录1.概述2.特点3.内部类入门案例4.成员内部类4.1 被private修饰4.2 被static修饰5.局部内部类6.匿名内部类1.概述 如果一个类存在的意义就是为指定的另一个类,可以把这个类放入另一个类的内部。 就是把类定义在类的内部的情况就可以形成内部类的形式。 A类中…

【内网安全】——CS操作指南(二)

作者名:白昼安全主页面链接: 主页传送门创作初心: 一切为了她座右铭: 不要让时代的悲哀成为你的悲哀专研方向: web安全,后渗透技术每日emo:关心和细节吗?注意:我这里的cs…

Android MVI框架的使用

AndroidMviFrame AndroidMviFrame 是一个Android简单易用的项目框架 文档下面会对框架中所使用的一些核心技术进行阐述。该框架作为技术积累的产物,会一直更新维护,如果有技术方面的谈论或者框架中的错误点,可以在 GitHub 上提 Issues&…

DAMA认证(CDGA/CDGP)证书好考吗

随着数字化经济的不断发展,企业对数据重视程度越来越高,致使越来越多得数字人关注到DAMA认证。很多小伙伴都会有这样的疑问,DAMA认证(CDGA/CDGP认证)好考吗?通过率怎么样?今天小编就在这里做一下简单的说明…

UniRx之操作符详解-Linq语法

前言 UniRx中由很多操作符,注意要分为三类 Linq操作符,和Linq语法风格一致Rx操作符,从Rx.Net库继承下来的操作符。UniRx操作符,UniRx针对Unity的独有操作符。 Rx和Linq Linq是微软的一项技术,新增一种自然查询的SQ…

时间序列预测

问题简介 简单来说,时间序列是按照时间顺序,按照一定的时间间隔取得的一系列观测值,比如我们上边提到的国内生产总值,消费者物价指数,利率,汇率,股票价格等等。时间间隔可以是日,周…

数字IC设计 Synopsys EDA Tools的安装补充

数字IC Synopsys 七件套的Ubuntu安装步骤 推荐大佬的安装教程,本人亲测可用,在这里表示十分感谢! 数字IC设计的第一步——Synopsys EDA Tools的安装 跟着大佬的教程仔细点可以一步到位的! 在这里备忘本人遇到的几个粗心导致的问…

浅谈Spring IoC容器

目录 1.IoC容器 2.依赖注入 1.IoC容器 IOC: Inversion of Control,是一种设计思想。 在spring框架中,Spring 通过IoC容器进行管理所有Java对象的实例化和初始化,控制对象与对象之间的依赖关系。 IoC管理的对象称为Bean,它与使…

“华为杯”研究生数学建模竞赛2005年-【华为杯】A题:行车时间估计和最优路线选择(附获奖论文)

赛题描述 A: Highway Traveling time Estimate and Optimal Routing Ⅰ Highway traveling time estimate is crucial to travelers. Hence, detectors are mounted on some of the US highways. For instance, detectors are mounted on every two-way six-lane highways o…

MySQL 百万级数据,如何做分页查询?

随着业务的增长,数据库的数据也呈指数级增长,拿订单表为例,之前的订单表每天只有几千个,一个月下来不超过十万。而现在每天的订单大概就是2w,目前订单表的数据已经达到了700w。这带来了各种各样的问题,今天…

国产ETL工具/ETL 产品 (BeeDI ) 集团财务 双向同步 审核平台

项目需求核心 实时同步、双向同步、部分同步、日志解析同步、断点续传 项目需求概要 35分公司财务数据实时同步汇总中心平台 🔛 中心平台财务数据实时同步分发35分公司 项目需求内容 35分公司数据中部分表数据同步到中心库对应表,10张表分公司表年数…

【MyBatis】mybatis缓存机制

1. 缓存基础知识:缓存: cache缓存的作用: 通过减少IO的方式, 来提高程序的执行效率mybatis缓存包括:一级缓存: 讲话查询的数据存储到SqlSession中二级缓存: 将查询的数据存储到SqlSessionFactory中或者集成第三方的缓存: 比如EhCache...mybatis缓存只针对DQL语句, 也就是说缓存…

【1145. 二叉树着色游戏】

来源:力扣(LeetCode) 描述: 有两位极客玩家参与了一场「二叉树着色」的游戏。游戏中,给出二叉树的根节点 root,树上总共有 n 个节点,且 n 为奇数,其中每个节点上的值从 1 到 n 各不…

WPF使用AvalonEdit实现代码高亮显示、搜索、替换功能

很多工程软件拥有自己定义的脚本语言,作为程序员用惯了具有高亮显示和智能提示功能的编辑器,所以针对特定的脚本自己开发一个编辑器。主要采用WPF、C#语言以及AvalonEdit控件。 文章目录AvlonEdit控件实现自定义高亮显示实现文本搜索实现文本替换自定义搜…

磁疗效果因“病”而异,坚持=胜利!

磁疗在我国具有悠久的历史早在春秋战国时期,就有神医扁鹊运用磁疗治病的记载。 北京军区总医院理疗科主任,中华生物磁学研究会秘书长周万松认为,关于磁场改善血液循环这一点是肯定的,磁场可以扩张血管、加速血流、改善血液循环。但…

【H5游戏】-整一个简单的解压小游戏【抽纸巾】

专栏简介 💒个人主页 📰专栏目录 点击上方查看更多内容 📖心灵鸡汤📖社会不相信庸俗,成功需要汗水和寂寞铸就。无数次的质疑或是嘲笑,这些都无所谓,记住自己是谁,自己想要什么就…

Django的信号机制解读

Django的信号 Django的信号机制不同于Linux的信号机制,Django 中的信号用于在框架执行操作时解耦。当某些动作发生的时候,系统会根据信号定义的函数执行相应的操作 Django的信号主要包含以下三个要素: 发送者(sender&#xff0…

网络隔离后的文件传输怎么解决?深度解析4种主流方案

网络隔离对于很多企业来说并不陌生,出于数据安全的考虑,为了隔离有害的网络和可能的网络攻击,越来越多的企业在内部进行了网络隔离。隔离的形态和方式有多种,总体上主要以物理隔离和逻辑隔离为主。网络隔离可以一定程度上甚至彻底…