数仓开发流程规范

news2024/11/16 15:34:16

 一、目的

数据研发规范化旨在为数据开发提供规范化的研发流程指导方法,目的是简化、规范化日常工作流程,提高工作效率,较少无效与冗余工作,赋能企业更强大的数据掌控力来应对海量增长的业务数据,从而释放更多的人力与财力专注于业务创新

二、角色职责

  • 数据产品经理

负责承接、评估业务方提出的数据需求,并组织需求评审、产出产品需求文档,同时需要把控其他更细化的技术评审。

  • 设计人员

根据已定稿的产品需求文档所述需求,进行数据探查,了解数据形态(数据质量、数据分布),同时根据探查结果实现表设计、Mapping设计、调度设计等系分设计工作。

  • 开发人员

根据设计人员产出稿件,定制计划并实现代码,同时进行单元测试与代码评审。

  • 测试人员(开发人员兼职)

负责验证需求与结果一致性,发i西安代码问题与项目风险。

  • 运维人员

负责发布任务,并处理数据、程序、调度、监控告警等异常事件,保障数据产出时效、程序高效运行和生产稳定性。

  • QA人员(设计人员兼职)

在需求评审前期,负责需求实现的安全性与合规性

流程

概要流程

详细流程

需求阶段 

 设计阶段

 开发阶段

 测试验证阶段

 发布阶段

三、流程节点及交付物

1、需求

1.1 需求提出

时间点:需求评审前至少一天

参与方:分析师

提供形式:邮件

交付物:需求模板,介绍清楚需求背景,目的(意义),交付时间,交付物(如果是表,确定表头、样例数据),产品需求文档。(状态,需求待评审,需求确认)

1.2 需求分析

时间点:需求发出到需求评审前,至少预留一天时间

目的:为了提前熟悉需求,提升评审效率

参与人员:数仓架构、数仓开发

1.3 需求评审

时间点:双方约定需求评审时间,在需求发出一天后

参与方:分析师、数据产品、数仓开发

目的:三方快速达成一致,确定开发口径

交付物:按照需求评审确定口径,需求方发送确认邮件,一切口径按照确认邮件进行开发,需求(需求邮件确认)(状态,需求待评审,需求确认)

2、设计

2.1 数仓设计

时间点:需求评审后

参与方:数仓架构

目的:明确数据边界,确定逻辑口径

交付物:ER图或设计文档(涉及到新的架构设计和调整),血脉关系图(对应数据开发需求)

3、开发

3.1 数仓开发

时间点:需求评审后

参与方:数仓开发人员

交付物:生成落地表、编写sql脚本、调度脚本(SVN)

3.2 CodeReview (评审)

时间点:测试环境开发完成

参与方:架构师、数仓开发人员

目的:确认开发逻辑没有明显漏洞,数据量级保证准确

交付物:代码评审报告(文档包括改进点和时间,无则确认);

互相审核机制:成员间相互审核代码

3.3 CheckList

时间点:贯穿整个开发流程

参与方:数仓方

目的:数仓从需求产生到最后的上线交付,一切留痕,保证开发质量

交付物:开发验证单

4、测试验证

1、数仓内部测试验证

时间点:开发环境上线后

参与方:数仓开发人员

目的:保证数据开发质量,暴露数据存在的问题

交付物:验证逻辑代码、结果截图

2、需求方数据核验

时间点:线上冒烟测试后

参与方:数据产品、分析师,测试人员

目的:保证需求与数仓开发是一致的

交付物:确定后发出确认邮件(不发生的默认数据质量没有问题)邮件(状态,数据确认)

5、发布验收

1.发布

时间点:测试确认邮件后

参与方:需求,数仓开发

交付物:邮件确认(上线单)

流程:SVN先更新--后修改--再提交的流程;打包工程-上传AZKaBan

2.验收

时间点:发布后

参与方:需求人员

交付物:邮件(状态,验收确认)

2.数据回溯

时间点:需求方发出数据核验确认邮件后

参与方:分析师、数仓开发

分析师交付物:确定数据回溯周期

数仓交付物:按照确认邮件进行回溯,完成后邮件回复

交付物:邮件确认

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1663063.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

keil的jlink重新选择芯片识别

keil选择jlink要选择对应芯片,一旦选择成功会出现以下文件 如果选择错了芯片类型,就需要删除这两个文件,然后重新进入选择,就可以了

神经网络与空间变换关系

神经网络的隐藏层实际上就是在进行一次空间变换,隐藏层中神经元的个数就是变换后空间的维度,代表可以升维也可以降维。 不同是 神经网络的一层运算不只有矩阵乘法,还会有一个加法。以及 进行完线性计算后,还要经过非线性的激活函…

泰迪智能科技企业数据挖掘流程分析及特色服务优势

企业发展会沉淀大量的数据,数据中囊括了企业业务各种维度指标,通过数据挖掘和数据分析 ,让企业业务了解过去、现在和未来将要发生什么,从而更好的调整企业发展方向。泰迪智能科技企业数据挖掘平台是面向企业级用户快速处理数据构建…

微信小程序之简单的发送弹幕操作

大家看视频的时候是不是时不时会有弹幕飘过~ 在我们微信小程序当中,我们可以十分简单的实现,接下来为大家介绍一下吧! 我们使用微信官方给我们的一个视频链接 "http://wxsnsdy.tc.qq.com/105/20210/snsdyvideodownload?filekey302802…

语言基础 /CC++ 可变参函数设计与实践,va_ 系列实战详解(强制参数和变参数的参数类型陷阱)

文章目录 概述va_ 系列定义va_list 类型va_start 宏从变参函数的强制参数谈起宏 va_start 对 char 和 short 类型编译告警宏 va_start 源码分析猜测 __va_start 函数实现 va_arg 宏宏 va_arg 无法接受 char 和 short为啥va_arg可解析int却不能解析float类型?宏 va_a…

Linux 第二十七章

🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️‍🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C,linux 🔥座右铭:“不要等到什么都没有了…

答辩PPT不会做?试试这些AI工具,一键生成

在我原本的认知里面,答辩PPT是要包含论文各个章节的,在答辩时需要方方面面都讲到的,什么摘要、文献综述、实证分析、研究结果样样不落。但是,这大错特错! 答辩PPT环节时长一般不超过5分钟,老师想要的答辩P…

【JavaSE】/*初识Java*/

目录 一、了解 Java 语言 二、Java 语言的重要性 2.1 使用程度 2.2 工作领域 三、Java 语言的特性 四、Java 的基础语法 五、可能遇到的错误 六、第一个 java 程序代码解析 七、Java 注释 八、Java 标识符 九、Java 关键字 一、了解 Java 语言 Java 是由 Sun Micr…

2023年建筑特种作业人员安全生产知识试题

100分题库提供安全员考试试题、建筑安全员考试预测题、建筑安全员ABC考试真题、安全员证考试题库等,提供在线做题刷题,在线模拟考试,助你考试轻松过关。 判断题(1-20) 1.《建筑工程安全生产管理条例》是我国第一部关于…

mac苹果电脑卡顿反应慢如何解决?2024最新免费方法教程

苹果电脑以其稳定的性能、出色的设计和高效的操作系统,赢得了广大用户的喜爱。然而,随着时间的推移,一些用户会发现自己的苹果电脑开始出现卡顿、反应慢等问题。这不仅影响使用体验,还会影响工作效率。那么,面对这些问…

2024年旅游行业薪酬报告

来源:薪智 近期历史回顾: 2024年中国健康家电消费洞察及趋势研究报告.pdf 2024巴菲特股东大会5万字完整版.pdf 2024年全国大学生新媒体直播大赛.pdf 2024北京市高级别自动驾驶示范区数据安全治理白皮书.pdf 2024年第一季度开发者健康调查报告.pdf 2024年…

计算机毕业设计 | vue+springboot线上考试 在线测试系统(附源码)

1,项目介绍 项目背景 在线考试借助于网络来进行,传统考试所必备的考场和监考对于在线考试来说并不是必要项目,因此可以有效减少组织考试做需要的成本以及设施。同时,由于在线考试系统本身具有智能阅卷的功能,也大大减…

记录文件上传exists方法遇到的坑

1、问题 判断文件是否存在使用exist方法,官方的注释是这样的 百度翻译结果:true,当且仅当由该抽象路径名表示的文件或目录存在时;否则为false 2、实际返回 注意:实际上exsits方法的返回值与其官方注释的返回结果是相…

NSSCTF中的web学习(md5())

目录 MD5的学习 [BJDCTF 2020]easy_md5 [LitCTF 2023]Follow me and hack me [LitCTF 2023]Ping [SWPUCTF 2021 新生赛]easyupload3.0 [NSSCTF 2022 Spring Recruit]babyphp MD5的学习 md5()函数: md5($a):返回a字符串的散列值 md5($a,TRUE)&…

一套全新的PACS医学存档影像系统源码 RIS和PACS系统分别在哪些方面发挥作用

RIS和PACS系统分别在哪些方面发挥作用 RIS系统的作用 放射信息系统(RIS)主要用于管理和调度患者的放射检查流程。它的主要功能包括患者管理、检查预约、报告生成等。RIS系统通常作为独立系统运行,侧重于临床流程管理,并优化放射…

关于docker network网络

首先,我们来看看Docker默认的网络模式,即docker0网桥。 每当你安装Docker时,它会创建一个名为docker0的虚拟网桥,并设置一个IP地址范围供它进行端口映射等工作。所有Docker容器在创建时,都会自动连接到这个docker0网桥,并分配一个虚拟IP地址。这样,容器与主机之间,以及容器与容…

3d里如何做螺旋状模型?---模大狮模型网

螺旋状模型在3D设计中常常被运用,不仅可以用于创造独特的装饰品和艺术品,还可以用于建筑设计、工程模拟等领域。然而,对于初学者而言,如何在3D软件中创建螺旋状模型可能是一个挑战。在本文中,我们将分享几种简单而有效…

Qt——信号 和 槽

目录 概述 信号和槽的使用 自定义信号和槽 带参数的信号和槽 概述 在Linux系统中,我们也介绍了信号的产生、信号的检测以及信号的处理机制,它就是系统内部的通知机制,也可以是一种进程间通信的方式。在系统中有很多信号,我们可…

镜舟科技亮相2024中国移动算力网络大会、Qcon、DTC等多项活动

在刚刚过去的 4 月份,镜舟科技受邀参与一系列技术交流活动,与移动云、金科创新社、infoQ、墨天轮、开科唯识等媒体及合作伙伴展开积极交流,并分享其在数据技术、金融等垂直行业领域的创新实践,从产业侧、业务侧、技术侧洞察需求、…

React:Router-3.路由懒加载

在 React:Router-1.BrowserRouter组件式 和 React:Router-2. createBrowserRouter函数式 两篇文章中我们已经完成了路由的创建。但是这种方式,会全量加载路由资源,如果项目较复杂,会产生性能问题。 为了优化项目性能&…