火山引擎 DataLeap:从短视频 APP 实践看如何统一数据指标口径

news2024/11/17 3:58:13

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

短视频正在成为越来越多人发现世界的窗口,其背后的创作者生态建设是各大短视频 APP 不可忽视的重要组成部分。

为了激励更多优质内容生产,某短视频 APP 经常面向创作者主办投稿活动,而在复盘投稿数据过程中,该团队音乐运营人员在查找「音乐投稿率」指标时,同时搜索到了「音乐投稿率(音乐元素投稿比例)」,两个指标名称相似,但细究之下含义却大相径庭。

图:某短视频平台举办的创作者活动

不仅仅是「音乐投稿率」这一个指标,该短视频 APP 内部每天都会发生很多类似问题。

由于该短视频 APP 旗下业务线比较多,包括工具、社交等,每个活动协同的业务方多、人员复杂,而各业务指标都由自己单独定义,并独立交由不同研发人员开发,由此导致指标分散、口径不一致。

即使已经完成研发、运营、战略等各个团队对齐,也可能存在某团队因业务需求调整口径,又未周知其他团队,导致指标再次对不上,影响工作效率,甚至出现数据误差。

为了解决数据指标中存在的种种难题,数据团队基于火山引擎 DataLeap,把建设统一的数据指标管理平台纳入团队重点工作。据了解,火山引擎 DataLeap 能够解决“灵活数据分析”场景下的找数据、找口径的问题,帮助客户建设可共享、可视化、服务化的业务指标体系。

在机制层面,数据团队自上而下发起数据指标看板建设需求,从各业务指标诉求中抽象出统一的规范,并建立投稿数据使用规范。当收到一个新指标开发需求时,先明确指标负责人,其他方向同学则对齐该指标。举个例子,主端投稿“投稿数”业务指标建设,影像、图文投稿则要对齐该“投稿数”指标的口径。

在工具层面,数据团队通过 DataLeap 建立了统一的指标管理平台,辅助以上机制落地。首先,数据团队建立了一个跨业务团队的公共层数据,各业务方的数据均依赖公共层数据表进行加工。其次,基于火山引擎 DataLeap 的“指标平台”能力,将投稿核心指标分类管理,保障指标口径出口一致性。DataLeap 指标可视化能力,直接屏蔽了底层物理表,帮助运营等非研发人员,更清晰获取数据指标信息、操作指标变更、完成指标进一步分析。

通过以上方法,该短视频 APP 内部关于数据指标口径的答疑会和讨论会大大减少,一方面提高团队工作效率、指标使用效率,另一方面,也很大程度规避由指标口径不统一导致的下游数据问题。

随着越来越多公司数据规模的扩大,垂直业务单元会越来越多,而在跨垂直单元数据建设过程中,各种数据不统一、指标集中梳理难、指标统一定义难、指标追溯难等问题愈加突出。火山引擎 DataLeap 将提供从指标定义、运营、发现、洞察、质量到消费与反馈的全流程,提升指标使用效率、降低指标重复开发成本和数据答疑成本,为更多有数据指标建设的企业、行业提供服务。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/935014.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

下一代存储解决方案:湖仓一体

文章首发地址 湖仓一体是将数据湖和数据仓库相结合的一种数据架构,它可以同时满足大数据存储和传统数据仓库的需求。具体来说,湖仓一体可以实现以下几个方面的功能: 数据集成: 湖仓一体可以集成多个数据源,包括结构…

exe打包工具(收录)

收录: Advanced Installation静默安装包的制作方法 Advanced Installer打包exe安装包教程 Advanced Installer使用指南 advanced installer 使用常见问题整理 exe打包工具:advanced installer介绍

使用飞桨实现的第一个AI项目——波士顿的房价预测

part1.首先引入相应的函数库: 值得说明的地方: (1)首先,numpy是一个python库,主要用于提供线性代数中的矩阵或者多维数组的运算函数,利用import numpy as np引入numpy,并将np作为它的别名 part…

这可能是你看过最详细的 [八大排序算法]

排序算法 前置知识 [排序稳定性]一、直接插入排序二、希尔排序三、直接选择排序四、堆排序五、冒泡排序六、快速排序七、归并排序八、计数排序(非比较排序)排序复杂度和稳定性总结 前置知识 [排序稳定性] 假定在待排序的记录序列中,存在多个…

Docker 将容器打包成镜像推送镜像到仓库

Docker 将容器打包成镜像&推送镜像到仓库 一、将容器打包成镜像 $ docker commit <容器ID> <镜像名称:标签>示例&#xff1a; $ sudo docker ps CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS …

FreeSWITCH 1.10.10 简单图形化界面5 - 使用百度TTS

FreeSWITCH 1.10.10 简单图形化界面5 - 使用百度TTS 0、 界面预览1、注册百度AI开放平台&#xff0c;开通语音识别服务2、获取AppID/API Key/Secret Key3、 安装百度语音合成sdk4、合成代码5、在PBX中使用百度TTS6、音乐文件-TTS7、拨号规则-tts_command 0、 界面预览 http://…

JVM第一篇 认识java虚拟机

目录 1. 什么是java虚拟机 2. java虚拟机分类 2.1. 商用虚拟机 2.2. 嵌入式虚拟机 3.java虚拟机架构 4.java虚拟机运行过程 1. 什么是java虚拟机 传统意义上的虚拟机是一种抽象化的计算机&#xff0c;通过在实际的计算机上仿真模拟各种计算机功能来实现的&#xff0c;是操…

Python在电路课程中的应用

1 需求 课程中有大量的计算&#xff0c;电路方程、复数计算&#xff0c;之前都是用的MATLAB online&#xff0c;可现在要过期了&#xff0c;只能更换平台。 2 工具 https://www.online-python.com/ Python3 在线工具 | 菜鸟工具 (runoob.com) 3 Sinusoid 章节 涉及到复数计…

AI绘图(11)stable diffusion 如何写好prompt四

在最开始我写了三篇关于prompt的&#xff0c;具体的大家可以跳转来去看&#xff0c;以下给出来链接&#xff1a; AI绘图&#xff08;3&#xff09;stable diffusion如何写好prompt 一_牧子川的博客-CSDN博客 AI绘图&#xff08;4&#xff09;stable diffusion如何写好prompt …

无涯教程-聚类算法 - Mean-Shift

如前所述&#xff0c;它是在无监督学习中使用的另一种强大的聚类算法&#xff0c;与K均值聚类不同&#xff0c;它不做任何假设&#xff0c;因此&#xff0c;它是一种非参数算法。 均值平移算法基本上是通过将数据点移向最高密度的数据点(即群集质心)来迭代地将数据点分配给群集…

Modbus协议详解1:Modbus的简介

Modbus协议是应用非常广泛的一种通信协议规约&#xff0c;也是最早应用在工业现场的协议。 早在1979年出现工业串行链路以来&#xff0c;Modbus的应用就开始普遍起来&#xff0c;它使得各种自动化设备之间的互相通信得到实现&#xff0c;做嵌入式产品开发的朋友应该不会陌生&am…

RT1050的ADC

文章目录 1 ADC介绍2 ADC框图2.1 外部输入通道2.2 输入电压范围2.3 触发源2.4 时钟源2.5 偏移矫正功能2.5.1 校准 1 ADC介绍 RT1052 有 2 个 ADC&#xff0c;每个 ADC 有 12 位、10 位、8 位可选&#xff0c;每个 ADC 有 16 个外部通道。 ADC具有最高 1MS/s 采样率支持单次或…

ubuntu安装goland

下载并解压goland sudo tar -C /opt/ -xzvf goland-2023.1.3.tar.gz配置应用图标 新建文件&#xff1a; vim /usr/share/applications/goland.desktop文件中写入如下内容&#xff1a; [Desktop Entry] TypeApplication NameGoLand Icon/opt/GoLand/bin/goland.png Exec/op…

uni-app 分不清的全局变量this, uni, $u, vm, uni.$u, this.$u

项目引入了uview,并将uview所有模块指给uniapp全局变量uni uni.$u$u 在登录页面&#xff0c;或者APP.vue打印以下变量&#xff1a; this, uni, $u, vm, uni.$u, this.$u

软件测试之可靠性测试

CNAS标识 软件可靠性测试主要目的是通过在有使用代表性的环境中执行软件&#xff0c;以证实软件需求是否正确实现&#xff0c;为进行软件可靠性估计采集准确的数据&#xff0c;并找出所有对软件可靠性影响较大的错误。可靠性测试的特点是不同于硬件可靠性测试&#xff0c;主要…

TCP协议的重点知识点

TCP协议的重点知识点 TCP(传输控制协议)是一种面向连接、可靠的数据传输协议,工作在传输层,提供可靠的字节流服务。它是互联网协议栈中最重要、最复杂的协议之一,也是面试中常被问到的知识点。本文将详细介绍TCP协议的各个重要概念。 TCP基本特性 TCP主要具有以下基本特性: …

香橙派OrangePi zero H2+ 驱动移远EC200A

1 系统内核&#xff1a; Linux orangepizero 5.4.65-sunxi #2.2.2 SMP Tue Aug 15 17:45:28 CST 2023 armv7l armv7l armv7l GNU/Linux 1.1 下载内核头安装 下载&#xff1a;orangepi800 内核头rk3399链接https://download.csdn.net/download/weixin_37613240/87635781 1.1.1…

去除wps段落柄,删除空白页

如图&#xff0c;有一个段落柄在左端&#xff0c;无法删除&#xff0c;只能编辑。 导致本来是8页内容&#xff0c;现在是9页&#xff0c;多了一空白页 后面新建一个空白页&#xff0c;发现默认会自带一个段落柄&#xff0c;所以有可能这个段落柄是不能消除的&#xff0c;那么如…

SSH报错-Terminal shell path: C:\WINDOWS\System32\cmd.exe 此时不应有

最近接盘了实验室的工作&#xff0c;需要重新配置连接自己的VScode的SSH远程连接服务器&#xff0c;结果配置了一个下午都没搞好&#xff0c;决定记录一下&#xff0c;希望大家避免踩坑。在vscode上遇到的是这个报错&#xff1a; 错误日志 [11:40:12.097] Checking ssh with …

自考《00538 中国古代文学史(一)》2023年4月历年真题答案

自考科目列表,自考本科,题库,自学考试,历年真题 1.“弹歌、断竹、续竹、飞土、逐尖”属于() A.寓言 B.神话 C.传说故事 D.原始歌谣 2.出自《山海经》的神话是() A.女娲补天 B.盘古开天地 C.后羿射日 D.鲧禹治水 3.汉代伏生所传今文《尚书》共计() A.25篇 B.29篇 C.33篇 D.58篇 …