大厂数仓专家实战分享:企业级埋点管理与应用

news2024/9/23 3:22:37

一.什么是埋点

埋点(Event Tracking),是互联网数据采集工作中的一个俗称,正式应该叫事件跟踪,英文为 Event Tracking,它主要是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。

二.埋点数据用来干什么

埋点数据主要是用来收集用户的行为数据的,网站收集用的的行为数据可以分析网站的运行效果、用户行为特点、业务的目标达成。同时,还可以通过这些数据,实现为用户提供个性化的推荐功能,以达到最大的业务转化率。它主要包括以下功能:

  • 在产品流程关键部位植相关统计代码,用来追踪每次用户的行为,统计关键流程的使用程度。

  • 在产品中植入多段代码追踪用户连续行为,建立用户模型来具体化用户在使用产品中的操作行为。

  • 与研发及数据分析师团队合作,通过数据埋点还原出用户画像及用户行为,建立数据分析后台,通过数据分析、优化产品。

三.为什么要埋点?

网站自己产生的业务数据,如新闻网站发布的资讯文章、电商网站发布的商品信息等内容存放在网站自己的业务数据库里,网站如果有需要可以随时同步到数据仓库或者调取使用,但用户的行为,一般不会以业务数据的形式在数据库里存储,这有以下几个原因:

  1. 用户的行为复杂:除了用户的基础的页面访问、链接点击跳转等行为外,还有诸如鼠标动作、滑动屏幕、实施重力感应等交互行为,这些行为呈现多样性,无法全部列举,在设计业务系统时一般不做考虑。

  2. 用户的行为数据量大:用户在产品上的行为互动频繁,尤其在移动互联网场景下多屏互动时,产品设计更倾向于引导用户完成相应的目标,用户也乐于与软件进行流畅的互动。

  3. 用户的行为数据对业务无依赖:用户的行为数据与产品的主业务关联不大,用户的行为往往用于对用户进行后续的个性化的服务,但不会产生即时的影响。

基于以上原因,我们需要专门收集用户的行为数据,就需要用到埋点操作。

四.埋点的实现方式

埋点的方法有很多种,大部分是利用第三方统计工具(如云眼),也有在产品研发的时候直接在程序里嵌入代码统计搭建自己的后台以供查询。

埋点的方式包括:手工埋点、可视化埋点、自动化埋点等。

按实现机理可以分为:手工编码嵌入、自动编码嵌入、运行时嵌入等。

使用第三方sdk埋点:如百度统计、友盟、TalkingData、Google Analytics、Sensors Analytics等都提供了这一方案。

五.埋点的上报

1.上报的时机:时机就是事件场景,因什么而发生,发生了什么,由谁来触发。触发者可以是用户、系统、运营人员,本质还是系统,系统是事件发生的代理者。一个时机应该包含以上的隐含信息。常见的时机有:点击、浏览(访问)、曝光、播放、结果等事件。

事件往往站在结果的角度,对业务的影响,更加业务化。这时,事件不会过于关注埋点的触发场景,更多的聚焦在业务结果上。因此,事件往往有很多的时机,多种时机会产生一个事件。常见的事件有:关注、购买、收藏、下载、播放、曝光等等我们发现,上边很多事件其实都是由「点击」而来的。

2.上报的上报信息:埋点上报的信息一般分为:

  • 1)公共信息:一般为用户的全局信息,包含设备、网络、个人、页面、位置模块、时间等与业务无关的通用信息。

  • 2)业务公共信息:一般为主数据信息,商品、内容、订单等与业务内容相关的信息,一般为企业多个业务共用的信息。

  • 3)自定义信息:业务内容的信息。                          

  • 4)扩展信息:特殊场景下上报的信息。     

以下是一个埋点设计表:

3.埋点信息主要包括:

1)基本信息

SDK版本
事件产生的时间
服务端接收的时间
本次启动的时间
Sessionid

2)用户信息

账号ID
用户昵称
idfa/imei md5加密值
设备id
是否首日访问
国家
城市
省份
县区
会员等级

3)设备信息

操作系统
操作系统版本
手机型号
设备制造商
设备型号
屏幕高度
屏幕宽度
经度
纬度
深色模式
是否 WiFi
网络类型
运营商名称
IP
UA信息

4)应用信息

是否是灰度版本
当前渠道
应用内部版本号
AB测试标识
实验ID
包名
是否青少年模式
夜间模式
位置是否授权
提醒是否开启
安装渠道

5)位置信息

互联网产品,特别是面向 C 端的产品,在内容呈现方面往往以区块为主体分隔,在区块中展现具体的业务内容。模块是指在展示界面中展示一批具体内容的区域。这些区域内部来看,往往承载了相同性质的内容,如视频、文章、商品等,或者表达了一种聚合方式,如推荐模块中的内容类型可能是混杂的,但此模块则表示模块中的内容全部来自于推荐。

在模块的外部来看,不同模块代表了不同的内容类型,或是不同的内容维度。

模块的编码:模块的顺序一般是从左到右,从上到下,并对界面中所有的内容全部(包括弹窗、默认隐藏内容等)纳入编码范围。

A.界面信息:
当前页面
当前URL
URL参数
当前URI
上一页
页面标题
形式(原生/H5)
B.界面层级:
一级
二级
三级
四级
C.模块信息:
模块名称
父模块名称
模块位置顺序

六.埋点数据在企业里面的应用场景

数据埋点可以根据用户在APP上的一系列操作线索,提炼有用的信息,进行数据分析。重点不在于埋点的作用,其实在于获取埋点数据后的二次加工,如何分析输出业务分析结论。

1、分析运营机制的合理性

如移动APP上大多都有用户分享的功能,一般的营销手段是通过老拉新的方式,运营设定一些奖励机制,用来提高APP的注册量。

提前在用户分享键返回后台重新进入购买页面埋点,就能记录到页面的访问次数和转化率,用于分析奖励机制对用户的刺激性,指导策略方向。

2、分析产品功能的合理性

如产品设计了新功能想提高下用户的满意度。提前在新功能的各个按钮上进行埋点,就能获取到用户使用新功能的次数,以及在新功能的使用行为,可以分析用户是否对新功能比较感兴趣,页面的跳转设置是否合理等。

3、分析用户消费行为,挖掘流失点

如老板问你为什么最近收益这么少。在用户消费的核心页面和按钮进行埋点,就能记录到每个流程的转化率,用于分析用户漏斗的哪一个阶段出现了问题,结合业务输出解决方案。

4、监控产品的流畅性

如产品刚上线阶段,需要监控用户使用过程中,各个页面或按钮响应的流畅性是否存在问题。提前在核心功能页面和按钮进行埋点,就能记录到每个页面和按钮的衔接情况,发现问题及时解决,以免影响用户体验。

5、分析不同渠道的用户行为差异

如市场推广常常需要分析不同渠道的用户转化情况,以便减少推广成本。提前在各个渠道进行埋点,记录各渠道用户在APP中的后续行为,调整推广策略。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1228877.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

中国互联网格局改变的重点,在于真正走向海外,打破美国垄断

媒体报道指字节跳动上半年的营收达到540亿美元,超过了其他互联网企业,这是国内互联网行业格局发生重大变化的证明,那么是什么原因导致了这一格局的改变呢? 中国互联网的发展也有20多年了,这20多年涌现了一大批互联网企…

文件夹改名:批量随机重命名文件夹,让整理更轻松

在日常生活和工作中,文件夹重命名是一件非常常见的事情。有时候,可能需要批量处理文件夹,为其加上统一的名称,或者按照某种特定的规则来重命名。然而,当我们手动进行这些操作时,会消耗大量的时间和精力。这…

Redis:Java客户端

前言 "在当今大数据和高并发的应用场景下,对于数据缓存和高效访问的需求日益增长。而Redis作为一款高性能的内存数据库,以其快速的读写能力和丰富的数据结构成为众多应用的首选。与此同时,Java作为广泛应用于企业级开发的编程语言&…

三极管-开关电路-电路电子-嵌入式开发-物联网开发-电子元件

一、概述 本文我们主要讲解电子电路中十分重要的元件--三极管。三极管常常被用来当作开关或作为放大电流的作用,下面我们将主要围绕着其作为开关电路的使用来介绍三极管。 二、分类 学习三极管前,我们必须认识三极管的三级,包含箭头的一端为发…

【论文阅读笔记】Deep learning for time series classification: a review

【论文阅读笔记】Deep learning for time series classification: a review 摘要 在这篇文章中,作者通过对TSC的最新DNN架构进行实证研究,探讨了深度学习算法在TSC中的当前最新性能。文章提供了对DNNs在TSC的统一分类体系下在各种时间序列领域中的最成功…

(1)(1.17) Maxbotix 模拟声纳

文章目录 前言 1 连接到Pixhawk 2 通过Mission Planner进行设置 3 测试传感器 4 参数说明 前言 XL-Maxbotix-EZ 系列模拟声纳(XL-MaxSonar-EZ0、EZ4 和 EZL0)是相对便宜的短距离(7m 至 10m)测距仪,主要设计用于室…

Linux系统中Qt应用程序确保使用集成显卡进行图形渲染

背景:有一个Qt开发的应用程序,使用了Qt的OpenGL模块来渲染QImage加载的图片,当应用程序切换到图片渲染界面时,系统CPU占用率立马到了100%多,容易造成程序卡顿,可设备是自带集成显卡的,期望效果是…

7 Redis的PipeLine

PipeLine的作用是批量执行命令 redis的性能瓶颈基本上是网络 import org.springframework.beans.factory.annotation.Autowired; import org.springframework.stereotype.Component; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.…

牛客::栈的压入、弹出序列

栈的压入、弹出序列 题目 输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否可能为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如序列1,2,3,4,5是某栈的压入顺序,序列4,5,3,2,1是该压栈序列对应的一个弹出序列&…

ShardingSphere-JDBC 之数据分片详细讲解

文章目录 单一节点存储问题数据分片垂直分片水平分片 ShardingSphere-JDBC 数据分片核心概念表相关概念数据节点分片行表达式分布式主键 ShardingSphere-JDBC 数据分片原理ShardingSphere-JDBC 数据分片实现示例1、数据库表创建2、引入依赖3、配置参数4、代码示例 ShardingSphe…

FPGA实现平衡小车(文末开源!!)

FPGA平衡小车 一. 硬件介绍 底板资源: TB6612电机驱动芯片 * 2 MPU6050陀螺仪 WS2812 RGB彩色灯 * 4 红外接收头 ESP-01S WIFI 核心板 微相 A7_Lite Artix-7 FPGA开发板 电机采用的是平衡小车之家的MG310(GMR编码器)电机。底板上有两个TB6612芯片,可以驱动…

Python运维监控系统之架构设计

说起Python这门编程语言的作用,可以列举很多方面,其实每一门流行的编程语言都可以列举很多方面,但是要说起Python的主要领域,莫过于运维监控方面,在这方面有大量优秀的开源运维系统。 虽然有很多优秀的开源运维监控系统…

基于springboot实现智能热度分析和自媒体推送平台系统项目【项目源码】

基于springboot实现自媒体社区平台系统演示 系统开发平台 在该自媒体分享网站中,Eclipse能给用户提供更多的方便,其特点一是方便学习,方便快捷;二是有非常大的信息储存量,主要功能是用在对数据库中查询和编程。其功能…

《微信小程序开发从入门到实战》学习十九

3.3 开发创建投票页面 3.3.7 wx:for列表渲染 接下来为创建的投票页面添加一个“添加选项”的功能。需要用户输入文字,应该使用input组件。头投票的数量是不确定的,面对不确定数量的组件的情况时,可以使用wx:for属性对组件进行列表渲染。 使…

windows pgsql 数据库 数据目录更改

一.先停止postgres服务 cmd命令 services.msc找到服务停止 二.修改注册表 cmd命令 regedit找到路径 \HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\postgresql-x64-13 将“-D”后的目录名修改为新的数据目录位置即可,如果目录路径中含有…

【C++】泛型编程 ⑦ ( 类模板常用用法 | 类模板声明 | 类模板调用 | 类模板作为函数参数 )

文章目录 一、类模板基础用法1、类模板声明定义2、类模板使用3、类模板做函数参数 二、完整代码示例1、代码示例2、执行结果 一、类模板基础用法 1、类模板声明定义 上一篇博客中 , 【C】泛型编程 ⑥ ( 类模板 | 类模板语法 | 代码示例 ) 讲解了模板类的基础语法 , 模板类声明如…

23 - 如何优化JVM内存分配?

JVM 调优是一个系统而又复杂的过程,但我们知道,在大多数情况下,我们基本不用去调整 JVM 内存分配,因为一些初始化的参数已经可以保证应用服务正常稳定地工作了。 但所有的调优都是有目标性的,JVM 内存分配调优也一样。…

计算机网络的标准化工作及相关组织

一、国际化组织 计算机网络的标准化工作由一些主要的组织来进行管理和推动。以下是几个主要的计算机网络标准化的国际组织及其相关的标准: 1. 国际标准化组织(ISO):国际标准化组织负责制定各种行业的标准,包括计算机…

Linux性能分析——TOP命令详解

我的圈子: 高级工程师聚集地 我是董哥,高级嵌入式软件开发工程师,从事嵌入式Linux驱动开发和系统开发,曾就职于世界500强公司! 创作理念:专注分享高质量嵌入式文章,让大家读有所得! …

网络割接用VRRP替换HSRP

如图3-11所示,C6500作为核心层设备上行连接出口路由器NE40E-X3,下行连接接入层设备CE6800。C6500上配置HSRP实现冗余备份网关,同时在二层网络部署MSTP破除环路。 总体思路 HSRP为CISCO私有协议,CE系列交换机(以CE1280…