常见的九种大数据分析模型

news2025/1/24 2:27:02

常见的9种大数据分析模型分别为:
事件分析、
属性分析、
渠道分析、
Session分析、
留存分析、
归因分析、
漏斗分析、
路径分析、
分布分析

1、【事件分析】
事件分析,是指用户在 APP、网站等应用上发生的行为,即何人,何时,何地,通过何种方式,做了什么事。
事件分析模型主要用于分析用户在应用上的行为,比如打开 APP、注册、登录、支付订单等。通过触发用户数、触发次数、访问时长等基础指标度量用户行为,同时也支持指标运算,构建复杂的指标衡量业务过程。
那么,事件分析模型能够解决哪些问题呢?
例如:
监测产品每天的用户数、访问次数、使用时长;趋势是否发生了变化?
引起变化的因素有哪些?
北京地区的用户和上海地区的用户,购买家电品类的金额分布差异在哪里?
今天在产品中发起了一个话题,各个时段用户的参与情况如何?
最近半年付费用户数和 ARPU 值是多少?

事件分析模型能够实时监测用户在不同平台的用户行为,通过不同维度归因指标变化因素,还能通过自定义指标组合成新的指标实现更为强大的分析能力。

在这里插入图片描述

2、【属性分析】
属性分析是基于用户自定义属性或预置属性的占比分析,能够按照不同的属性来统计用户数等指标的属性占比,进而得到初步的分析结论。例如,通过对性别属性的用户数占比分析,我们可以快速得到不同性别的用户数统计结果。

通过属性分析,可以快速查看在不同属性上的用户数分布情况,便于统计不同特征的用户总量,在使用属性分析的过程中,需要合理选择度量方式,常用的度量方式包括:用户数、去重数、总和、最大值、最小值、均值等。

例如:我们选择的指标为“累计消费金额的均值”,维度为“会员等级”,用户选择“所有用户”,那么我们得到的结果是“所有不同会员等级用户的平均消费金额是多少”。

属性分析模型同事件分析模型类似,可以进行多维度多用户之间的对比、多种图表形式展示统计结果。在有标签功能的场景下,还可以对不同版本标签的统计对比分析。

在这里插入图片描述

3、【渠道分析】

渠道,即企业(产品)与用户产生互动的各个触点,比如搜索引擎、社交媒体、广告平台、线下站会等等。

渠道分析模型用于分析用户(包括访客)的访问来源,通过访问用户数、访问次数、访问时长、跳出率等基础指标评估渠道质量,同时也支持自定义转化目标衡量渠道的转化效果。

那么,渠道分析能够解决哪些问题呢?
例如:
各个渠道实时的访问用户数、浏览量如何?
上周选择了多个渠道对网站进行推广,各个渠道带来的用户注册量如何?
社交媒体、搜索引擎、外部链接……哪个渠道带来的用户留存率更高?
微信来源用户更多集中在公众号还是朋友圈?
哪些搜索词带来的流量很大,且转化效果也好?

渠道分析模型通过定义基础指标和转化指标、选择分析平台、渠道维度,就能够清晰地呈现各渠道表现,从而评估不同渠道的实际产出效果,最终选择优质渠道组合,提高整体ROI。

在这里插入图片描述
4、【Session分析】
Session,即会话,是指在指定的时间段内在网站/H5/小程序/APP上发生的一系列用户行为的集合。
例如,一次会话可以包含多个页面浏览、交互事件等。Session 是具备时间属性的,根据不同的切割规则,可以生成不同长度的 Session。

Session分析模型含多种度量 Session 访问质量的指标,包括访问次数、人均访问次数、总访问时长、单次访问时长、单次访问深度、跳出次数、跳出率、退出次数、退出率、人均访问时长、总页面停留时长、平均页面停留时长。

在这里插入图片描述
不同于事件分析,Session 分析中额外支持了一些维度的细分,以满足特定场景下针对 Session 分析的需求,包括:

渠道来源分组:用以区分每次访问的渠道来源,仅适用于 Web/H5/小程序;
浏览页面数:以步长5为间隔,统计每次浏览页面数的分布情况;
着陆页:用以区分每次访问的着陆页,可以评价不同着陆页的访问质量;
退出页:用以区分每次访问的退出页,可以评价不同页面的退出情况,找到退出率高的页面进行优化;
访问时长:按照 0-3 secs,3-10 secs,10-30 secs,30-60 secs,1-3 mins,3-10 mins,10-30 mins,30-60 mins,1 hour 以上的区间进行划分,统计每次访问的时长分布。

同事件分析类似,Session 分析也支持多指标、多维度和多过滤条件,同时也支持多用户分群之间的横向对比。同时在 Session 分析中,还支持按照日、周、月三种不同粒度来进行统计分析,用户可以根据查询数据的时间跨度来选择合适的粒度进行分析。

5、【留存分析 】
留存分析 留存是指用户在 APP、网站等应用上使用过,并一段时间后仍有使用。

留存分析模型是一种衡量用户健康度/参与度的方法,超越下载量、DAU 等指标,深入了解用户的留存和流失状况,发现影响产品可持续增长的关键因素,指导市场决策、产品改进、提升用户价值等。

那么,留存分析模型能够解决哪些问题呢?
例如:
上个月做了一次产品迭代,如何评估其效果?
是否完成了产品经理期望完成的行为?
作为一个社交 APP,在注册后不添加好友和添加 10 个好友的用户后续留存有差异吗?
短期留存低,长期留存一定很差吗?
两个推广渠道带来不同的用户,哪个渠道的用户更有可能是的高价值用户?
近 30 天注册的用户,半个月都没有回访的用户比例是多少?

留存分析模型支持条件过滤和多人群的对比分析,支持对全量数据随机抽样计算。同时我们还可以通过留存分析判断新用户在几天、几周、几月后是否愿意回来使用你的功能,还可自定义初始行为和结束行为进行功能留存分析。

在这里插入图片描述
留存是基于某个用户群体的初始行为时间来计算的,描述发生了某个行为的同期群,在一段时间后是否发生了期望的行为。初始行为和后续行为均可以是任意事件或者某个具体的事件。

不同的分析场景中可以设置多个不同的留存条件来分析:
初始行为和后续行为设置为相同,对比不同的功能重复发生的情况,发现用户对不同功能的使用粘性;
初始行为相同,设置不同的后续行为,对比同一个优化是否对其他功能有不同的影响;
后续行为相同,设置不同的初始行为,对比发现不同的运营手段、产品功能对核心业务目标的影响。

6、【归因分析】
归因分析 在做运营活动时,我们可能会在产品内的多个运营位上投放活动素材,试图在用户与产品交互过程中的各个触点上,吸引用户的注意力,引导流量走向和用户行为,促成最终转化。此外,用户本身可能还会通过搜索、内容推荐等触点获取信息,这些触点对用户是否能达成转化也发挥着重要作用。
也就是说,在用户转化路径上,站内的众多触点都参与了对用户的劝说和引导,影响了用户的最终决策。那么,对比各个用户触点,它们对关键指标的达成分别贡献了多大力量,是否都如运营人员所预期的那样,具有优秀的转化能力;亦或者,存在被低估的情况?在之后的运营中,该如何调整对各运营位资源投入的权重分配?

对于以上问题,归因分析提供了一种直观的度量 —— 转化贡献度,主要用于衡量和评估站内的用户触点对总体转化目标达成(如订单总金额)所作出的贡献,可以非常直接地量化每个运营位和触点的转化效果和价值贡献。常见的归因分析模型有以下五种
在这里插入图片描述
首次触点归因:
将转化功劳 100% 归于首次互动的待归因事件;
末次触点归因:将转化功劳 100% 归于末次互动的待归因事件;
线性归因:将转化功劳平均分配给转化路径上的所有待归因事件;
位置归因:按待归因事件在转化路径上的位置分配转化功劳,一般首次和末次互动的事件各占 40%,中间触点的事件均分剩余的 20%; 时间衰减归因:按待归因事件发生的时间顺序,分配转化功劳,距离目标事件发生时间越近的待归因事件,做出的贡献越大,分配到的功劳越多。

7、【路径分析】
路径分析 路径是指用户在应用中使用的行为轨迹。在产品运营过程中,无论是产品、运营还是市场团队都希望能够清晰地了解用户行为路径,来验证运营思路、指导产品迭代优化,达到用户增长、转化的最终目的。

当有明确的转化路径时,通过预先建立漏斗来监测转化率会比较容易。但是很多情况下,虽然有最终的转化目标,但是用户到达该目标却有多条路径,无法确定哪条路径是用户走得最多的路径,哪条转化路径最短,这时候就需要智能路径分析模型的帮助。
在这里插入图片描述
通过智能路径分析模型能够解决如下问题:

用户主要是从哪条路径最终形成支付转化的?
用户离开预想的路径后,实际走向是什么?
不同特征的用户行为路径有什么差异?

8、【漏斗分析】
漏斗分析,是分析用户使用某项业务时,经过一系列步骤转化效果的方法。漏斗分析模型能够灵活自定义多步骤之间的转化过程,找到关键流失环节及影响因素,进而分析用户行为进行针对性优化动作。

在这里插入图片描述
官网流量很大,但注册用户很少,是过程中哪个环节出了问题?
用户从“注册 – 绑卡 - 提交订单 - 支付订单” 总体转化率如何?
不同地区的用户支付转化率有什么差异?
两个推广渠道带来了不同的用户,哪个渠道的注册转化率高?
上周针对注册环节的问题做了一次优化,转化率趋势是否有提升?

在理想情况下,用户会沿着产品设计的路径到达最终目标事件,但实际情况是用户行为路径是多种多样的。通过埋点事件配置关键业务路径,可以分析多种业务场景下转化和流失的情况,我们不仅找出产品潜在问题的位置,还可以定位每个环节流失用户,进而定向营销促转化。

9、【分布分析】
分布分析主要能够提供「维度指标化」之后的数据分解能力,将原有维度按照一定的数值区间进行维度划分,进而分析每个维度区间的分布情况,在以下分析场景中十分常见:分析订单的金额分布、分析某类特殊事件的发生时段分布、分析某类特殊事件的发生次数分布、分析触发某类事件的用户年龄分布。

在这里插入图片描述
由此可见,分布分析主要针对的是数值型和日期型这两类属性,如金额、年龄、时间、频次,因此当用户打点上传的数据中包括这两类属性时,那么在日常的分析中就有可能会使用分布分析来解决一些特定问题。常用指标有:X 事件的次数分布、X 事件的活跃时段分布、X 事件的活跃天数分布、X 事件 Y 属性的总和/均值/人均值等分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/440029.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python OpenCV 蓝图:1~5

原文:OpenCV with Python Blueprints 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 计算机视觉 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 当别人说你没有底线的时候,你最好真…

【AI】NVIDIA CUDA-X AI名词解释

0、NVIDIA CUDA-X AI NVIDIA CUDA-X AI是一套完整的深度学习软件 官网:https://developer.nvidia.com/deep-learning-software https://github.com/NVIDIA:NVIDIA产品、演示、示例、入门教程 1、深度学习训练 Deep Learning Training 1.1、DALI 数据加载库 (DALI)是一…

Redis实现分布式锁原理和Redisson框架实现分布式锁,全网最详细讲解

声明:我的大部分篇幅都讲的分布式锁的原理和实现,如果想直接用Redisson框架实现分布式锁,可以直接翻至最后面 关于分布式锁,适用于并发量特别大的微服务集群,能做到同步的实现资源的获取 我其实没有经过真实项目的分布…

MySQL调优笔记——慢SQL优化记录(1)

上周,项目出现线上问题,在这家公司做的是一个SAAS平台,总用户量大约10万人; 经过排查,发现是SQL问题,导致数据库响应慢,进而拖垮了整体服务; 通常,查询耗时较长的SQL涉…

Java优先级队列-堆

Java优先级队列-堆 💐1. 二叉树的顺序存储💐🎃 1.1 存储方式🎃👻1.2 下标关系👻 🌸2. 堆(heap)🌸🌞2.1 概念🌞🌝2.2 操作-向下调整🌝&…

SER | 语音情绪识别中的TIM-NET_SER项目复现

大家好,今天复现的是目前语音情绪识别的SOTA论文,论文中文名称是 时间建模的重要性: 用于语音情感识别的新型时空情感建模方法 。论文中训练的数据集有英文德语等几个语音情绪识别中常见的语音情绪数据集,以对比精度权重等效果~各…

Android 下一代架构指南:DDD

移动端架构与网站架构的区别是什么?网易新闻客户端的架构演进历程是怎样的?为什么要选择 DDD 思想来指导重构?DDD 落地中应当关注哪些方面?带着这些问题我们来看下文。(节选自网易新闻App架构重构实践) 当…

Kafka吞吐量

目录 kafka的架构和流程 小文件对HDFS影响: 解决办法: kafka的架构和流程 ⾸先Kafka从架构上说分为⽣产者Broker和消费者,每⼀块都进⾏了单独的优化,⽐如⽣产者快是因为数据的批量发送,Broker快是因为分区,分区解决了并发度的问题,⽽且⽂…

媒体宣传的优势与重要性

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 媒体宣传日益成为企业和品牌宣传推广的重要手段,媒体的宣传报道更有权威性,能够帮助品牌进行背书,更有权威性,另外媒体的报道在搜索引擎中…

基于GPS/北斗卫星技术的无盲区车辆调度系统

基于GPS/北斗卫星技术的无盲区车辆调度系统 现代车辆调度系统是一种集全球卫星定位技术(GPS)、地理信息技术(GIS)和现代通信技术于一体的高科技项目。它将移动目标的动态位置(经度与纬度)、时间和状态等信息…

linux环境搭建jmeter、ant、git、Jenkins、jdk、Tomcat

我在搭建环境时,将jmeter、ant、jdk、Tomcat都放在陆opt文件夹下 1.下载jmeter、ant、Jenkins(Jenkins.war包)、jdk、Tomcat Linux环境下安装Jenkins,需要jdk版本大于11 2.环境配置 jdk配置 vim /etc/profile 添加配置信息&am…

飞书接入ChatGPT - 将ChatGPT集成到飞书机器人,直接拉满效率 【飞书ChatGPT机器人】

文章目录 前言环境列表视频教程1.飞书设置2.克隆feishu-chatgpt项目3.配置config.yaml文件4.运行feishu-chatgpt项目5.安装cpolar内网穿透6.固定公网地址7.机器人权限配置8.创建版本9.创建测试企业10. 机器人测试 前言 在飞书中创建chatGPT机器人并且对话,在下面操作步骤中,使…

LBS找外贸客户 外贸怎么找客户

随着全球贸易的不断发展,越来越多的企业开始寻找更多的客户和销售机会。而随着移动互联网的普及,LBS已经成为了人们生活和工作中不可或缺的一部分。在商业领域中,LBS被广泛应用于定位、导航、营销等方面,为企业提供了更加便捷、精…

如何在Mac VM Fusion上安装和使用Plan 9

我在 Mac 上使用 VM Fusion 安装 Plan 9 的时候遇到了很多问题,官方文档和有些前两年的国外的一些博客并没有写清楚,甚至出现了“误导”的情况(有些情况变了)。所以来写本文帮助其他也遇到的问题的人。 如果你能看到这篇博客&…

上传ChatGPT相关资源,瓜分¥5000元奖金池

一、活动时间 资源类型时间上传地址上传【ChatGPT的原理分析】资源4月17日-4月30日https://upload.csdn.net/creation/uploadResources?taskId643925fde212675bb64a3984&utm_sourceblog上传【Chatgpt的多种使用方法】资源4月15日-4月30日https://upload.csdn.net/creatio…

介绍NPOI 的颜色卡、名称以及索引

文章目录 前言 遍历NPOI颜色 前言 使用NPOI的颜色时,一些颜色类的名称很难想象出具体对应的颜色,所以有了下面的对照表,方便使用。 NPOI 颜色的索引范围是 8~64,超出范围无效。 色彩类名索引Index名称#000000HSSFColor.Black8黑色#ffffffH…

【C++ 一】C++ 入门、数据类型、运算符

C 入门、数据类型、运算符 文章目录 C 入门、数据类型、运算符前言1 C 初识1.1 第一个C程序1.1.1 创建项目1.1.2 创建文件1.1.3 编写代码1.1.4 运行程序 1.2 注释1.3 变量1.4 常量1.5 关键字1.6 标识符命名规则 2 数据类型2.1 整型2.2 sizeof 关键字2.3 实型(浮点型…

【最详细最完整】windows 安装 Oracle Java环境

windows 安装Oracle Java环境 一、安装教程二、验证Java环境 前言:公司有个app的项目,我是打算使用uniapp来实现,那么调试是需要使用到java环境,所以我本地就得安装java环境,接着我找了好多文章发现没有相对完整的&…

在头部大厂做了13年云计算后,这次他想系统地聊聊FinOps!

随着企业上云战略的深入普及,越来越多的企业开始关注云成本优化。伴随着企业对IT资源的投入不断增加,企业迫切需要解决成本与效率,以及如何将云成本优化落到实处的问题。 FinOps是将财务和业务整合到一起的变革,可以帮助企业更好…

抖音数字人主播app

抖音数字人主播app是指一款利用计算机生成的虚拟数字人,在抖音平台上进行实时音视频传输和互动的应用程序。该软件可以让用户创建自己的虚拟数字人,并在抖音平台上进行实时互动和交流。 抖音数字人主播app通常需要包含以下功能: 3D建…