R语言使用马尔可夫链对营销中的渠道归因建模

news2025/1/17 22:54:18

介绍

在这篇文章中,我们看看什么是渠道归因,以及它如何与马尔可夫链的概念联系起来。最近我们被客户要求撰写关于马尔可夫链的研究报告,包括一些图形和统计输出。我们还将通过一个电子商务公司的案例研究来理解这个概念如何在理论上和实践上运作(使用R)。

 

 相关视频:马尔可夫链原理可视化解释与R语言区制转换Markov regime switching实例

马尔可夫链原理可视化解释与R语言区制转换Markov regime switching实例

,时长07:25

 相关视频:马尔可夫链蒙特卡罗方法MCMC原理与R语言实现|数据分享

马尔可夫链蒙特卡罗方法MCMC原理与R语言实现

,时长08:47

什么是渠道归因?

Google Analytics为归因建模提供了一套标准规则。根据Google的说法,“归因模型是决定销售和转化如何分配给转化路径中的接触点的规则或一组规则。例如,Google Analytics中的最后一次互动模型会为紧接销售或转化之前的最终接触点(即,点击次数)分配100%的功劳。相比之下,第一个互动模型为启动转化路径的接触点分配100%的功劳。“

我们将在本文后面看到最后一个交互模型和第一个交互模型。在此之前,让我们举一个小例子,进一步了解渠道归因。假设我们有一个转换图,如下所示:

在上述情况下,客户可以通过渠道'C1'或渠道'C2'开始他们的旅程。以C1或C2开始的概率为50%(或0.5)。我们首先计算转换的总体概率,然后进一步查看每个渠道的影响。

P(转换)= P(C1→C2→C3→转换)+ P(C2→C3→转换)

= 0.5 * 0.5 * 1 * 0.6 + 0.5 * 1 * 0.6

= 0.15 + 0.3

= 0.45

马尔可夫链

马尔可夫链是一个过程,它映射活动并给出概率分布,从一个状态转移到另一个状态。马尔可夫链由三个属性定义:

状态空间 - 处理可能存在的所有状态的集合

转换操作 - 从一个状态转移到另一个状态的概率

当前状态概率分布 - 在过程开始时处于任何一个状态的概率分布

我们知道我们可以通过的阶段,从每条路径移动的概率以及我们知道当前状态的可能性。这看起来与马尔可夫链相似。

事实上,这是一个马尔可夫链的应用。如果我们要弄清楚渠道1在我们的客户从始至终转换的过程中的贡献,我们将使用去除效果的原则。去除效果原则说,如果我们想要在客户过程中找到每个渠道的贡献,我们可以通过删除每个渠道并查看在没有该渠道的情况下发生了多少次转化。

例如,我们假设我们必须计算通道C1的贡献。我们将从模型中删除通道C1,并查看图片中没有C1的情况下发生了多少次转换,即所有渠道完好无损时的总转换次数。我们计算渠道C1:

P(去除C1后的转换)= P(C2→C3→转换)

= 0.5 * 1 * 0.6

= 0.3

30%的客户互动可以在没有C1渠道的情况下进行转换; 而C1完好无损,45%的互动可以转换。所以,C1的去除效果是

0.3 / 0.45 = 0.666。

C2和C3的去除效果为1(您可以尝试计算,但直觉地认为,如果我们要删除或者C2或C3,我们将能够完成任何转换?)。

这是马尔可夫链的一个非常有用的应用。在上述情况下,所有渠道--C1,C2,C3(在不同阶段)被称为转换状态 ; 而从一个渠道移动到另一个渠道的概率称为转移概率。

客户旅程是一系列渠道,可以看作是一个有向马尔可夫图中的一个链,其中每个顶点都是一个状态(渠道/接触点),每条边表示从一个状态移动到另一个状态的转移概率。由于到达状态的概率仅取决于之前的状态,因此可以将其视为无记忆马尔可夫链。

电子商务公司案例研究

让我们进行真实案例研究,看看我们如何实施渠道归因建模。

一家电子商务公司进行了一项调查并收集了客户的数据。这可以被认为是具有代表性的人群。在调查中,公司收集了有关客户访问各种触点的数据,最终在其网站上购买该产品。

总共有19个渠道,客户可以遇到产品或产品广告。在19个渠道之后,还有三种情况:

#20 - 客户决定购买哪种设备;

#21 - 客户已经做出最终购买;

#22 - 客户尚未决定。

渠道的总体分类如下:

类别渠道
网站(1,2,3)公司的网站或竞争对手的网站
研究报告(4,5,6,7,8)行业咨询研究报告
在线/评论(9,10)自然搜索,论坛
价格比较(11)聚合渠道
朋友(12,13)社交网络
专家(14)在线或离线专家
零售店(15,16,17)实体店
其他 (18,19)其他,例如在各地的促销活动

现在,我们需要帮助电子商务公司确定投资营销渠道的正确策略。应该关注哪些渠道?公司应该投资哪些渠道?我们将在下一节中使用R来解决这个问题。

使用R的实现

我们读取数据,尝试在R中实现并检查结果。

> head(channel)

输出:

R05A.01	R05A.02	R05A.03	R05A.04	…..	R05A.18	R05A.19	R05A.20
16	4	3	5		NA	NA	NA
2	1	9	10		NA	NA	NA
9	13	20	16		NA	NA	NA
8	15	20	21		NA	NA	NA
16	9	13	20		NA	NA	NA
1	11	8	4		NA	NA	NA

我们将进行一些数据处理,将其带入一个阶段,我们可以将其用作模型中的输入。然后,我们将确定哪些客户已进行最终转换。

创建一个特定格式的变量'路径',可以作为模型的输入。另外,我们将使用“dplyr”包找出每条路径的总发生次数。

路径转变

路径转换
1 > 1 > 1 > 201
1 > 1 > 12 > 121
1 > 1 > 14 > 13 > 12 > 201
1 > 1 > 3 > 13 > 3 > 201
1 > 1 > 3 > 17 > 171
> 1 > 6 > 1 > 12 > 20 > 121

> channel_fin = ddply(channel_fin,~path,summarise, conversion= sum(convert))
> head(channel_fin)

输出:

路径转变

路径转换
1 > 1 > 1 > 201
1 > 1 > 12 > 121
1 > 1 > 14 > 13 > 12 > 201
1 > 1 > 3 > 13 > 3 > 201
1 > 1 > 3 > 17 > 171
1 > 1 > 6 > 1 > 12 > 20 > 121

现在,我们将创建一个启发式模型和一个马尔科夫模型,将两者结合起来,然后检查最终结果。

输出:

Output:

渠道名称首次接触转换…..线性接触转换线性接触值
113073.77366173.773661
200473.998171473.998171
127576.12786376.127863
143456.33574456.335744
13320204.039552204.039552
3168117.609677117.609677
173176.58384776.583847
65054.70712454.707124
85653.67786253.677862
10547211.822393211.822393
1166107.109048107.109048
16111156.049086156.049086
219994.11166894.111668
4231250.784033250.784033
72633.43599133.435991
56274.90040274.900402
9250194.07169194.07169
152265.15922565.159225
1845.0265875.026587
191012.67637512.676375

输出:

:

渠道名称总体转换总体转换值
182.48296182.482961
20432.40615432.40615
1283.94258783.942587
1463.0867663.08676
13195.751556195.751556
3122.973752122.973752
1783.86672483.866724
663.28082863.280828
861.01611561.016115
10209.035208209.035208
11118.563707118.563707
16158.692238158.692238
298.06719998.067199
4223.709091223.709091
741.91924841.919248
581.86547381.865473
9179.483376179.483376
1570.36077770.360777
185.9508275.950827
1915.54542415.545424

在进一步讨论之前,我们先来了解一下我们上面看到的一些术语的含义。

第一次接触转换:当该渠道是客户的第一个触点时,通过渠道进行的转换。第一个触点获得100%的功劳。

上次接触转换:当该渠道是客户的最后一个接触点时,通过渠道发生的转化。100%功劳给予最后的接触点。

回到R代码,让我们合并这两个模型,并以可视化方式表示输出。

# 绘制总转换
ggplot(R1, aes(channel_name, value, fill = variable)) +
  geom_bar(stat='identity', position='dodge') +

从上图中可以清楚地看到结果。从第一次接触转换角度来看,渠道10,渠道13,渠道2,渠道4和渠道9非常重要; 而从最后接触的角度来看,第20渠道是最重要的(因为在我们的例子中客户决定购买哪种产品)。就线性接触转换而言,渠道20、渠道4和渠道9是重要的。从总转换角度来看,渠道10,13,20,4和9非常重要。

结束

在上面的图表中,我们已经能够找出哪些是我们关注的重要渠道,哪些可以被忽略或忽视。这种情况使我们对客户分析领域马尔可夫链模型的应用有了很好的了解。电子商务公司现在可以更准确地创建他们的营销策略,并使用数据驱动的见解分配他们的营销预算。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/44602.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

QT开发教程:QScroller实现home界面滑动效果

在上章我们学习了QScroller实现home界面滑动效果,但是该界面是实现的上下滑动效果,如果想模拟手机home滑动界面,则需要实现左右滑动效果. 本章,则重写QStackedWidget类,来真正的模拟手机,来实现home界面左右滑动效果. 1.SmoothStackedWidget类实现 demo界面如下图所示(创建了…

[附源码]计算机毕业设计springboot第三方游戏零售平台

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

Discourse 在 2022-11 的最新版本中提供了新的边栏

官方有关这个边栏的说明和解释文章请参考链接: Try out the new sidebar and notification menus! - announcements - Discourse Meta 中的内容。 在这个新设计的边栏中包含了一些所有人都需要使用的快捷链接,同时还包括一些定义的快捷分类链接和 Tag 链…

haproxy keepalive实践

1 安装haproxy wget http://download.openpkg.org/components/cache/haproxy/haproxy-2.6.6.tar.gz tar -zxvf haproxy-2.6.6.tar.gz cd haproxy-2.6.6 mkdir -p /app/haproxy # 安装依赖,解决haproxy.c:80:31的问题 sudo yum -y install gcc openssl-devel pcre-devel system…

【Python】一、Python程序运行方式

文章目录实验目的一、熟悉Python的安装二、熟悉PyCharm安装三、启动IDLE,进入Python Shell,熟悉环境,运行教材案例:输出“hello world!”四、打开“命令提示符”窗口,使用pip安装管理pygame、numpy等第三方…

算法训练Day30 回溯算法专题 | LeetCode332. 重新安排行程;51.N皇后(棋盘问题);37.解数独(二维的递归)

前言: 算法训练系列是做《代码随想录》一刷,个人的学习笔记和详细的解题思路,总共会有60篇博客来记录,计划用60天的时间刷完。 内容包括了面试常见的10类题目,分别是:数组,链表,哈…

android 自定义view: 跑马灯-光圈

本系列自定义View全部采用kt **系统: **mac android studio: 4.1.3 **kotlin version:**1.5.0 gradle: gradle-6.5-bin.zip 本篇效果: 前沿 最近在bilibili看到一个跑马灯光圈效果挺好, 参考着思路写了一下. bilibili地址,美中不足的是这是html代码 QaQ 实现思路 将效果…

Spark系列之Spark启动与基础使用

title: Spark系列 第三章 Spark启动与基础使用 3.1 Spark Shell 3.1.1 Spark Shell启动 安装目录的bin目录下面,启动命令: spark-shell$SPARK_HOME/bin/spark-shell \ --master spark://hadoop10:7077 \ --executor-memory 512M \ --total-executor-…

长短期记忆网络(LSTM)重点!(自己汇集了很多资料在这篇博客)

文章目录参考资料推荐基础知识评论区精髓代码实现底层实现简洁实现参考资料推荐 心心念念 学了这么久 ,终于学到第57集了。 参考一篇掘金的图文LSTM 李宏毅老师的手撕视频配套课件 27:39 开始手撕 看完了李沐老师的LSTM又去找了李宏毅老师的课程然后发现又多了个导…

西门子机床联网

一、设备信息确认 1、确认型号 数控面板拍照确认: 此系统为:西门子828D 还有一种情况是面板无任何版本信息,这时就需要进入系统里面再确认。 2、确认通讯接口 1、数控面板的后面 X130为网络标号 2、其他位置 其他位置一般是前面位置用…

H3C mstp+vrrp实验 新华三杯拆解

H3C mstpvrrp实验一、实验拓扑二、实验要求局域网规划:可靠性:三、实验配置(一)链路聚合1.创建链路聚合组2.检查(二)VLAN1.创建vlan2.放行vlan3.检查(三)MSTP1.配置MSTP域2.配置主备…

通俗易懂的java设计模式(1)-单例模式

什么是单例模式? 单例模式是java中最简单的一种设计模式 需要注意的问题: 1.单例类有且只能有一个实例 2.单例类必须自己创建出这个实例,并提供给外界 那么如何自己创建实例而不让外界创建呢?很简单,我们将无参的构造函…

麦芽糖-刀豆球蛋白A,maltose-ConcanavalinA,刀豆球蛋白A-PEG-麦芽糖

麦芽糖-刀豆球蛋白A,maltose-ConcanavalinA,刀豆球蛋白A-PEG-麦芽糖 中文名称:麦芽糖-刀豆球蛋白A 英文名称:maltose-ConcanavalinA 别称:刀豆球蛋白A修饰麦芽糖,ConA-麦芽糖 还可以提供PEG接枝修饰麦芽糖,麦芽糖…

SpringCloud-alibaba-Nacos 从理论到落地使用

Nacos: Dynamic Naming and Configuration Service 就是: 一个更易于构建云原生应用的动态服务发现、配置管理和服务管理平台。、 下面是生态图: Nacos EurekaConfig Bus 即 Nacos就是注册中心 配置中心的组合 他能干什么呢? 1、替代Eu…

防火墙firewalld

RHEL7中有几种防火墙共存:firewalld、iptables、ebtables等。基于iptables的防火墙默认不启动,但仍然可以继续使用。RHEL7默认使用firewalld作为防火墙,管理工具是firewall-cmd。RHEL7的内核版本是3.10,在此版本的内核里防火墙的包…

论文阅读2 Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

目录 问题 创新 1、Introduction 2、相关工作 3、HAKE模型 原文:[1911.09419] Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction (arxiv.org) 问题 现有的知识图嵌入模型主要关注对称/反对称、反转和复合symmetry/antisymmetry, i…

EquiVSet

又搬来一个于最优子集的神经集合函数学习方法 集合函数被广泛应用于各种场景之中,例如商品推荐、异常检测和分子筛选等。在这些场景中,集合函数可以被视为一个评分函数:其将一个集合作为输入并输出该集合的分数。我们希望从给定的集合中选取…

【新知实验室-TRTC开发】实时音视频之欢度世界杯

目录 一、什么是TRTC 二、用5分钟跑通一个demo 1、开通腾讯云-TRTC 2、获取demo必须的两把钥匙 2.1输入应用名称 2.2下载对应的源码包(手机、web、小程序等) 2.3拿到钥匙 2.4完成 三、搭建一起看世界杯应用 1、解压源码(耗时30S&#x…

Linux下top命令详解

Linux下top命令用法详解 作为一名Linux软件攻城狮,top命令大家应该并不陌生。top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况。top可以动态显示过程,不断刷新当前状态。top命令提供了实时的对系统处理器的状态监视。它将…

Kotlin高仿微信-第5篇-主页-通讯录

Kotlin高仿微信-项目实践58篇详细讲解了各个功能点,包括:注册、登录、主页、单聊(文本、表情、语音、图片、小视频、视频通话、语音通话、红包、转账)、群聊、个人信息、朋友圈、支付服务、扫一扫、搜索好友、添加好友、开通VIP等众多功能。 Kotlin高仿…