VOC数据洞察在淘宝详情页的应用与实践

news2024/11/26 19:29:29

9006ba1626729976521daf902b22cd5e.gif

本专题共10篇内容,包含淘宝APP基础链路过去一年在用户体验数据科学领域(包括商详、物流、性能、消息、客服、旅程等)一些探索和实践经验,本文为该专题第二篇。

在商详页基于用户动线和VOC挖掘用户决策因子带来浏览体验提升;在物流侧洞察用户求助时间与实际物流停滞时长的关系制订表达策略带来物流产品满意度提升;在性能优化域构建主客观关联模型找到启动时长与负向反馈指标的魔法数字以明确优化目标;构建多源VOC标签体系综合运用用户行为和用户VOC洞察、落地体验优化策略,并总结出一套用户体验分析方法论。

本文为此系列第二篇文章,前一篇见——

第一篇:淘宝用户体验分析方法论

900a60589a79df869917400c5bf42b56.png

前言

用户体验是用户在使用产品过程中建立起的一种主观感受,它与用户的预期强相关,不同用户带着不同的需求使用同一款产品体验存在着差异,倘若能够通过数据感知这些差异并形成产品优化策略落地,势必会给产品带来体验提升。

在本文中,笔者将简要介绍数据科学如何基于用户行为动线和用户VOC(Voice Of Customer)数据构建指标和标签,洞察用户行为动线和用户意图差异点,挖掘影响消费者在详情浏览体验的关键因素,指引产品落地优化策略并带来体验提升效果。此外,本文将采用BPPISE数科案例框架编写,以便读者能够清晰地理解整个案例的工作过程。

df06110d0ed97a32697ce4442753b701.png

业务背景

通过用户满意度调研获知,消费者在宝贝详情页上对关键信息获取和信息筛选效率存在较大的诉求,彼时行业关键因子(尺码、参数、成分等)分散,前台固定心智表达待提升。为提升消费者在详情浏览体验,我们希望围绕行业维度差异决策因子,对商品主图、首屏信息等关键模块进行升级,提升消费者决策链路流畅度,进而带来商家经营增量。

传统的商品决策因子供给依赖行业小二的经验输入,部分行业依靠用户调研,范围有限、粒度较粗,无法细化到类目、人群维度进行精细化运营。因此,在本案例中,数据科学综合运用主客观数据建立分析模型,洞察出不同人群、类目下用户在详情的行为和需求和差异点,给出产品体验优化建议,设计AB实验验证效果。


9fb8663e1549048875f967da20ec312b.png

问题定义

数据科学是一门将“现实业务问题”转换为“数据世界中的问题”,再采用数据科学的理论、技术和工具等将数据转化为知识,为解决业务问题提供直接指导的学科。围绕业务问题,我们需要准确地定义出数据可解的问题。

▐  数据选择

巧妇难为无米之炊,在定义数据问题前,首先要明确需要哪些数据来解决问题,以确保问题的可衡量性。在了解业务问题的基础上,思考详情产品体验升级背后的核心假设为:不同的用户带着不同的需求进入手淘后浏览不同类目商品其关注因素可能不同,若详情产品构建灵活的差异化承接能力,势必会给决策效率和成交转化率带来增长机会

基于该假设可以推导研究两类数据对解决问题会启到关键作用:

  1. 用户动线数据:用户在进入到离开详情的一系列时序行为数据,包括模块的曝光、滑动、点击、停留等,该类数据能反应出用户具体表现。

特别地,有别于传统的页面级埋点数据(即页面浏览、曝光、点击事件),该场景需要精细化到单个页面内的模块级埋点数据(包括模块滑动、曝光、点击、停留等)。

  1. 用户原声数据(VOC):用户通过APP反馈渠道吐露的原声,该类数据可提取出不同用户对不同商品信息表达的不同需求。

特别地,由于VOC来源渠道多,文本信息处理复杂且成本较高, 需要精准地选择目标数据,以在项目中保持方向和专注。

VOC渠道

数据特点和限制

商家客服咨询

用户在售前、售后产生的与商品、服务咨询,偏主动

APP用户反馈

用户使用手淘过程中遇到产品体验问题,偏售前、主动

平台求助

用户下单后遇到的求助、纠纷类问题,偏售后、主动

商品评价

用户收货后的评价,偏售后、被动

问大家

用户C2C对商品信息的咨询,偏售前、主动

淘宝VOC数据源及特点汇总

结合淘宝VOC数据特点和限制,选择商家客服咨询作为本案例中了解用户对详情商品表达差异化需求的目标数据源。特别地,选择该数据是基于一个基础认知:消费者从商详入口进线咨询的第一句有效语聊大概率是该用户在售前针对商品信息最关注的问题,即最能体现出用户需求。该问题可能是对商品的疑虑、信息缺失、咨询建议等。

▐  问题定义


在确认具备解决业务问题的目标数据后,我们给出本案例的数据问题定义:

如何基于用户动线及商家客服咨询VOC建立数据模型,分析归纳影响用户在详情决策的关键因素,洞察不同行业不同人群决策因子差异以指导详情产品结构化表达策略,提升浏览转化效率。

9f4b0b2d65913d27e3c5744951b44dc3.png

数据准备

数据的收集、加工和预处理是数据科学的重要一环,本节介绍如何准备模块级的埋点、VOC标签数据,确保提供干净、一致、可用基础数据,以帮助项目获得更准确的结果。

▐  用户动线数据

模块

事件

埋点名称

埋点参数

价格模块

曝光

曝光-主页-价格组件-展现

Page_Detail_Show-Price

点击

控件-主页-价格组件-点击

Page_Detail_Button-Price

标题模块

曝光

曝光-主页-品牌业务标-展现

Page_Detail_Show-Brand

点击

控件-主页-品牌业务标-点击

Page_Detail_Button-Brand

曝光

曝光-主页-标题组件-展现

Page_Detail_Show-Title

点击

控件-主页-标题-长按-分享

Page_Detail_Button-GoodsTitleShare

...

...



详情事件埋点示意表

用户动线数据重点介绍下埋点采集环节:有别于传统的客户端页面埋点, 本案例需要精确到页面内模块级的分析,因此自定义了一套埋点规范以感知用户在模块间关注点差异。如上表,定义并收集了详情内标题、属性参数、图文详情等多个模块组件的点击、展现、消失埋点,以支撑产出用户核心浏览指标(控件曝光率、点击率、关闭率、横滑率、停留时长等)。

▐  用户VOC数据

商家客服咨询会话数据隐藏着大量用户对商品的诉求和决策信息,为了支撑后续结构化分析,需要对VOC数据进行标签化工作,以确保数据的可用和高效。

  • 标签设计

一级标签

二级标签

三级标签

商品咨询

商品参数

产地、存储方式、成分、...


商品包装

包装方式、规则数量...


商品使用

食用方式、注意事项


...

...

库存咨询

是否有货

...

...

...

...

VOC标签设计示例

为保证标签数据产出的一致性,有必要明确标签设计原则,标签分为三级:

  1. 一级:for跨行业可对比分析的通用咨询类型,咨询话术不因商品、行业的差异性有显著区别;

  2. 二级:for单个行业内跨一级类目可对比分析的咨询类型,在一类的咨询关键词里语义相近,比如食品行业内,茶vs乳制品;

  3. 三级:for单个一级类目内跨叶子类目可对比分析的咨询类型,在一类的咨询关键词里语义相近,比如茶类目下,普洱vs花草茶。三级包括:采摘时间、适用茶具、生长季节等。

  • 标签提取

61f2f0ec94b8704751121de04591b247.png

标签提取流程示意图

VOC标签的提取工作本质是一个文本分类问题,NLP分类随着Bert提出和演进趋于成熟,影响分类效果的关键因素是如何构建准确的训练集。结合业务现状诉求,对构建训练集要求如下:

  1. 训练集应尽可能覆盖可能出现的数据情况以确保模型泛化能力

  2. 构建训练集过程应尽可能高效以满足项目节奏且节约加工成本

上图,为解决a、b两项问题,在流程中先通过文本聚类,对同一类目下用户原声进行归纳以全面感知用户咨询意图构成,标签生产迭代过程中可在较短周期内对标签定义达成共识,提升训练集构建效率。

实际的用户原声数据中会存在长短句不一致问题,常规文本聚类方法(例如通过TF-IDF/Word2Vec再求均值生成句子向量的方式)聚出来类簇很散、准确度较低,聚类结果也无法作为标注结果。该案例中,采用BIO+CRF的方法对VOC进行二元关键短语提取,结合词性判断进行特征提取,组装为:动词+动词、动词+名词、形容词+名词等组合,再通过DBSCAN进行聚类。该类方法的特点在于:

  1. 关键短语提取:一段短文本中最能代表其核心含意大概率是一段二元的短语组合,且动词+动词、动词+名词、名词+形容词等短语组合最能突显短文本中心思想。如:页面#打不开(n+adj)、关闭#交易(v+n)。

  2. DBSCAN聚类:针对一个新的商品类目,无法评估可设计的标签数及对VOC的整体利用率。基于密度的DBSCAN聚类法天然将VOC划分为两大类:可构成类簇、不可构成类簇(噪声);可统计噪声占比指标评估VOC利用率,持续优化生产链路中各类参数。

8d2790b3c131536104bf3e91139d99b8.png

分析洞察

准备好所需数据后,我们着手开始分析,通常是4步走:明确分析目标、设计分析思路、形成分析结论、落地数据策略。

▐  分析目标

详情动线分析的三大主体为“用户”、“商品”、“浏览行为”,围绕“什么样的用户”进入“什么商品”产生了“什么样的浏览行为”采集各模块的浏览、点击、停留时长数据及行为时序。综合归纳主流用户的行为路径及关注信息,对产品体验进行升级,满足消费者诉求;同时挖掘部分用户的行为及关注点差异,判断是否具备业务放大价值。

  1. 什么样的用户:客观特征(年龄、消费力、性别等)+主观意图(买/逛)

  2. 什么商品:品类、决策周期、价格特征等

  3. 什么样的浏览行为:模块曝光点击率、停留时长、跳失情况等

▐  分析思路

动线分析是基于如下假设:不同人群、类目、场景的用户决策因子的差异化和增强表达,可提升详情用户浏览体验,提升购物决策效率。

  • 假设树

f12935640eb4f0fa15328d966d2b1c12.png

  • 分析维度

5e8a811162797d4c82e8fa4b9ad25be3.png

  • 分析指标

6c7ef57398ab0639742dc030c4f0c184.png

▐  分析结论(男装)

  • 动线分析

bc6d2904a224d32a0839b48bf60536f2.png

  • VOC分析

fa114e28ee7363176d75f4ed99970a85.png

▐  策略产出(男装)

  • 整体结论

对于男装类目的详情页,用户对a、b、c模块的关注高,a模块引导客服多,主要由于现有详情可能存在细节图/效果展示缺失、尺码成分基础信息不容易查找等体验问题。对于男装购买决策而言,用户主要关注尺码、质量、...等(有季节特性)。

从来源看,首猜来源的用户逛的特点显著,更倾向于通过店铺推荐或进店寻找感兴趣的商品;而直播页来源的用户整体浏览深度显著较浅...。

从人群看,男性用a模块的意愿高且更关注款式,会员更关注x,新客更关注y,高购用户更关注z。

从类目看,用户在x类目中,对a、b、c的关注显著更高。

  • 优化建议

基于分析结论给出产品优化建议,需明确业务是否采纳,跟进落地节奏。特别地,数科同学对产品/业务的认知和了解程度不同,其优化建议并不一定每次都被采纳,部分建议存在着历史已上线的情况,需与产品同学紧密沟通以推进落地。

449e128cd0caced607ea3ea59c2a7d90.png

64e25b97a009fdf001ae41b60c66df65.png

策略落地

9714a4aa12822dd9ce85926a6b4b8ccc.png

b56430d26f6da65ef2283e696257b3a0.png

31e634e530faca2106f50f7e2126dd68.png

效果评估

实验分层

d4e35dadbd0f022a8a25e1e1c8d5b715.png

实验数据:笔数转化率显著+x%,单uv价值显著+y%,成交uv转化率微正;人均ipv显著-a%、人均停留时长显著-b%。

实验解读:基于本案例的优化方法能明显提升详情产品转化效率(笔数转化率显著提升),增强用户决策效率(人均ipv和停留时长显著降低),但同时也未能让更多用户转化(成交uv转化率效果微弱),本质上带来的是产品体验的提升,效果符合预期。

efe345fa0d62c56cc4ec30c47fbbee04.png

团队介绍

我们是大淘宝技术交易履约数据科学团队,负责面向淘宝交易履约链路(下单、支付、购物车、物流、逆向等)海量数据挖掘DAU、DAC及用户体验增长机会。团队致力于围绕用户行为路径、用户VOC洞察用户需求,基于人货场匹配落地交易链路触达、转化、复购和体验策略,提升消费者购物体验。
 目前团队招聘中,欢迎拥有消费者、商品、交易、营销等相关领域数据分析/数据科学背景的优秀人才加入,有兴趣可将简历发送至zhuqi.zq@taobao.com 。

¤ 拓展阅读 ¤

3DXR技术 | 终端技术 | 音视频技术

服务端技术 | 技术质量 | 数据算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/665466.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何使用 PowerPoint 2021 制作演示文稿(PPT)?

软件安装:办公神器office2021安装教程,让你快速上手_正经人_____的博客-CSDN博客 引言 PowerPoint 是一款非常常用的演示文稿制作工具,它可以帮助您创建漂亮的幻灯片,展示您的想法和信息。如果您是 PowerPoint 的新手&#xff…

如何选择初始化向量【密码学】(5)

目录 一、分组算法如何计算 二、什么影响算法的安全性 三、密钥的使用次数限制 一、分组算法如何计算 分组算法包括3个部分:数据分组,分组运算和链接模式。 数据分组:将数据分割成加密函数能够处理的数据块,如果不能整分&#x…

【MYSQL篇】mysql不同存储引擎中索引是如何实现的?

前言 不同的存储引擎文件是不一样,我们可以查看数据文件目录: show VARIABLES LIKE datadir;每 张 InnoDB 的 表 有 两 个 文 件 ( .frm 和 .ibd ), MyISAM 的 表 有 三 个 文 件 (.frm、.MYD、.MYI&…

简单的PWN堆栈溢出的尝试

这是一道2018年西电CTF线下赛的一道ez_pwn的小题目,该题目为堆栈溢出漏洞的利用1 本次实验环境为 ubuntu 20.0.4 使用工具:GDB pwngdb 首先分析文件大致情况 checksec ez_pwn Arch: amd64-64-little 表示该二进制文件是 64 位的 。 RELRO: Partial R…

计算机网络课程设计——中小型网络工程设计

文件地址:https://github.com/Recursiondzl/Computer-Network github里面有课设文件,别白嫖,点个star哦 摘 要:本次计算机网络实践,完成了中小型网络工程设计与实现对计算机网络知识进行了系统的复习,实践能力获得了…

0基础学习VR全景平台篇第45篇:编辑器底部菜单- 关联场景功能操作

大家好,欢迎观看蛙色VR官方系列——后台使用课程! 本期为大家带来蛙色VR平台,底部菜单—关联场景功能操作。 一、本功能将用在哪里? 关联场景,是某个场景下的子场景,也可以理解为VR漫游作品的三级分组&…

1-简单回归问题

一.梯度下降(gradient descent) 1.预测函数 这里有一组样本点,横纵坐标分别代表一组有因果关系的变量 我们的任务是设计一个算法,让机器能够拟合这些数据,帮助我们算出参数w 我们可以先随机选一条过原点的直线&#xf…

【GESP】2023年03月图形化一级 -- 小猫捉老鼠

文章目录 小猫捉老鼠1. 准备工作2. 功能实现3. 设计思路与实现(1)角色、舞台背景设置a. 角色设置b. 舞台背景设置 (2)脚本编写a. 角色:Mouse1b. 角色:Cat 2 4. 评分标准 小猫捉老鼠 1. 准备工作 &#xff…

Vue3项目中使用vue-router

目录 1、Vue Router 的主要概念和功能2、什么是 vue-router?3、为什么需要 vue-router?4、基本概念和安装4.1 了解单页面应用(SPA)和路由的基本概念4.1.1单页面应用(Single Page Application,SPA)4.1.2路由…

【运维知识进阶篇】zabbix5.0稳定版详解3(监控Nginx+PHP服务状态信息)

这篇文章继续给大家介绍zabbix监控,监控Nginx、PHP等服务,其实非常简单,难点在于如何去取这个值,包括监控业务,难点在于思路是否清晰,思维是否活跃,如何去进行判断是否有这个业务,并…

小白到运维工程师自学之路 第三十四集 (redis的基本使用)

一、概念 Redis是一个开源的内存数据结构存储系统,它可以用作数据库、缓存和消息中间件。Redis支持多种数据结构,如字符串、哈希表、列表、集合、有序集合等。Redis的特点是数据存储在内存中,因此读写速度非常快,同时也支持数据持…

【Vue3+Ts project】认识 @vueuse/core 库

目标: 根据屏幕宽度改变 实现动态获取盒子的宽度 目录 目标: 一、javascript实现 二、vueuse/core 库实现 一、javascript实现 1.首先 window.innerWidth 获取当前屏幕宽度,然后将 盒子宽度 除 375 乘 当前屏幕宽度 150 / 375 * window.innerWidth 2.将获取的…

千万不要跟随这 4 种领导!

​ 见字如面,我是军哥! 最近有程序员读者问我,什么样的领导不能跟随?都有哪些坑!这个我擅长哈,毕竟职场混迹 15 年~ 第一种,技术能力不行还喜欢指手画脚的领导。 第二种,…

鹏云网络分布式块存储社区版问世,首发开源存储解决方案

2023年1月,南京鹏云网络科技有限公司(简称:鹏云网络)正式宣布开源ZettaStor DBS分布式块存储系统,开放了自研10余年的分布式块存储技术,自此踏上了“自研”与“开源”一体并行的生态闭环之路。 研发十年&am…

python程序获取最新的行政区划名称代码

一、实现目标 最近由于项目需要,需要获取最新的过去全国县以上行政区划的名称和代码。网上虽然有一些资料,但是不是需要积分就是需要会员,而且担心这些资料不是最新的。因此,想着使用程序从官方网站上获取最新的全国行政区划数据。 二、实现思路 1、找到官方最新发布的全国…

c++11 标准模板(STL)(std::basic_ios)(五)

定义于头文件 <ios> template< class CharT, class Traits std::char_traits<CharT> > class basic_ios : public std::ios_base 类 std::basic_ios 提供设施&#xff0c;以对拥有 std::basic_streambuf 接口的对象赋予接口。数个 std::basic_ios…

【夜深人静学数据结构与算法 | 第七篇】时间复杂度与空间复杂度

目录 前言&#xff1a; 引入&#xff1a; 时间复杂度&#xff1a; 案例&#xff1a; 空间复杂度&#xff1a; 案例&#xff1a; TIPS&#xff1a; 总结&#xff1a; 前言&#xff1a; 今天我们将来介绍时间复杂度和空间复杂度&#xff0c;我们代码的优劣就是依…

力扣算法刷题Day38|动态规划:斐波那契数 爬楼梯 使用最小花费爬楼梯

力扣题目&#xff1a;#509. 斐波那契数 刷题时长&#xff1a;参考答案后5min 解题方法&#xff1a;动态规划 复杂度分析 时间O(n)空间O(n) 问题总结 无 本题收获 动规五部曲思路 确定dp数组以及下标的含义&#xff1a;dp[i]的定义为&#xff0c;第i个数的斐波那契数值…

VMware虚拟机彻底卸载详细教程

VMware虚拟机彻底卸载 一、彻底卸载过程1.1 停止VMware服务1.2 结束vmware任务1.3 开始卸载VMware1.4 删除注册表信息1.5 删除安装目录 二、vmware 安装教程三、vmware 使用教程 回到目录   回到末尾 一、彻底卸载过程 卸载之前&#xff0c;需要先关闭VMware相关的后台服务…

软件技巧:7款冷门且十分良心的软件

1、Okular 阅读器 Okular是一款来自KDE的通用文档阅读器&#xff0c;支持众多文档格式&#xff0c;如PDF、Postscript、DjVu、CHM、XPS、ePub、图片格式、漫画格式等&#xff0c;支持Windows、macOS与Linux&#xff0c;是科研学术人士阅读文献的好工具&#xff0c;也是电子书爱…