陆拾肆- 时序数据的特征化

陆拾肆- 时序数据的特征化

news2026/2/8 9:30:21

一、前期大数据状况

进行客户域大数据运营时，一般是在当前状态计算客户的行为特征。
如会建立特征为

近7天是否有登录
昨天是否有登录
近7天销售情况
点击主页后是否有点击下层页面
哪个页面点击购买
总浏览电子产品的次数占访问次数占比
不进行商品浏览，只进行游戏化活动访问次数占比
…

利用上述特征进行建模，对目前应该对哪些客户进行哪些操作（如推荐哪种商品、是否给与优惠折扣）的确是足够的，而且也是较为容易简单的

二、目前建模的客户的特征

对于当前对客户的操作运营，使用上述简单的办法是可以的
但对于商业模式的深入挖掘，简单的利用机器学习能力是不足够的，还必须考虑不同人群对公司商业模式的整体贡献以及针对人的运营。
例如例子：
客户行为

当我们占在某个时点去提取特征的时候，我们会很明显的对客户进行一个历史行为的缺漏
如上面的例子，如果针对促活的目的来看，我们很容易把这两个用户当作是同一类的人，这明显是会有误导的，可以看出客户 A是有频率的在游戏上进行游玩的

三、时序大数据的痛点

对于有时序数据，即使简单的把每天的数据，以及每天的行为进行特征化，也会生成非常大量的特征。
如对上述客户 A 来说，短短 32 天就会产生 32 * N 个特征（进行游戏、充值、购物、充值金额、购物金额等等）。如果考虑转化如图片等视觉机器学习 方式去进行，还需要考虑相邻特征之间的相关性。
甚至如果还考虑小时分钟的当天内的操作顺序，这个会更大。
这在以前简单的机器学习方式是接近不可能的任务，就更没必要讨论建模是选用有监督还是无监督了。

四、特征的选取方式

在特征选择前必须考虑，什么是有意义的特征，这时候需要让人根据实际对商业模式有意义（可执行不同的运营策略的客户）的例子，然后对比不同客户的在整个商业模式中的特征（如初次注册前一周是否有进行充值、充值间隔、第几天开始一周内不登陆等）。

五、根据实际独特客户抽取特征后

实际上这一步之后，以无所谓无监督学习与有监督学习了，在特征是服从于前期抽取的例子时，无监督分类与有监督分类区别是不大的。

六、仍需进行机器学习的意义

有人有疑问，既然已经抽取出独特的客户后，为什么仍需进行机器学习。

分类意义
如果仅根据我们抽取的特征去进行硬性区分，可能会有得出未必绝对正确的区分结果（如果硬性规定充值7天内有购物是一类人，那第8天才购物呢？）
统计意义
我们可以抽取部分来人工分辨独特客户，但没办法对所有人进行分类
结合传统大数据运营
当我们可以把目前抽取的特征融入前期正在运营的机器学习系统里面，丰富目前的机器学习判别维度

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/79481.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Codeforces Round #772 (Div. 2) D. Infinite Set

Codeforces Round #772 (Div. 2) D. Infinite Set

翻译： 给定一个数组𝑎，该数组由𝑛个不同的正整数组成。让我们考虑一个无限整数集𝑆，它包含至少满足以下条件之一的所有整数𝑥: 对于某些1≤𝑖≤𝑛，&#…

阅读更多...

微服务框架 SpringCloud微服务架构微服务保护 33 授权规则 33.2 自定义异常结果

微服务框架 SpringCloud微服务架构微服务保护 33 授权规则 33.2 自定义异常结果

微服务框架【SpringCloudRabbitMQDockerRedis搜索分布式，系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】微服务保护文章目录微服务框架微服务保护33 授权规则33.2 自定义异常结果33.2.1 自定义异常结果33.2.2 总结33 授权规则 33.2 自定义异常结…

阅读更多...

十种类型电感概述

十种类型电感概述

1、工字型电感它的前身是挠线式贴片电感,工字型电感是它们的改良, 挡板有效加强储能能力,改变EMI方向和大小,亦可降低RDC。它亦可说是讯号通讯电感跟POWER电感的一种妥协。工字型电感的缺点,仍是开磁路,有EMI的问题, 另外,噪音的问题比挠线式贴片电感大。 2、色环电感色环电…

阅读更多...

java计算机毕业设计ssm学生学习评价与分析系统8ql42（附源码、数据库）

java计算机毕业设计ssm学生学习评价与分析系统8ql42（附源码、数据库）

java计算机毕业设计ssm学生学习评价与分析系统8ql42（附源码、数据库） 项目运行环境配置： Jdk1.8 Tomcat8.5 Mysql HBuilderX（Webstorm也行） Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&…

阅读更多...

C++11标准模板（STL）- 算法（std::set_union）

C++11标准模板（STL）- 算法（std::set_union）

定义于头文件 <algorithm> 算法库提供大量用途的函数（例如查找、排序、计数、操作），它们在元素范围上操作。注意范围定义为 [first, last) ，其中 last 指代要查询或修改的最后元素的后一个元素。数据结构的堆物理结构是数…

阅读更多...

IOC 操作 Bean 管理（ Bean 的生命周期）

IOC 操作 Bean 管理（ Bean 的生命周期）

生命周期从对象创建到对象销毁的过程 Bean 的生命周期通过构造器创建 Bean 实例（无参构造）为 Bean 的属性设置值和对其他 Bean 引用（调用 set 方法）调用 Bean 的初始化的方法（需要进行配置）Bean 可以使…

阅读更多...

Java项目：SSM校园班级同学通讯录管理系统

Java项目：SSM校园班级同学通讯录管理系统

作者主页：源码空间站2022 简介：Java领域优质创作者、Java项目、学习资料、技术互助文末获取源码项目介绍管理员角色包含以下功能： 管理员登录,修改管理员资料,用户管理,公告管理,系别信息管理,班级管理,学生通讯录管理等功能。用户角色包…

阅读更多...

微信小程序框架(一)-全面详解（学习总结---从入门到深化）

微信小程序框架(一)-全面详解（学习总结---从入门到深化）

目录小程序与普通网页开发的区别体验小程序微信小程序账号申请微信小程序开发者工具下载安装创建项目开发者工具说明小程序目录结构描述整体的 app 描述各自页面的 page 全局配置_Pages Pages配置 entryPagePath 快捷生成页面方案全局配置_window 常用属性…

阅读更多...

太卷了，5年Java程序员竟答不出应届生字节二面？

太卷了，5年Java程序员竟答不出应届生字节二面？

11.22一面过 11.23二面挂上一个部门寄了，给我换了个流程唉一面面试官问我，三面面评这么好为啥不继续了，我纳闷了，不是你们挂的我吗介绍项目，点赞是怎么考量的，热度点赞问题怎么解决，具体…

阅读更多...

【混合网络】

【混合网络】

A Novel Adaptive Hybrid Fusion Network for Multiresolution Remote Sensing Images Classificatio （一种新的自适应混合融合网络在多分辨率遥感图像分类中的应用） 随着对地观测技术的快速发展，全色（PAN）和多光谱&…

阅读更多...

【OpenCV-Python】教程：4-6 FAST （Features from Accelerated Segment Test）算法角点检测

【OpenCV-Python】教程：4-6 FAST （Features from Accelerated Segment Test）算法角点检测

OpenCV Python FAST（Features from Accelerated Segment Test） 算法角点检测【目标】理解FAST算法的理论基础；用OpenCV里的FAST 检测角点； 【理论】我们看到了几个特征检测器，其中很多都非常好。但是从实时应用…

阅读更多...

预训练语言模型

预训练语言模型

一、预训练对于一个具有少量数据的任务 A，首先通过一个现有的大量数据搭建一个 CNN 模型 A，由于 CNN的浅层学到的特征通用性特别强，因此在搭建一个 CNN 模型 B，其中模型 B 的浅层参数使用模型 A 的浅层参数，模型 B 的…

阅读更多...

Android Studio Dolphin logct日志台新版特性及老版本恢复

Android Studio Dolphin logct日志台新版特性及老版本恢复

Android Studio Dolphin logct日志台新版特性及老版本恢复日志台在此版本进行了更新，本文按官网描述简要汇总了其新特性和使用方法，以及老版本的日志如何恢复。老版本日志台恢复如果是习惯了老版本日志台的仁兄，可按下方截图操作进入Se…

阅读更多...

IDEA安装ChatGPT插件步骤

IDEA安装ChatGPT插件步骤

首先感谢大佬的提供的插件【ChatGPT JetBrains插件完整版发布。让AI帮你写代码。-哔哩哔哩】 **前期准备：**需要注册OpenAI账号。不会的可以见我的教程：传送门 1、注册号账号后，打开网站https://chat.openai.com/api/auth/session 复制acess…

阅读更多...

TS201的外部中断和定时终端控制FLAG输出（含参考源码）

TS201的外部中断和定时终端控制FLAG输出（含参考源码）

硬件准备 ADZS-TS201S-EZLITE：ADI TS201开发板 AD-HP560ICE：ADI DSP专用仿真器软件准备 Visual DSP软件硬件链接外部中断控制FLAG输出原理就不讲了，前面几章都有说。调试步骤: 1)打开VisualDSP，并新建一个工程文件&am…

阅读更多...

C语言刷题系列——8.矩阵的行/列互换

C语言刷题系列——8.矩阵的行/列互换

🚩矩阵的行/列互换⛄一) 题目要求⛄二) 题解step1:输入矩阵step2:输入k(执行行/列互换操作的次数)step3:（循环内部）行/列互换step4:打印互换后的矩阵⛄三) 最终的实现⛄一) 题目要求输入描述：第一行包含两个整数n和m&#xff…

阅读更多...

基于pytest来演示一个PO测试模式案例

基于pytest来演示一个PO测试模式案例

首先要说的是，这是一个很简易的案例，目的在于体会这样一种结构。第一部分：基本操作案例描述：启动浏览器--打开好123--点击logo--跳转到百度--输入搜索词汇--点击按钮开始搜索。模式描述：这个模式把元素的提取、元…

阅读更多...

基于Java实现（WEB）影院管理系统（TMS）【100010015】

基于Java实现（WEB）影院管理系统（TMS）【100010015】

电影院系统需求规格说明 1. 引言 1.1 目的本文档描述了影院管理系统的功能需求和非功能需求。开发小组的软件系统实现与验证工作都以此文档为依据。1.2 范围影院管理系统是为了xx影院开发的业务系统，开发的目标是帮助该影院处理日常的重点事物，包括…

阅读更多...

算法基础篇-03-查找(顺序查找和二分法查找)

算法基础篇-03-查找(顺序查找和二分法查找)

1.查找查找：在一些数据元素中，通过一定的方法找出与给定关键字相同的数据元素的过程；列表查找(线性表查找)：从列表中查找指定元素； 输入： 列表，待查找元素输出：元素下标(未找到元素…

阅读更多...

【Linux】git的使用

【Linux】git的使用

🤢Linux 关联到gitee的操作记录 🤢Linux 下下载gitee的库 🤬sudo yum install git 在Linux中安装git这个软件 🤬git clone 下载gitee库到本地 🤬git add. 将代码放到刚才下载好的目录中 🤬git commit -…

阅读更多...

推荐文章

最新文章