如何用深度神经网络预测潜在消费者

news2024/10/5 2:21:58

1. 模型架构

本项目采用的是DeepFM模型,其结构结合了FM(因子分解机)与深度神经网络(DNN),实现了低阶与高阶特征交互的有效建模。模型分为以下几层:

1.1 FM部分(因子分解机层)

FM层主要用于建模稀疏特征的低阶交互,其数学公式如下:

  • 一阶部分(线性模型):
  • y linear = ∑ i = 1 n w i x i y_{\text{linear}} = \sum_{i=1}^{n} w_i x_i ylinear=i=1nwixi
  • 其中,wi是线性权重,xi是输入特征。
  • 二阶部分(特征交互部分):
  • y FM = ∑ i = 1 n ∑ j = i + 1 n ⟨ v i , v j ⟩ x i x j y_{\text{FM}} = \sum_{i=1}^{n} \sum_{j=i+1}^{n} \langle \mathbf{v}_i, \mathbf{v}_j \rangle x_i x_j yFM=i=1nj=i+1nvi,vjxixj
  • 其中,vi 和 vj 是特征嵌入向量,表示特征间的隐式交互,⟨vi,vj⟩ 是向量的内积,用于捕捉特征之间的低阶关系。
1.2 DNN部分(深度神经网络层)

DNN部分用于捕捉高阶特征交互。输入特征首先通过嵌入层映射为低维稠密向量,然后输入深度神经网络。DNN部分的计算公式如下:

  • 第一层全连接层
  • h 1 = ReLU ( W 1 ⋅ x + b 1 ) h_1 = \text{ReLU}(W_1 \cdot x + b_1) h1=ReLU(W1x+b1)
  • 其中,W1和 b1 是第一层的权重矩阵和偏置,x是输入的嵌入向量,ReLU是激活函数。
  • 第二层全连接层
  • h 2 = ReLU ( W 2 ⋅ h 1 + b 2 ) h_2 = \text{ReLU}(W_2 \cdot h_1 + b_2) h2=ReLU(W2h1+b2)
  • 类似地,W2和 b2 是第二层的权重矩阵和偏置。
  • 输出层
  • y DNN = σ ( W 3 ⋅ h 2 + b 3 ) y_{\text{DNN}} = \sigma(W_3 \cdot h_2 + b_3) yDNN=σ(W3h2+b3)
  • 其中,σ是sigmoid激活函数,用于二分类预测。
1.3 DeepFM的融合

DeepFM模型将FM部分和DNN部分的输出进行融合,最终的输出为:

y output = σ ( y linear + y FM + y DNN ) y_{\text{output}} = \sigma(y_{\text{linear}} + y_{\text{FM}} + y_{\text{DNN}}) youtput=σ(ylinear+yFM+yDNN)

通过同时训练这三部分,模型能够同时捕捉到低阶和高阶特征交互。
在这里插入图片描述

2.1 训练流程

模型的训练流程包括以下步骤:

  • 数据准备:对输入特征进行嵌入,并将稀疏特征转化为低维嵌入向量,同时将连续特征归一化。
  • 前向传播:通过FM层和DNN层分别对低阶和高阶特征进行建模,并将两部分的结果结合起来,计算最终输出。
  • 损失函数:使用二元交叉熵损失函数:
  • L = − 1 N ∑ i = 1 N [ y i log ⁡ ( y i ^ ) + ( 1 − y i ) log ⁡ ( 1 − y i ^ ) ] L = -\frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y_i}) + (1 - y_i) \log(1 - \hat{y_i}) \right] L=N1i=1N[yilog(yi^)+(1yi)log(1yi^)]
  • 其中,yi是真实标签,yi^是模型预测的概率。
  • 优化器:模型使用Adam优化器来更新参数,调整学习率以获得最佳收敛效果。
2.2 评估指标
  • AUC(Area Under Curve) :AUC用于评估模型的分类能力。AUC值越接近1,表示模型的分类性能越好。模型通过回调函数监控验证集上的AUC,以确定模型性能并进行早停或调整学习率。

3. 核心代码详细讲解

1. 数据预处理与特征工程

解释:读取用户行为数据集,包含用户与商品的交互数据。

暂时无法在飞书文档外展示此内容

解释:随机生成一个1到5之间的整数来替换原始的 action_type 列。这里模拟了不同的用户行为类型,可能为了确保数据的多样性或处理数据的平衡性。

暂时无法在飞书文档外展示此内容

解释:将行为时间字段转换为datetime格式,并按照时间排序,以便后续提取时序特征并进行模型训练。

暂时无法在飞书文档外展示此内容

解释:从行为时间中提取月、日等时序特征,以帮助模型捕捉用户行为的时间趋势。

2. 模型架构构建

解释:定义DeepFM模型的输入部分。sparse_input用于处理类别型(稀疏)特征,dense_input用于处理连续型(密集)特征。

暂时无法在飞书文档外展示此内容

解释:对稀疏特征进行嵌入处理。每个类别型特征通过嵌入层转换为低维的稠密向量,便于后续的FM和DNN层处理。

暂时无法在飞书文档外展示此内容

解释:构建FM模型的一阶线性部分,将稀疏和密集特征的线性嵌入结果结合,形成线性组合。

暂时无法在飞书文档外展示此内容

解释:构建FM部分的二阶交互层,计算嵌入向量的内积并通过 Subtract 操作实现特征交互。通过平方和差公式得到交互结果,并通过Lambda层调整系数。

暂时无法在飞书文档外展示此内容

解释:DNN部分通过多个全连接层实现高阶特征的非线性组合。每一层都通过批标准化、激活函数和Dropout层进行处理,防止过拟合并增强模型的泛化能力。

暂时无法在飞书文档外展示此内容

解释:将FM模型的线性部分、二阶交互部分以及DNN部分的输出拼接在一起,最终通过Sigmoid层输出预测结果(适用于二分类任务)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2189101.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Epoch、Batch与Iteration简答理解

揭秘神经网络训练的三大神秘要素:Epoch、Batch与Iteration 在探索深度学习的奇妙世界时,你是否曾被Epoch、Batch和Iteration这三个术语搞得晕头转向?别担心,今天我们就来揭开它们的神秘面纱,带你深入了解神经网络训练的奥秘! 一、Epoch:时间的轮回,数据的洗礼 Epoch…

Python | Leetcode Python题解之第454题四数相加II

题目: 题解: class Solution:def fourSumCount(self, A: List[int], B: List[int], C: List[int], D: List[int]) -> int:countAB collections.Counter(u v for u in A for v in B)ans 0for u in C:for v in D:if -u - v in countAB:ans countAB…

《深度学习》OpenCV 图像拼接 原理、参数解析、案例实现

目录 一、图像拼接 1、直接看案例 图1与图2展示: 合并完结果: 2、什么是图像拼接 3、图像拼接步骤 1)加载图像 2)特征点检测与描述 3)特征点匹配 4)图像配准 5)图像变换和拼接 6&am…

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-03

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-03 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-03目录1. A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models摘要研…

centos72009源码编译R语言

./dev/make-distribution.sh --name custom-spark --pip --r --tgz -Pconnect -Psparkr -Phive -Phive-thriftserver -Pmesos -Pyarn -Dhadoop.version3.4.0 -Pkubernetes spark3.5.3 源码版本 ./dev/make-distribution.sh --name custom-spark --pip --r --tgz -Pconnect -P…

有符号整型和无符号整型比较大小,整型提升{9.28下午}

有符号整型和无符号整型比较大小时,会先把有符号整型先转变成无符号整型 -1的补码是32个1,当成无符号整型来处理时,补码就是源码,所以是一个超级大的数 在C语言中,当有符号整型(如int)和无符号…

MATLAB|电气互联系统有功-无功协同优化模型

目录 1 主要内容 模型示意图 目标函数 程序亮点 2 部分程序 3 程序结果 4 下载链接 1 主要内容 本程序基本复现《“碳中和”目标下电气互联系统有功-无功协同优化模型》,文献模型提供了一个很好的创新思路,把常规电气互联系统的调度和有功无功优化…

Jmeter中有关属性的获取的问题

Jmeter中有3个方法用来获取属性值: props.getProperty(propName), ${__property(propName)} ${__P(propName)} 试验了下,在JSR223 Sampler中使用以上3个方法获取属性值的情况 1. 返回结果如下: 这里看到,在jmeter属性列表里…

QT学习笔记3.2(建立项目、执行_打包、生成执行文件exe)

QT学习笔记3.2(建立项目、执行_打包、生成执行文件exe) 目录 windeployqt打包过程中: enigma virtual box把所有文件打包成.exe文件 资料 mingw还没有编译成功过,这里说明使用msvc的过程。 使用msvc可以编译生成 1.生成执行文件、库文件…

【玩转 JS 函数式编程_006】2.2 小试牛刀:用函数式编程(FP)实现事件只触发一次

文章目录 2.2 该问题的函数式解 A functional solution to our problem1. 高阶函数解 A higher-order solution2. 高阶函数解的手动测试 Testing the solution manually3. 高阶函数解的自动测试 Testing the solution automatically4. 更好的解决方案 Producing an even better…

计算机毕业设计 基于Python的程序员薪资分析系统的设计与实现 Python+Django+Vue 前后端分离 附源码 讲解 文档

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…

1000题-操作系统概述

特性微内核(Microkernel)宏内核(Monolithic Kernel)设计哲学精简内核,将非核心功能移至用户空间将所有核心功能集成到单一内核空间中功能集成仅包含最基本的操作系统功能(如进程间通信、内存管理基础&#…

[Meachines] [Easy] Sea WonderCMS-XSS-RCE+System Monitor 命令注入

信息收集 IP AddressOpening Ports10.10.11.28TCP:22,80 $ nmap -p- 10.10.11.28 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 8.2p1 Ubuntu 4ubuntu0.11 (Ubuntu Linux; protocol 2.0) | ssh-hostkey: | 3072 e3:54:…

SkyWalking监控SQL参数

前言 SkyWalking可以记录每个请求中执行的所有SQL,但是默认情况下,SkyWalking不记录SQL参数导致使用起来不是很方便,每次都得看日志才能知道具体的参数。不过SkyWalking提供了一个配置参数,开启后,便可记录SQL执行的参…

【AI学习】Mamba学习(一):总体架构

论文:《Mamba: Linear-Time Sequence Modeling with Selective State Spaces》 作者1:Albert Gu,现在是CMU(卡内基梅隆大学)助理教授,曾在DeepMind 工作。多年来一直推动SSM架构发展。 作者2:Tri Dao,现为…

青少年科普教学系统小程序的设计

管理员账户功能包括:系统首页,个人中心,管理员管理,基础数据管理,作品信息管理,通知公告管理,视频信息管理,系统管理 微信端账号功能包括:系统首页,视频信息&…

免费神器!PDF 秒变图片在线转换软件大揭秘

现在电子设备使用的频繁,会收到各种不同格式的文件,为了统一或者使用方便转寒格式就成为了我们日常的需求。今天我们来探讨PDF和图片之间的转换需求,探索pdf转图片在线转换免费工具有哪些。 1.福昕PDF转换大师 链接直通:https:/…

RabbitMQ(死信队列)

一、本文抒写背景 前面我也在延迟队列篇章提到过死信队列,也提到过一些应用场景! 今天呢,这篇文章,主要就是实战一个业务场景的小Demo流程,哈哈,那就是延迟关闭订单。 二、开始啦!letgo! 首…

健康养生行业为何要搭建自己的专属知识付费小程序平台?集师知识付费系统 集师知识付费小程序 集师知识服务系统 集师线上培训系统

在如今快节奏的生活中,健康养生已成为人们日益关注的话题。从饮食调理到运动健身,再到心理调适,健康养生的内涵不断丰富,市场需求也愈发旺盛。面对这一趋势,健康养生行业搭建自己的专属知识付费小程序平台,…

AAA Mysql与redis的主从复制原理

一 :Mysql主从复制 重要的两个日志文件:bin log 和 relay log bin log:二进制日志(binnary log)以事件形式记录了对MySQL数据库执行更改的所有操作。 relay log:用来保存从节点I/O线程接受的bin log日志…