深入解析xDeepFM:结合压缩交互网络与深度神经网络的推荐系统新突破

news2025/4/16 12:32:17

今天是周日,我来解读一篇有趣的文章——xDeepFM。这篇文章由 Mao et al. 发表在SIGIR 2019会议。文章提出了一个新的网络模型——压缩交互网络(CIN),用于显式地学习高阶特征交互。通过结合 CIN 和传统的深度神经网络(DNN),形成了一个新的模型 xDeepFM。该模型能够同时学习显式和隐式的高阶特征交互,极大地减少了手动特征工程的工作量,并且在多个真实数据集上表现优异,超越了传统的模型如 FM 和 DeepFM。这项工作对提升特征交互学习的效率具有重要意义,尤其在推荐系统等领域的应用中,可以帮助我们更好地捕捉用户行为和产品特征之间的复杂关系。

接下来,我将深入对这篇论文展开全面解读。和以往一样,我会严格依照论文的结构框架,从研究背景、核心论点、实验设计到最终结论,逐一对文章的各个关键部分进行细致剖析 ,力求为大家呈现这篇时间序列预测论文的全貌,挖掘其中的研究价值与创新点。

1. Abstract

组合特征在许多商业模型的成功中起着至关重要的作用。然而,由于Web规模系统中的原始数据具有多样性、海量性和高速性,人工构造这些特征通常代价高昂。基于因式分解的模型可以通过向量乘积的方式自动学习组合特征之间的模式,并且具有对未见特征进行泛化的能力。随着深度神经网络(DNN)在各个领域取得巨大成功,研究人员最近提出了一些基于DNN的因式分解模型,旨在同时学习低阶和高阶的特征交互。尽管普通的DNN具备从数据中学习任意函数的强大能力,但其生成特征交互的方式是隐式的,且仅在比特级别进行。在本文中,提出了一种新颖的压缩交互网络(Compressed Interaction Network, CIN),其目标是以显式方式、在向量级别生成特征交互。本文展示了CIN在功能上与卷积神经网络(CNN)和循环神经网络(RNN)有相似之处。作者进一步将CIN与经典的DNN结合,构建了一个统一模型,并将其命名为极深因式分解机(eXtreme Deep Factorization Machine, xDeepFM)。一方面,xDeepFM 能够显式地学习某些有界度的特征交互;另一方面,它也能隐式地学习任意的低阶和高阶特征交互。在三个真实世界的数据集上进行了全面的实验,结果表明,xDeepFM 优于当前最先进的模型。

2. INTRODUCTION

特征在许多预测系统的成功中起着核心作用。由于直接使用原始特征很少能获得最优效果,数据科学家通常需要投入大量工作,对原始特征进行转换,以构建出性能最佳的预测系统,或在数据挖掘比赛中取胜。一种主要的特征转换方式是对类别特征进行交叉乘积转换。这些特征被称为交叉特征或多维特征,它们用于衡量多个原始特征之间的交互关系。例如,一个三维交叉特征 AND(user_organization=msra, item_category=deeplearning, time=monday) 的取值为 1,表示该用户所在公司为 Microsoft Research Asia、当前展示的内容是关于深度学习的技术文章,且时间为周一。

 完整文章链接:深入解析xDeepFM:结合压缩交互网络与深度神经网络的推荐系统新突破

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2334983.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CST1017.基于Spring Boot+Vue共享单车管理系统

计算机/JAVA毕业设计 【CST1017.基于Spring BootVue共享单车管理系统】 【项目介绍】 共享单车管理系统,基于 Spring Boot Vue 实现,功能丰富、界面精美 【业务模块】 系统共有四类用户,分别是:监管用户、运营用户、调度用户、普…

vue实现二维码生成器和解码器

vue实现二维码生成器和解码器 1.生成基本二维码:根据输入的value生成二维码。 2.可定制尺寸:通过size调整大小。 3.颜色和背景色:设置二维码颜色和背景。 4.静区(quiet zone)支持:通过quietZone调整周围的…

c#和form实现WebSocket在线聊天室

c#和form实现WebSocket在线聊天室 功能点 后端程序 (Program.cs)​​1.WebSocket 聊天服务器核心功能​​a.管理客户端连接(ConnectionManager 类)b.支持公聊消息广播(所有用户可见)c.支持私聊消息(通过 用户ID 格式指…

量子代理签名:量子时代的数字授权革命

1. 量子代理签名的定义与核心原理 量子代理签名(Quantum Proxy Signature, QPS)是经典代理签名在量子信息领域的延伸,允许原始签名者(Original Signer)授权给代理签名者(Proxy Signer)代为签署文…

「Unity3D」TextMeshPro中的TMP_InputField,用来实现输入框的几个小问题

第一,正确设置Scrollbar。 设置Scrollbar之后,不能设置Text Component的Font Size为Auto Size,否则Scrollbar无法正确计算显示。 那么,要想自动适配字体大小,可以让Placeholder中的Font Size设置为Auto,这…

Docker 介绍 · 安装详细教程

为什么选择 Docker? ✅ 环境一致性 – 告别“在我机器上能跑”的问题,确保开发、测试、生产环境一致。 ✅ 高效轻量 – 秒级启动,资源占用远低于传统虚拟机。 ✅ 跨平台支持 – 可在任何支持 Docker 的环境中运行,包括云服务器、…

vulnhub:sunset decoy

靶机下载地址https://www.vulnhub.com/entry/sunset-decoy,505/ 渗透过程 简单信息收集 nmap 192.168.56.0/24 -Pn # 确定靶机ip:192.168.56.121 nmap 192.168.56.121 -A -T4 # 得到开放端口22,80 在80端口得到save.zip,需要密码解压。 john破解压缩…

方案精读:71页制造企业一体化ERP系统项目实施方案【附全文阅读】

今天聊聊制造企业 ERP 系统项目实施方案。 某钾肥企业在发展中面临信息化难题,像物资编码不规范、业务手工化、财务业务脱节等 。为此,打造 “流程驱动,业务整合” 的一体化 ERP 管理平台很关键。它涵盖采购、销售、生产、运营流程,实现供应链、预算、资金、财务整…

MATLAB遇到内部问题,需要关闭,Crash Decoding : Disabled - No sandbox or build area path

1.故障界面 MATLAB运行时突然中断,停止运行。故障界面如图: MATLAB Log File: C:\Users\wei\AppData\Local\Temp\matlab_crash_dump.21720-1 ------------------------------------------------ MATLAB Log File -----------------------------------…

【Redis】Redis C++使用

一、Redis的自定义网络协议 1.1 为什么可以编写出一个自定义的Redis客户端 为什么我们可以编写出一个自定义的Redis客户端?因为Redis公开了自己的自定义协议。而对于一些其他软件的客户端,我们无法编写出一个自定义的Redis客户端,因为他们没…

每日一题(小白)暴力娱乐篇19

样例: 6 1 1 4 5 1 4 输出: 56 66 52 44 54 64 分析题意可以得知,就是接收一串数字,将数字按照下标每次向右移动一位(末尾循环到第一位),每次移动玩计算一下下标和数字的乘积且累加。 ①接收…

25级总分413数学一142专业124东南大学820考研经验电子信息通信工程,真题,大纲,参考书。

我是南京理工大学的本科生,25 考研一战东大,政治 69,英一 78,数一 142,专业课(820)124,总分 413。我从 3 月正式开始备考,专业课跟着无线电论坛jenny 老师进行学习&#…

【数据结构_6上篇】有关链表的oj题

import java.util.*;/* public class ListNode {int val;ListNode next null;ListNode(int val) {this.val val;} }*/ public class Partition {public ListNode partition(ListNode pHead, int x) {// write code here//1.首先要判断链表是否为空的情况if(pHead null){retu…

【QT】QWidget 概述与核心属性(API)

🌈 个人主页:Zfox_ 🔥 系列专栏:Qt 目录 一:🔥 控件概述 🦋 控件体系的发展阶段 二:🔥 QWidget 核心属性 🦋 核心属性概览🦋 用件可用&#xff08…

微服务篇——SpringCloud

服务注册 Spring Cloud5大组件有哪些? 服务注册和发现是什么意思?Spring Cloud如何实现服务注册发现? nacos与eureka的区别 负载均衡 如何实现负载均衡? Ribbon负载均衡的策略有哪些? 如何自定义负载均衡的策略&…

如何使用PyCharm自动化测试

如何使用PyCharm自动化测试 1.打开PyCharm右击文件,点击新建项目 按照如图配置,然后点击创建 2.创建好后,点击文件,然后点击设置 按照如图步骤,查看selenium和webdriver-manager是否存在 3.以上都完成后按照如图创…

记一次某网络安全比赛三阶段webserver应急响应解题过程

0X01 任务说明 0X02 靶机介绍 Webserver(Web服务器)是一种软件或硬件设备,用于接收、处理并响应来自客户端(如浏览器)的HTTP请求,提供网页、图片、视频等静态或动态内容,是互联网基础设施的核心…

复现QGIS-MCP教程

由于Claude国内下载不了尝试使用Cursor 下载安装Cursor Cursor - The AI Code Editor 本示例安装的是0.46版本 UV安装 简介 安装 安装成功 配置环境变量 验证 下载代码 git clone gitgithub.com:jjsantos01/qgis_mcp.git QGIS插件安装 文件拷贝 您需要将 qgis_mcp_plu…

docker部署certimateSSL证书管理自动续签

开源certimate项目地址:https://github.com/usual2970/certimate 官方文档地址:https://docs.certimate.me/docs/introduction 与certbot对比 维度CertbotCertimate安装方式通过包管理器(如apt/yum)安装支持二进制文件、Docker…

R语言——直方图

参考资料:学习R 如果我们要研究一个连续变量的分布,直方图是最佳的选择。 1、base绘图 在base中可以使用hist函数绘制直方图,与plot函数一样,它没有data参数,须把数据框置于with中。 data(obama_vs_mccain,package&q…