精通推荐算法20:特征交叉之DCN -- 异构模型Wide侧引入高阶交叉

news2024/9/27 21:18:05

1 引言

DeepFM通过FM显式引入了二阶特征交叉,提升了低阶特征交叉能力。但在推荐场景中,三阶、四阶甚至更高阶的特征交叉同样十分重要。比如在应用市场(如Google Play)推荐场景中,“年轻”的“男性”用户,对“射击类游戏App”下载率较高。此处特征组“用户年龄、用户性别、App类型”的三阶交叉,对标签“用户是否下载App”十分重要。有没有办法在模型中显式引入高阶特征交叉呢?有两种思路:

  1. 通过DNN深度神经网络。DNN具有高阶特征交叉能力,但交叉是隐式,而不是显式的。DNN由多层全连接网络构成,全连接本质上是对特征向量加权求和,即使堆叠多层,也很难拟合向量间的内积、外积等显式高阶操作。
  2. 引入更高阶的FM。FM通过内积操作,具备显式二阶特征交叉能力。那能否扩展到三阶、四阶甚至更高阶呢?理论上可行,但参数量和计算量会爆炸性提升。对于50个特征,二阶交叉有C^2_{50} = 1225 种组合,尚且可以接受。三阶交叉有C^3_{50} = 19600种组合,参数量爆炸,难以训练和上线。这也是为什么这么多年来,FM很难突破二阶的原因。

DCN则提出了另一种解决方案,理论上可以实现任意高阶特征的显式交叉,而且不会带来参数量的爆炸增长。论文由斯坦福大学和谷歌研究人员于2017年联合提出,全称“ Deep & Cross Network for Ad Click Predictions[8]

DCN模型结构

DCN同样采用异构模型,分为交叉网络(Cross network)和深度网络(Deep network)两部分,这也是其名字的由来。最底层是Embedding层和拼接层(Stacking layer),之上为并行的交叉网络和深度网络,最后利用一层逻辑回归融合二者并输出。模型整体结构和DeepFM比较相似,如图4-9所示。

DCN的深度网络与Wide & Deep、DeepFM相似,就不再赘述。重点看交叉网络是怎么实现的。交叉网络的输入为拼接好的特征Embedding向量,如图4-9最下边方框所示。网络可堆叠多层,理论上不限制。每层的计算过程如公式4-20所示。

DCN总结和思考

DCN看起来很美好,但其实也存在不少问题,在业界有不少争议。主要有:

  1. 它对所有特征向量拼接后,再整体进行外积交叉,其操作是element-wise的。而不是像FM那样先在特征间交叉,再累加起来,也就是vector-wise的。同一特征向量内的各元素,应该整体考虑,被同等对待,故采用vector-wise的方式进行特征交叉更为合理。另外,特征向量间交叉是具备实际物理意义的,比如向量内积代表了两者的余弦相似度。而DCN的这种交叉则不具备实际物理意义。
  2. DCN仅使用少量的参数就可以实现显式高阶特征交叉,其模型容量十分有限,不得不让人怀疑。最直接的,一层的DCN其实并不能退化为FM网络。

不过,DCN关于“显式高阶特征交叉”的思考,还是非常值得学习的。其交叉网络的设计,虽然有一定缺陷,但也值得借鉴。后续DCN-V2、xDeepFM等模型给出了更为合理的解决方案。

作者新书推荐

历经两年多,花费不少心血,终于撰写完成了这部新书。本文在4.7节中重点阐述了

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式

微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

详细介绍和全书目录,详见

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1985264.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用javaagent和javassist实现Arthas的watch功能

一、被监控的服务 spring-boot-demo 1、 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation&q…

如何让AI绘画SD可控又好用?10个硬核控图能力(ControlNet)了解一下

大家好&#xff0c;我是灵魂画师向阳 Stable Diffusion&#xff08;简称SD&#xff09;作为一款目前非常流行且强大的AIGC工具&#xff0c;相信大家已经有一定了解&#xff01; 这款工具的使用说简单却也复杂&#xff0c;想要获得高质量图片&#xff0c;其硬核控图能力**&…

安装Supervisor队列进程、管理 Laravel 队列进程

在 CentOS 上安装 Supervisor 并配置 Laravel 的步骤如下&#xff1a; 1.安装 Supervisor&#xff1a; 使用以下命令安装 Supervisor&#xff1a; sudo yum install epel-release sudo yum install supervisor 2.配置 Supervisor&#xff1a; 创建一个新的 Supervisor 配置文…

ARMxy边缘计算网关用于过程控制子系统

在现代工业生产中&#xff0c;过程控制系统的优化对于提高生产效率、保证产品质量、降低能源消耗等方面都具有重要意义。而 ARMxy 工控机作为一种高性能、高可靠性的工业控制设备&#xff0c;正逐渐成为过程控制系统优化的新选择。 ARMxy 工控机采用了先进的 ARM 架构处理器&am…

海南自闭症学校排名榜最新:突破传统,呵护孩子成长

在当今社会&#xff0c;对于自闭症儿童的教育和康复&#xff0c;关注度日益提高。各种自闭症学校排名榜层出不穷&#xff0c;然而&#xff0c;这些排名榜的真实性和权威性却常常有待商榷。家长们在为孩子选择自闭症寄宿学校时&#xff0c;切不可盲目依赖这些排名&#xff0c;而…

【ProtoBuf】语法类型详解

目录 字段规则 消息类型的定义与使用 嵌套定义 非嵌套定义 同文件中消息类型作为字段类型使用 其他文件.proto文件的消息使用 enum类型 Any类型 oneof类型 map类型 默认值 更新消息 保留字段 未知字段 前后兼容 选项option 字段规则 上篇文章我们提到消息是由…

【Java】字符串相关类的底层原理(014)

目录 ♦️字符串存储的内存原理 &#x1f38f;字面量字符串对象 &#x1f38f;构造函数声明字符串对象 ♦️比较的是什么 &#x1f38f;基本数据类型 &#x1f38f;引用数据类型 ♦️字符串拼接的底层原理 &#x1f38f;拼接的时候没有变量参与 &#x1f38f;拼接的时候…

3GPP 4G 5G 主要协议

4G LTE的协议主要是36 series 5G NR的协议主要是38 series

别被割韭菜了!这些才是好评率90%以上的低代码开发平台!

别找了~别找了~ 翻遍全网&#xff0c;好评率高达 90% 以上的低代码开发平台都在这了&#xff01; 想要“提高人员效率&#xff0c;降低开发成本”的朋友&#xff0c;看这一篇就够了&#xff01; 7100字干货&#xff0c;带你“沉浸式”了解国内 7 家领先的低代码开发平台&…

IPsec VPN综合实验

一、实验目的及拓扑 实验目的&#xff1a; 1、在总部通过防火墙建立双机热备 2、在分支通过路由器向外宣告防火墙NAT SERVER 3、在分支和总部自己建立站点到站点VPN并实现负载分担 二、基础配置 如拓扑所示配置相应端口地址 三、详细配置 &#xff08;一&#xff09;双机…

unity VR项目3DUI:人物头部旁“说话框”,功能:1.永远朝向相机 2.打字效果 3.UI不会被模型遮挡 4.切换位置 5.文字自动根据内容扩充

提示&#xff1a;文章有错误的地方&#xff0c;还望诸位大神不吝指教&#xff01; 文章目录 前言一、UI搭建1.创建基节点2.创建Canvas3.添加永远看向相机代码4.创建UI背景&#xff0c;设置相关操作1.锚点设置2.添加组件&#xff1a;Vertical Layout Group、Content Size Fitter…

P-one新增火焰图-为性能测试开启新视野

随着软件业务流程的日益复杂&#xff0c;传统的性能测试方法已经难以满足对性能问题精准定位的需求。测试人员需要一种更加直观、全面的方式来分析软件在运行过程中的性能表现&#xff0c;以便快速准确地找到性能瓶颈并进行优化。因此&#xff0c;我们在性能测试平台P-One中加入…

几分钟教你实现一个酷炫的扫光效果

前言 话不多说&#xff0c;咱们先来看看本篇文章中我们实现的效果。 是不是发现这个效果非常的熟悉&#xff1f;没错&#xff0c;这经常能够在一些电商网站可以看到&#xff0c;那这究竟是怎么实现的呢&#xff1f;接下来由我来带领大家尝试做一个类似这样的效果出来。 实现…

浏览器采集黑屏 问题

chrome://flags/#use-angle Choose ANGLE graphics backend 选择OPENGL 然后重启浏览器 就可以了

美股市场波动与科技股动态

一、美股市场波动 周一&#xff0c;美股三大股指低开高走&#xff0c;但最终收盘时道指跌2.6%&#xff0c;纳指跌3.43%&#xff0c;标普跌3%。美国十年国债收益率涨0.053%&#xff0c;收报3.787%&#xff0c;恐慌指数VIX涨64.9%至38.57。现货黄金跌1.34%&#xff0c;报2409.42…

2024年有哪些好用的文件加密软件?十款常用加密软件推荐

在2024年&#xff0c;随着数据泄露和网络威胁的日益复杂&#xff0c;文件加密软件成为了保护敏感信息不可或缺的工具。无论是个人用户还是企业&#xff0c;选择合适的加密软件都是确保数据安全的重要一环。 1. 安秉加密软件 安秉加密软件专为企业设计&#xff0c;提供全面的信…

SpringBoot框架学习笔记(六):自定义转换器、内容协商 和 Thymeleaf

1 自定义转换器 1.1 基本介绍 &#xff08;1&#xff09;SpringBoot在响应客户端请求时&#xff0c;将提交的数据封装成对象时&#xff0c;使用了内置的转换器&#xff0c;一共提供了124个内置转换器&#xff0c;核心源码&#xff0c;在 GenericConverter 接口的内部类 Conve…

澳洲联储按兵不动,通胀阴霾难散

澳洲联储核心通胀率仍远高于目标水平&#xff0c;经济增长依然强劲&#xff0c;因此维持高利率是必要的。 鹰派立场坚定 澳洲联储的这一决定与全球其他央行的政策走向形成了鲜明对比。许多发达经济体的央行已经开始降息&#xff0c;以应对经济增长放缓的风险。然而&#xff0…

TapData 信创数据源 | 国产信创数据库 OceanBase 数据同步指南,加速国产化进程,推进自主创新建设

随着国家对自主可控的日益重视&#xff0c;目前在各个行业和区域中面临越来越多的国产化&#xff0c;采用有自主知识产权的国产数据库正在成为主流。长期以来&#xff0c;作为拥有纯国产自研背景的 TapData&#xff0c;自是非常重视对于更多国产信创数据库的数据连接器支持&…

WiFi模块无线通信交互,乐鑫ESP32物联网方案,启明云端乐鑫代理商

随着物联网(IoT)技术的飞速发展&#xff0c;我们正步入一个智能化、互联化的世界。在这一进程中&#xff0c;无线WiFi模块作为连接物理世界与数字世界的桥梁&#xff0c;扮演着至关重要的角色。 WiFi模块是一种基于WiFi协议的无线模块&#xff0c;它可以实现设备之间的无线通信…