美团DAT:A Dual Augmented Two-tower Model for Online Large-scale Recommendation

news2024/12/26 14:19:54

A Dual Augmented Two-tower Model for Online Large-scale Recommendation

美团的对偶增强双塔为了user塔和item塔操碎了心,众所周知,双塔的一个大毛病就是item和user的交叉太晚,重要的信息经过层层神经网络的抽象提取,有些重要的信息活不到交叉的那一刻就在中途丢失了。怎么尽早实现user塔和item塔的交叉是个让大家都想破脑袋的事,腾讯的MVKE通过全局向量作为桥梁,一桥架起双塔,实现早期的user塔和item的交叉,在实际业务中落地效果不错,美团的DAT通过在user塔和item塔分别构造一个增强向量,user塔的增强向量作为user塔输入的一部分,去学item塔的输出,item塔的增强向量作为item塔输入的一部分,去学user塔的输出,从而实现user塔和item塔的交叉。这个做法也是非常巧妙。

做法

结构如图
在这里插入图片描述
可以看到,一个重要的改动就是user塔的Embedding层多了一个增强向量 a u \mathbf a_u au,item塔的Embedding多了一个增量向量 a v \mathbf a_v av,user塔的增强向量 a u \mathbf a_u au学习item塔的最终输出向量 p v \mathbf p_v pv,item塔的增强向量学习user塔最终输出向量 p u \mathbf p_u pu

同时user塔的增强向量 a u \mathbf a_u au也作为user塔的Embedding输入,作为user塔炼丹原材料,最终产出用户塔的输出 p u \mathbf p_u pu,也就是item塔的信息实际上成为了user塔输入的一部分,item塔也是同样的操作。这样就实现了item塔和user的尽可能早的交叉。

详细做法

输入侧,以用户塔为例,第 i i i个特征域的Embedding记为 e i \mathbf e_i ei,用户侧的各个特征域(年龄、性别、地域、…)拼接起来就是如下
[ e 1 , e 2 , . . . e n ] [\mathbf e_1, \mathbf e_2, ... \mathbf e_n] [e1,e2,...en]
再拼接上构造的用户侧增强向量 a u \mathbf a_u au,用户侧Embedding可以表示为
z = [ e 1 , e 2 , . . . e n , a u ] \mathbf z = [\mathbf e_1, \mathbf e_2, ... \mathbf e_n, \mathbf a_u] z=[e1,e2,...en,au]
经过炼丹炉炼制,炼制过程表示为
h 1 = R e L U ( W 1 z + b 1 ) \mathbf h_1 = ReLU(\mathbf W_1 \mathbf z + \mathbf b_1) h1=ReLU(W1z+b1)
h L = R e L U ( W l h L − 1 + b l ) \mathbf h_L = ReLU(\mathbf W_l \mathbf h_{L-1} + \mathbf b_l) hL=ReLU(WlhL1+bl)
p u = L 2 N o r m ( h L ) \mathbf p_u = L2 Norm(\mathbf h_L) pu=L2Norm(hL)
同理可以炼制item塔,得到item塔输出 p v \mathbf p_v pv

那么增强的向量怎么学习塔对面的输出呢,每个增强向量通过一个辅助loss的方式,这个辅助loss在论文中称为AMM(Adaptive-Mimic Mechanism),对label为1(y=1)的样本计算辅助loss,其实就是要求这2个向量是一致的,形式如下
l o s s u = 1 T ∑ y ( a u − p v ) 2 loss_u = \frac 1 T \sum y(\mathbf a_u - \mathbf p_v)^2 lossu=T1y(aupv)2
l o s s v = 1 T ∑ y ( a v − p u ) 2 loss_v= \frac 1 T \sum y(\mathbf a_v - \mathbf p_u)^2 lossv=T1y(avpu)2

*因为这个loss是为了更新增强向量用的,所以需要固定 p v \mathbf p_v pv p u \mathbf p_u pu,反向传播的时候,需要阻塞loss对 p v \mathbf p_v pv p u \mathbf p_u pu的梯度更新。

类目信息迁移

业务生产中,各个item所属的类目通常是极度不均衡的,有的类目包含的item少,有的类目包含的item多,通常包含较少类目的item学习可能会不充分,这里设置了一个loss来让占主导的类目信息往长尾类目信息上面迁移。通过占主导的类目协方差和其他类目协方差的模来约束。
l o s s C A = ∑ i = 2 m ∣ ∣ C ( S m a j o r ) − C ( S i ) ∣ ∣ F 2 loss_{CA} = \sum_{i=2}^m \vert \vert C(S^{major}) - C(S^i) \vert \vert^2_F lossCA=i=2m∣∣C(Smajor)C(Si)F2

loss计算

主loss,item塔的输出和user塔的输出 s ( u , v ) = < p u , p v > s(u, v) = <\mathbf p_u, \mathbf p_v> s(u,v)=<pu,pv>

l o s s p = − 1 T ∑ ( y log ⁡ σ ( < p u , p v > ) + ( 1 − y ) log ⁡ ( 1 − σ ( < p u , p v > ) ) ) loss_p = - \frac 1 T \sum (y \log \sigma (<\mathbf p_u, \mathbf p_v>) +(1-y) \log (1 - \sigma (<\mathbf p_u, \mathbf p_v>)) ) lossp=T1(ylogσ(<pu,pv>)+(1y)log(1σ(<pu,pv>)))

最后的loss为

l o s s = l o s s p + λ 1 l o s s u + λ 2 l o s s v + λ 3 l o s s C A loss = loss_p + \lambda_1 loss_u + \lambda_2 loss_v + \lambda_3 loss_{CA} loss=lossp+λ1lossu+λ2lossv+λ3lossCA

实验效果

可以看到加了增强向量的双塔效果还是不错的。
在这里插入图片描述
论文地址:https://dlp-kdd.github.io/assets/pdf/DLP-KDD_2021_paper_4.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/437498.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

15、异常处理

文章目录 1、错误处理1、默认规则2、定制错误处理逻辑3、异常处理自动配置原理4、异常处理步骤流程 【尚硅谷】SpringBoot2零基础入门教程-讲师&#xff1a;雷丰阳 笔记 路还在继续&#xff0c;梦还在期许 1、错误处理 1、默认规则 默认情况下&#xff0c;Spring Boot提供/er…

傻傻的分不清 Comparator 和 Comparable 接口? 两分钟弄懂~

目录 一、Comparable 接口 二、Comparator 接口 一、Comparable 接口 Comparable 是一个排序接口&#xff08;意味着该支持排序&#xff09;&#xff0c;可以看作内比较器&#xff0c;也就是说可以和自己比较&#xff0c;通常用来自己属性与自己属性进行比较&#xff0c;最后通…

百年孤独 -- 有感

《创世记》之后&#xff0c;首部值得全人类阅读的文学巨著。 — 纽约时报 加西亚 马尔克斯以小说作品创建了一个自己的世界&#xff0c;一个浓缩的宇宙&#xff0c;其中喧嚣纷乱却又生动可信的现实&#xff0c;映射了一篇大陆及其人民的富足与贫困。 — 诺贝尔文学奖颁奖辞 马…

wordpress+apache搭建问题总结

访问首页出现服务器目录 需要到apache的httpd.conf 添加index.php默认值 更新失败。 此响应不是合法的JSON响应 大多出现于修改固定连接后 打开httpd.conf文件,把AllowOverride None修改为AllowOverride All,重启apache即可解决 AllowOverride Noneyi意味着忽略.htaccess文件…

VS2022中创建C++SDK库(dll动态库)并调用SDK库(dll动态库)

VS2022中创建CSDK库(dll动态库)并调用SDK库(dll动态库) 一、说明 通过前两篇的文章我们知道了封装一个Qt下的SDK库&#xff08;dll动态链接库&#xff09;和封装Pimpl模式。 Qt创建SDK库(dll动态库)并调用SDK库(dll动态库) SDK(动态链接库dll)的封装技巧 本篇介绍在C VS下…

深度解析动态分配内存管理

目录 ​编辑 一. 前言 二.正文 2.0 计算机中的内存 2.1 动态申请函数头文件 2.2 malloc函数 2.3 free函数 2.3 calloc函数 2.4 realloc函数 2.5 经典笔试题 1. 2. 2.6 柔性数组 三.结语 一. 前言 本小节跟大家分享动态内存管理的知识&#xff0c;希望能给大家带…

2020年全国10m分辨率地表覆盖数据集

1.数据概况 地球观测技术的进步使得土地覆盖制图的空间分辨率不断提高&#xff0c;但这也导致了高分辨率影像样本收集和更新变得更加耗时。本研究提出了一种基于样本噪声学习的跨分辨率土地覆盖制图框架&#xff0c;利用现有低分辨率产品生成大量高分辨率影像标签用于深度语义…

【Python从入门到进阶】17、文件的读写操作

接上篇《16、文件的打开和关闭》 上一篇我们学习了Python打开和关闭文件的操作。本篇我们主要学习Python文件对象包含哪些方法&#xff0c;并学习文件如何进行读、写、定位和删除。 一、文件对象的属性和方法 通过上一篇的学习我们知道&#xff0c;open函数会返回给我们一个文…

一个简单的盒模型嵌套---一个大盒子里面嵌套两个中盒子,右边中盒子嵌套六个小盒子

html代码&#xff1a; <div class"box1"><div class"box2"></div><div class"box3"><div class"box4"></div><div class"box5"></div><div class"box6">&…

apple pencil值不值得购买?ipad平替电容笔安利

自从Apple Pencil上市后&#xff0c;平替电容笔在国内的销量&#xff0c;也是随之而增加&#xff0c;虽然Apple Pencil的性能不错&#xff0c;但由于其的价格太高&#xff0c;所以不少普通用户都买不起。现在市面上有很多能够代替苹果原装笔的平替电容笔。在这里&#xff0c;我…

Debezium系列之:自定义表级别Topic的名称

Debezium系列之:自定义表级别Topic的名称 一、需求背景二、去掉部分topic名称的方法三、debezium具体实现方法四、完整配置一、需求背景 debezium表级别Topic命名规则为:topic.prefix参数的值.数据库名称.表的名称现在支持实时需求,命名名称需要修改为topic.prefix参数的值.…

SAP KANBAN 从入门到放弃系列之生产补货模式

目录 系统操作 看板牌-生产补货 系统配置&#xff1a; 补充策略配置 看板状态配置 创建物料主数据 创建供应区域 创建控制周期-经典看板 系统操作 看板牌-生产补货 需要必要的看板配置和主数据设置 第一步&#xff1a;事务代码:PK13N&#xff0c;需求端KANBAN.供应端…

【数据库】 | 初始数据库

&#x1f397;️ 博客新人&#xff0c;希望大家一起加油进步 &#x1f397;️ 乾坤未定&#xff0c;你我皆黑马 目录 1、什么是数据库2、数据库分类3、 一些重要概念4、 数据存储 1、什么是数据库 存储数据用文件就可以了&#xff0c;为什么还要弄个数据库? 文件保存数据有以…

访京东查询(自定义查询,组件形式,多页面使用,自定义查询条件)

1、效果图 2、使用了Ant Design of Vue里面的tag属性&#xff0c;也可以不用自己写样式。 3、代码模块 1、创建一个公共组件vue文件 <template><a-card size"small" :bordered"false" style"margin-bottom: 10px; padding:0px;">&l…

SVG格式文件可以用什么软件打开?

SVG是一种基于矢量的图像文件格式&#xff0c;通过基于网格上的点和线的数学公式存储图像&#xff0c;与 JPEG 等基于像素的位图文件不同。这种文件类型可以在不损失任何质量的情况下生成很小的文件&#xff0c;因而加载速度也相对更快&#xff0c;也使其成为LOGO和复杂在线图形…

SQL——多表连接查询

若一个查询同时涉及两个或两个以上的表&#xff0c; 则称之为连接查询&#xff08;在FROM子句中体现)。 参与连接的表可有多个&#xff0c;但连接操作在两个表之间进行&#xff0c;即两两连接。 连接查询包括&#xff1a; 内连接 等值连接&#xff1a;用“”比较被连接列的列值…

场景提效:多维表格重塑项目管理流程

此模板适用场景&#xff1a;多任务多团队之间的项目管理 预计实现效果&#xff1a;一张万能表格汇总所有信息&#xff0c;并可以按多视图进行或查看&#xff0c;根据待办项自动定期提醒成员同步进度。 效果对比 需求旧方式新方式统一汇总管理信息全篇文字罗列&#xff0c;呈…

【Linux】线程

1.理解地址空间和页表 1.地址空间是进程能够看到的资源窗口 2.页表决定进程真正拥有的资源情况 3.合理的对地址空间和页表进行资源划分就可以对一个进程的所有资源进行划分&#xff1a;过地址空间分为栈区、堆区…通过页表映射到不同的物理内存。 在32位平台下&#xff0c;…

Mysql学习(十一) -- 常见问题处理

1. MySQL数据库cpu飙升的话你会如何分析 重点是定位问题。 使用top观察mysqld的cpu利用率 切换到常用的数据库使用show full processlist;查看会话观察是哪些sql消耗了资源&#xff0c;其中重点观察state指标定位到具体sql pidstat 定位到线程在PERFORMANCE_SCHEMA.THREADS中…

Nevercenter CameraBag Pro照片滤镜软件 v2023.2.0

Nevercenter CameraBag Pro是一款照片滤镜工具&#xff0c;它可以让您轻松地添加各种效果和样式到您的照片中。该软件可以模拟不同类型的相机、胶片和滤镜&#xff0c;让您的照片呈现出具有艺术感的效果。 CameraBag Pro提供了多达200种不同的滤镜和效果&#xff0c;包括黑白、…