「2023 | 快手」PEPNet:融合个性化先验信息的多场景多任务网络

news2024/11/23 21:47:56

之前梳理过多场景建模方法:推荐系统(二十四)「知识梳理」多场景建模梳理,现在介绍快手提出的多场景多任务方法PEPNet。

Title: PEPNet: Parameter and Embedding Personalized Network for Infusing with Personalized Prior Information

From: 2023 快手

Link: https://arxiv.org/pdf/2302.01115.pdf

1 背景

现在推荐系统大多为多场景多任务,如下图所示,有多个页面,每个页面视为一个场景,如快手的精选、首页、发现页面,每个场景下有多个任务,如点赞、关注、收藏等。
在这里插入图片描述

不同场景下用户和item存在重叠,具有一定共性,展现形式和时机(如单双列、购买前后)等不同,同时具有一定差异性;不同任务之间具有不同的稀疏性,同时也存在相互影响;如果在建模过程中忽略了多场景和多任务之间的共性和差异性,会影响建模效果,如果多个场景和任务不能很好地进行平衡,会存在场景跷跷板(domain seesaw)和 任务跷跷板(task seesaw)现象。

针对上面问题,论文提出一种PEPNet网络(Parameter and Embedding Personalized Network),是一种高效、低成本部署、即插即用的方法,并在快手全量上线。

2 方法

网络结构如下图所示,主要包含Gate Nu、EPNet和PPNet三部分:

  • Gate NU:基于先验信息的门控结构,是EPNet和PPNet的基本单元;
  • EPNet:场景信息作为输入,增强模型对用户跨域行为的底层感知能力;
  • PPNet:用户和item信息作为门控输入,适配不同任务每层参数,平衡顶层任务间相互依赖关系;
    在这里插入图片描述

2.1 Gate Neural Unit(Gate NU)

如下图,由两层FC构成,第一层激活函数为relu,第二层激活函数为sigmoid,第二层结果乘2作为输出,从而把输出取值从[0, 1]转化为[0, 2]
在这里插入图片描述

2.2 Embedding Personalized Network(EPNet)

如下图,场景特征(场景ID或场景特有特征)作为输入,通过Gate NU得到门控网络结果,门控网络结果和Embedding层结果进行element-wise相乘后,得到融入场景信息的Embedding结果,作为后续DNN和PPNet输入。
在这里插入图片描述

2.3 Parameter Personalized Network(PPNet)

如下图,[融入场景信息的Embedding结果、用户id、Item id、作者id] concat在一起作为输入,通过Gate NU得到门控结果,然后与DNN层结果element-wise相乘后,作为下一层DNN的输入。其中,融入场景信息的Embedding结果作为输入,为了不影响EPNet对embedding的更新和学习,训练过程中梯度不进行回传。
在这里插入图片描述

2.4 部署工程优化

(1)Feature score eliminationstrategy

为了确保系统能长时间运行,避免embedding参数很快填满机器内存,设计一个特殊的参数服务器来实现无冲突和内存高效的全局共享embedding表​。​

(2)DNN/Embedding layer Updating

模型采用在线学习,用户、item和作者不断新增,导致id特征会快速膨胀,同时存在大量过期或低频的ID,所有ID特征都存储会导致效率不高,带来额外的存储和计算开销,针对该问题,采用​两种策略:

对特征设置特定数量,超过的被删除
对特征设置过期时间,保留频繁更新的特征ID,删除未得到更新的特征

(3)Training strategy

在实践中,ID特征更新速度较快,在线学习的情况下为了更好地捕获底层embedding变化,同时稳定更新顶层DNN参数,embedding和DNN参数采用不同的更新策略,其中embedding层采用AdaGrad优化器,学习率为0.05,而DNN层采用Adam优化器,学习绿5e-6。

​3 实验

(1)与其他方法对比
在这里插入图片描述

(2)消融实验
在这里插入图片描述

(3)线上效果

在这里插入图片描述

往期推荐:

推荐系统中提升用户留存算法

推荐系统(35) 序列建模文章梳理

推荐系统(32)「梳理」知识蒸馏优化粗排模型

推荐系统(30):2022顶会CTR相关论文梳理

推荐系统(26) 2022 Q2工业界推荐算法实践经验梳理

推荐系统(十一) 2021-2022年工业界推荐算法实践经验汇总

推荐系统(二十四)「知识梳理」多场景建模梳理

推荐系统,离线AUC涨了10%之多,在线CTR等效果可能一点都不涨吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1394244.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GMT学习记录

我主要根据GMT中文手册一步一步学习的!!!!B站视频介绍的是5.0老版本仅仅建立基础理解这个软件。 好的,学了一点发现直接把gmt转为shp,就得到我想的文件 gmt数据转shape格式数据 - 简书 (jianshu.com) 命…

OpenEL GS之深入解析视频图像处理中怎么实现错帧同步

一、什么是错帧同步? 现在移动设备的系统相机的最高帧率在 120 FPS 左右,当帧率低于 20 FPS 时,用户可以明显感觉到相机画面卡顿和延迟。我们在做相机预览和视频流处理时,对每帧图像处理时间过长(超过 30 ms)就很容易造成画面卡顿,这个场景就需要用到错帧同步方法去提升…

从前端角度浅谈性能 | 京东物流技术团队(转载)

1 前言 自网站诞生以来,页面白屏时间、用户交互的响应速度等一直都是开发者关心的问题,这直接影响了一个网站能否为用户的浏览提供舒适的服务,而这种舒适度,直接关系着对用户的吸引力,毕竟谁都不能忍受一个页面长达10秒…

HarmonyOS—声明式UI描述

ArkTS以声明方式组合和扩展组件来描述应用程序的UI,同时还提供了基本的属性、事件和子组件配置方法,帮助开发者实现应用交互逻辑。 创建组件 根据组件构造方法的不同,创建组件包含有参数和无参数两种方式。 说明 创建组件时不需要new运算…

What is `addArgumentResolvers` does in `WebMvcConfigurer` ?

addArgumentResolvers 在SpringMVC框架中,主要用于向Spring容器注册自定义的参数解析器。在处理HTTP请求时,SpringMVC会使用这些参数解析器将请求中的数据(如查询参数、路径变量、表单数据等)转换并注入到控制器方法的参数中。 使…

[C++] VS 2022演练 - 创建和使用静态连接库(Static Lib) (详细图文)

什么是静态连接库? 静态连接库是一种将代码编译成二进制可执行文件时使用的库。在静态链接库中,代码被直接嵌入到可执行文件中,而不是作为外部库单独链接。这意味着当程序运行时,不需要额外的依赖项或库文件。 使用静态连接库的优点是减少了对外部依赖的需求,并且可以更…

【Linux系统编程】环境变量的组织方式

environ和getenv函数 在Linux中,environ是一个全局的外部变量,其类型为char**,存储着系统的环境变量。除了使用主函数中的第三个参数外,我们也可使用environ函数直接访问系统的环境变量。 注意:这里在代码内部使用envi…

使用pdfbox 为 PDF 增加水印

使用pdfbox 为 PDF增加水印https://www.jylt.cc/#/detail?activityIndex2&idbd410851b0a72dad3105f9d50787f914 引入依赖 <dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>3.0.1</ve…

【计算机组成与体系结构Ⅱ】Tomasulo 算法模拟和分析(实验)

实验5&#xff1a;Tomasulo 算法模拟和分析 一、实验目的 1&#xff1a;加深对指令级并行性及开发的理解。 2&#xff1a;加深对 Tomasulo 算法的理解。 3&#xff1a;掌握 Tomasulo 算法在指令流出、执行、写结果各阶段对浮点操作指令以及 load 和 store 指令进行了什么处…

网工每日一练(1月15日)

1.某计算机系统由下图所示的部件构成&#xff0c;假定每个部件的千小时可靠度为R&#xff0c;则该系统的千小时的可靠度为 ( D ) 。 2.以下IP地址中&#xff0c;属于网络 201.110.12.224/28 的主机IP是&#xff08; B &#xff09;。 A.201.110.12.224 B.201.110.12.238 C.20…

1. SpringBoot3 基础

文章目录 1. SpringBoot 概述2. SpringBoot 入门3. SpringBoot 配置文件3.1 SpringBoot 配置文件基本使用3.2 yml 配置文件 4. SpringBoot 整合 Mybatis5. Bean 管理5.1 Bean 扫描5.2 Bean 注册5.3 注册条件 6. 组合注解7. 自动配置原理8. 自定义 Starter 1. SpringBoot 概述 …

蓝桥杯(C++ 矩形总面积 错误票据 分糖果1 三国游戏 分糖果2)

目录 一、矩形总面积 思路&#xff1a; 代码&#xff1a; 二、错误票据 思路&#xff1a; 代码&#xff1a; 三、分糖果1 思路&#xff1a; 代码&#xff1a; 四、三国游戏 思路&#xff1a; 代码&#xff1a; 五、分糖果2 思路&#xff1a; 代码&#xff1a;…

LLM:Sinusoidal位置编码

1&#xff1a;什么是大模型的外推性&#xff1f; 外推性是指大模型在训练时和预测时的输入长度不一致&#xff0c;导致模型的泛化能力下降的问题。例如&#xff0c;如果一个模型在训练时只使用了512个 token 的文本&#xff0c;那么在预测时如果输入超过512个 token&#xff0…

「云渲染科普」效果图渲染吃显卡还是cpu

准确来说看渲染器属于CPU渲染、还是显卡渲染。通常情况下&#xff0c;不少的渲染工作为了追求渲染效果的和速度&#xff0c;同时利用 CPU 和 GPU 的计算资源&#xff0c;达到最佳的效果图呈现方式。 一、效果图显卡渲染与cpu渲染对比 1、CPU(中央处理器)&#xff1a; - 传统的…

【数学建模美赛M奖速成系列】数据可视化方法(一)

数据可视化方法 写在前面山脊图优点缺点实现matlabpython 气泡矩阵图实现matlabpython 后续 写在前面 最近开始更新一个新的系列科研绘图&#xff0c;在同一个竞赛下&#xff0c;大家都近乎相同的解题思路下。之所以能出现一等二等三等奖的区别很大部分都在于结果的可视化&…

【总结】Linux命令中文帮助手册

1. 为什么要总结Linux命令中文帮助手册 Linux 官方并不提供中文的 help、man 帮助手册。网络上已有的前人翻译过的中文手册版本比较老&#xff0c;且翻译存在误差。从记忆角度来看&#xff0c;Linux 很多命令都不一定记得住详细的用法&#xff0c;易遗忘&#xff0c;缺少经验总…

计算机系统基础知识揭秘:硬件、处理器和校验码

计算机系统基础知识揭秘&#xff1a;硬件、处理器和校验码 一、计算机系统基础知识的重要性二、计算机系统硬件2.1、内存和存储设备2.2、输入输出设备 三、中央处理器&#xff08;CPU&#xff09;3.1、运算器3.2、控制器3.3、寄存器组3.4、多核CPU 四、数据表示4.1、原码、反码…

一文极速了解【自注意力机制】

当下如火如荼的大模型&#xff0c;其中的关键技术就是注意力机制&#xff08;Attention&#xff09;&#xff0c;于2015年提出。2017年的“Attention is all you need”一文提出了Transformer模型&#xff0c;去掉RNN&#xff0c;只保留注意力&#xff0c;性能吊打所有机器翻译…

Android Studi安卓读写NDEF智能海报源码

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?id615391857885&spma1z10.5-c.w4002-21818769070.11.1f60789ey1EsPH <?xml version"1.0" encoding"utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xmln…

Intel杀回车载计算领域,极氪首发其第一代AI SoC

作者 |德新 编辑 |王博 Intel低调地重新杀回车载计算领域。 在两个月前&#xff0c;在上海举办的进博会上&#xff0c;Intel对外展示了基于新一代酷睿核心打造的智能座舱平台。 在此之前&#xff0c;这家芯片巨头任命了服役公司20多年的老将Jack Weast作为汽车业务的全球负责…