精通推荐算法7:多任务学习 -- 总体架构

news2024/11/17 17:45:14

1 多任务学习的总体架构

目前的互联网主流推荐场景在大多数情况下需要优化多个业务目标。例如在淘宝商品推荐中,需要兼顾点击率和转化率。在抖音短视频推荐中,需要考虑完播率、播放时长、点赞率、评论率、关注率等目标。为了提升各项业务目标,并降低维护成本,它们大多采用了多任务学习(Multi-Task Learning,MTL),并取得了非常不错的业务效果。

推荐算法多任务学习主要包括多任务建模多任务融合两部分。多任务建模主要解决如何同时学习多个任务的表征的问题,其核心在于需要平衡任务间的相关性和差异性,从而提升整体性能。多任务融合则主要解决如何利用多个预估值进行最终排序的问题,通常有融合公式排序模型强化学习等解决方案。推荐算法多任务学习的知识框架如图1所示。

图1 多任务学习知识框架

多任务学习在我的新书《精通推荐算法:核心模块+经典模型+代码详解》第7章中有详细讲解。包括ESSM、MMOE和PLE等面试常考的模型。详细请参见

《精通推荐算法:核心模块+经典模型+代码详解》(谢杨易)【摘要 书评 试读】- 京东图书

2 为什么需要多任务学习

多任务学习目前被广泛应用于搜索、推荐和广告等场景中。相比单任务学习,它的优点主要如下。

  • 降低训练、部署和维护成本。多任务学习利用一个模型联合训练和优化多个业务目标,进行模型训练、部署和维护。同时,任务间共享一部分参数,缩小了模型整体体积,并降低了内存开销。特别是Embedding层,拥有模型绝大部分参数。多任务学习通过共享Embedding的方式,可以显著缩小模型体积,节省离线和在线资源。
  • 数据增强。在某些情况下,一些任务的数据较难获得,例如电商中的购买行为,单独训练模型容易欠拟合,影响表达能力和业务效果。通过共享参数的方式,可以让模型学习到其他任务的特征和数据,例如电商中的点击行为,从而缓解该任务的数据稀疏问题,相当于一定程度的数据增强。
  • 减少过拟合。多任务模型需要同时优化所有子任务,尽量让它们都达到最优。对于某个特定子任务,其他任务相当于它的正则项,有利于降低过拟合风险。
  • 提升泛化能力。多任务学习可以让模型学到更多的任务和知识,在各个子任务上均表现良好。这有利于提升模型泛化能力,在处理新的子任务时鲁棒性更好。

3 多任务学习的基本框架

多任务学习主要有硬参数共享(Hard Parameter Sharing)和软参数共享(Soft Parameter Sharing)两大类。硬参数共享直接让多个子任务共享某些模型结构和参数,目前仍然是主流方法。最常见的硬参数共享方法是共享底层(Share Bottom),它让子任务共享模型底层,例如Embedding层和前几层DNN。而模型上层,例如后几层DNN和输出层,则是相互独立的。硬参数共享的模型结构如图2所示。

图2 硬参数共享的模型结构

软参数共享的每个任务都拥有独立的模型,通过在各子任务模型参数的距离中加入正则化约束来保证任务间的相关性和模型间的相似性。常用的正则化方法有L1正则和L2正则等。软参数共享的模型结构如图3所示。

图3 软参数共享的模型结构

相比于软参数共享,硬参数共享模型的参数更少,结构更为紧凑和简单,训练和维护成本更低,是目前推荐算法多任务学习的主流范式。ESMMMMOEPLE等经典多任务模型,均属于硬参数共享模型。ESMM利用用户行为顺序关系,建立了曝光、点击、转化三者之间的关联,有效解决了传统CVR任务的样本选择偏差和数据稀疏问题,取得了非常不错的效果。其模型结构如图4所示。

图4 ESSM的模型结构

MMOE 构建了多个底层专家(Experts)网络,可以抽取不同信息。每个子任务有一个独立门控(Gate)单元,将多个专家的输出融合到该子任务中。得益于采用了多个专家网络和门控单元,MMOE建模子任务差别较大的场景时,仍能取得不错的效果。目前它已被广泛应用于搜索、推荐和广告的各大业务场景中。MMOE模型结构如图5所示。

图5 MMOE的模型结构

PLE将由所有子任务共享的底层网络,拆解成共享部分和独立部分,从而平衡任务间的相关性和差异性。同时通过堆叠多层底层网络,渐进式分离出各子任务的深层语义信息。PLE在子任务相关性高和相关性低的场景,均表现良好,并成功应用在腾讯视频推荐场景,取得了非常不错的业务效果。PLE模型结构如图6所示。

图6 PLE的模型结构

4 多任务学习的难点和挑战

多任务学习具有维护成本低、数据增强、减少过拟合和提升泛化能力等优点,可以提升各项业务水平。多任务学习要解决的主要问题如下。

1)如何平衡子任务间的相关性和差异性。子任务间有一定的相似性和相关性,同时具备一定的差异性,甚至冲突。例如,淘宝商品推荐中的点击率和转化率。通过共享底层等硬参数共享方法,可以学习到各子任务间的相关性,但也容易带来信息串扰,导致子任务间差异较大时效果不佳,某些子任务的执行效果甚至不如单任务建模,这就是负迁移现象。MMOE模型在底层构建了多个专家(Experts)网络,用来提取多种不同信息,同时利用每个子任务独有的门控(Gate)单元,融合多个专家的输出,兼顾子任务间的相关性和差异性。PLE模型则更进一步,将专家网络拆分为子任务共享的和独占的,进一步缓解了负迁移问题。

2)如何融合子任务的损失。一般采用加权求和方式,如式(1)所示。

其中,L为模型总损失,是多任务学习的最终优化目标。w为融合权重,用来平衡各个子任务的影响,防止总损失被某些任务主导。 n 为子任务个数。损失函数融合的难点在于难以确定合适的融合权重,而且在训练过程中可能还需要动态调节。

3)如何融合子任务的输出。多任务模型的每个子任务均会有一个输出,需要将它们融合成一个输出,作为最终的排序分数。最为简便的方法是使用融合公式,PLE便采用了这一方法。但融合公式缺点明显,一方面基于非监督学习,难以获得准确的权重;另一方面难以随着数据分布的变化而动态更新。网格搜索、排序模型和强化学习等多种方案可以对其进行优化。其中BatchRL-MTF模型利用强化学习,将多模型融合看作一个马尔科夫决策过程,并在推荐会话中提出了一种基于批量强化学习的多任务融合框架。并通过对用户行为的全面研究,从用户粘性和用户活跃度两个方面,运用启发式算法对用户满意度反馈进行了建模。

6 作者新书推荐

历经两年多,花费不少心血,终于撰写完成了这部新书。

购书方式:新书发布,京东限时15天内5折优惠。原价89,现价44.5,一杯咖啡的价钱。

发货速度:京东自营,半天即可送到。

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式

微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询

售后:支持京东七天无理由退货,售后无忧。

详细介绍和全书目录,详见

《精通推荐算法:核心模块+经典模型+代码详解》(谢杨易)【摘要 书评 试读】- 京东图书

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1713552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

虹科Pico汽车示波器 | 免拆诊断案例 | 2017款吉利帝豪GL车发动机偶尔无法起动

故障现象  一辆2017款吉利帝豪GL车,搭载JLC-4G18发动机和手动变速器,累计行驶里程约为39.3万km。车主反映,该车发动机偶尔无法起动。故障发生频率比较频繁,冷机状态下故障比较容易出现。 故障诊断  接车后试车,故…

一款超好用的国产Redis可视化工具

一、简介 1、这是一款追求极致性能(它可以支持前面100万数据的展示。)海量数据下低内存占用、极简布局、高效交互、跨平台、支持反序列化Java字节码的redis可视化客户端工具。 支持三大操作系统Windows、MacOS、Linux,适合不同操作系统口味的…

树莓派开箱

1.树莓派4B配置 CPU:64位1.5GHZ四核处理器。 GPU:Broadcom VideoCore VI500MHZ 蓝牙5.0 电源Type C(5V 3A),也可以使用排针链接5V锂电池最大放电电流必须达到3A。 还有千兆以太网等以后用到再说。 接下来进入文章重点 2.镜像文件烧录 前期准备:1…

ChatGPT魔法,定制个性化提示词!

扮演Prompt创作者的角色 我想让你成为我的Prompt创作者。你的目标是帮助我创建最佳的Prompt,这个Prompt将由 你ChatGPT使用。 你将遵循以下过程: 1.首先,你会问我Prompt是关于什么的。我会告诉你,但我们需要通过不断的重复来改进…

在 CentOS 上安装 PostgreSQL 的全面指南

PostgreSQL 是一种功能强大的开源关系型数据库管理系统,广泛应用于各种领域。它提供了诸如事务处理、并发控制和数据完整性等高级功能,因此深受开发者和企业的欢迎。本指南将逐步引导您在 CentOS 上安装 PostgreSQL,以便您充分利用其众多优势…

Facebook:社交世界的接口

在当今数字时代,社交媒体已经成为了人们生活中不可或缺的一部分,而Facebook作为其中的巨头之一,扮演着至关重要的角色。本文将带您深入探索Facebook这张社交世界的画卷,全面了解这个令人着迷的平台。 起源与历程 Facebook的故事始…

无线麦克风什么牌子的音质效果好?一文读懂无线领夹麦克风哪款好

​在当今的数字时代,无线技术已经深入到我们生活的方方面面,无线领夹麦克风便是其中的佼佼者。它们为讲者、表演者以及那些需要在移动中讲话的人们提供了解放双手和自由移动的可能。本文旨在探讨无线领夹麦克风的多种用途,以及如何挑选最适合…

Pycharm打开django支持

在 PyCharm 中打开 “Settings/Preferences” -> “Languages & Frameworks” -> “Django”。 勾上Enable Django support 然后配置好文件根目录就好了

基于PTP实现主机与相机系统时钟同步功能

基于PTP实现主机与相机系统时钟同步功能 一、PTP简介二、工业相机PTP功能支持三、工业相机时间戳介绍3.1基本概念3.2海康工业相机时间戳介绍3.2.1相机参数时间戳3.2.2图像嵌入式时间戳3.2.3相机event事件时间戳3.2.4各种时间戳的时序关系3.2.5通过工业相机SDK获取相机时间戳 四…

如何将md文件精确的转换成docx文件

如何将md文件转换成docx? 文章目录 如何将md文件转换成docx?一、如何将MD文件比较完美的转换成word呢?二、方法3 步骤1、下载一个可用的MarkDown编辑器2、下载Pandoc安装 三、来进行转化了 一、如何将MD文件比较完美的转换成word呢&#xff1…

MySQL实战行转列(或称为PIVOT)实战sales的表记录了不同产品在不同月份的销售情况,进行输出

有一个sales的表,它记录了不同产品在不同月份的销售情况: productJanuaryFebruaryMarchProduct AJanuary10Product AFebruary20Product BJanuary5Product BFebruary15Product CJanuary8Product CFebruary12 客户需求展示为如下的样子: pro…

【优选算法】分治 {三分快排:三指针优化,随机选key,快速选择算法;归并排序:统计数组中的逆序对,统计数组中的翻转对;相关编程题解析}

一、经验总结 1.1 三分快排 优化一:三指针优化 之前学习的快速排序无法妥善处理相等或重复序列的排序问题(有序且三数取中无效),使快速排序的效率无法达到最优。 为了解决重复序列的问题,我们将原先的双指针法&…

Spire.PDF for .NET【文档操作】演示:将PDF 拆分为多个 PDF

Spire.PDF 完美支持将多页 PDF 拆分为单页。但是,更常见的情况是,您可能希望提取选定的页面范围并保存为新的 PDF 文档。在本文中,您将学习如何通过 Spire.PDF 在 C#、VB.NET 中根据页面范围拆分 PDF 文件。 Spire.PDF for .NET 是一款独立 …

光速进化!易天万兆光模块全面升级

易天光通信宣布10G SFP/25G SFP28系列光模块产品进行了全新升级,旨在为客户提供更优质、更高效、更可靠的光通信解决方案。这次升级不仅是技术的突破,更是对未来光通信发展趋势的深刻洞察和精准把握。 一、技术革新,性能卓越 本次全系列产品…

记一次艰难的SQL注入(过安全狗)

1.前言 最近在挖补天的src,然后挖出了不少SQL注入,完了出了数据库名就不管那么多提交了。今天挖了个报错注入的,突然一激灵,说我不能这样颓废下去了,刚好是个后台登录的界面,我决心要登进它的后台。 2.注入…

【UnityShader入门精要学习笔记】第十五章 使用噪声

本系列为作者学习UnityShader入门精要而作的笔记,内容将包括: 书本中句子照抄 个人批注项目源码一堆新手会犯的错误潜在的太监断更,有始无终 我的GitHub仓库 总之适用于同样开始学习Shader的同学们进行有取舍的参考。 文章目录 使用噪声上…

WebGL实现医学教学软件

使用WebGL实现医学教学软件是一个复杂但非常有益的项目,可以显著提升医学教育的互动性和效果。以下是详细的实现步骤,包括需求分析、技术选型、开发流程和注意事项。北京木奇移动技术有限公司,专业的软件外包开发公司,欢迎交流合作…

XV7011BB可为智能割草机的导航系统提供新的解决方案

智能割草机作为现代家庭和商业草坪维护保养的重要工具,其精确的定位和导航系统对于提高机器工作效率和确保安全运行至关重要。在智能割草机的发展历程中,定位和导航技术一直是关键的创新点。 传统的基于RTK(实时动态差分定位技术)技术的割草机虽然在…

对比方案:5款知识中台工具的优缺点详解

知识中台工具为企业和组织高效地组织、存储和分享知识,还能提升团队协作的效率。在选择搭建知识中台的工具时,了解工具的优缺点,有助于企业做出最佳决策。本文LookLook同学将对五款搭建知识中台的工具进行优缺点的简单介绍,帮助企…

wifi贴码推广哪家靠谱?

如今越来越多的人想轻资产创业,WIFI贴码是共享行业最无成本的创业项目了,而在选择厂商的时候,大家就想要知道哪家公司靠谱,更好、更便宜、可靠。那么wifi贴码推广哪家靠谱?别急,下面小编将带你一起了解。 目…