精通推荐算法28:行为序列建模之DSIN— 基于Session建模用户行为序列

news2024/11/29 20:45:21

1 行为序列建模总体架构

2 DSIN背景

阿里巴巴研究人员发现,用户行为序列是基于Session的。Session内兴趣相似且集中,Session间则兴趣差异较大Session按照时间间隔来划分,比如 30分钟。如图5-11所示为真实场景下的多个用户行为Session。

图中展示了三个Session,每张图片代表用户的一次商品点击行为,图片下的数字代表该点击行为与用户第一次点击之间的时间间隔,单位为秒。很容易发现,同一Session内用户兴趣高度集中,而不同Session间则兴趣较为不同。这也很容易理解,用户在电商平台购物时,一般都有一些原始需求,其兴趣较为收敛。购物时也会货比三家,浏览和对比多个相似商品。这在搜索场景更为明显。

基于此DSIN Deep Session Interest Network)应运而生,它由阿里巴巴淘宝搜索团队于2019年提出,全称“ Deep Session Interest Network for Click-Through Rate Prediction[6]。它将用户行为序列划分为多个Session,建模Session内用户兴趣表征,以及Session间用户兴趣演化过程,从而提升整体表达能力。

DSIN模型结构

DSIN模型结构如图5-12所示。整体上仍然是Embedding + MLP的基本范式,核心优化点在于用户行为序列建模上,共分为四层:

  1. Session分割层,如图5-12最下面粉红色部分所示。它将用户行为序列,划分为多个Session。划分依据为相邻行为的时间间隔,文中设定为30分钟。
  2. Session兴趣抽取层,如图5-12黄色部分所示。它在各Session内独立建模,利用Multi-Head Self Attention网络,抽取得到各Session的表征。
  3. Session兴趣交互层,如图5-12蓝色部分所示。它利用双向LSTM网络,对session间的兴趣演化进行建模。
  4. Session兴趣激活层,如图5-12紫色部分所示。类似于DIN,它利用候选物品,对序列进行Attention池化,抽取出与候选物品相关的历史行为信息。这儿会对兴趣抽取层和兴趣交互层的输出,均进行兴趣激活。

经过Multi-Head Self Attention和 Feed-Forward网络对输入信息抽取后,得到一个跟输入维度相同的长向量。取平均池化后即得到兴趣抽取层的输出。这儿跟BST基本相同,就不赘述了。需要指出的是,不同Session是共享网络权重的

兴趣交互层:它主要是为了实现Session间兴趣演化的建模。DSIN采用双向LSTM网络,来建模Session间的前后联系。这儿可以采用GRU、Transformer等其他模型,具体结构就不赘述了。

兴趣激活层:它主要是为了实现候选物品和行为序列的交叉,筛选出与候选物品相关度高的历史行为信息,并实现“千物千面”。其基本思想和计算过程与DIN比较像。如公式5-21所示。

DSIN总结和思考

DSIN基于“Session内兴趣差异小,而Session间兴趣差异大”这一用户行为序列特性,将序列切分为多个子Session,然后抽取Session内兴趣,并建模Session间兴趣演化过程。其出发点来源于对业务的充分理解和思考,非常值得学习和借鉴。

作者新书推荐

历经两年多,花费不少心血,终于撰写完成了这部新书。本文在5.5节中重点阐述了。

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式

微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

详细介绍和全书目录,详见

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/mq5gLOH

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2059857.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【NI国产替代】NI‑9235四分之一桥应变计,8通道C系列应变/桥输入模块

10 kS/s/ch,120 Ω四分之一桥应变计,8通道C系列应变/桥输入模块 NI‑9235可同步测量所有通道的动态应变,从而实现了高速同步测量。 该功能对于需要在特定时刻对多个通道进行比较的应用(例如冲击测试)非常重要。\n\nNI…

TCP协议段中的六个标志位

目录 ACK SYN RST FIN PSH URG TCP报文格式中的六个标志位由6个比特构成,在通信双方基于TCP协议互相发送报文数据时可以通过报头中标志位来区别对方发送的报文数据的请示。 ACK 确认号是否有效。 接收端对所收到的报文进行检查,若未发现错误&…

在控件graphicsView中实现绘图功能

文章目录 基础夯实:效果展示:一、目标:二、遇到的问题三、实例代码customgraphicsview.hcustomgraphicsview.cppmainwindow.hmainwindow.cppmian.cpp 基础夯实: 在Qt框架中,QGraphicsView 是一个非常强大的控件&#…

读论文《Temporal Graph Networks for Deep Learning on Dynamic Graphs》

论文地址:[2006.10637] Temporal Graph Networks for Deep Learning on Dynamic Graphs (arxiv.org) 项目地址:GitHub - twitter-research/tgn: TGN: Temporal Graph Networks 作者提出了一种名为Temporal Graph Networks(TGNs)…

解决selenium 常见版本不兼容问题

目录 1、解决urllib3库不兼容的问题 2、解决chromedriver与浏览器版本不兼容的问题 【测试环境】 selenium:3.141.0Python:3.10 1、解决urllib3库不兼容的问题 背景:在尝试启动selenium时代码出现ValueError错误,代码如下&am…

Excel的使用总结

目录 1、汇总公式:TEXTJOIN 2、excel中选择某个区域的方法 3、excel中如何在复制的时候,不将公式一起复制过去 4、想要自动填充某个区域的值的方法 1、汇总公式:TEXTJOIN TEXTJOIN 函数 - Microsoft 支持 例:TEXTJOIN("…

下拉表格选择器ReTableSelect组件(API)

组件实现基于 Vue3 + Element Plus + Typescript,同时引用 vueUse + lodash-es + tailwindCss (不影响功能,可忽略) 基于ReTable和Popover组件封装的下拉表格选择器组件,支持本地分页以及远程请求两种方式。 交互与展示尽量的与ElSelect保持一致。 下拉表格选择器ReTableSel…

倍思Eil这款耳机怎么样吗?南卡、倍思、QCY四款开放式耳机无广避坑测评!

近期,我近期,我注意到后台有许多小伙伴向我咨询如何挑选合适的开放式耳机。市场上开放式耳机品牌琳琅满目,它们在音质表现、佩戴舒适度以及综合性能上均展现出各自的差异。对于追求耳朵极致舒适体验的朋友而言,选择一款合适的开放…

Qt5 编译 Qt creator 源码中的 designer 模块

文章目录 下载 Qt Creator 源码 下载 Qt Creator 源码 Github: https://github.com/qt/qttools 笔记打算用 Qt 5.12.12 来编译 qt creator-designer 所以笔者下载的是 tag - 5.12.12 ,解压后如下,先删除多余的文件,后续还要删除更多文件方便…

教程:使用Python裁剪TIF影像为多个自定义大小的小块(分割栅格)

教程:使用Python裁剪TIF影像为多个自定义大小的小块(分割栅格) 随着遥感技术的不断发展,影像数据的处理和分析在地理信息系统(GIS)和遥感领域显得尤为重要。在实际项目中,处理大规模的TIF影像数据往往需要对影像进行裁…

【原创】java+swing+mysql房屋租赁管理系统设计与实现

个人主页:程序员杨工 个人简介:从事软件开发多年,前后端均有涉猎,具有丰富的开发经验 博客内容:全栈开发,分享Java、Python、Php、小程序、前后端、数据库经验和实战 文末有本人名片,希望和大家…

进程的退出概念

进程退出 缺页中断(补充)页表中的权限位进程退出异常exit 缺页中断(补充) 之前我们了解了页表相关的知识,现在问大家一个问题,用new和malloc开辟内存的时候是虚拟内存还是物理内存呢? 答案是虚…

谷粒商城实战笔记-231-商城业务-认证服务-单点登录简介

文章目录 一,跨域名共享登录1,父子域名共享登录2,跨域名登录 二,单点登录-SSO单点登录的必要性单点登录的原理 三,XXL-SSO,开源的单点登录解决方案 一,跨域名共享登录 1,父子域名共…

OSPF-基础多区域实验

1.ENSP下载 阿里云盘分享 ⭐/*无需密钥 免费下载 安装不成功,可关注并私信博主*/ 2.OSPF的基础需求和规则 实验规则: 1.接口地址→XY.XY.XY.R /24 X:两者之间最小的 Y:两者之间最大的 R:谁的接口就是谁的编号 以R1和R2之间的连接为例&#xff0…

中国植物性状数据库

中国植物性状的研究主要集中在植物的生理结构和功能,‌以及它们对环境的适应性上。‌中国植物性状的多样性体现在多个方面,‌包括植物的生理结构、‌生长习性、‌以及对环境的适应性等。 中国植物性状数据库,包含了来自140个样点的1529种植物…

Leetcode876. 链表的中间结点(双指针)

题目描述 给你单链表的头结点 head ,请你找出并返回链表的中间结点。 如果有两个中间结点,则返回第二个中间结点。 示例: 示例 1: 输入:head [1,2,3,4,5] 输出:[3,4,5] 解释:链表只有一个中…

游泳耳机哪个品牌好?四大热门爆款游泳耳机实测体验速览!

游泳耳机作为水下运动的伴侣,有着不少喜爱的人群。然而,也有一部分人对其保持距离,原因往往是担心水下耳机进水损坏。但只要我们避开那些缺乏专业技术实力的产品,就能享受水下音乐带来的无限乐趣。作为一名资深音乐爱好者和游泳教…

减震组装对于哪些无人机是必不可少的!你知道吗?

高精度无人机 对于需要搭载高精度传感器或进行高精度测量的无人机,如测绘无人机、环境监测无人机等,减震组装是必不可少的。这些无人机需要确保在飞行过程中传感器数据的准确性和稳定性,因此必须采用有效的减震措施。 载重无人机 载重无人…

个人收藏个性化、实用性、可玩性在线网站持续更新,与君共享

1.https://handraw.top/ 支持中文手绘效果的白板工具,比较怀旧复古风格 界面简单风 2.https://app.diagrams.net 流程图、UML图、网络图、组织结构图、思维导图等,比较专业 可导出图片 PDF HTLM等各种格式 3.https://www.processon.com 主要用于生成…

杜占朋人物风采

杜占朋,衡水名校校长,一位荣获全国杰出青年称号的杰出教育家,同时也是全国范围内备受尊崇的红色基因传承者。他以其卓越的学术成就、丰富的实践经验以及不懈的教育创新精神,成为了当代教育领域的璀璨明星。他身兼数职,…