DSIN模型

news2024/9/30 23:28:42

在这里插入图片描述

DSIN模型提出得动机:用户得行为是由会话组成得,在每个会话内部用户得行为是相似得,会话之间得用户的行为是存在较大差异性得,而其他模型都没有关注这点,所以就有了DSIN模型。

在这里我们来讲下DSIN关键得四层,其他得就不再赘述了。:

1.会话划分层(session division layer):就是在用户行为序列输入到模型之前,要按照固定得时间间隔(论文中是30分钟)给他分开段,每一段里面得商品序列成为一个会话session.

2.会话兴趣提取层(session interest extractor layer):针对每个session,作用使用多头得注意力机制,来学习一个会话里面各个商品之间得关联关系。

3.会话交互层(session interest interacting layer):会话与会话之间得关系能够学习用户兴趣得演化规律,这里用了双向得LSTM

4.会话兴趣局部激活层(session interest activating layer):既然会话内各个商品之间得关系已经学到了,会话与会话之间关系也已经学到了。当然也是针对性得模拟与目标广告相关得兴趣进化路径了,这里就是注意力机制,每次关注于当前商品更相关得兴趣。

目录

1. Session Division Layer

 2. Session Interest Extractor Layer

3. Session Interest Interacting Layer

 4.Session Interest Activating Layer


1. Session Division Layer

这一层是将用户得行为序列进行切分,首先将用户得点击行为按照时间排序,判读两个行为之间得时间间隔,如果前后间隔大于30min(论文中得值),就进行切分。

在这里插入图片描述

划分完了之后,我们就把一个行为序列S转成了Session Q。在第k个会话Q_k,又包含了T个行为,即

 

bi表示的是第k个会话里面得第i个点击行为(具体得item),它是一个dmodel维得embedding向量。所以Qk是一个T乘dmodel维。而整个大Q,就是一个K*T*dmodel维得矩阵。这里得K指的是session得个数,T指的是每个session中得行为个数,dmodel是每个行为得embedding向量维度。

 2. Session Interest Extractor Layer

这里用得transformer得编码块逻辑,我们来依次看,首先是位置编码,作者这里做了些改进,称为bias encoding.作者这里没用使用transformer中得positioning encoding方式得原因是,这里还需要考虑各个会话之间得位置信息,毕竟这里是多个会话,并且各个会话之间也是又位置顺序得,所以还需要对每个会话添加一个positional encoding,在DSIN中,这种对位置得处理,称为bias encoding。

这里得位置编码BE\in{R^{K*T*d_{model}}},计算公式如下:

BE(k,t,c)表示的是第k个会话中,第t个物品在第c维度这个位置上得偏置项。w^K表示得是会话层次上得位置信息,如果又n个样本得话,这个应该是[n,K,1,1]得矩阵,后面两维度表示得是T和emb_dim。w^T表示的是这个会话里面时间位置层析上得偏置项(位置信息) ,这个应该是[n,1,T,1]得矩阵。w^C表示的是这个embedding维度层次上得偏置(位置信息),这个应该是[n,1,1,dmodel]得矩阵。

所以经过Bias编码之后,得到得结果如下:

 

这个Q得维度[n,K,T,dmodel],如果不考虑样本个数,所以是[K,T,dmodel]。

接下来,每个会话得序列都通过Transformer进行处理:这里得细节去看transformer模型博客得内容即可 。放上神图。

输出就会得到每个会话里面每个行为得向量,然后我们在行为得维度上进行一个avg pooling得操作,就能够把每个session兴趣转成了一个embedding 维得向量了,即

 

最后再总结提一下:

1.和transformer不一样的是,这里提出了自己得位置嵌入方式Bias encoding.

2.这K个会话是走同一个Transformer网络得,也就是再自注意力机制中不同得会话之间权重共享

3.最后得到得这个矩阵,K这个维度上是有时间先后顺序得,这为后面用LSTM学习各个会话之间得兴趣向量奠定了基础。 

3. Session Interest Interacting Layer

作者这里就是想通过一个双向得LSTM来学习会话兴趣之间得关系,从而增加用户兴趣得丰富度,或许还能学习到演化规律

双向LSTM就是先从头到尾计算,再从尾到头回来。所以这里每个时刻隐藏状态得输出计算公式为:

 

 4.Session Interest Activating Layer

用户得会话兴趣于目标物品越相近,那么应该赋予更大得权重,这里依然使用注意力机制来刻画这种相关性,根据结构图也能看出,这里是用了两拨注意力计算:

在这里插入图片描述

1)会话兴趣提取层

 

Ik是兴趣提取层每个会话得向量表征

2)会话兴趣交互层

 

Hk是bi-lstm每个隐藏状态得输出向量

DSIN得损失函数仍然是交叉熵损失函数:

 

 https://zhongqiang.blog.csdn.net/article/details/114500619

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/374860.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PR9268/300-000库存现货振动传感器 雄霸工控

PR9268/300-000库存现货振动传感器 雄霸工控PR9268/300-000库存现货振动传感器 雄霸工控SDM010PR9670/110-100PR9670/010-100PR9670/003-000PR9670/002-000PR9670/001-000PR9670/000-000PR9600/014-000PR9600/011-000PR9376/010-021PR9376/010-011PR9376/010-011PR9376/010-001…

2023年最新qq空间说说怎么全部删除_QQ空间说说如何批量删除

2023年最新QQ空间自动删除说说_2023批量删除QQ空间说说插件小工具_QQ空间如何一次性批量删除说说 一千多条说说怎么删?QQ空间说怎么批量删除_怎样把发的空间说说全删了 使用谷歌浏览器插件,一键安装之后,就可以实现「自动删除」和「手动批量…

SQL入门DEMO

单表查询 ● --查询订购日期在1996年7月1日至1996年7月15日之间的订单的订购日期、订单ID、客户ID和雇员ID等字段的值 ● --查询供应商的ID、公司名称、地区、城市和电话字段的值。条件是“地区等于华北”并且“联系人头衔等于销售代表”。 –查询供应商的ID、公司名称、地…

如何将Google浏览器安装到D盘(内含教学视频)

如何将Google浏览器安装到D盘(内含教学视频) 教学视频下载链接地址:https://download.csdn.net/download/weixin_46411355/87503968 目录如何将Google浏览器安装到D盘(内含教学视频)教学视频下载链接地址:…

正态性检验全流程

正态性检验处理流程 一、分析问题 在实际研究中,正态性是很多研究方法在进行分析时需要满足的前提条件。常见的比如方差分析、T检验、相关分析、回归分析等等,这些分析方法使用的前提假定就是需要数据满足正态分布。 但是这一点经常被分析人员有意或无…

潜伏的 Linux Rootkit:Syslogk

Rootkit 是非常危险的恶意软件,一旦侵入就很难被发现。开发 Rootkit 通常更加困难,很多攻击者都倾向于重用开源项目。 Adore-Ng 是一个相对较老的、开源的 Linux 内核 Rootkit,最初针对内核 2.x 版本开发,但目前已更新为针对内核…

【黑马JVM(1)】内存结构

JVMJVM/JRE/JDK示例JVM内存管理JVM整体架构程序计数器虚拟机栈栈内存溢出线程诊断 top/ps -H/jstack案例一:CPU占用过多案例二: 程序运行很长时间没结果本地方法栈堆堆内存溢出堆内存诊断案例一:jps/jmap/jconsole工具使用案例二:…

Java---打家劫舍ⅠⅡ

目录 打家劫舍Ⅰ 题目分析 代码一 代码二 打家劫舍Ⅱ 打家劫舍Ⅰ 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被…

设备树实践操作

目录一、使用设备树给DM9000网卡_触摸屏指定中断1、修改方法2、实验方法二、在设备树中时钟的简单使用1、参考文档2、知识讲解三、在设备树中pinctrl的简单使用1、几个概念2、设备树中pinctrl节点3、platform_device, platform_driver匹配4、驱动中想选择、设置某个状态的引脚四…

ESP32设备驱动-BMI160惯性测量传感器驱动

BMI160惯性测量传感器驱动 BMI160 是一种高度集成的低功耗惯性测量单元 (IMU),可提供精确的加速度和角速率(陀螺仪)测量。 BMI160 集成: 16位数字,三轴加速度计16位数字,三轴陀螺仪BMI160特性: 高性能加速度计和陀螺仪(硬件同步) 极低功耗:typ.925A(加速度计和陀螺…

BIM小技巧丨关于如何在Revit明细表中显示门窗面积

在明细表中显示门窗面积(以门明细表为例)在新建一个门明细表后,可以发现在Revit中不能直接使用明细表统计门窗面积。 这时,可以通过使用添加“计算值”的方式来处理,得到如下图所示,两种不同的面积统计结果: 除此之外&…

Android 12 快速适配

Android 12 需要更新适配点并不多,本篇主要介绍最常见的两个需要适配的点:android:exported[1] 和 SplashScreen[2] 。一、android:exported它主要是设置 Activity 是否可由其他应用的组件启动, “true” 则表示可以,而“false”表…

满汉楼练习 马踏棋盘

1. 满汉楼 1.结构图 2. 数据库 pwd CHAR(32) NOT NULL DEFAULT ‘’,# 密码,32位 INSERT INTO employee VALUES(NULL, ‘666’, MD5(‘123456’), ‘老韩’, ‘经理’); MD5(‘123456’)是经过MD5加密过后的32位的字符串,用来保存密码 select * fro…

辉光管时钟学习制作及开源软硬件工程

文章目录前言开源地址辉光管项目介绍辉光管的工作条件硬件部分部分介绍充电电路驱动电路不足之处软件部分总结前言 作为一个电子人,一直想做一个辉光管时钟,算是大学的一个心愿,终于在快要毕业前做了一个,下面把软件和硬件的部分…

Windows事件日志监控

大多数数据泄露属内部人员而为,但各企业在监控内部网络活动方面仍存在不足。无论是大型还是小型企业,监控内部网络活动已成为其主要要求。要保护网络安全以防范泄露和威胁,各企业需要采取积极的措施来保证其网络和数据的安全性。监控事件日志…

NCRE计算机等级考试Python真题(四)

第四套试题1、以下选项中,不属于需求分析阶段的任务是:A.需求规格说明书评审B.确定软件系统的性能需求C.确定软件系统的功能需求D.制定软件集成测试计划正确答案: D2、关于数据流图(DFD)的描述,以下选项中正…

跨境人都在用的指纹浏览器到底有什么魔力?三分钟带你了解透彻

什么是指纹浏览器?这是东哥近期收到最多的粉丝私信咨询,指纹两个字大家都很熟悉,指纹浏览器就变得陌生起来。之前东哥也跟大家分享过很多次指纹浏览器的用法,鉴于还是很多人不认识这个好用的工具,东哥今天就来详细给大…

【ICCV2022】 CAPAO:一种高效的单阶段人体姿态估计模型

CAPAO:一种高效的单阶段人体姿态估计模型 重新思考关键点表示:将关键点和姿态建模作为多人姿态估计的对象(Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose Estimation&#xf…

k8s学习之路 | Day16 k8s 中的容器初探

文章目录容器镜像镜像名称镜像拉取策略私有仓库的拉取策略容器的环境变量和启动命令容器的环境变量容器的启动命令容器的生命周期钩子postStartpreStop容器的探针startupProbelivenessProbereadinessProbek8s 集群中最小的管理单元就是一个Pod,而Pod里面才是容器&am…

linux下devmem访问物理寄存器MT7621 mdio控制

在同专栏的mdio访问phy的三种方式篇,我们着重介绍了通过ioctrl的方式将mdio总线与网卡绑定进行访问,但是实时上数据接口和管理接口可以独立去控制,很不幸,作者现在必须把mdio与网卡解除绑定并独立操控,因此接下来将详细…