DSIN模型

news2024/11/18 17:43:32

在这里插入图片描述

DSIN模型提出得动机：用户得行为是由会话组成得，在每个会话内部用户得行为是相似得，会话之间得用户的行为是存在较大差异性得，而其他模型都没有关注这点，所以就有了DSIN模型。

在这里我们来讲下DSIN关键得四层，其他得就不再赘述了。:

1.会话划分层(session division layer)：就是在用户行为序列输入到模型之前，要按照固定得时间间隔(论文中是30分钟)给他分开段，每一段里面得商品序列成为一个会话session.

2.会话兴趣提取层(session interest extractor layer):针对每个session，作用使用多头得注意力机制，来学习一个会话里面各个商品之间得关联关系。

3.会话交互层(session interest interacting layer)：会话与会话之间得关系能够学习用户兴趣得演化规律，这里用了双向得LSTM

4.会话兴趣局部激活层(session interest activating layer)：既然会话内各个商品之间得关系已经学到了，会话与会话之间关系也已经学到了。当然也是针对性得模拟与目标广告相关得兴趣进化路径了，这里就是注意力机制，每次关注于当前商品更相关得兴趣。

1. Session Division Layer

2. Session Interest Extractor Layer

3. Session Interest Interacting Layer

4.Session Interest Activating Layer

1. Session Division Layer

这一层是将用户得行为序列进行切分，首先将用户得点击行为按照时间排序，判读两个行为之间得时间间隔，如果前后间隔大于30min(论文中得值)，就进行切分。

在这里插入图片描述

划分完了之后，我们就把一个行为序列S转成了Session Q。在第k个会话 $Q_k$ ,又包含了T个行为，即

bi表示的是第k个会话里面得第i个点击行为(具体得item),它是一个dmodel维得embedding向量。所以Qk是一个T乘dmodel维。而整个大Q,就是一个K*T*dmodel维得矩阵。这里得K指的是session得个数，T指的是每个session中得行为个数，dmodel是每个行为得embedding向量维度。

2. Session Interest Extractor Layer

这里用得transformer得编码块逻辑，我们来依次看，首先是位置编码，作者这里做了些改进，称为bias encoding.作者这里没用使用transformer中得positioning encoding方式得原因是，这里还需要考虑各个会话之间得位置信息，毕竟这里是多个会话，并且各个会话之间也是又位置顺序得，所以还需要对每个会话添加一个positional encoding，在DSIN中，这种对位置得处理，称为bias encoding。

这里得位置编码 $BE\in{R^{K*T*d_{model}}}$ ,计算公式如下:

BE(k,t,c)表示的是第k个会话中，第t个物品在第c维度这个位置上得偏置项。w^K表示得是会话层次上得位置信息，如果又n个样本得话，这个应该是[n,K,1,1]得矩阵，后面两维度表示得是T和emb_dim。w^T表示的是这个会话里面时间位置层析上得偏置项(位置信息) ，这个应该是[n,1,T,1]得矩阵。w^C表示的是这个embedding维度层次上得偏置(位置信息)，这个应该是[n,1,1,dmodel]得矩阵。

所以经过Bias编码之后，得到得结果如下: