(13)工业界推荐系统-小红书推荐场景及内部实践【用户行为序列建模】

news2024/11/21 0:33:18

(1)工业界推荐系统-小红书推荐场景及内部实践【业务指标、链路、ItemCF】
(2)工业界推荐系统-小红书推荐场景及内部实践【UserCF、离线特征处理】
(3)工业界推荐系统-小红书推荐场景及内部实践【矩阵补充、双塔模型】
(4)工业界推荐系统-小红书推荐场景及内部实践【正负样本选择】
(5)工业界推荐系统-小红书推荐场景及内部实践【线上召回和模型更新】
(6)工业界推荐系统-小红书推荐场景及内部实践【其他召回通道】
(7)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题1】
(8)工业界推荐系统-小红书推荐场景及内部实践【冷启动问题2】
(9)工业界推荐系统-小红书推荐场景及内部实践【排序模型】
(10)工业界推荐系统-小红书推荐场景及内部实践【排序模型的特征】
(11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
(12)工业界推荐系统-小红书推荐场景及内部实践【交叉结构】

LastN特征

  • LastN:用户最近的 𝑛 次交互(点击、点赞等)的物品ID。
  • 对 LastN 物品 ID 做 embedding,得到 𝑛 个向量。
  • 把 𝑛 个向量取平均,作为用户的一种特征。
  • 适用于召回双塔模型、粗排三塔模型、精排模型。
    在这里插入图片描述

Deep Neural Networks for YouTube Recommendations

DIN模型

  • DIN 用加权平均代替平均,即注意力机制 (attention)。
  • 权重:候选物品与用户 LastN 物品的相似度。
    在这里插入图片描述
  • 对于某候选物品,计算它与用户 LastN 物品的相似度。
  • 以相似度为权重,求用户 LastN 物品向量的加权和,结果是一个向量。
  • 把得到的向量作为一种用户特征,输入排序模型,预估(用户,候选物品)的点击率、点赞率等指标。
  • 本质是注意力机制(attention)。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

Deep interest network for click-through rate prediction

SIM模型

Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction

DIN模型的缺点

  • 注意力层的计算量 ∝ 𝑛(用户行为序列的长度)。
  • 只能记录最近几百个物品,否则计算量太大。
  • 缺点:关注短期兴趣,遗忘长期兴趣。

如何改进DIN?

  • 目标:保留用户长期行为序列(𝑛 很大),而且计算量不会过大。
  • 改进 DIN:
    • DIN 对 LastN 向量做加权平均,权重是相似度。
    • 如果某 LastN 物品与候选物品差异很大,则权重接近零。
    • 快速排除掉与候选物品无关的 LastN 物品,降低注意力 层的计算量。

SIM

  • 保留用户长期行为记录,𝑛 的大小可以是几千。
  • 对于每个候选物品,在用户 LastN 记录中做快速查找,找到 𝑘 个相似物品。
  • 把 LastN 变成 TopK,然后输入到注意力层。
  • SIM 模型减小计算量(从 𝑛 降到 𝑘)。

第一步 查找

  • 方法一:Hard Search
    • 根据候选物品的类目,保留 LastN 物品中类目相同的。
    • 简单,快速,无需训练。
  • 方法二:Soft Search
    • 把物品做 embedding,变成向量。
    • 把候选物品向量作为query,做 𝑘 近邻查找,保留 LastN 物品中最接近的 𝑘 个。
    • 效果更好,编程实现更复杂。

第二步 注意力机制

使用时间信息

  • 用户与某个 LastN 物品的交互时刻距今为 𝛿。
  • 对 𝛿 做离散化,再做 embedding,变成向量 𝐝。
  • 把两个向量做 concatenation,表征一个 LastN 物品。
    • 向量 𝐱 是物品 embedding 。
    • 向量 𝐝 是时间的 embedding。
      在这里插入图片描述

为什么 SIM 使用时间信息?

  • DIN 的序列短,记录用户近期行为。
  • SIM 的序列长,记录用户长期行为。
  • 时间越久远,重要性越低。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/183035.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker搭建LNMP+Wordpress

一、服务器环境 容器操作系统IP地址主要软件nginxCentOS 7172.18.0.10Docker-NginxmysqlCentOS 7172.18.0.20Docker-MysqlmysqlCentOS 7172.18.0.20Docker-Mysql 二、Linux系统基础镜像 systemctl stop firewalld setenforce 0 docker pull centos:7 #从公有仓库中下载cento…

cubeIDE开发, stm32人工智能开发应用实践(Cube.AI).篇三

一、cube.AI实际项目应用 接篇二,前文都是采用FP-AI-SENSING1案例和配套的B-L475E-IOT01A开发板来阐述的,而实际项目中,我们都是基于自身项目硬件平台来训练模型及部署模型的,我们仅仅需要cube.AI软件包(作为可调用库&…

技术大佬说我对「压测目标」的分析不够细

前言 前面总结压测类型的时候有简单描述了不同压测类型的从准备-脚本设计-压测的整体过程,但是对于压测对象没有更深入的进行分析总结,导致在压测执行结束后,出现压测结果不准确的情况。所以这边就压测的对象进行单独的总结分析。 在执行压测…

lego-loam学习笔记(三)

前言: 对于lego-loam中点云聚类源码的学习,它使用了广度优先算法,并且使用了数组双指针技巧。 主要分为两个部分: 第一个是labelComponents函数,它的功能是为每个点及其相邻的4个点运算角度,在对角度小于…

微信小程序开发

微信小程序开发 | 前言:本文章中的很大一部分内容的图片,文字信息来源于微信小程序官方文档和网络资源,感谢大家的支持,如文章中有不足和错误的地方,请及时联系作者-白泽。并协同修改,相信大家的帮助会使这…

屏蔽360阻止远程执行变更注册表自启动数据的办法

屏蔽360阻止远程执行变更注册表自启动数据的办法 运程服务器上的程序,由于需要。我在服务器中,加入更新升级自身(exe)文件,并变更操作系统自启动数据的代码。 实践证明,通过客户端,调用运程服务…

spring 声明式事务 @Transactional 运行原理

注意:如果想要理解spring 的声明式事务,必须先理解AOP 的原理。 一、spring注册 InfrastructureAdvisorAutoProxyCreator 通过 EnableTransactionManagement 可以看到先把TransactionManagementConfigurationSelector通过Import注册到spring。同时注意…

VULNCMS靶机

环境准备 靶机链接:百度网盘 请输入提取码 提取码:i3j0 虚拟机网络链接模式:桥接模式 攻击机系统:kali linux 2022.03 信息收集 1.查看靶机ip地址 2.探测目标靶机开放端口和服务情况。 nmap -p- -sV -A 192.168.1.108 漏洞…

嵌入式串行接口标准

在嵌入式系统中,经常使用UART接口实现通讯、调试日志数据等功能,但UART是一种异步通信协议,并未定义物理层的电气接口标准。 在板件通信时,UART接口之间通常基于IO直接连接进行通信(TTL/CMOS电平标准,3.3V电…

梦熊杯-十二月月赛-白银组题解-B.契约

B. Problem B.契约(contract.cpp) 内存限制:256 MiB 时间限制:1000 ms 标准输入输出 题目类型:传统 评测方式:文本比较 题目描述: 「璃月」是「契约」的国度。 摩拉克斯认为&#xff0c…

Lua 字符串

Lua 字符串 参考至菜鸟教程。 字符串或串(String)是由数字、字母、下划线组成的一串字符。 Lua 语言中字符串可以使用以下三种方式来表示: 单引号间的一串字符。双引号间的一串字符。[[ 与 ]] 间的一串字符。 以上三种方式的字符串实例如下: string1 …

基于语义分割Ground Truth(GT)转换yolov5目标检测标签(路面积水检测例子)

基于语义分割Ground Truth(GT)转换yolov5目标检测标签(路面积水检测例子) 概述 许多目标检测的数据是通过直接标注或者公开平台获得,如果存在语义分割Ground Truth的标签文件,怎么样实现yolov5的目标检测…

【图论】求欧拉回路

前言 你的qq密码是否在圆周率中出现? 一个有意思的编码问题:假设密码是固定位数,设有nnn位,每位是数字0-9,那么这样最短的“圆周率”的长度是多少?或者说求一个最短的数字串定包含所有密码。 理论 一些…

acwing1264_动态求连续区间和

目录 算法分类: 问题描述 算法适用题目范围: 实现代码: 算法分类: 树状数组/线段树 问题描述 给定 n个数组成的一个数列,规定有两种操作,一是修改某个元素,二是求子数列 [a,b]的连续和。 …

1602_MIT 6.828试验环境搭建

全部学习汇总: GreyZhang/g_unix: some basic learning about unix operating system. (github.com) 最近尝试看一下MIT的操作系统教程,找到了一个6.828的课程。看了一下网络上的介绍,看起来这个大家的认可度还是很高的。开动之前&#xff0c…

Android面经_111道安卓基础问题(四大组件BroadCast、内容提供者篇)

该文章涉及的内容主要是:BroadCast、内容提供者; Android基础问题——四大组件之BroadCast、ContentProvider 内容提供者1、BroadCast1.1、Android的广播分类1.2、Android的广播注册方式1.3、广播作用域2、内容提供者Content provider2.1、什么是内容提供…

Google Protobuf 实践使用开发

Android 敏捷开发助手 Lottie动画 轻松使用PNG、JPG等普通图片高保真转SVG图Android 完美的蒙层方案Android MMKV框架引入使用强大无匹的自定义下拉列表Google Protobuf 实践使用开发 Protobuf 实践使用前言Protobuf基本介绍Protobuf 使用配置protobuf 基本语法1. 基本使用2. …

JavaWeb-Ajax

JavaWeb-Ajax 3,Ajax 3.1 概述 AJAX (Asynchronous JavaScript And XML):异步的 JavaScript 和 XML。 我们先来说概念中的 JavaScript 和 XML,JavaScript 表明该技术和前端相关;XML 是指以此进行数据交换。 3.1.1 作用 AJAX…

用Python绘制傅里叶级数和泰勒级数逼近已知函数的动态过程

文章目录Taylor级数Fourier级数本文代码: Fourier级数和Taylor级数对原函数的逼近动画Taylor级数 级数是对已知函数的一种逼近,比较容易理解的是Taylor级数,通过多项式来逼近有限区间内的函数,其一般形式为 f(x)∑n0Nanxnf(x)\su…

Lua 运算符 - 较为特殊部分

Lua 运算符 - 较为特殊部分 参考至菜鸟教程。 算术运算符 操作符描述实例^乘幂A^2 输出结果 100-负号-A 输出结果 -10//整除运算符(>lua5.3)5//2 输出结果 2在 lua 中,/ 用作除法运算,计算结果包含小数部分,// 用作整除运算,计…