精通推荐算法32:行为序列建模总结

news2024/11/17 10:24:11

1 行为序列建模总体架构

2 行为序列整体总结

用户行为序列建模是推荐算法中至关重要的一环,也是目前较为核心和前沿的研究方向。其主要分为短序列建模长序列建模两大方向。短序列建模又主要分为池化序列化两种方式,其中池化包括Sum-Pooling、Average-Pooling、Max-Pooling等非特征交叉型,和以DIN为代表的Attention-Pooling。序列化则包括以DIEN为代表的RNN型,和以BST、DSIN等为代表的Transformer型。目前基于Transformer强大的特征抽取和并行计算能力,Transformer型已经成为了短序列建模的主流

长序列建模则更进一步,考虑如何挖掘用户长期兴趣。其主要分为离线法在线法两大类。离线法以MIMN为代表。它通过独特的工程设计,将长周期行为序列先离线建模好,在线请求时直接调用,大大减少了模型耗时,从而满足上线需求。在线法以SIMETA为代表,它们基于两阶段范式,先搜索出长序列中与当前候选物品相关的行为,得到一个短序列,再基于Transformer等短序列建模方法,得到最终的序列表征。

用户行为序列建模是推荐系统中的重点和难点,目前越来越多的公司在这个方向投入重兵,并取得了非常不错的业务效果。同时,其与NLP中的文本序列建模一脉相承,有不少共同点,很多思想和方法可以相互借鉴。
 

参考文献

这是精通推荐算法23 ~ 精通推荐算法31,总共9篇文章的参考文献。这也是行为序列建模领域比较核心的paper,建议读者一定要详细阅读。

  1. Paul Covington, Jay Adams, and Emre Sargin. 2016. Deep Neural Networks for YouTube Recommendations. In RecSys. 191–198.
  2. Guorui Zhou, Xiaoqiang Zhu, et al. 2018. Deep Interest Network for Click-Through Rate Prediction. In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. ACM, 1059–1068.
  3. Guorui Zhou, Na Mou, Ying Fan, et al. 2019. Deep Interest Evolution Network for Click-Through Rate Prediction. In Proceedings of the 33nd AAAI Conference on Artificial Intelligence. Honolulu, USA.
  4. Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, and Wenwu Ou. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba. In Proceedings of the 1st International Workshop on Deep Learning Practice for High-Dimensional Sparse Data, pages 1–4, 2019.
  5. Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser, and Illia Polosukhin. Attention is all you need. In NIPS, pages 5998–6008, 2017.
  6. Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, and Keping Yang. Deep Session Interest Network for Click-Through Rate Prediction. In IJCAI, 2019.
  7. Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, and Kun Gai. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction. In KDD, 2019.
  8. Pi Qi, Xiaoqiang Zhu, Guorui Zhou, Yujing Zhang, Zhe Wang, Lejian Ren, Ying Fan, and Kun Gai. Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction. In KDD, 2020.
  9. Qiwei Chen, Changhua Pei, Shanshan Lv, Chao Li, Junfeng Ge, and Wenwu Ou. 2021. End-to-End User Behavior Retrieval in Click-Through Rate Prediction Model. arXiv preprint arXiv:2108.04468 (2021).

作者新书推荐

历经两年多,花费不少心血,终于撰写完成了这部新书。行为序列建模在第五章中重点阐述了,目录结构如下。

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式

微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

详细介绍和全书目录,详见

《精通推荐算法》,限时半价,半日达icon-default.png?t=O83Ahttps://u.jd.com/mq5gLOH

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2175806.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

828华为云征文 | 使用 Memtester 对华为云 X 实例进行内存性能测试

目录 前言 1 华为云X实例介绍 2 Memtester 简介 2.1 什么是Memtester 2.2 安装 Memtester 3 测试方案设计 3.1 测试目标 3.2 测试环境 3.3 测试命令 4 测试数据及性能分析 4.1 带宽测试结果 4.2 延迟测试结果 5 性能瓶颈与优化建议 6 总结 前言 在云计算的应用场…

Spring Boot 点餐系统:简化您的订餐流程

第五章 系统实现 5.1用户功能模块 用户点击进入到系统操作界面,可以对首页、个人中心、美食订单管理、美食评价管理、我的收藏管理等功能模块,个人信息:通过列表可以获取用户账号、用户姓名、性别、年龄、头像、用户手机、配送地址并进行修改…

Python入门:类的异步资源管理与回收( __del__ 方法中如何调用异步函数)

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 文章内容 📒📝 使用上下文管理器📝 使用 `__del__` 方法📝 结合使用上下文管理器与 `__del__`📝 资源回收的重要性⚓️ 相关链接 ⚓️📖 介绍 📖 在编程中,资源的管理和回收至关重要,尤其是在处理网络请求时。频…

Linux三剑客对数据处理

grep配合正则表达式可以灵活的查找文本内容。 但是有些时候我们不仅仅需要找出数据,还需要按照一定的规则进行整合,格式化排列 文本文件内有一百条规范数据,如下: John Doe, 25, Engineer Alice Smith, 30, Data Scientist Bob …

不将“旧”,换新家电的门槛又被TCL拉低了

在不同的时代背景中,“新旧”两字所代表的消费含义在不断更迭。过去物质匮乏的年代,“新三年,旧三年,缝缝补补又三年”的俭朴消费观贯穿了国人的生活。随着经济发展,“旧的不去,新的不来”逐渐成为社会消费…

市场调研利器 网络问卷的优势及面临的挑战

网络问卷作为市场调研工具,高效便捷、成本低廉、数据准确度高且灵活多样。但其低响应率、数据偏差、隐私与安全及技术依赖等挑战也需关注。企业应优化调研方法,应对挑战,以获取全面市场信息。 一、网络问卷的优势 首先,我们来分析…

【频分复用】5G中OFDM和GFDM的比较(频谱效率、误码率、星座图、复杂度)【附MATLAB代码及报告】

微信公众号:EW Frontier QQ交流群:554073254 背景 5G需要满足低延迟、高数据速率、连接密度和其他应用需求,这些应用需要增强的移动的宽带、超可靠和低延迟连接以及海量机器类型连接[1]。这种通信所需的信道容量受到噪声、衰减、失真和符号间…

千亿大数据不为人知的数据库缺陷——中看不中用的设置——MySQL大数据优化

一、数据插入之后变了2147483647 在 MySQL 数据库的操作中,我们常常会遇到各种意想不到的情况。其中,当插入日志数据时,如果没有对数据的大小和范围进行有效的控制,就可能会引发一系列问题。想象一下这样的场景:我们…

花都狮岭寄宿自闭症学校:开启孩子的生命之门

在花都狮岭这片充满温情的土地上,有一所特别的学校,它像一把钥匙,轻轻旋转,为自闭症儿童们开启了一扇通往无限可能的生命之门——这就是广州星贝育园自闭症儿童寄宿制学校。这所学校不仅是知识的摇篮,更是孩子们心灵成…

BACnet-NPDU(4)

前面抓取了BACnet 的UDP和RS485数据进行分析,现在做一下总结。 BACnet不管是走UDP还是RS485,里面的NPDU和APDU数据结构是一样的,只是BACnet的头不一样,这里做一下总结。 1、UDP的BACnet 头 BACnet/IP 使用 UDP 协议进行数据传输&a…

spring cloud Gateway网关

网关是将所有面向用户的服务接口统一管理的代理服务器,所有内部服务的远程调用都是在局域网内部,而网关是在公网中。 一、依赖 通过访问网关调用项目中的服务,需要使用Eureka,网关服务器需要在Eureka服务注册它自己,本…

【C++报错已解决】std::ios_base::floatfield

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 专栏介绍 在软件开发和日常使用中,BUG是不可避免的。本专栏致力于为广大开发者和技术爱好者提供一个关于BUG解决的经…

The 2024 CCPC Online Contest (C I J三题思路)

写在前面 因为学弟已经问了几个题了,于是乎这场没有vp,准备直接开写了 题目 C. 种树(树形dp) 题解 只有两种情况, 一种是1-2-3,1是2的父亲,2是3的父亲 另一种是1-2-3,2同时是1…

新手如何使用Qt——方法使用

前言 那么这篇文章其实是我在使用Qt的过程当中呢,我发现在Qt使用过程中,在我理解信号和槽这个概念后,在编写槽函数数的时候,发现了自身存在的问题,我的难点是在于当我在编写槽函数的时候,我知道这个槽函数是…

GD32片内flash读写数据

如有技术问题及技术需求请加作者微信! GD32片内Flash的读写数据是微控制器编程中的常见任务,主要用于存储程序代码、配置参数或用户数据等。以下将详细介绍GD32片内Flash的读写数据方法和程序。 一、GD32 Flash的基本特性 存储空间划分:GD32的Flash存储空间通常分为主存储块…

W39-02-jmeter中如何实现:下一个请求是需要根据前一个请求返回值进行循环请求

业务压测需求: 查询和上报接口, 1.查询接口返回的数据有好几条需要上报的数据 2.查询接口中返回的每条数据中,有两个字段需要传递到上报接口 3.查询接口中,这两个字段一个为int型,一个为数组[1,2,3,4] 实现方式 …

大模型算法岗常见面试题100道(非常详细)零基础入门到精通,收藏这一篇就够了

大模型应该是目前当之无愧的最有影响力的AI技术,它正在革新各个行业,包括自然语言处理、机器翻译、内容创作和客户服务等等,正在成为未来商业环境的重要组成部分。 截至目前大模型已经超过200个,在大模型纵横的时代,不…

2条件欧几里得聚类

条件欧几里得聚类 本教程介绍如何使用类: 一种分割算法,根据欧几里得距离和需要保持的用户可自定义条件对点进行聚类。pcl::ConditionalEuclideanClustering 此类使用与 Euclidean Cluster Extraction、Region growing segmentation 和 Color-based …

以太网交换安全:端口隔离

一、端口隔离 以太交换网络中为了实现报文之间的二层广播域的隔离,用户通常将不同的端口加人不同的 VLAN大型网络中,业务需求种类繁多,只通过 VLAN实现报文的二层隔离,会浪费有限的VLAN资源。而采用端口隔离功能,则可…

【Verilog学习日常】—牛客网刷题—Verilog企业真题—VL66

超前进位加法器 描述 题目描述: 求两个四位的数据编写一个四位的超前进位加法器,建议使用子模块 提示:超前进位加法器的位公式如下 这里‘’ ‘’符号不是‘加’和‘乘’,是‘或’和 ‘与’ 波形示意图: 输入…