推荐系统中冷启动环节的设计实现

news2024/7/2 21:29:54

目录

  • 推荐系统中冷启动环节的设计实现

推荐系统中冷启动环节的设计实现

唐楠烊 [IT阅读排行榜](javascript:void(0)😉 2024-06-28 07:15 北京

推荐系统中的冷启动分为物料冷启动和用户冷启动。用户冷启动主要是针对新用户,但有时候也用于低活用户拉活。物料冷启动主要是让优质物料得到快速下发,让模型可以迅速捕获到用户对该物料的关注。本文将详细讲解用户冷启动和物料冷启动。

1、用户冷启动

**
**

用户冷启动就是通过物料钩子、注册信息、多域信息、联邦学习等各种技巧去迅速获取用户的兴趣点实现个性化推荐,激发用户的留存。此外针对新用户还需要考虑定期刺激用户兴趣,不断用优质物料去试探用户,甚至做到兴趣的流转和承接,迅速抓住用户的兴趣,提高用户黏性。比如,针对信息流推送业务的用户进行冷启动,当一个新用户点击某条推送物料后,用户会迅速进入信息流的某个业务界面(如图文或者视频界面),这时候,对应的业务界面也要做好对应的承接推荐,继续给用户优质的物料,让用户深入地使用该产品,而不是用户点完一个物料以后就完毕了。因此,对承接页的物料展示位的填充就很讲究了,首先,基于推送的I2I物料肯定是要有的;其次,用户的其他兴趣点物料和高热度物料也要着重考虑。同时,对于相同的用户冷启动“打法”,除了针对新用户,也可以定期针对低活用户进行拉活冷启动。用户流失其实是一个常见的问题,关键还是要分析用户为什么流失的问题,比如用户物料兴趣得不到满足,有违规内容,App的生态运转不良,竞品用其他手段拉走了用户等。通过分析得到问题后,就要针对这部分低活用户进行类似冷启动的“打法”,并且做好一系列的兴趣承接工作让用户重新回到App里面。

2、物料冷启动

**
**

物料冷启动主要是针对新入库不久的物料,让其得到迅速下发,从而筛选出好的物料,产生流量的“滚雪球”效应。物料冷启动方法很多,主要包括用户粉丝冷启动、物料基础信息冷启动、物料相似性冷启动和物料进退场机制(具体请阅读《推荐系统全链路设计:原理解读与业务实践》一书)。

现在的主流“打法”是物料进退场机制(也称作爬坡机制)。物料进退场机制主要是为每个物料设置一级级的限制,然后就是设置物料爬坡的限制,之后再根据各个业务情况去设置更进一步的流量筛选条件,直到最后物料流入正常流量库。下图展现了整个冷启动物料到正常物料的流程。

图片

图11-1 冷启动物料到自然流量物料库的转换

冷启动流量需要考虑流量放量的速度和物料、用户的基础特征,相比自然流量的模型,冷启动环节的模型需要忽略反馈数据,如点击、下发、点赞、评论等。

3、PID算法

**
**

在流量分发的过程中,肯定不可能一次性爆发式地分发下去,而是间隔式地均匀分发。因为,流量在不同时段的量都是不同的,而且物料肯定不应该被集中式下发,应该在各个时段都有分发。所以,为了合理的分发物料,需要对物料流量进行合理的控制,PID(Proportion Integration Differentiation,比例-积分-微分控制器 )就是流量控制的典型算法。

PID算法分为比例、积分和微分三部分,是控制领域的常见稳定控制算法。具体公式如下:

图片

其中:

图片

图片

图11-2 PID流程

其实,PID操作类似于对热水器的水进行加热到固定水温。比如要将水温加热到40℃,一开始肯定要迅速升温,但是到35℃的时候就要减缓加温力度,到40℃就不再进行加温,只需要维持即可。怎么合理的将水温加到40℃,并且维持在40℃,就是PID需要做的事情。
PID的核心就是图片
l图片:控制当前主要误差的系数,图片越大,调节的力度越大,越激进; 图片越小,调节力度越保守。例如,假设某个物料需要发100条,要发10h,则每小时发10条(记为图片)。通过计算当前真实要发的量,图片越大,达到预期总发放量的速度越快。

l图片:如果仅仅用比例,假设我们计划发10条,但是只发了4条,这样实际发放和计划发放就存在暂态误差。如果暂态误差拉长就会变为稳态误差,所以,我们再引入一个分量,该分量和误差的积分是正比关系。由于这个积分项会将前面若干次的误差进行累计,所以可以很好地消除稳态误差。该值不宜太大,一般取0.8-2之间。

l图片:一般指t时刻和t-1时刻的误差值,即调节控制中的振荡,通常,微分环节相当于放大了反馈信号中的高频信号。系数取得不好会,就会引起高频震荡。

PID算法在实际的应用中就是模拟线上环境,然后对图片进行调参,让整个分发系统达到一个稳定的状态。

下面给出将某个物料在8h内分发100条的PID算法代码。

图片

实现了以上代码后,绘制时间和物料每小时的下发关系图。

图片

图片

图片

图片

图片

图片

作者:唐楠烊

来源:IT阅读排行榜

本文摘编自《推荐系统全链路设计:原理解读与业务实践》,机械工业出版社出版,经出版方授权发布,转载请标明文章来源。

延伸阅读

图片

*《推荐系统全链路设计:原理解读与业务实践》*

*唐楠烊 著*

一套基于业务场景的个性化精准推荐系统解决方案

推荐系统、NLP技术专家撰写

深度解读多层推荐系统构建和优化的原理和核心技术

*
*

内容简介:

这是一本指导中高级从业者高质量落地现代推荐系统,围绕现代推荐系统核心技术展开深度解读的专业工具书,又是一套完整的推荐系统高质量落地解决方案。本书基于推荐算法工程师实际工作场景规划内容,融合了作者在阿里巴巴、58同城等多家大厂做推荐系统设计和优化的经验,是一本方法和实践兼具的好书。

本书不针对零基础从业者,而是以帮助初级算法工程师向中高级进阶为目标。书中从底层剖析推荐系统在实际业务场景中可能出现的各种问题,直指问题的本质,并按照推荐系统工作流程逐一破解。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1872408.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CVPR24已开源:刷新监督学习SOTA,无监督多目标跟踪时代来临!

论文标题: Matching Anything by Segmenting Anything 论文作者: Siyuan Li, Lei Ke, Martin Danelljan, Luigi Piccinelli, Mattia Segu, Luc Van Gool, Fisher Yu 导读: 在计算机视觉的征途中,多目标跟踪(MOT&…

武汉凯迪正大—漆包圆线软化击穿试验仪 漆包线检测仪器

产品功能 武汉凯迪正大电气有限公司生产KDZD-JC软化击穿试验仪用于检测3.00mm及以下漆包线在热状态下漆膜软化后的绝缘性能,根据设定的预热温度、试验时间、仪器自动完成对试样的预加热、加负荷、加试验电压,达到试验时间或试样被击穿时即卸负荷&#x…

您渴望提升交易技能吗?

您渴望提升交易技能吗?Eagle Trader就是您的理想选择!我们精心设计了多样化的挑战,配备真实数据模拟交易环境,让您轻松精进交易技术。更有精选交易工具和卓越服务助您一臂之力,优化策略,洞察市场&#xff0…

锂电池的串并联特性

1节锂电池电芯的规格是10000mah,4v(总能量10000*4) 那么3节电芯串联电池的规格是10000mah,12v(总能量10000*12)注意,这里电池的规格不是30000mah 3节电芯并联的规格是30000mah,4v …

【数据采集】亮数据浏览器、亮网络解锁器实战指南

前言 继上次我们写了数据采集与AI分析,亮数据通义千问助力跨境电商前行的文章之后,好多小伙伴来后台留言,表示对亮数据的数据采集非常感兴趣,并且感觉用起来非常顺手,大大减少了小白用户获取数据的成本。 在这儿&…

Redis和PHP的Bitmap于二进制串的相互转换

Redis和PHP的Bitmap于二进制串的相互转换 场景 错题集的存储,需要有正确的题号id集合,错误的题号id集合,两者并集后在全量题的集合中取反就是未答题号id 选型 基于场景的数据结构设计,有试过列表等,测试结果&#xff1…

Debian linux忘记root密码如何重置

重启电脑, 到下图再按 e 键 在页面中可以看到有个ro的行,在ro行的尾部,添加 rw init/bin/bas 3. ctrl X 启动系统,最后会进入命令行模式 4. 重设root密码,输入命令 passwd root,按照提示输入新密码并确认 5. 重启系…

Spring项目报错解读与全部报错详解

你好,我是Qiuner. 为帮助别人少走弯路和记录自己编程学习过程而写博客 这是我的 github https://github.com/Qiuner ⭐️ ​ gitee https://gitee.com/Qiuner 🌹 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 😄 (^ ~ ^) 想看更多 那就点个关注吧 我…

智能语音热水器:置入NRK3301离线语音识别ic 迈向智能家居新时代

一、热水器语音识别芯片开发背景 在科技的今天,人们对于生活品质的追求已不仅仅满足于基本的物质需求,更渴望通过智能技术让生活变得更加便捷、舒适。热水器作为家庭生活中不可或缺的一部分,其智能化转型势在必行。 在传统热水器使用中&#…

ProfibusDP主站转Modbus模块连接称重仪配置案例

在工业自动化领域,常常需要将不同协议的设备进行连接。比如,将ProfibusDP主站转Modbus模块(XD-MDPBM20)用于连接称重仪,可以实现不同设备之间的数据交换和通信。ProfibusDP主站转Modbus网关(XD-MDPBM20&…

一站式AI服务平台:MaynorAI助您轻松驾驭人工智能

一站式AI服务平台:MaynorAI助您轻松驾驭人工智能 在当前的数字化时代,人工智能(AI)技术已经成为推动各行各业创新发展的核心动力。为了更好地满足企业和个人用户对AI服务的需求,MaynorAI 作为一个领先的一站式调用国内…

万物皆可爬——亮数据代理IP+Python爬虫批量下载百度图片助力AI训练

💂 个人网站:【 摸鱼游戏】【神级代码资源网站】【导航大全】🤟 一站式轻松构建小程序、Web网站、移动应用:👉注册地址🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交…

我用低代码平台自己搭建了一套MES应用系统,1天搞定!

MES系统是什么 MES系统是一套面向制造企业车间执行层的生产信息化管理系统。它能够为操作人员和管理人员提供计划的执行、跟踪以及所有资源(包括人、设备、物料、客户需求等)的当前状态。通过MES系统可以对从订单下达到产品完成的整个生产过程进行优化管…

2024年6月大众点评深圳餐饮店铺POI分析18万家

2024年6月大众点评深圳餐饮店铺POI共有178720家 店铺POI点位示例: 店铺id G9TSD2JvdLtA7fdm 店铺名称 江味龙虾馆(南山店) 十分制服务评分 8.8 十分制环境评分 8.8 十分制划算评分 8.6 人均价格 128 评价数量 12840 店铺地址 南山大道与桂庙路交叉口西北角…

vue3 【提效】使用 CSS 框架 UnoCSS 实用教程

该换种更高效的方式写 CSS 啦&#xff0c;举个例&#xff1a; <div class"flex"> </div>相当于 <div class"flex"> </div> <style> .flex {display: flex; } </style>当然&#xff0c;还有超多强大的功能帮我们提升…

MySQL事务:ACID特性的实现原理

事务是MySQL等关系型数据库区别于NoSQL的重要方面&#xff0c;是保证数据一致性的重要手段。本文将首先介绍MySQL事务相关的基础概念&#xff0c;然后介绍事务的ACID特性&#xff0c;并分析其实现原理。 一、基础概念 事务&#xff08;Transaction&#xff09;是访问和更新数…

大数据之FlinkCDC

最近在做FLinkCDC数据实时同步的数据抽取处理 目标: 将源端系统Oracle数据库的实时数据通过FLINKCDC的形式抽取到Doris中 问题: 在抽取的过程中,如果表的数据量太大,抽取超过30张表以后,所有的任务大概运行25~30分钟以后,所有的任务的状态会从running 变为 Failed. 解决方案…

RAG开发中常见的12个痛点及解决方案

受到 Barnett 等人论文《构建检索增强生成系统的七大挑战》启发&#xff0c;本文将探讨论文中提及的七大挑战及在开发 RAG&#xff08;检索增强生成&#xff09;流程中常遇到的五个额外难题。更为重要的是&#xff0c;我们将深入讨论解决这些 RAG 难题的策略&#xff0c;以便我…

综合IT运维管理解决方案

综合IT运维管理解决方案 在信息化和数字化高速发展的时代&#xff0c;企业的IT运维管理已经成为保障业务连续性和提升运营效率的关键环节。高效的IT运维管理不仅能够降低运维成本&#xff0c;还能提升服务质量和用户满意度。本文将详细介绍综合IT运维管理解决方案&#xff0c;…

照明物联网:基于网关的智能照明云监控系统解决方案

智能照明系统就是利用物联网技术&#xff0c;将同一空间的照明、空调、新风、排风等系统共同接入物联网平台&#xff0c;实现了“设备互联、数据互通”的智慧物联能力。照明数据、环境监测数据通过网关上传云端&#xff0c;在云端进行统计分析并将结果通过各种终端共享&#xf…