精通推荐算法1:为什么需要推荐系统(系列文章,建议收藏)

news2024/10/1 19:26:11

作者简介:

腾讯算法研究员。硕士毕业于中国科学院大学。在阿里和腾讯工作多年,拥有丰富的搜索和推荐算法经验。CSDN博客专家,原创文章100篇。发表专利15个,其中已授权6个。

1 概述

随着互联网的大力发展,用户规模和内容规模均呈现迅猛发展。用户侧日活过亿早已不是什么新鲜事,内容侧由于UGC生产方式的普及,拥有几十亿内容库的平台也屡见不鲜。如何让海量用户在海量内容中找到自己喜欢的,以及如何让海量内容被海量用户精准消费,一直以来都是每个公司十分核心的问题。

在这个背景下,搜索系统推荐系统应运而生。搜索主要解决用户如何快速寻找自己感兴趣内容的问题,偏主动型消费。推荐则主要解决内容如何精准推送给合适用户的问题,偏被动型消费。二者对用户、平台和内容都有十分重要的意义。

推荐系统与用户体验

用户第一基本是当今每个互联网公司的共识,作为流量分发的中心,推荐系统也不例外。几乎所有想长远发展的公司,其推荐系统都会将用户体验放在第一位,其次才是兼顾商业价值。推荐系统可以从如下几个方面提升用户体验:

  1. 加快信息获取效率:当前推荐系统通常基于个性化分发,不同用户看到的内容不同,即“千人千面”。它可以从海量内容中发现用户感兴趣的,节省用户寻找有用信息的时间,从而有效解决“信息过载”问题。图1所示为两个不同性别用户在京东APP首页的展示内容。左图为男性用户,展示内容主要为数码商品、家具电器和自行车。右图为女性用户,则以女装、母婴和厨房用品等为主。
  2. 提升内容供给质量:推荐系统基于优胜劣汰的原则,高质量内容通常更容易获取流量,而低质量内容则很可能会被淘汰。这有利于刺激生产者提升内容生产质量,从而提升用户体验。例如用户可以很轻松的买到物美价廉的商品,很容易的浏览到有深度有见地的文章等。
  3. 培养用户潜在兴趣:推荐系统还能不断试探、挖掘和培养用户的潜在兴趣,带来一定的惊喜性。这有助于用户兴趣的多样化,避免信息茧房和审美疲劳,从而提升用户体验。例如用户购买了一部手机,则之后陆续给他推荐手机壳、贴膜和耳机等配件。一年后再给他推荐其他手机,因为可能到了换机的时候,从而最大化挖掘其潜在需求。很多时候,推荐系统可能比用户更了解自己。

图1 不同性别用户的京东APP首页

推荐系统与内容生产

内容供给是每个平台型公司安身立命的根本,例如电商公司的核心在于,商品能否做到“多快好省”,其中每个字都是关键。推荐系统作为流量入口和分发中心,对内容生产的作用不言而喻。它可以从如下几个方面助力内容生产:

  1. 提升内容生产公平性:基于优胜劣汰原则,高质量内容获取的流量要远大于低质量内容。转化率的提升,可以带来曝光机会的进一步增加。创作者用心付出,自然就能得到平台的回报。另外受众广的内容比受众窄的更容易得到流量,但其竞争往往也更为激烈,最终可以达到动态平衡。总之,推荐系统创造了一个相对公平的环境,让各种不同的内容可以充分自由竞争。
  2. 增加内容曝光机会基于个性化分发,推荐系统可以提升用户浏览量和粘性,从而提升平台整体流量。这也为每个创作者带来了福音,特别是曝光机会聊聊的尾部创作者。另外,个性化分发和热门打压策略,有助于流量的均衡化,避免过于集中在头部物品上。从而增加其他内容的曝光机会。
  3. 扶持有潜力的中小生产者:推荐系统同样存在马太效应,中小生产者数量很大,但曝光机会不多。他们虽然良莠不齐,但处于成长阶段,未来潜力很大。另外他们对内容多样性和平台生态意义重大。因此推荐系统往往会对其进行扶持。通过冷启保量生态扶持等策略,给予中小生产者一定流量,有利于加速其成长。

最后需要注意的是,增大用户规模提升用户粘性,才能做大平台整体流量,从而从根本上提升生产者曝光机会,以及做到流量普惠。要做到这些,还是需要不断提升用户体验。从这个角度同样可以看出用户体验的重要意义。

推荐系统与平台发展

推荐系统对平台发展同样至关重要。它很大程度上决定了内容分发效率,并与公司各项核心指标息息相关。它可以从如下几个方面助力平台发展:

  1. 扩大用户规模:优化推荐系统,有利于提升用户体验,可以增加用户留存,从而提升平台日活、月活和注册用户数等关键指标。不重视这一点的公司,辛辛苦苦做营销活动获取的新用户,也很容易流失掉。
  2. 提升平台流量好的推荐系统可以不断发掘和满足用户实时需求,让用户沉浸其中。这有利于提升用户消费深度和粘性,从而增加人均曝光、人均点击和人均时长等核心效率指标。目前抖音和快手等短视频平台,人均时长已经高达100分钟以上,推荐系统在其中起到了十分重要的作用。
  3. 增加公司收入公司发展的最终目的还是盈利,因此平台收入是终极目标。通过优化推荐系统,可以提高电商平台订单量和内容平台使用时长。从而有利于商业化目标(如广告)的达成。2021年天猫“双十一”成交额为5403亿元,其中大部分是搜索和推荐系统流量。即使1%的提升也能带来540亿元的增量,十分惊人。另外,抖音2022年广告收入超过2000亿元,推荐系统同样功不可没。

正因为推荐系统的重要地位,Netflix于2006年推出一项竞赛,获奖者可以获得100万美元的巨额奖金,以帮助优化其推荐系统。目前,各家公司在推荐系统上的研发投入,都毫不吝啬,也印证了其重要地位。图1-2所示为2009年-2021年天猫“双十一”成交额,其规模十分惊人。

图2 2009年-2021年天猫“双十一”成交额

5 总结

搜索、推荐和广告是绝大多数互联网公司的核心业务,其地位不言而喻。从事这个方向的工程师是十分幸运的。同时,搜索、推荐和广告三大方向一脉相承,其复用性很高,基本掌握一个方向,其他另外两个方向也能得心应手。本文是《精通推荐算法》系列文章的第一篇,后续会连载更多内容。包括召回、粗排、精排和重排的知识体系当前重难点如何优化,以及业界的经典模型等。干货多多,强烈建议关注和收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1332773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

操作无法完成(错误 0x000006ba),Windows 11 PDF打印机无法使用解决办法

操作无法完成(错误 0x000006ba),Windows 11 PDF打印机无法使用解决办法 解决方式一 先重启一次电脑,看看是否可以解决问题。 解决方式二 重新启动 Printer Spooler 服务

降本后如何有效增效

在当今竞争激烈的商业环境中,“勒紧裤腰带”式的求生存谋发展,已成为更多成长型企业常态化的战略方向之一了。然而,如何在有限的资源成本下释放更多的效能?降本策略是否会影响组织活力造成得不偿失的结果?如果降本之后…

Maya python清除命名空间

问题描述: Maya命名空间可能存在嵌套。 如上,直接删除 :female_actor02会出现异常。 因此需要先删除子命名空间,再删除父命名空间。 解决方法: def remove_namespace_node(namespace_name, ns_parent":"):""…

解决虚拟机卡顿、卡死、待机后不动的情况(真实有效

本人环境: VM workstation 17.5 ubuntu 22.04 虚拟机配置:4核 4g issue: 出现开机卡死不动运行一段时间,可能半小时不到,就页面卡死不动经常需要关机重启才解决,可能没有解决 1.配置虚拟化引擎 这一步我称…

旅游品牌网站搭建的作用是什么

我国旅游业规模非常高,各地大小旅游景区也是非常多,尤其节假日更是可以达到峰值,无论周边游还是外地游对所要去的景区,消费者总是需要来回了解很多,浏览器查或旅行社咨询等。 对旅游企业而言,传统线下方式…

css 实现满屏升空的气球动画

最终实现效果 demo放在最后了。。。。 问题一 怎么实现满屏气球?简单理解就是多个气球的合并,难道要写多个盒子吗?确实是这样子,但可以有更好的办法,其实就是通过原生操作多个盒子生成,所以只需要实现一个…

【JavaWeb学习笔记】13 - JSP浏览器渲染技术

项目代码 https://github.com/yinhai1114/JavaWeb_LearningCode/tree/main/jsp 目录 项目代码 JSP 一、JSP引入 1.JSP现状 2.为什么需要JSP 二、JSP基本原理及使用 1.基本介绍 2.快速入门 ​编辑 3.JSP运行原理 4.page指令 三、JSP三种常用的脚本 1.声明脚本基本语…

做到这两条,破解35岁中年危机

最近我在看吴军老师的《富足》这本书,其中有一篇文章讲的是如何破解35岁中年危机,我觉得讲清楚了这个问题的本质,我在这里分享给你,以下内容大部分摘抄自《破解35岁中年危机》一章。 35岁中年危机的原因 35岁中年危机的说法好像…

nodejs微信小程序+python+PHP计算机网络在线考试系统-计算机毕业设计推荐

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性:…

04_线性表

线性表 顺序表顺序表的实现顺序表的遍历顺序表的容量可变顺序表的时间复杂度java中ArrayList实现 链表单向链表单向链表API设计java中LinkedList实现 链表的复杂度分析链表反转快慢指针中间值问题单向链表是否有环问题有环链表入口问题 循环链表约瑟夫问题 栈栈概述生活中的栈计…

nuxt打包占用磁盘IO

目录 前言排除过程 前言 jenkins运行打包,总是要卡一段时间,磁盘IO很高。我手动执行后的确发现了这个问题,如下图所示。 排除过程 我的方案很原始,利用git恢复到以前的版本,抽检,搞了差不多两个小时&am…

简单的喷淋实验--嵌入式实训

目录 喷淋实验--嵌入式实训 1.MQTT通信原理 2.MQTT库的移植 3.代码流程 运行视频如下: 喷淋实验--嵌入式实训 1.MQTT通信原理 MQTT(Message Queuing Telemetry Transport)是一种轻量级的发布/订阅消息传输协议,旨在提供可靠、高效的通信…

基于Java SSM框架实现教学质量评价评教系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现教学质量评价评教系统演示 摘要 随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,教学质量评价系统当然也不能排除在外。教学质量评价系统是以实际运用为…

Git本地仓库命令补充

说明:之前对Git本地仓库的基础使用总结过一篇笔记,Git本地仓库使用,本文对Git的一些基础命令进行补充。 一步提交 通常,我们本地仓库使用Git,文件都需要先 add,将文件从工作区加入到暂存区,然…

MOSFET管驱动设计细节,波形分析

MOSFET管驱动设计细节,波形分析 Chapter1 MOSFET管驱动设计细节,波形分析MOSFET驱动芯片的内部结构MOS驱动电路设计需要注意的地方MOS管驱动电路参考MOS管驱动电路的布线设计常见的MOS管驱动波形高频振铃严重的毁容方波又胖又圆的肥猪波打肿脸充正弦的生于方波他们家的三角波大…

windows server 2008 R2 x64 基础知识(2)

一、防火墙设置 1.windows防火墙的种类: 1)工作组网络环境 2)域网络环境 2.防火墙的配置 1)打开管理工具:win->管理工具->高级安全windows防火墙 2)管理配置: (1)防火墙的数据流类型 a.入站流量:外部访问内部分流量 b…

Trinity软件对转录组进行无参比对教程

写在前面 2023年将结束,小杜的生信笔记分享个人学习笔记也有2年的时间。在这2年的时间中,分享算是成为工作、学习和生活中的一部分。自己为了运行和维护社群也算花费大量的时间和精力,自己认为还算满意吧。对于个人来说,自己一直…

Tauri:构建高效安全的桌面应用程序 | 开源日报 No.124

tauri-apps/tauri Stars: 64.6k License: Apache-2.0 Tauri 是一个开源项目,它可以通过 Web 前端构建更小、更快和更安全的桌面应用程序。 该项目具有以下优势和特点: Tauri 可以帮助用户构建桌面应用程序,并使用 web 前端技术进行界面设计…

uniapp框架——初始化vue3项目(搭建ai项目)

uniapp框架 uni-app 是一个使用 Vue.js 开发所有前端应用的框架,开发者编写一套代码,可发布到iOS、Android、Web(响应式)、以及各种小程序(微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝)、快应用等多个平…

[deepspeed]deepspeed安装和测试代码

deepspeed官方对linux系统支持非常好,安装流程较为简单,推荐使用linux系统使用deepspeed.deepspeed由于要使用大模型进行训练和推理,建议显存>24GB。windows上官方不直接支持,但是网上有安装whl文件,只能0.8.3这样老…