鱼哥推荐书籍第18期:《推荐系统》算法 案例与大模型

news2024/11/28 12:47:47

鱼哥推荐书籍第18期:《推荐系统》算法 案例与大模型

    • 什么是推荐系统?
    • 推荐系统解决了哪些问题?
    • 推荐系统的应用领域
    • 常用的推荐算法:
        • 基于内容的推荐算法
        • 协同过滤算法:
    • 如何系统学习推荐系统:
        • 第一部分:
        • 第二部分:
        • 第三部分:
        • 第四部分:

在当今数字化时代,推荐系统已经成为许多互联网平台的核心功能之一。无论是在线购物、音乐和视频流媒体、社交媒体,还是新闻和内容聚合,推荐系统都扮演着至关重要的角色。它们通过分析用户的历史行为和偏好,以及其他相关信息,为用户提供个性化的推荐内容,从而提高用户体验,增加平台的粘性,以及促进销售和内容传播。那么,推荐系统究竟是如何运作的呢?让我们深入探索一下。

在这里插入图片描述

什么是推荐系统?

推荐系统是计算机软件工程的一个子领域,通过大数据、机器学习等技术,在用户使用产品的过程中,学习用户的兴趣偏好,主动展示他可能喜欢的“物品”(这里的物品是指待推荐的东西,可以是商品、电影、视频、文章、音乐、美食、景点、理财产品甚至是人,后面都用物品指代,不再说明),从而促成“消费”,节省用户时间,提升用户体验,优化资源配置,最终为服务提供方、物品提供方创造商业价值。

上述定义有几点需要说明,以便大家更好地理解推荐系统的特性与本质。

  • 推荐系统是一种软件工程解决方案,通过代码实现推荐能力,将为用户推荐物品这一流程做到完全自动化。
  • 推荐系统是机器学习的一种应用,通过学习用户的行为数据,构建数学模型,预测用户的兴趣,最终为用户推送其可能喜欢的物品,满足用户被动的需求,提升用户体验。
  • 推荐系统是一项交互式产品功能,产品为推荐系统提供载体,用户在使用产品的过程中触发推荐系统,推荐系统为用户提供个性化的推荐。作为一个产品,物品怎么展示、如何与用户交互、交互过程中可能遇到什么问题,这些都要考虑。
  • 推荐系统是一项人机协同的(软件)服务,通过推荐系统,用户可以获得符合自身兴趣的物品推荐,满足其个性化的、被动的需求。任何服务都需要运营,在服务过程中,服务的宣导、问题的解决等都需要借助人力。
  • 推荐系统是一种过滤信息、匹配资源的手段,通过机器学习算法和软件工程,推荐系统从海量信息中为用户进行筛选和过滤。
  • 推荐系统最终的目标是提升用户体验,为服务提供方和物品提供方创造商业价值。

从上面的说明可知,推荐系统是一个偏业务的交叉学科,需要综合利用软件工程、机器学习、产品设计、运营、大数据等跨学科的知识,才可以构建出满足用户需求、有商业价值的推荐系统。

推荐系统解决了哪些问题?

推荐系统是互联网(特别是移动互联网)快速发展的产物。它本质上是一种从海量信息中为用户检索其感兴趣的信息的技术手段。推荐系统结合用户信息(地域、年龄、性别等)、物品信息(名称、价格、产地等)以及用户行为(浏览、购买、点击、播放等),利用机器学习技术构建用户兴趣模型,利用软件工程技术实现软件服务,为用户提供精准的个性化推荐。

推荐系统能够很好地满足物品提供方、平台方、用户三方的需求。拿淘宝购物举例,物品提供方是成千上万的网店,平台方是淘宝,用户是在淘宝上购物的自然人或企业。推荐系统可以更好地将物品曝光给有需要的用户,提升用户和物品的匹配效率。

从本质上讲,推荐系统解决的是资源配置问题。通过软件、算法、工程手段,将供给端(物品提供方)和需求端(用户)通过平台(提供个性化推荐的产品,如淘宝)进行匹配。推荐系统的目标是提升资源的配置效率。

推荐系统的应用领域

对于一款互联网产品来说,只要平台上存在“大量供用户消费的物品”,推荐系统就有用武之地。具体来说,推荐系统的应用领域主要有如下几类。

  • 电商:淘宝、京东、亚马逊等。
  • 视频:B 站、爱奇艺、抖音、快手等。
  • 音乐:网易云音乐、酷狗音乐、QQ 音乐等。
  • 资讯:微信公众号、今日头条、网易新闻等。
  • 生活服务:美团、携程、脉脉等。

可以说,只要是 to C 的互联网产品,都能看到推荐系统的身影。随着技术的发展、生活方式的改变,推荐系统更多的应用场景正在不断被挖掘和创造,比如无人驾驶汽车上的推荐、VR 设备上的推荐、线上线下融合推荐、跨品类的商品和服务推荐等。

常用的推荐算法:

推荐系统大量使用机器学习技术,机器学习技术是推荐系统中最核心的部分。推荐系统的常用算法,主要分为两类:基于内容的推荐算法和协同过滤算法。

基于内容的推荐算法

推荐系统通过技术手段将物品与人关联起来。物品自身包含很多属性,这些属性可以作为用户偏好的标签。通过记录用户与物品的交互行为,我们可以挖掘出代表用户对物品的偏好的标签,利用这些偏好标签为用户进行推荐,就是基于内容的推荐算法。拿商品推荐来说,商品有品牌、品类、价格、产地等属性,推荐系统可以根据用户以前的购买行为获得他对商品品牌、品类、价格、产地等属性的偏好,从而为他推荐可能感兴趣的商品。比如用户购买过 iPhone 手机,我们就可以根据这一行为挖掘出用户对“苹果”这个标签感兴趣,进而为用户推荐苹果电脑、苹果手机壳、苹果电源线等商品,如图所示。

在这里插入图片描述

协同过滤算法:

通过记录用户在互联网产品上的交互行为,可以利用“物以类聚,人以群分”的朴素思想来为用户提供个性化推荐。
具体来说,“物以类聚”是指如果有很多用户对某两个物品有相似的偏好,说明这两个物品是“相似”的,我们可以给用户推荐与其喜欢的物品“相似”的物品,这就是基于物品的(item-based)协同过滤算法。“人以群分”就是找到与目标用户兴趣相同的用户(有过类似的行为),将他们浏览过的内容推荐给目标用户,这就是基于用户的(user-based)协同过滤算法
在这里插入图片描述
这里提到的协同过滤算法是最古老、最简单的协同过滤算法。我们熟知的基于社交关系的推荐其实也是一种协同过滤,比如微信公众号将朋友点过“在看”的内容推荐给你。
在这里插入图片描述
这里提到的协同过滤是比较宽泛的概念,不局限于 user-based、item-based。只要利用群体行为构建推荐算法模型,就属于协同过滤的范畴。协同过滤的概念类似于生物学中的协同进化,通过个体之间直接或者间接的相互作用,挖掘出个体之间隐含的联系,由此推荐系统会越来越懂用户的兴趣偏好。

基于内容的推荐算法和协同过滤算法的差异。二者最本质的区别是:基于内容的推荐算法只使用用户自身的行为信息(与别的用户无关)为其进行推荐,而协同过滤需要利用群体的行为来为某个用户进行推荐(“协同”代表的是群体智慧)。

在真实的推荐场景中,多种算法往往会混合使用,比如混合多种基于内容的推荐算法,混合多种协同过滤算法,甚至将基于内容的推荐算法和协同过滤算法混合。

另外,在商业应用中,推荐算法一般包括召回和排序,召回是初筛的过程(利用多种策略、算法将用户可能喜欢的物品筛选出来),排序是精准打分的过程(构建打分模型,将初选的、用户可能感兴趣的物品按照用户兴趣分数降序排列)。

如何系统学习推荐系统:

今天在这里给大家推荐一本新上市的书《推荐系统:算法、案例与大模型》。全书共 8 篇 24 章,从不同角度介绍了推荐系统构建的理论、方法、策略、案例,围绕推荐系统在企业(特别是 B 端行业)中的应用与实践展开叙述。

在这里插入图片描述
给大家列出目录看一下,非常全面!

第一部分:

详解推荐系统基础,清晰、全面的推荐基础知识。

在这里插入图片描述

第二部分:

详解推荐系统核心算法。

在这里插入图片描述

第三部分:

工程实践与代码实战。

在这里插入图片描述

第四部分:

行业案例通过真实行业案例,呈现 B 端高频规则和策略。
在这里插入图片描述
最后一部分,ChatGPT、大模型与推荐系统篇,通过洞悉未来趋势,了解大模型时代下的推荐系统。
在这里插入图片描述
这本书是绝对的干货满满,书中的案例也是来自行业一线的真实案例,非常具有借鉴意义。

本书不同于市面上现有的推荐系统专题图书,对经典推荐问题的讲解简洁,且有实际案例,尤其增加了现今最火热的大模型与推荐系统结合的内容,可见这个有二十多年企业实践应用历史的话题,也正在焕发新的生命力。

推荐大家仔细看看目录,如果有你需要的知识,就可以买一本来看看~

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1599317.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java探索之旅】数组使用 初探JVM内存布局

🎥 屿小夏 : 个人主页 🔥个人专栏 : Java编程秘籍 🌄 莫道桑榆晚,为霞尚满天! 文章目录 📑前言一、数组的使用1.1 元素访问1.2 数组遍历 二、JVM的内存布局🌤️全篇总结 …

聚道云软件连接器助力企业实现滴滴出差报销自动化

一、客户介绍 某机械有限公司是一家在机械设备制造领域拥有深厚底蕴和卓越实力的企业。自公司成立以来,该公司始终秉承创新、务实、高效的发展理念,专注于机械设备的研发、生产和销售。经过多年的发展,公司已成为国内机械行业的佼佼者&#…

PyQt介绍——弹框介绍和使用

PyQt介绍——弹框介绍和使用 一、QMessageBox QMessageBox是一种通用的弹出式对话框,用于显示消息,允许用户通过单击不同的标准按钮对消息进行反馈 QMessageBox类提供了许多常用的弹出式对话框,如提示、警告、错误、询问、关于等对话框。这…

软考证书有用吗?软考证书的含金量大吗?

一、以考代评 通过考试并获得相应级别计算机专业技术资格(水平)证书的人员,表明其已具备从事相应专业岗位工作的水平和能力,用人单位可根据《工程技术人员职务试行条例》有关规定和工作需要,从获得计算机专业技术资格…

诺奖得主与巨资“铸剑”:两年内,Pasqal冲刺量子计算的商业化大关

PASQAL的量子计算机 几年前,中性原子技术似乎是最不可能取得突破的领域。因为它们没有电荷,这使得控制它们显得尤为困难。然而,随着哈佛大学和麻省理工学院的最新研究进展,以及像QuEra这样的私营初创公司的努力,中性原…

修改百度百科的词条的方法

百度百科作为国内最大的百科全书网站之一,是广大网民获取各类知识的重要途径之一。所以,如何修改百度百科的词条成为了很多人关心的话题。本文将介绍修改百度百科的方法,并提供一些技巧和注意事项。 注册百度账号 首先,进入百度百…

2024/4/6—力扣—简化路径

代码实现&#xff1a; // 分割/得到名字 char **split(const char *s, int *returnSize) {int n strlen(s);char **ans (char **)malloc(sizeof(char *) * n);int l 0, r 0, len 0;while (r < n) {while (r < n && s[r] /) {r;}l r;while (r < n &…

Flask前端页面文本框展示后端变量,路由函数内外两类

一、外&#xff01;路由函数外的前后端数据传输 Flask后端 ↓ 首先导入包&#xff0c;需要使用 后端&#xff1a;flask_socketio来进行路由外的数据传输&#xff0c; from flask_socketio import SocketIO, emit 前端&#xff1a;还有HTML头文件的设置。 <!DOCTYPE …

面试突击---MySQL索引

面试突击---MYSQL索引 面试表达技巧&#xff1a;1、谈一下你对于mysql索引的理解&#xff1f;&#xff08;为什么mysql要选择B树来存储索引&#xff09;2、索引有哪些分类&#xff1f;3、聚簇索引与非聚簇索引4、回表、索引覆盖、最左匹配原则、索引下推&#xff08;1&#xff…

实验案例二:配置路由器实现互通

一.实验环境 实验用具包括两台路由器&#xff08;或交换机)&#xff0e;一根双绞线缆&#xff0c;一台PC&#xff0c;一条Console线缆。 二.需求描述 如图6.14所示&#xff0c;将两台路由器的Gig0/0接口相连&#xff0c;通过一台PC连接设备的Console端口并配置IP地址&#x…

跟风Spring的context继承风格写的一个业务处理器,无聊

忽然记起spring的context的N重继承风格&#xff0c;一个抽象类实现一部份功能&#xff0c;想从那重改复写就从哪重开始。脑子一抽&#xff0c;也在业务代码里面玩了下。效果嘛。学得是有模有样&#xff0c;感觉就是越搞越复杂。有点过度设计了&#xff0c;折腾个啥呢。哈哈哈……

防止企业数据泄密的四种有效措施

防止企业数据泄密的四种有效措施 泄密大案每天都在上演&#xff0c;受害者既有几十人的小型企业&#xff0c;也有上万人的世界500强&#xff0c;为什么这些企业都难逃数据泄露的噩梦呢&#xff1f;我们应该采取什么措施来防止信息泄密呢&#xff1f; 首先我们来看看数据泄密的…

聚贤帮赵远峰:照亮希望 激励奋斗

在2023年河北涿州灾情爆发后,聚贤帮的一众学员深入困难群众中去,力所能及贡献自己的一份力量。其实早在2022年4月,聚贤帮的许多成员就曾多次踏入山区,开展慈善活动,用自己的力量为当地居民带来温暖和关爱。 “照亮希望,激励奋斗”成为了大家慈善活动的信仰。通过捐款和物资,聚…

swiper 插件 轮播图

html代码 <div class"text_box"><div class"swiper mySwiper"><div class"swiper-wrapper"><div class"swiper-slide"><imgsrc"https://cdn.pixabay.com/photo/2023/11/08/09/58/leaf-8374442_640.jp…

Linux --- 高级IO

目录 1. 什么是IO 2. 阻塞的本质 3. 五种IO模型 3.1. 通过故事认识五种IO模型 3.2. 上述故事的总结 3.3. 具体的五种IO模型 3.3.1. 阻塞IO 3.3.2. 非阻塞轮询式IO 3.3.3. 信号驱动IO 3.3.4. 多路转接IO 3.3.5. 异步IO 4. 非阻塞IO 4.1. fcntl 系统调用 1. 什么是I…

怎么清除3D模型杂质?---模大狮模型网

在进行3D建模过程中&#xff0c;模型可能会受到各种杂质的影响&#xff0c;这些杂质可能来自于模型本身的结构问题、导入导出过程中的错误、或者是不当的编辑操作所留下的痕迹。清除这些杂质是保证模型质量和渲染效果的关键步骤之一。本文将介绍几种常见的清除3D模型杂质的方法…

【Android】重温Activity生命周期

前言 Android中用得最多的组件是Activity&#xff0c;而它的生命周期也是最基础的知识&#xff0c;从刚接触Android到工作中会频繁依赖这部分知识。可能大多数人能说出页面新建到页面关闭会走的生命周期&#xff1a;onCreate、onStart、onResume、onPause、onStop、onDestory&…

计算机网络 Cisco路由器基本配置

一、实验内容 1、按照下表配置好PC机IP地址和路由器端口IP地址 2、配置好路由器特权密文密码“abcd&#xff0b;两位班内序号”和远程登录密码“star” 3、验证测试 a.验证各个接口的IP地址是否正确配置和开启 b.PC1 和 PC2 互ping c.验证PC1通过远程登陆到路由器上&#…

VMware安装Linux虚拟机(rocky9)

软件准备&#xff1a; VMware虚拟机ISO系统镜像文件 选择创建虚拟机→典型→下一步→点击稍后安装操作系统 选择Linux系统和对应版本 输入虚拟机名称和选择保存位置 设置磁盘大小 根据需要自定义硬件配置→完成 然后点击编辑虚拟机设置→CD/DVD→选择ISO镜像 然后开启虚拟机→…