好书推荐 -- 《精通推荐算法》

news2024/12/25 9:17:22

新书发布,京东限时15天内5折优惠,半天即可送到。

图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

1 作者介绍、本书内容、Q&A、业内人士好评和图书实拍

本书不仅适合推荐算法工程师,还适合搜索、广告和营销等领域的从业者。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

2 全书目录

第1章 推荐系统概述 1

1.1 为什么需要推荐系统 1

1.1.1 推荐系统与用户体验 2

1.1.2 推荐系统与内容生产 3

1.1.3 推荐系统与平台发展 4

1.2 推荐系统分类 5

1.2.1 业务领域分类 5

1.2.2 内容介质分类 5

1.2.3 交互形态分类 6

1.2.4 应用场景分类 6

1.3 推荐系统技术架构 7

1.4 本章小结 9

第2章 数据样本和特征工程 10

2.1 数据样本 10

2.1.1 样本不均衡问题 11

2.1.2 样本不置信问题 14

2.1.3 离/在线样本不一致问题 16

2.2 特征工程 17

2.2.1 特征类目体系 18

2.2.2 特征处理范式 21

2.2.3 特征重要性评估 22

2.3 本章小结 23

第3章 传统推荐算法 25

## 3.1 协同过滤 25

3.1.1 基于用户的协同过滤 26

3.1.2 基于物品的协同过滤 27

3.1.3 协同过滤的优点和局限性 28

3.2 矩阵分解 29

3.2.1 矩阵分解实现方法 30

3.2.2 矩阵分解的优点和局限性 31

3.3 逻辑回归 31

3.3.1 逻辑回归求解过程 33

3.3.2 逻辑回归的优点和局限性 34

3.4 因子分解机 35

3.4.1 因子分解机模型简化 35

3.4.2 因子分解机的优点和局限性 36

3.5 组合模型 37

3.5.1 GBDT + LR组合模型结构 38

3.5.2 GBDT特征转换过程 39

3.5.3 组合模型的思考和总结 40

3.6 本章小结 40

第4章 特征交叉 42

4.1 特征交叉概述 43

4.1.1 特征交叉的意义 43

4.1.2 特征交叉基本范式 44

4.1.3 特征交叉的难点 45

4.2 Deep Crossing:经典DNN框架模型 46

4.2.1 业务背景和特征体系 46

4.2.2 模型结构 48

4.2.3 实现方法 52

4.3 FNN 54

4.3.1 为什么Embedding收敛慢 55

4.3.2 模型结构 55

4.4 PNN 58

4.4.1 模型结构 58

4.4.2 特征交叉实现方法 59

4.5 Wide&Deep:异构模型奠基者 61

4.5.1 “记忆”和“泛化” 61

4.5.2 模型结构 62

4.5.3 系统实现 64

4.5.4 代码解析 66

4.6 DeepFM:异构模型Wide侧引入FM 68

4.6.1 模型结构 68

4.6.2 代码解析 70

4.7 DCN:异构模型Wide侧引入高阶交叉 74

4.8 NFM:异构模型Deep侧引入显式交叉 77

4.9 xDeepFM:异构模型引入子分支 79

4.10 本章小结 83

第5章 用户行为序列建模 85

5.1 用户行为序列建模概述 86

5.1.1 行为序列建模的意义 87

5.1.2 行为序列建模的基本范式 87

5.1.3 行为序列建模的主要难点 88

5.1.4 行为序列特征工程 89

5.2 DIN:基于注意力机制建模用户行为序列 90

5.2.1 背景 90

5.2.2 模型结构 92

5.2.3 模型训练方法 95

5.2.4 代码解析 98

5.3 DIEN:GRU建模用户行为序列 100

5.3.1 模型结构:兴趣抽取层 100

5.3.2 模型结构:兴趣进化层 103

5.4 BST:Transformer建模用户行为序列 105

5.4.1 模型结构 105

5.4.2 代码解析 109

5.5 DSIN:基于Session建模用户行为序列 114

5.6 MIMN:基于神经图灵机建模长周期行为序列 117

5.6.1 工程设计:UIC模块 118

5.6.2 MIMN模型结构 119

5.7 SIM:基于检索建模长周期行为序列 123

5.8 ETA:基于SimHash实现检索索引在线化 126

5.8.1 ETA模型结构 127

5.8.2 SimHash原理 128

5.9 本章小结 129

第6章 Embedding表征学习 131

6.1 Embedding表征学习概述 132

6.1.1 Embedding概述 133

6.1.2 Embedding表征学习的意义 134

6.1.3 Embedding表征学习的基本范式 134

6.1.4 Embedding表征学习的主要难点 135

6.2 基于序列的Embedding建模方法 135

6.2.1 Word2vec任务定义:CBOW和Skip-gram 136

6.2.2 Word2vec模型结构 137

6.2.3 Word2vec训练方法 138

6.2.4 Item2vec:推荐系统引入序列Embedding 139

6.2.5 序列建模总结和思考 139

6.3 基于同构图游走的Graph Embedding 139

6.3.1 DeepWalk:同构图游走算法开山之作 140

6.3.2 LINE:一阶相似度和二阶相似度探索 141

6.3.3 Node2vec:同质性和结构等价性探索 142

6.3.4 同构图游走的优缺点 144

6.4 基于异构图游走的Graph Embedding 145

6.4.1 Metapath2vec 145

6.4.2 EGES 146

6.4.3 异构图游走的优缺点 149

6.5 图神经网络 149

6.5.1 GCN:图神经网络开山之作 149

6.5.2 GraphSAGE:图神经网络工业应用的高潮 152

6.5.3 图神经网络总结 153

6.6 向量检索技术 153

6.6.1 向量距离计算方法 154

6.6.2 向量检索算法 156

6.6.3 向量检索常用工具:Faiss 161

6.7 本章小结 162

第7章 多任务学习 165

7.1 多任务学习发展历程 166

7.1.1 为什么需要多任务学习 166

7.1.2 多任务学习的基本框架 167

7.1.3 多任务学习的难点和挑战 168

7.2 ESMM模型:解决SSB和DS问题的利器 169

7.2.1 样本选择偏差和数据稀疏问题 169

7.2.2 ESMM模型结构 170

7.2.3 ESMM核心代码 172

7.3 MMOE模型:多专家多门控网络 174

7.3.1 MMOE模型结构 174

7.3.2 MMOE核心代码 177

7.4 PLE模型:解决负迁移和跷跷板现象的利器 179

7.4.1 负迁移和跷跷板现象 180

7.4.2 单层CGC模型结构 180

7.4.3 PLE模型结构 183

7.4.4 PLE核心代码 184

7.5 多任务融合 188

7.5.1 网格搜索 189

7.5.2 排序模型 190

7.5.3 强化学习 190

7.6 本章小结 192

第8章 召回算法 194

8.1 召回概述 196

8.1.1 推荐底池 196

8.1.2 多路召回 197

8.1.3 召回的难点 198

8.1.4 召回评价体系 199

8.2 个性化召回 200

8.2.1 基于内容的个性化召回 200

8.2.2 基于协同过滤的个性化召回 201

8.2.3 基于社交关系的个性化召回 203

8.3 向量召回 203

8.3.1 实现方法 204

8.3.2 YouTube DNN 204

8.3.3 Facebook EBR 206

8.3.4 百度MOBIUS 208

8.4 用户行为序列类向量召回 209

8.4.1 多峰兴趣建模的意义 210

8.4.2 MIND的模型结构 210

8.4.3 胶囊网络 212

8.5 样本选择偏差问题 213

8.5.1 召回样本构建方法 213

8.5.2 ESAM和迁移学习 215

8.6 召回检索优化和TDM 218

8.6.1 TDM在线检索过程 218

8.6.2 TDM索引构建和模型训练过程 220

8.6.3 JTM 221

8.6.4 OTM 222

8.7 本章小结 223

第9章 粗排算法 226

9.1 粗排概述 228

9.1.1 粗排样本和特征 228

9.1.2 粗排发展历程 228

9.1.3 粗排的难点 230

9.1.4 粗排评价体系 230

9.2 PFD模型:知识蒸馏学习交叉特征 231

9.2.1 PFD模型结构 231

9.2.2 PFD模型原理 232

9.2.3 PFD与传统蒸馏相结合 233

9.2.4 PFD在精排中的应用 234

9.3 COLD模型:显式特征交叉 235

9.3.1 双塔内积模型 235

9.3.2 COLD模型 237

9.4 FSCD模型:效果和效率联合优化 238

9.4.1 FSCD特征选择原理 239

9.4.2 FSCD训练步骤 241

9.5 本章小结 242

第10章 重排算法 243

10.1 重排概述 245

10.1.1 为什么需要重排 245

10.1.2 重排的难点和挑战 245

10.1.3 流量调控 246

10.2 打散和多样性 246

10.2.1 打散 247

10.2.2 多样性 248

10.2.3 多样性发展历程 248

10.3 上下文感知和PRM模型 249

10.3.1 什么是上下文感知 250

10.3.2 PRM模型结构 250

10.3.3 其他上下文感知实现方案 253

10.4 实时性和延迟反馈问题 254

10.4.1 推荐系统实时性的意义 254

10.4.2 推荐系统实时性分类 255

10.4.3 延迟反馈问题 256

10.4.4 延迟反馈优化方案 257

10.5 端上重排和EdgeRec 257

10.5.1 为什么需要端上模型 258

10.5.2 端上推理引擎 259

10.5.3 EdgeRec系统架构 259

10.5.4 EdgeRec模型结构 260

3 购书方式

新书发布,京东限时15天内5折优惠,一杯咖啡的价钱。

京东自营,半天即可送到。

图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询,售后无忧。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式
微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。
售后:支持京东七天无理由退货,售后无忧。

4 买家评论

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1953942.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[CISCN2019 华东南赛区]Web11

进来先做信息收集,右上角显示当前ip,然后有api的调用地址和请求包的格式以及最重要的是最下面的smarty模版,一看到这个就得想到smarty模版注入 测试了一下两个api都无法访问 直接切到数据包看看能不能通过XFF来修改右上角ip 成功修改&#x…

Unity横版动作游戏 -瓦片地形和动画瓦片

(规则瓦片)瓦片地形和动画瓦片 准备阶段 在Tilemap中创建一个新的文件夹起名叫做Rule Tile,创建一个Rule Tile,用来设置瓦片地形,我们将用他来绘制地形图,类似于Godot中的瓦片地形。 这里给他取名为了Ground 1,用于创…

ARM32开发——PWM蜂鸣器案例

🎬 秋野酱:《个人主页》 🔥 个人专栏:《Java专栏》《Python专栏》 ⛺️心若有所向往,何惧道阻且长 文章目录 需求原来的驱动移植操作替换初始化 更新Play函数完整代码 需求 通过控制PB9来播放音乐,PB9对应的定时器通道&#xff1…

CTF之网站被黑

简单看一下网页和源码没发现什么明显漏洞 那就扫描一下目录 发现了/shell.php文件,访问一下,发现是一个后台管理登录页面 别无他法只能爆破喽,爆破后发现密码是hack flag{25891d9e9d377f006eda3ca7d4c34c4d}

2024第三届钉钉杯大学生大数据挑战赛【A题】完整分享

2024第三届钉钉杯大学生大数据挑战赛已经开赛,小编给大家带来非常实用的助力【A题】完整,(看图片下方的说明),资料预览: 微信公众号

【python】批量读取Word文档中的特定表格并保存为Excel文件

批量读取Word文档中的特定表格并保存为Excel文件 在工作中,我们常常需要从多个Word文档中提取数据,然后将这些数据汇总到一个Excel文件中进行分析。下面,我将分享一个Python脚本,它可以从多个Word文档中读取特定的表格数据&#…

暑期c++ 命名空间

有任何不懂的问题可以评论区留言&#xff0c;能力范围内都会一一回答 今天是暑期第一天开始写c笔记&#xff0c;新起点&#xff0c;新开始加油 我们先来看两串代码 这串代码编译没有问题 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> int rand 14; int main(…

手机图片如何转化为word文档?分享3种好用的软件。

在数字化时代&#xff0c;手机已经成为我们生活中不可或缺的一部分。随着手机拍照功能的日益强大&#xff0c;我们常常用手机记录下重要的信息和瞬间。但你有没有遇到过这样的烦恼&#xff1a;如何将手机里的图片快速转化为可编辑的Word文档呢&#xff1f;今天&#xff0c;就为…

从工艺到性能:模具3D打印材料不断革新

在模具3D打印领域&#xff0c;材料性能的持续优化与创新是推动模具3D打印的关键因素&#xff0c;近年来&#xff0c;各种3D打印新材料不断涌现&#xff0c;模具3D打印材料也开始重工艺导向逐步向性能导向发展&#xff0c;如毅速公司推出的ESU-EM191/191S及ESU-EM201不锈钢粉末、…

C语言 | Leetcode C语言题解之第299题猜数字游戏

题目&#xff1a; 题解&#xff1a; #define MIN(a, b) ((a) < (b) ? (a) : (b))char * getHint(char * secret, char * guess){int A 0;int B 0;int dicS[10] {0};int dicG[10] {0};int i 0;while(secret[i]){if(secret[i] guess[i]){//同位置且相等&#xff08;完…

【React】useState:状态管理的基石

文章目录 一、什么是 useState&#xff1f;二、useState 的基本用法三、useState 的工作原理四、高级用法五、最佳实践 在现代前端开发中&#xff0c;React 是一个非常流行的库&#xff0c;而 useState 是 React 中最重要的 Hook 之一。useState 使得函数组件能够拥有自己的状态…

RHEL 7.6 安装oracle database 19c Real Application Cluster Part5: RU配置

RHEL 7.6 安装oracle database 19c Real Application Cluster Part1: 基础环境配置 RHEL 7.6 安装oracle database 19c Real Application Cluster Part2: Grid Infrastructure配置 RHEL 7.6 安装oracle database 19c Real Application Cluster Part3: ASM磁盘组配置 RHEL 7.…

《程序猿入职必会(5) · CURD 页面细节规范 》

&#x1f4e2; 大家好&#xff0c;我是 【战神刘玉栋】&#xff0c;有10多年的研发经验&#xff0c;致力于前后端技术栈的知识沉淀和传播。 &#x1f497; &#x1f33b; CSDN入驻不久&#xff0c;希望大家多多支持&#xff0c;后续会继续提升文章质量&#xff0c;绝不滥竽充数…

深入理解多态:发工资

看完目录就可以大概理解了&#xff0c;然后就需要去敲一敲代码&#xff0c;不过这个多态还确实挺厉害的。 目录 做一件事 员工1&#xff1a;干第一个过程 员工2&#xff1a;干第二个过程 员工3&#xff1a;干第三个过程 员工4&#xff1a;干第四个过程 员工5&#xff1a;…

Live555源码阅读笔记:哈希表的实现(C++)

&#x1f601;博客主页&#x1f601;&#xff1a;&#x1f680;https://blog.csdn.net/wkd_007&#x1f680; &#x1f911;博客内容&#x1f911;&#xff1a;&#x1f36d;嵌入式开发、Linux、C语言、C、数据结构、音视频&#x1f36d; &#x1f923;本文内容&#x1f923;&a…

重生之“我打数据结构,真的假的?”--6.排序

1.排序的概念 排序&#xff1a;所谓排序&#xff0c;就是使⼀串记录&#xff0c;按照其中的某个或某些关键字的⼤⼩&#xff0c;递增或递减的排列起来的 操作。 1.1排序分类 2.排序算法实现 2.1插入排序 直接插⼊排序是⼀种简单的插⼊排序法&#xff0c;其基本思想是&#…

深入探索Python3网络爬虫:构建数据抓取与解析的强大工具

前言 在当今这个信息爆炸的时代&#xff0c;数据成为了驱动各行各业发展的关键要素。无论是市场分析、用户行为研究&#xff0c;还是内容聚合与推荐系统&#xff0c;都需要从海量的互联网数据中提取有价值的信息。而网络爬虫&#xff0c;作为自动化获取网页数据的技术手段&…

FPGA开发——按键的使用及其消抖方法

一、概述 我们在进行各种硬件开发时通常都会实现多效果的综合和实现&#xff0c;而在实际的开发中&#xff0c;每个时刻只会显示单个效果&#xff0c;这就需要涉及到效果之间的切换了&#xff0c;而要实现状态切换最好的就是使用按键进行按键&#xff0c;所以按键在我们的日常…

Redis知识点总价

1 redis的数据结构 2 redis的线程模型 1&#xff09; Redis 采用单线程为什么还这么快 之所以 Redis 采用单线程&#xff08;网络 I/O 和执行命令&#xff09;那么快&#xff0c;有如下几个原因&#xff1a; Redis 的大部分操作都在内存中完成&#xff0c;并且采用了高效的…

深度学习系列69:模型部署的基础知识

参考https://mp.weixin.qq.com/s?__bizMzI4MDcxNTY2MQ&mid2247488952&idx1&sn880d3ad47a8fb3eab56514135f0e643b&chksmebb51d5adcc2944c276af19e8cff5e73c934f8811706be0a94c5f47f9e767c902939903e6b95&scene21#wechat_redirect 1. 基本流水线 1.1 介绍…