多目标排序模型
回顾一下推荐系统的链路
常见的交互指标
排序模型做的事情
多目标模型就是要预测多个目标
预测概率和实际是否交互求交叉熵损失
训练时通常会遇到类别不平衡问题,可以考虑做采样
采样可能导致预估点击率偏高
可以通过校准公式进行校准
Multi-gate Mixture-of-Experts
几个专家就是放几个神经网络
进一步考虑对多个神经网络的输出进行加权
可能会出现极化的现象
可以通过dropout的方式来解决极化
多目标有多个预估分数就可以有不同融合方式
视频播放建模
播放时长建模
视频完播用回归或分类都可以
完播率通常和视频时长有关,不能直接把预估的完播率⽤到融分公式
通常做个调整再用到融分公式
排序模型的特征
用户画像
物品画像
用户统计特征
笔记统计特征
场景特征
特征处理
特征覆盖率的概念
数据服务分三步
粗排
精排模型的线上推理代价大
双塔模型牺牲准确性换计算量
粗排的三塔模型
三塔模型的推理