召回_Swing 模型
swing模型是ItemCF的一种改造
ItemCF的原理
举个例子。
ItemCF的存在的问题
有可能两篇不同类型的物品/笔记被分享到同一个微信群,从而提高了两个不同类型的视频被同一组人打开的概率。
而这只能说明这两个物品/笔记具有相同的受众,而非彼此之间是相似的。
所以需要改进算法来处理掉相同受众(处在同一个圈子里面的情况)的情况。
而问题就变成了怎么去找到同一圈子的人。
比如在我们的生活中,同一圈子的人的消息是互通的,好的产品可能就会在这个圈子里面互相安利。也就是说,如果去判断这两个人是否属于同一个圈子,可以去判断这两个人所被安利/收藏的物品的交叠程度是否相对大。
当然,也要考虑说这个圈子就是经常分享相似商品(比如一个专门分享高端红酒的交流群)。
其中
α
\alpha
α是一个人工设置的参数,直观上
α
\alpha
α保证了分母不为0,而overlap
在
α
\alpha
α的基础上进行增值,使得相似度减小。也就是说当overlap越大,用户
u
1
u_1
u1和用户
u
2
u_2
u2越可能处在同一个圈子内,贡献的相似度应该要有所下滑。