目录
1、摘要
2、引言
2.1协同过滤
2.2矩阵分解
3.准备工作
3.1学习隐性数据
3.2矩阵分解
3.3神经协同过滤
3.4广义矩阵分解
3.5多层感知器
3.6GMF和MLP的融合-NeuMF(神经矩阵分解)
4.总结
1、摘要
尽管最近的一些工作已经把深度学习运用到了推荐中,但是他们主要是用它(深度学习)来对一些辅助信息(auxiliary information)建模,比如描述文字的项目和音乐的声学特征。当涉及到建模协同过滤的关键因素(key factor)————用户和项目(item)特征之间的交互的时候,他们仍然采用矩阵分解的方式,并将内积(inner product)做为用户和项目的潜在特征点乘。通过用神经结构代替内积这可以从数据中学习任意函数,据此我们提出一种通用框架,我们称它为NCF(Neural network-based Collaborative Filtering,基于神经网络的协同过滤)。NCF是一种通用的框架,它可以表达和推广矩阵分解。为了提升NFC的非线性建模能力,我们提出了使用多层感知机去学习用户-项目之间交互函数(interaction function)。在两个真实世界(real-world)数据集的广泛实验显示了我们提出的NCF框架对最先进的方法的显著改进。
2、引言
尽管MF(矩阵分解)对于协同过滤是有效的,但众所周知,它的性能会受到交互功能(内积)的简单选择的影响。关于关键协作过滤效果的建模,他们仍然求助于MF,使用内部产品将用户和物品的潜在特征结合起来。这项工作通过形式化协作过滤的神经网络建模方法来解决上述研究问题。我们专注于隐性反馈,通过观看视频、购买产品和点击物品等行为间接反映用户的偏好。与显性反馈(即评级和评论)相比,隐性反馈可以自动跟踪,因此更容易为内容提供商收集。然而,利用它更具挑战性,因为没有观察到用户满意度,而且负面反馈自然稀少。在本文中,我们探讨了如何利用DNN对有噪声的隐式反馈信号进行建模的中心主题。
2.1协同过滤
根据用户过去的交互(如评分和点击)对项目的偏好进行建模。
2.2矩阵分解
它将用户和项目投影到共享的潜在空间中,使用潜在特征向量来表示用户或项目。此后,用户对项目的交互被建模为其潜在向量的内积。
3.准备工作
3.1学习隐性数据
3.2矩阵分解
MF用一个潜在特征向量实值将每个用户和项目关联起来。令Pu和Qi分别表示用户u和项目i的潜在向量;MF评估相互作用Yui作为Pu和Qi的内积:
这里的K表示潜在空间的维度。正如我们所看到,MF模型是用户和项目的潜在因素的双向互动,它假设潜在空间的每一维都是相互独立的并且用相同的权重将它们线性组合。因此,MF可视为潜在因素的线性模型。
3.3神经协同过滤
输入分别描述用户u和物品i构成的两个特征向量,由于这项工作侧重于纯协作过滤设置,只使用user和item作为输入特征,将其转换为一个one-hot encoding的二进制稀疏向量,可以很容易的通过content(内容)特征来获取用户表示,以此解决冷启动的问题, embedding层是将稀疏表示投影到稠密向量的全连接层,Neural CF层的每一层都可以定制,用以发现user-item交互的某些潜在结构,最后一个隐藏层X的尺寸决定了模型的能力。最后的输出层是预测分数,通过最小化在目标值yui和yui之间的pointwise loss来执行训练。
3.4广义矩阵分解
3.5多层感知器
3.6GMF和MLP的融合-NeuMF(神经矩阵分解)
4.总结
在这项工作中,我们探索了用于协同过滤的神经网络结构。我们设计了一个通用框架NCF,并提出了三种实例:GMF,MLP和NeuMF,以不同的方式模拟用户-项目交互。我们的框架简单而通用; 它不仅限于本文提出的模型,它对深入学习推荐方法的也具有指导意义。这项工作补充了主流浅层协同过滤模型,为深入学习推荐研究开辟了新途径。
在将来的工作中,我们将研究NCF模型在成对学习中的应用,并将NCF扩展到建模辅助信息,如用户评论,知识库和时间信号。现有的个性化模式主要集中在个人身上,为用户群体开发模型将会是一个有趣的发展,这有助于社会团体的决策。此外,我们特别感兴趣的是建立多媒体项目的推荐系统,这是一个有趣的任务,但在推荐社区中受到相对较少的关注。多媒体项目(如图像和视频)包含更丰富的视觉语义,可以反映用户的兴趣。 要构建多媒体推荐系统,我们需要开发有效的方法来学习多视图和多模态数据。 另一个新出现的方向是探索循环神经网络和散列方法(hashing methods)的潜力,以提供有效的在线推荐。