在电影评分的案例中,基于内容过滤的方法需要用到两个向量,一个是来自用户的特征向量Vu,另一个是电影特征的向量 Vm。以用户的特征为例,原始的向量Xu作为一个神经网络的输入,经过几层之后输出一个有32个单元的向量Vu,电影的特征向量也通过神经网络,注意两个网络的层数、隐藏单元数可能不同,但最后输出的维度必须相同。最后做出的预测为Vv点乘Vm,也可以加一个sigmoid函数来预测 y 为1的概率(user j , movie i)。
也可以把两个网络放在一起,成本函数如下,用这个成本函数,通过Vu点乘Vm的好坏来调节两个网络的参数,也可以在后面加上像神经网络一样的正则化项。这种组合两个网络的能力也是神经网络强大的原因之一。
也可以找到类似的电影,Vkm和Vim之间的距离小,则电影 k 和电影 i 是相似的,这个过程就像协同过滤中找到相似的用户。注意,可以提前计算电影的相似性,可以在前一天晚上计算好,第二天用户浏览时直接拿来推荐相似的电影。