Springboot 实现基于用户和物品的协同过滤算法

news2025/4/26 12:22:29

简介

协同过滤算法(简称CF)

算法详解

算法使用

基于用户

基于物品

总结

前言-与正文无关

生活远不止眼前的苦劳与奔波，它还充满了无数值得我们去体验和珍惜的美好事物。在这个快节奏的世界中，我们往往容易陷入工作的漩涡，忘记了停下脚步，感受周围的世界。让我们一起提醒自己，要适时放慢脚步，欣赏生活中的每一道风景，享受与家人朋友的温馨时光，发现那些平凡日子里隐藏的幸福时刻。因为，这些点点滴滴汇聚起来的，才是构成我们丰富多彩生活的本质。希望每个人都能在繁忙的生活中找到自己的快乐之源，不仅仅为了生存而工作，更为了更好的生活而生活。

送你张美图！希望你开心！

简介

协同过滤算法(简称CF)

在早期，协同过滤几乎等同于推荐系统。主要的功能是预测和推荐。协同过滤推荐算法分为两类，分别是：

（英文userCF）

基于用户的协同过滤算法(相似的用户可能喜欢相同物品)；这个一般适合推荐新闻和皮皮虾之类的，数据跟人有很大关系，而且信息是每日都是更新的。如果你推荐购物这种，因为一个新建的用户可能购买的商品不足全量商品万分之1，商品数据量大，人对商品购买少，很难找到相似的人；随着用户和物品数量的增加，计算复杂度增加，所以需要这种更适合第二种算法。
（英文itemCF）

基于物品的协同过滤算法（这种方法通过分析物品之间的相似性，根据用户喜欢的物品，，推荐最大相似度其他物品。比如用户喜欢物品A，然后通过算法的出物品C和A的相似度极高，那么用户有可能喜欢物品C）。当然也有缺点:需要足够的用户-物品交互数据来找出物品之间的相似性。

算法详解

如果想知道算法细节可以看我的皮尔森相关系数介绍，这边只是代码级别

推荐系统算法协同过滤算法详解（二）皮尔森相关系数-CSDN博客

算法使用

下面例子都是基于电影推荐系统做的，向用户推荐喜欢的电影。核心有几个字段，1用户id，2电影id，3是评分。如果你不是电影推荐而是其他，其实代码都一样，逻辑也都大差不差。

核心协同过滤算法类，不管你是基于用户，还是基于商品电影都需要，使用的是皮尔森相关系数

package com.tarzan.recommend.core;

import com.tarzan.recommend.dto.RelateDTO;
import org.assertj.core.util.Lists;

import java.util.*;
import java.util.stream.IntStream;

/**
 * 核心算法
 *
 */
public class CoreMath {



    /**
     * 计算相关系数并排序
     * @param key
     * @param map
     * @return Map<Integer,Double>
     */
    public static Map<Integer,Double> computeNeighbor(Integer key, Map<Integer,List<RelateDTO>>  map,int type) {
        Map<Integer,Double> distMap = new TreeMap<>();
        List<RelateDTO> userItems=map.get(key);
        map.forEach((k,v)->{
            //排除此用户
            if(!k.equals(key)){
                //关系系数
                double coefficient = relateDist(v,userItems,type);
                //关系距离
             //   double distance=Math.abs(coefficient);
                distMap.put(k,coefficient);
            }
        });
        return distMap;
    }


    /**
     * 计算两个序列间的相关系数
     *
     * @param xList
     * @param yList
     * @param type 类型0基于用户推荐 1基于物品推荐
     * @return double
     */
    private static double relateDist(List<RelateDTO> xList, List<RelateDTO> yList,int type) {
        List<Double> xs= Lists.newArrayList();
        List<Double> ys= Lists.newArrayList();
        xList.forEach(x->{
            yList.forEach(y->{
                if(type==0){
                    if(x.getItemId().equals(y.getItemId())){
                        xs.add(x.getIndex());
                        ys.add(y.getIndex());
                    }
                }else{
                    if(x.getUseId().equals(y.getUseId())){
                        xs.add(x.getIndex());
                        ys.add(y.getIndex());
                    }
                }
            });
        });
        return getRelate(xs,ys);
    }

    /**
     * 方法描述: 皮尔森（pearson）相关系数计算
     *
     * @param xs x集合
     * @param ys y集合
     */
    public static double getRelate(List<Double> xs, List<Double> ys){
        int n=xs.size();
        //至少有两个元素
        if (n<2) {
            return 0D;
        }
        double Ex= xs.stream().mapToDouble(x->x).sum();
        double Ey=ys.stream().mapToDouble(y->y).sum();
        double Ex2=xs.stream().mapToDouble(x->Math.pow(x,2)).sum();
        double Ey2=ys.stream().mapToDouble(y->Math.pow(y,2)).sum();
        double Exy= IntStream.range(0,n).mapToDouble(i->xs.get(i)*ys.get(i)).sum();
        double numerator=Exy-Ex*Ey/n;
        double denominator=Math.sqrt((Ex2-Math.pow(Ex,2)/n)*(Ey2-Math.pow(Ey,2)/n));
        if (denominator==0) {
            return 0D;
        }
        return numerator/denominator;
    }

}

实体类

package com.tarzan.recommend.dto;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

/**
 * 关系数据
 *
 */
@Data
@AllArgsConstructor
@NoArgsConstructor
public class RelateDTO {
    /** 用户id */
    private Integer useId;
    /** 电影id */
    private Integer itemId;
    /** 评分 */
    private Double index;


}

基于用户

入参是你要给推荐具体电影的当前用户id，

package com.tarzan.recommend.service;

import com.tarzan.recommend.core.ItemCF;
import com.tarzan.recommend.core.UserCF;
import com.tarzan.recommend.dto.ItemDTO;
import com.tarzan.recommend.dto.RelateDTO;

import java.util.List;
import java.util.stream.Collectors;

/**
 * 推荐服务
 *
 */
public class Recommend{

    /**
     * 方法描述: 猜你喜欢
     *
     * @param userId 用户id
     */
    public static List<Integer>  userCfRecommend(int userId){
        List<RelateDTO> data= Sql获取不同用户对不同电影评分关系;
        // 获取到推荐的电影id
        List<Integer> recommendations = UserCF.recommend(userId, data);
        return recommendations ;
    }


}

package com.tarzan.recommend.core;

import com.tarzan.recommend.dto.RelateDTO;

import java.util.*;
import java.util.stream.Collectors;

/**
 * 核心算法
 *
 * @since JDK1.8
 */
public class ItemCF {

    /**
     * 方法描述: 推荐电影id列表
     *
     * @param itemId 当前电影id
     * @param list 用户电影评分数据
     * @return {@link List<Integer>}
     */
    public static List<Integer> recommend(Integer itemId, List<RelateDTO> list) {
        //按物品分组
        Map<Integer, List<RelateDTO>>  itemMap=list.stream().collect(Collectors.groupingBy(RelateDTO::getItemId));
        //获取其他物品与当前物品的关系值
        Map<Integer,Double>  itemDisMap = CoreMath.computeNeighbor(itemId, itemMap,1);
        //获取关系最近物品
        double maxValue=Collections.max(itemDisMap.values());
        return itemDisMap.entrySet().stream().filter(e->e.getValue()==maxValue).map(Map.Entry::getKey).collect(Collectors.toList());
    }


}

基于物品

入参是当前用户曾经评过高分的电影id，以此通过算法推荐和此电影相似度高的电影

package com.tarzan.recommend.service;

import com.tarzan.recommend.core.ItemCF;
import com.tarzan.recommend.core.UserCF;
import com.tarzan.recommend.dto.ItemDTO;
import com.tarzan.recommend.dto.RelateDTO;

import java.util.List;
import java.util.stream.Collectors;

/**
 * 推荐服务
 *
 */
public class Recommend{

    /**
     * 方法描述: 猜你喜欢
     *
     * @param itemId 电影id
     */
    public static List<Integer>  userCfRecommend(int userId){
        List<RelateDTO> data= Sql获取不同用户对不同电影评分关系;
        // 获取到推荐的电影id
        List<Integer> recommendations = ItemCF.recommend(itemId, data);
        return recommendations ;
    }


}