基于标签的协同过滤算法实现与个人兴趣相关的文章推荐

news2025/1/16 5:53:07

在这里插入图片描述

一、前言

在当前信息爆炸的时代,每天都会涌现出大量的文章,人们有时候会感到信息的获取难度比筛选更大。而作为信息的提供者,我们应当为用户提供依据个人兴趣的文章推荐。

本项目中的文章标签相似度推荐功能使用了一种基于标签的协同过滤算法。具体地,我们先计算每篇文章的标签,然后计算出两篇文章之间的标签相似度,最后根据用户阅读过的文章,找到与之最相似的文章,推荐给用户。

下面是使用Java实现计算标签相似度的示例代码:

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

该方法以两个标签集合为参数,先将它们转化为Set,然后计算它们的并集和交集的大小,最后返回它们的相似度。

需要注意的是,这个算法实现会出现冷启动问题,即对于用户没有阅读记录的情况,我们无法根据它的阅读历史推荐文章。可以在这种情况下,使用一些简单的推荐策略,如热门文章推荐等。

二、后端开发

1. 框架和工具选择

本项目使用SpringBoot、SpringMVC和Mybatis-Plus构建后端。SpringBoot简化了Spring应用程序的搭建,SpringMVC是Spring的Web框架,Mybatis-Plus是Mybatis的增强工具。

2. 数据库设计

在本项目中,我们需要存储文章和用户的相关信息。具体的设计如下:

文章表(article):

字段名字段类型描述
idLong主键
titleString文章标题
authorString文章作者
contentString文章内容
create_timeDate发布时间
categoryString文章分类

用户表(user):

字段名字段类型描述
idLong主键
usernameString用户名
passwordString密码
emailString邮箱
create_timeDate注册时间

用户-文章表(user_article):

字段名字段类型描述
idLong主键
user_idLong用户id
article_idLong文章id
create_timeDate阅读时间

3. 接口设计

本项目共有以下接口:

注册接口(POST /user/register):用户注册接口,参数为用户名、密码、邮箱。

登录接口(POST /user/login):用户登录接口,参数为用户名和密码。

获取文章列表接口(GET /article/list):获取所有文章列表。

获取用户阅读历史接口(GET /user/history):获取用户阅读历史。

获取推荐文章接口(POST /article/recommend):获取推荐文章,参数为用户id。

4. 实现逻辑

用户注册接口:

前端请求:

axios.post('/user/register', {
  username: 'username',
  password: 'password',
  email: 'email'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/register")
public Result registerUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser != null) {
    return Result.error("该用户名已被注册");
  }
  user.setPassword(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()));
  userService.saveUser(user);
  return Result.success("注册成功");
}

用户登录接口:

前端请求:

axios.post('/user/login', {
  username: 'username',
  password: 'password'
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/login")
public Result loginUser(@RequestBody User user) {
  User existUser = userService.findUserByUsername(user.getUsername());
  if (existUser == null) {
    return Result.error("该用户不存在");
  }
  if (!existUser.getPassword().equals(DigestUtils.md5DigestAsHex(user.getPassword().getBytes()))) {
    return Result.error("密码错误");
  }
  String token = JwtUtil.createToken(existUser.getId(), existUser.getUsername());
  return Result.success(token);
}

获取文章列表接口:

前端请求:

axios.get('/article/list').then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/getArticles")
public Result getArticles() {
  List<Article> articles = articleService.findArticles();
  return Result.success(articles);
}

获取用户阅读历史接口以及前端请求:

需要在请求头中添加token。

axios.get('/user/history', {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@GetMapping("/history")
public Result getUserHistory(HttpServletRequest request) {
  Long userId = JwtUtil.getUserId(request.getHeader("Authorization"));
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Article> articles = new ArrayList<>();
  for (UserArticle userArticle : userArticles) {
    Article article = articleService.findArticleById(userArticle.getArticleId());
    articles.add(article);
  }
  return Result.success(articles);
}

获取推荐文章接口以及前端请求:

需要在请求头中添加token。

axios.post('/article/recommend', {
  user_id: userId
}, {
  headers: {
    'Authorization': 'Bearer ' + token
  }
}).then(res => {
  console.log(res.data)
})

后端实现:

@PostMapping("/recommend")
public Result recommendArticles(@RequestBody Map<String, Long> paramMap, HttpServletRequest request) {
  Long userId = paramMap.get("user_id");
  List<Article> articles = articleService.recommendArticles(userId);
  return Result.success(articles);
}

文章推荐功能的实现基于用户的阅读历史推荐和文章的标签相似度推荐。

用户阅读历史推荐的实现:

查询出用户阅读历史,根据文章分类和阅读时间排序,取出前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  return articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
}

文章标签相似度推荐的实现:

计算文章之间的标签相似度,取出与用户阅读过的文章最相似的前10篇文章作为推荐文章。

public List<Article> recommendArticles(Long userId) {
  // 获取用户阅读历史
  List<UserArticle> userArticles = userArticleService.findUserArticlesByUserId(userId);
  List<Long> articleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  // 如果用户没有阅读历史,则按文章分类排序,取前10篇文章
  if (articleIds.isEmpty()) {
    return articleMapper.selectList(new QueryWrapper<Article>().orderByDesc("create_time").last("limit 10"));
  }
  // 根据文章分类和阅读时间排序,取前10篇文章
  List<Article> articles = articleMapper.selectList(new QueryWrapper<Article>().in("id", articleIds)
                      .orderByDesc("create_time", "category").last("limit 10"));
  // 计算文章之间的标签相似度
  for (Article article : articles) {
    List<String> articleTags = Arrays.asList(article.getTags().split(","));
    for (Article a : articles) {
      if (a.getId().equals(article.getId())) {
        continue;
      }
      List<String> tags = Arrays.asList(a.getTags().split(","));
      double similarity = calculateSimilarity(articleTags, tags);
      a.setSimilarity(similarity);
    }
  }
  // 取出与用户阅读过的文章最相似的前10篇文章作为推荐文章
  List<Long> readArticleIds = userArticles.stream().map(UserArticle::getArticleId).collect(Collectors.toList());
  List<Article> recommendArticles = articles.stream()
                                        .filter(article -> !readArticleIds.contains(article.getId()))
                                        .sorted(Comparator.comparingDouble(Article::getSimilarity).reversed())
                                        .limit(10)
                                        .collect(Collectors.toList());
  return recommendArticles;
}

/**
 * 计算标签之间的相似度
 */
private double calculateSimilarity(List<String> tags1, List<String> tags2) {
  Set<String> set1 = new HashSet<>(tags1);
  Set<String> set2 = new HashSet<>(tags2);
  // 计算并集大小
  int unionSize = set1.size() + set2.size();
  set1.addAll(set2);
  // 计算交集大小
  int intersectSize = unionSize - set1.size();
  return (double) intersectSize / unionSize;
}

三、前端开发

1. 框架和工具选择

本项目使用VUE框架开发前端页面,同时使用axios库进行接口请求。

2. 页面设计

本项目共有以下页面:

登录页面(login):用户登录页面,包含用户名和密码输入框及登录按钮。

注册页面(register):用户注册页面,包含用户名、密码、邮箱输入框及注册按钮。

文章列表页面(article-list):展示所有文章列表。

用户阅读历史页面(user-history):展示用户的阅读历史列表。

推荐文章页面(recommend-articles):展示推荐给用户的文章列表。

3. 实现流程

登录页面:

登录界面,用户在该界面输入用户名和密码,请求后端登录接口,得到token以便后续接口请求。

注册页面:

注册界面,用户在该界面输入用户名、密码、邮箱,请求后端注册接口。

文章列表页面:

展示所有文章列表,用户点击文章标题可以进入文章详情页面。

用户阅读历史页面:

展示用户的阅读历史列表,用户可以查看阅读历史记录。

推荐文章页面:

展示推荐给用户的文章列表,根据后端推荐接口的返回结果展示。

四、总结

本篇博文详细介绍了如何使用SpringBoot、SpringMVC和Mybatis-Plus构建后端,使用VUE框架开发前端页面,以及如何实现文章推荐功能的详细流程和代码。

文章推荐功能的实现是基于用户阅读历史推荐和文章的标签相似度推荐,可以帮助用户更方便地获取到自己感兴趣的文章。

感谢您的阅读!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/494470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【设计模式】抽象工厂模式

【设计模式】抽象工厂模式 参考资料&#xff1a; Java设计模式 - 抽象工厂模式 重学 Java 设计模式&#xff1a;实战抽象工厂模式 文章目录 【设计模式】抽象工厂模式一、抽象工厂模式介绍1.1、什么是工厂方法模式1.2、角色概述 二、案例场景模拟2.1、背景一&#xff1a;Redis…

Camtasia2023最好用的电脑屏幕录制软件

Camtasia2023是市场上最好的录像机和屏幕录制软件之一。强大的软件视频编辑程序的Camtasia 适用于Windows和iOS。 它支持多种流行的媒体格式&#xff0c;并对您创建的视频提供令人印象深刻的控制范围。3000多万专业人士在全球范围内使用Camtasia展示产品&#xff0c;教授课程&a…

.netCHARTING 10.5 dotnetcharting Crack

.net图表 10.5 为柱形图和条形图添加拐角半径控件。 5月 05&#xff0c; 2023 - 16&#xff1a;18新版本 特征 直角或直线组织连接线 - 默认情况下&#xff0c;通过以直角绘制组织连接线来增强组织连接线的显示方式。您可以使用直线选项更改此默认值&#xff0c;并直接在点…

mssql修改排序规则

修改排序规则 在 Microsoft SQL Server 中&#xff0c;可以通过以下步骤来修改排序规则&#xff1a; 打开 SQL Server Management Studio&#xff08;SSMS&#xff09;&#xff0c;连接到 SQL Server 数据库实例。在“对象资源管理器”窗格中&#xff0c;右键单击数据库&…

VS+Qt+C++医院排队叫号系统

程序示例精选 VSQtC医院排队叫号系统 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<VSQtC医院排队叫号系统>>编写代码&#xff0c;带用户登录&#xff0c;管理员登录&#xff…

开源进展 | WeIdentity v3.1.0 发布,新增数据库部署和使用模式

作为连接实体对象&#xff08;人或物&#xff09;的现实身份与链上身份的可信映射&#xff0c;实现实体对象之间安全可信的数据授权与交换&#xff0c;分布式身份技术解决方案在推动区块链应用繁荣及可信数据流转的过程中扮演着重要角色。 WeIdentity是由微众银行自主研发并完全…

荟萃金融科技成果,展现数字金融力量丨通付盾受邀出席中国国际金融展

2023年4月27日&#xff0c;中国国际金融展在北京顺利落下帷幕。本届金融展以“荟萃金融科技成果&#xff0c;展现数字金融力量&#xff0c;谱写金融服务中国式现代化新篇章”为主题&#xff0c;由中国金融电子化集团有限公司和北京市石景山区政府联合主办。来自国内外的众多金融…

教室资源管理系统【纯控制台】(Java课设)

系统类型 纯控制台类型&#xff08;没有用到数据库&#xff09; 使用范围 适合作为Java课设&#xff01;&#xff01;&#xff01; 部署环境 jdk1.8Idea或eclipse 运行效果 本系统源码地址&#xff1a;https://download.csdn.net/download/qq_50954361/87753360 更多系统…

helm部署nacos

1.去helm仓库拉取nacos包 https://artifacthub.io/packages/helm/kubegemsapp/nacos?modalinstall helm repo add kubegemsapp https://charts.kubegems.io/kubegemsapp helm pull kubegemsapp/nacos tar -zxvf nacos-0.1.5.tgz mkdir -p nacos/ci/test2.修改chart配置文件 …

如何根据期刊缩写查找期刊?

英文论文写作中&#xff0c;经常会插入参考文献。参考文献中的期刊名称&#xff0c;时常需要使用缩写。或者是手头有期刊缩写后的名称&#xff0c;但是有时候&#xff0c;查了半天也查不到期刊期刊全称&#xff0c;费时费力让人崩溃。今天就给各位学者老师总结一些查询期刊缩写…

如何在 Python 开发环境中调用 ChatGPT 模型?

本文将演示在本地的 python 项目中调用 ChatGPT 模型。 写在前面第一步&#xff1a;获取 API Key第二步&#xff1a;安装 OpenAI 第三方库第三步&#xff1a;Python 开发环境中调用 ChatGPT 模型 写在前面 作为一名程序员&#xff0c;在开发过程当中时常需要使用 ChatGPT 来完…

项目创建第一天 搭建前端环境

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、环境是什么&#xff1f;二、使用步骤1.前台搭建方式1.创建项目2.目录结构3. 安装elementui4. 创建路由5.使用axios6.bug记录6.1出现跨域问题6.2 解决方式6.…

硬盘数据突然消失怎么回事?硬盘数据突然消失怎么找回

硬盘上的数据对每个人都至关重要&#xff0c;它可能是我们的珍贵回忆&#xff0c;多年学习的总结&#xff0c;或者一些不可告人的秘密。而硬盘中的数据可能会在不知情的情况下消失或被删除&#xff0c;这种情况对我们来说十分痛苦和困扰。然而&#xff0c;我们不必担心&#xf…

SLAM论文速递:SLAM—(2021)Amos-SLAM:一种基于视觉和几何的抗动态双阶段SLAM方法—5.65(1)

论文信息 题目&#xff1a; Visual SLAM in dynamic environments based on object detection 基于目标检测的动态环境下的视觉SLAM论文地址&#xff1a; https://www.sciencedirect.com/science/article/pii/S2214914720304402发表期刊&#xff1a; Defence Technology,&…

【python】pytorch包:深度学习(序章)

今日听闻师姐说pytorch实现深度学习要比keras更好用一些&#xff0c;特此记录 Part 0. 机器学习 与 深度学习 的联系与区别 参考B站视频链接 联系 深度学习是机器学习的分支&#xff0c;人工神经网络为基础&#xff0c;对数据的特征进行学习的方法 区别 特征抽取 机器学…

TensorRT入门实战,TensorRT Plugin介绍以及TensorRT INT8加速

文章目录 一、TensorRT介绍,工作流程和优化策略TensorRT是什么TensorRT的工作流程TRT优化策略介绍 二、TensorRT的组成和基本使用流程三、TensorRT的基本使用流程四、TensorRT Demo代码 : SampleMNISTCaffe Parser方式构建 五. TensorRT Plugin基本概念工作流程API介绍Dynamic …

复旦微的 JFM7K325T 国产化设计资料(PCIE711)

板卡概述 PCIE711 是一款基于 PCIE 总线架构的高性能数据预处理 FMC载板&#xff0c;板卡采用复旦微的 JFM7K325T FPGA 作为实时处理器&#xff0c;实现 各个接口之间的互联。该板卡可以实现 100%国产化。 板卡具有 1 个 FMC&#xff08;HPC&#xff09;接口&#xff0c;1 路…

字符设备注册与注销

1、对于字符设备驱动而言&#xff0c;当驱动模块加载成功以后需要注册字符设备&#xff0c;同样&#xff0c;卸载驱动模 块的时候也需要注销掉字符设备。字符设备的注册和注销函数原型如下所示 static inline int register_chrdev(unsigned int major, const char *name,const…

虹科方案 | HK-Edgility系统随时随地保护您的远程工作

通过上次的文章&#xff0c;我们了解到虹科HK-Edgility软件系统《将云计算扩展到边缘》的解决方案。今天的文章&#xff0c;我们将带您了解虹科系统在远程工作的方案简介。 一、时代背景 在当今新的数字化工作空间中&#xff0c;员工需要从家中、远程办公室和旅途中访问公司业务…

作为团队管理者,如何获得团队成员的信任和认可?

作为团队管理者&#xff0c;获得团队成员的信任和认可是非常重要的。只有当团队成员信任你并认可你的领导能力&#xff0c;才能更好地协同工作&#xff0c;提高工作效率和完成团队目标。那么&#xff0c;如何才能获得团队成员的信任和认可呢&#xff1f;以下是一些实用的建议。…