基于Python网络爬虫与推荐算法的新闻推荐平台。
网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版)
推荐算法:权重衰减+标签推荐+区域推荐+热点推荐+融合推荐算法。
文章目录
- 1.系统架构设计
- 2.数据库设计与实现
- 3.推荐算法实现流程
- 4.用户端实现效果
- 5.管理员端实现效果
- 6.系统后台实现效果
- 7.设备规格
1.系统架构设计
- 涉及框架:
Django、jieba、selenium、BeautifulSoup、Vue
框架等。 - 采用前后端分离(管理员端+用户端+Python系统后台)的设计架构,基于
Django
框架构建系统后端,通过Python
语言实现,利用NLP
等技术实现分词、内容推荐等算法;前端综合应用Vue
、NodeJS、ECharts
和HTML
等技术实现接口请求转发及可视化,关系型数据库采用MySQL 8.3
,实现结果数据的持久化。 - 功能模块详情设计如下图所示:
2.数据库设计与实现
- 版本详情
MySQL
数据库设计与实现
3.推荐算法实现流程
- 包含或常用推荐算法如下:
- 基于用户推荐(
Demographic-based Recommendation
)算法 - 基于内容推荐(
Content-based Recommendation
)算法 - 基于用户的协同推荐(
UserCF
)算法 - 基于统计信息的推荐算法
- 基于规则的推荐算法
- 多因子融合(混合)推荐算法
- 基于用户推荐(
- 推荐算法常用流程如下:
4.用户端实现效果
- 4.1 首页详情
- 4.2 为你推荐详情
- 4.3 启动运行命令及效果
npm run dev
5.管理员端实现效果
npm run serve
6.系统后台实现效果
manage.py runserver 0.0.0.0:8000