基于Apriori关联规则的电影推荐系统
1、效果图
2、算法原理
Apriori算法是一种用于挖掘关联规则的频繁项集算法,它采用逐层搜索的迭代方法来发现数据库中项集之间的关系并形成规则。
其核心思想是利用Apriori性质来压缩搜索空间,即如果一个项集是非频繁的,那么它的所有父集也是非频繁的,反之亦然。
Apriori算法的过程包括连接和剪枝两个主要步骤。在连接步骤中,算法会生成候选项集,这些候选项集是由前一次迭代发现的频繁项集通过连接操作产生的。在剪枝步骤中,算法会去除那些支持度低于用户定义的最小支持度的项集。
根据生成的关联规则实现给用户推送精准的物品推荐。
3、案例说明
3.1、评分表
现有电影评分表如下:
用户 | 评分的电影 |
---|---|
1 | 肖申克的救赎、霸王别姬、茶馆 |
2 | 霸王别姬、阿甘正传 |
3 | 肖申克的救赎、霸王别姬、阿甘正传 |
4 | 肖申克的救赎、美丽人生 |
5 | 霸王别姬、美丽人生 |
6 | 霸王别姬、美丽人生 |
7 |