文章目录
- 0. 结论
- 1. 算法起源
- 2. Apriori算法思想
-
- 2.1 算法综述
- 2.2 示例
0. 结论
- Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据组合.便于超市提高效益.
- (对离散数据进行操作,对连续数据操作没有意义)
1. 算法起源
- 关联规则挖掘的算法,比如Apriori, PrefixSpan, CBA;
- 如何评价频繁项的指标?
- 支持度 置信度 提升度
- 支持度:x与y的关联出现的概率:
- 置信度体现了一个数据出现后,另一个数据出现的概率,或者说数据的条件概率
- 支持度:x与y的关联出现的概率:
- 支持度 置信度 提升度