apriori算法


关联分析

上面这个简单的介绍了一下什么是频繁项集,那么什么才能叫频繁呢?

支持度和可信度这两个可以用来进行量化关联分析

这两个东西算起来比较简单,但是如果我们要计算的数量多起来的话,计算速度就会特别慢,所以这里我们可以使用apriori来进行简化计算。

计算步骤:

1.首先是计算频繁项集

2.然后分别计算支持度和可信度

apriori原理

假如我们有4个商品,然后这4个商品有下面这些组合方式

n个商品的组合情况有下面的计算公式

我们看一下上面这个图片,可以看到如果我们知道某个集合比如 {2,3}是非频繁的,那么我们就可以知道{0,2,3} {1,2,3} {0,1,2,3}都是非频繁的,所以这些都不用来计算了

这个算法的优缺点参考下面这个

apriori算法使用

具体代码参考

https://github.com/apachecn/AiLearning/blob/master/src/py3.x/ml/11.Apriori/apriori.py

从频繁项集中挖掘关联规则


文章作者: 小游
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 小游 !
  目录