关联规则的定义是什么:
关联规则(Association rule):指从事务数据库、关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。
关联分析(Association analysis):用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或者频繁项集的形式表示。关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系的有价值的有关知识。
一般地,关联规则挖掘问题可以划分成两个子问题:
1、发现频繁项目集
通过用户给定的Minsupport,寻找所有频繁项目集,即满足Support不小于Minsupport的项目集。事实上,这些频繁项目集可能具有包含关系。一般地,我们只关心那些不被其它频繁项目集所包含的所谓频繁大项集的集合。这些频繁大项集是形成关联规则基础。
2、生成关联规则
通过用户给定的Minconfidence,在每个最大频繁项目项目集中,寻找Confidence不小于Minconfidence的关联规则。这两个子问题主要在4.3节中进行介绍。