R语言关联规则深入详解
在用R语言做关联规则分析之前,我们先了解下关联规则的相关定义和解释。关联规则的用途是从数据背后发现事物之间可能存在的关联或者联系,是无监督的机器学习方法,用于知识发现,而非预测。关联规则挖掘过程主要包含两个阶段:第一阶段从资料集合中找出所有的高频项目组,第二阶段再由这些高频项目组中产生关联规则。接下来,我们了解下关联规则的两个主要参数:支持度和置信度。关联规则算法中最常用是Apriori算法。下面我们用R来做个关联规则的算法实例。具体的关联规则情况我们还要根据业务的实际情况进行筛选,也可以在建立关联规则模型的过程中去掉那些明显无用的规则。< lhs rhs support confidence lift再看结果中,只剩下4个lift值较高的关联规则。
下载地址
用户评论