1. 首页
  2. 信息化
  3. 管理软件
  4. 基于Spark的改进关联规则算法研究

基于Spark的改进关联规则算法研究

上传者: 2020-12-16 07:13:34上传 PDF文件 464.75KB 热度 19次
针对关联规则Apriori算法在信息爆炸时代面对海量数据时,其计算周期大、算法效率低等问题,将数据以特定的数据结构进行存储,降低数据遍历次数;在连接操作前进行剪枝操作,并且改变剪枝操作的判定条件;同时将改进算法IApriori与基于内存的大数据并行计算处理框架Apache Spark相结合,提出了一种基于Spark的Apriori改进算法(Spark+IAprior)。实验结果表明,Spark+IApriori算法在集群伸缩性和加速比方面都优于Apriori算法。
下载地址
用户评论