1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于MapReduce的CanopyKmeans改进算法.pdf

论文研究基于MapReduce的CanopyKmeans改进算法.pdf

上传者: 2019-09-27 18:13:32上传 PDF文件 565.5KB 热度 31次
针对分布式Canopy-Kmeans算法中Canopy选取的随机性问题,采用“最小最大原则”对该算法进行了改进,避免了Cannopy选取的盲目性;采用MapReduce并行计算框架对算法进行了并行扩展,使之能够充分利用集群的计算和存储能力,从而适应海量数据的应用场景。以海量互联网新闻信息聚类作为应用背景,对改进后的算法进行了实验分析。实验结果表明:该方法较随机挑选Canopy策略在分类准确率以及抗噪能力上都明显提高,而且在处理海量数据时表现出较大的性能优势。
下载地址
用户评论