基于HBase和SimHash的大数据K-近邻算法简

上传者：zc7134 2019-05-15 17:51:36上传 PDF文件 335.33KB 热度 31次

针对大数据K-近邻(K-nearestneighbors,K-NN)计算复杂度高的问题,提出一种基于HBase和SimHash的大数据K-近邻分类算法。利用SimHash算法将大数据集从原空间映射到Hamming空间,得到哈希签名值集合;将样例的行键与值的二元对存储到HBase数据库中,行健(rowkey)为样例的哈希签名值,值(value)为样例的类别;对于测试样例,以其哈希签名值作为健rowkey,从HBase数据库中获取所有样例的value,通过对这些values进行多数投票,即可以得到测试样例的类别。与基于MapReduce的K-NN和基于Spark的K-NN在运行时间和测试精度两方面进行试验比较。试验结果显示,在保持分类能力的前提下,提出的算法

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于HBase和SimHash的大数据K_近邻算法简

针对大数据K-近邻(K-nearestneighbors,K-NN)计算复杂度高的问题,提出一种基于...

大小：0B | 2019-05-15 17:51:36
K-最近邻算法（KNN）的Python实现

K-最近邻算法（KNN）是一种常用的机器学习算法，可以用于分类和回归问题。如何使用Python编写K...

大小：1.02KB | 2023-06-28 21:54:23
k-最近邻算法在分类和预测中的应用

大小：0B | 2019-01-10 03:45:12
pycharm中K-近邻算法实现与验证

大小：0B | 2019-04-13 21:21:07
基于哈希技术和MapReduce的大数据集K_近邻算法实现代码

基于哈希技术和MapReduce的大数据集K-近邻算法实现的完整代码

大小：0B | 2018-12-26 06:43:29
K-近邻法分类MATLAB代码

MATLAB分类模型代码，使用K-近邻法进行分类。

大小：740B | 2024-05-03 14:26:04
基于哈希技术与MapReduce的大数据集K近邻算法实现代码

基于哈希技术和MapReduce的大数据集K-近邻算法实现代码

大小：0B | 2019-07-27 04:12:23
HBase大数据.zip

HBase大数据.zip

大小：61.43MB | 2020-08-18 01:35:03
大数据系列-Hbase

大小：0B | 2019-01-22 03:17:58
K-均值算法

大小：0B | 2019-03-17 23:10:18
K-近邻分类器python实现

大小：0B | 2019-03-11 08:09:53
k-均值算法

大小：0B | 2019-03-09 22:40:44
大数据应用基于大数据和推荐算法研究.ppt

* 前面探讨的方法都是按行和列对相乘的矩阵进行划分这种划分方法只是矩阵划分的一种特殊形式在确保左矩阵...

大小：3.34MB | 2020-12-16 10:37:28
大数据Hbase的学习笔记

大小：0B | 2019-01-22 12:09:11
大数据hbase.zip

文件为大数据hbase-----javaAPI,里面含有hbase需要的lib文件，以及java实例...

大小：134.67MB | 2020-07-30 14:18:37
基于hbase的企业级大数据平台

大小：0B | 2019-03-02 15:32:58