1. 首页
  2. 移动开发
  3. 其他
  4. 基于KMeans的中英文文档聚类

基于KMeans的中英文文档聚类

上传者: 2023-01-21 04:49:18上传 ZIP文件 1.36MB 热度 11次
本项目采用K Means算法分别对若干中文文档和英文文档进行聚类其中K的取值为20即最终聚簇结果为20个簇其中文档间的距离采用的是余弦距离K Means算法的终止条件为所有簇的中心不再发生偏移.算法会返回中文文档和英文文档最大的三个簇所对应的文档id id与文档名一一对应以及每个簇距离类中心最近的5个文档.
下载地址
用户评论