1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 使用类内集中度和分层递阶约简的特征选择方法.pdf

论文研究 使用类内集中度和分层递阶约简的特征选择方法.pdf

上传者: 2020-07-21 21:58:12上传 PDF文件 532.05KB 热度 9次
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先简单分析了几种经典的特征选择方法,总结了它们的不足,然后提出了类内集中度的概念,紧接着把分层递阶的思想引入粗糙集并提出了一个改进的基于分层递阶的属性约简算法,最后把该约简算法同类内集中度结合起来,提出了一个综合的特征选择方法。该方法首先利用类内集中度进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明此种特征选择方法效果良好。
下载地址
用户评论