深入浅出机器学习算法:主成分分析
在对实际问题进行数据挖掘时,涉及到的特证数即数据维度往往是成百上千的,出于以下两个原因可能导致数据集质量不佳:噪声特征:该特征并不能对我们建模产生正向作用,或者同关注的变量基本上是不相关的 特征之间可替代性:当两个特征包含几乎一模一样的信息时,其中一个特征往往是可以剔除的(比如温度和体感温度变量) 主成分分析PrincipalComponentAnalysis,PCA是最常用的降维方法之一,它可以尽可能提取众多维度
下载地址
用户评论