数据挖掘面试题 上传者:xu10420 2019-05-15 17:20:20上传 RAR文件 39.55KB 热度 46次 一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier)是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。Grubbs’test(是以FrankE.Grubbs命名的),又叫maximumnormedresidualtest,是一种用于单变量数据集异常值识别的统计检测,它假定数据集来自正态分布的总体。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论