【机器学习】【决策树】C4.5算法,详解+python代码实现
ID3算法只有树的生成,所以该算法生成的树容易产生过拟合,C4.5在生成的过程,用信息增益比来选择特征。ID3算法以信息增益作为划分训练数据集的特征,存在缺点:偏向于选择特征值较多的特征。C4.5算法使用信息增益比(informationgainratio),可以对ID3算法这一缺点进行校正
下载地址
用户评论