1. 首页
  2. 数据库
  3. 其它
  4. 房屋价格预测 阿姆斯:试图做套索+多项式特征 源码

房屋价格预测 阿姆斯:试图做套索+多项式特征 源码

上传者: 2021-03-17 10:17:44上传 ZIP文件 33.2MB 热度 6次
房屋价格预测 学分: : 概括: 数据读取和EDA我已读取数据并执行了基本的EDA以获得洞察力。 已检查重复的行。所有预测变量与目标变量的散点图将显示线性/非线性的存在。 热图显示没有目标变量的最相关的特征。 我们检查这些变量以及目标变量中是否存在偏斜。 稍后我们将对它们应用log和boxcox转换。 数据清理我参考了以下有关特征工程的资源已根据文档删除了异常值,但保留了大多数异常值以最大程度地减少数据丢失。 再次在文档之后,缺失值已被替换为单独的类别或被替换为零。 目标变量是对数转换的。 特征工程这是最关键的一步,因为我从现有特征中获得了更多有用的特征,这些特征将改进我们的模型。 找到倾斜的列,然后应用boxcox转换。 此外,通过标签编码为某些编码为数值的分类特征提供了一般性。 这将帮助模型有效学习。 通过创建二进制列,我们将从缺少的值中获取更多信息,这些值被编码为单独的类
下载地址
用户评论