1. 首页
  2. 数据库
  3. 其它
  4. VariantSpark:针对基因组变体的机器学习 源码

VariantSpark:针对基因组变体的机器学习 源码

上传者: 2021-02-01 22:38:17上传 ZIP文件 41.41MB 热度 14次
变形火花 variant-spark是可扩展的工具包,用于针对GWAS之类的数据集优化的全基因组关联研究。 机器学习方法,尤其是随机森林(RF),是全基因组关联研究(GWAS)中标准单SNP分析的有希望的替代方法。 射频(RF)提供了可变重要性度量,可以根据其预测能力对SNP进行排名。 尽管有许多现有的随机森林实现方式可用,有些甚至是并行或分布式的,例如:Random Jungle,Ranger或SparkML,但大多数都没有经过优化以处理GWAS数据集,该数据集通常带有数千个样本和数百万个变量。 目前, variant-spark提供了基本功能,可用于建立随机森林模型和使用均值降低基尼
下载地址
用户评论