robics:自动检测LDA和NMF的鲁棒参数。 与scikit learn和gensim兼容 源码
强盗 rob ustTop ics是一个面向对构建健壮主题模型感兴趣的非机器学习专家的库。 主要目标是提供一个易于使用的框架来检查主题模型是否每次运行都达到相同或至少相似的结果。 产品特点 支持sklearn(LatentDirichletAllocation,NMF)和gensim(LdaModel,ldamulticore,nmf)主题模型 根据创建样本,该所需的样本少于网格搜索,并确保使用了整个参数空间,而随机抽样中不确定。 使用基于词向量的一致性得分,每个样本在不同的重新初始化之间进行简单的主题匹配。 根据以下四个指标对所有模型进行排名: 每个主题的前n个单词的 基于的主题分布相
下载地址
用户评论