TFIDF关键词提取模块
关键词提取的万能钥匙,非 基于TFIDF算法的关键词提取工具,逻辑清晰、效果也靠谱。用来做文本摘要或者分类前的预,挺合适的。不用额外训练模型,直接拿来提关键词,省事不少。 和传统的分词工具比起来,这玩意儿权重判断更灵活,比如在新闻、小说里抓住主干词,还挺准的。尤其适合你做快速原型开发,代码量不大,响应也快。 你要是用Python写数据清洗、做内容聚类,这个模块插进去刚刚好。结合wvtool或其他向量工具还能再往上卷一卷效果。支持文本文件批量,适合跑大数据集那种。 不过要注意一点,长文本效果更稳定,短文本的话可以和其他方法混着用,比如加个关键词词典或者用规则检索兜底,效果会更稳一点。 如果你正愁找不到靠谱的关键词提取方案,可以点进去看看:TFIDF 关键词提取。其他几个相关工具像wvtool、python 方法也值得瞄一眼。
下载地址
用户评论