Word2Vec报错:KeyError: “word ‘XXX’ not in vocabulary”
原文地址 发生在想通过model['XXX']观察一下XXX的词向量的时候 原因一 最简单的原因就是这个词不在你做来做训练的语料库中 原因二 在定义模型时 model = word2vec.Word2Vec(sentences, min_count=5) 有一个min_count的属性,它的默认值是5,Word2Vec在训练时会忽略词频小于该属性值的词,可能你进行观察的这个词的词频太低,训练时没有被采用 解决方法是降低该值的设定 原因三 model = word2vec.Word2Vec(sentences, min_count=5) 中的sentences默认是按这种格式 [['str1
下载地址
用户评论