simstring:SimString的Python实现一种简单有效的算法用于近似字符串匹配 源码
simstring Python实现,这是一种用于近似字符串匹配的简单高效的算法。 产品特点 使用此库,您可以从大量的字符串/文本中提取具有一定相似性的字符串/文本。 当您开发与语言处理有关的应用程序时,它将为您提供帮助。 该库支持各种相似度函数,例如余弦相似度,Jaccard相似度,并支持Word N-gram和Character N-gram作为特征。 您还可以轻松实现自己的特征提取器。 SimString具有以下功能: 快速的近似字符串检索算法。 100%精确检索。 尽管某些算法允许未命中(误报)以提高查询响应速度,但可以确保SimString通过快速查询响应实现100%正确的
下载地址
用户评论