SPTAG:分布式近似最近邻搜索(ANN)库可为大规模矢量搜索场景提供高质量的矢量索引构建搜索和分布式在线服务工具包 源码
SPTAG:一个用于快速近似最近邻居搜索的库 标记 SPTAG(空间分区树和图形)是由和发布的用于大规模向量近似最近邻居搜索方案的库。 介绍 该库假定样本表示为向量,并且可以通过L2距离或余弦距离来比较向量。 为查询向量返回的向量是与查询向量具有最小L2距离或余弦距离的向量。 SPTAG提供两种方法:kd树和相对邻域图(SPTAG-KDT)和平衡k均值树和相对邻域图(SPTAG-BKT)。 SPTAG-KDT在索引建立成本方面是有利的,而SPTAG-BKT在非常高维数据中的搜索准确性方面是有利的。 怎么运行的 SPTAG受NGS方法的启发[ ]。 它包含两个基本模块:索引构建器和搜索器。 RNG建立在k最近邻图[ , ]上,以增强连接性。 平衡的k均值树用于替换kd树,以避免针对非常高维向量的kd树中的距离限制估计不准确。 搜索从在空间分区树中搜索开始,以找到多个种子以开始RNG搜
下载地址
用户评论