backend:用于matchID项目的后端(Docker和API) 源码
介绍 该项目旨在为matchID项目提供后端。 完整文档可从。 主要目标是处理一个或多个公民国家数据集,并识别同一个人的多个匹配项(至少两个!)。 后端基本上提供了用配方烹饪数据集的可能性,从而产生了一个新的数据集。 该食谱可以“现场”烹饪或在后台烹饪,从而可以在Elasticsearch的基础上进行实时重新排名(无论是否使用机器学习)。 集成了用于准备姓名,出生位置,模糊匹配和分数的食谱书,并且可以针对您的用例进行完全自定义。 它是全API设计的(没有cli!),基于Flask RESTPlus 。 可扩展性依赖于单一的服务器多用于大熊猫ADN scikit学习Python部分,elasticsearch的云可扩展性大型模糊匹配使用情况。 它旨在提供在1U服务器上一天将两个数据集与数以千万计的记录进行匹配的功能。 全云可扩展性仍需要进一步的开发。 目前,该代码仍被认为仍处于“
下载地址
用户评论