paperetl:医学和科学论文的ETL流程 源码
医学和科学论文的ETL流程 paperetl是用于处理医学和科学论文的ETL库。 它支持以下来源: PDF文章 paperetl支持以下数据库来存储文章: SQLite的 弹性搜索 JSON文件 YAML文件 安装 最简单的安装方法是通过pip和PyPI pip install paperetl 您也可以直接从GitHub安装paperetl。 建议使用Python虚拟环境。 pip install git+https://github.com/neuml/paperetl 支持Python 3.6+ 其他依赖 研究设计检测使用Scispacy,可以通过以下方式安装: pip in
下载地址
用户评论