1. 首页
  2. 数据库
  3. 其它
  4. docconv:将PDFDOCDOCXXMLHTMLRTF等转换为纯文本 源码

docconv:将PDFDOCDOCXXMLHTMLRTF等转换为纯文本 源码

上传者: 2021-02-18 01:12:28上传 ZIP文件 1.46MB 热度 20次
docconv Go包装器库,可将PDF,DOC,DOCX,XML,HTML,RTF,ODT,Pages文档和图像(请参见下面的可选依赖项)转换为纯文本。 对于code.sajari.com/docconv用户的注意事项:该软件包的Go导入路径已移至code.sajari.com/docconv 。 安装 如果您尚未安装Go,则首先需要 。 要获取并构建代码: $ go get code.sajari.com/docconv/... 这还将在$GOPATH/bin构建命令行工具docd 。 确保$GOPATH/bin在PATH环境变量中。 依存关系 整洁,wv,popplerutils
下载地址
用户评论