1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 基于HMM的文档文本字段的数学表达提取。

论文研究 基于HMM的文档文本字段的数学表达提取。

上传者: 2020-08-05 05:36:32上传 PDF文件 2MB 热度 6次
针对难以自动,快速,有效地提取文档非结构化文本域中的数学表达式的问题,提出了一种基于隐马尔可夫模型的方法。 首先,该方法通过利用数学表达式的符号组合特征来训练HMM模型。 然后,进行了一些预处理工作,例如删除标签和过滤单词。 最后,将预处理后的文本转换为观察序列,作为HMM模型的输入,以确定哪个数学表达式并将其提取出来。 实验结果表明,该方法可以有效地从文档的文本字段中提取数学表达式,具有较高的准确率和查全率。
下载地址
用户评论