1. 首页
  2. 编程语言
  3. Java
  4. MMSeg 算法分词

MMSeg 算法分词

上传者: 2019-09-26 04:28:02上传 JAR文件 686.14KB 热度 46次
开源地址https://github.com/chenlb/mmseg4j-coremmseg4jcore使用Chih-HaoTsai的MMSeg算法(http://technology.chtsai.org/mmseg/)实现的中文分词器。MMSeg算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了98.41%。mmseg4j已经实现了这两种分词算法。
下载地址
用户评论