ansjseg源码
ansjseg是一个基于n-Gram+CRF+HMM的中文分词的java实现.分词速度达到每秒钟大约200万字左右(macair下测试),准确率能达到96%以上目前实现了.中文分词.中文姓名识别.用户自定义词典,关键字提取,自动摘要,关键字标记等功能可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目.
下载地址
用户评论