SuPar Kanbun:繁体中文的分词器POS tagger和依赖项解析器源码

上传者：hostile84530 2021-04-06 23:32:13上传 ZIP文件 2GB 热度 17次

苏帕·坎邦带有 , 和经典中文文本(汉文/文言文)的Tokenizer,POS-Tagger和Dependency-Parser。基本用法 >> > import suparkanbun >> > nlp = suparkanbun . load () >> > doc = nlp ( "不入虎穴不得虎子" ) >> > print ( type ( doc )) < class> >> > print ( suparkanbun . to_conllu ( doc )) # text = 不入虎穴不得虎子 1 不不 ADV v ,副詞,否定,無界 Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

SuPar Kanbun繁体中文的分词器POS tagger和依赖项解析器源码

苏帕·坎邦带有 , 和经典中文文本(汉文/文言文)的Tokenizer,POS-Tagger和De...

大小：2GB | 2021-04-06 23:32:13
UD Kanbun繁体中文的分词器POS tagger和依赖项解析器源码

UD-看板用于中文的Tokenizer,POS-Tagger和Dependency-Parser(...

大小：1.05GB | 2021-04-07 08:29:08
中文分词器

大小：0B | 2019-01-06 04:46:02
IK分词器，中文检索最好的分词器

大小：0B | 2018-12-08 11:20:11
es中文分词器ik分词器.zip

因为es本身的分词器对中文不是特别友好，所以使用ik分词器，分为两种模式，一种是粗模式，一种是细模式...

大小：0B | 2020-05-11 03:15:47
ansj中文分词器源码

Ansj Chinese word segmentation source

大小：0B | 2019-06-26 17:34:25
集成分词器–solr自带分词器和IK分词器对比

环境信息系统:CentOS Linux release 7.6.1810 solr:solr-7....

大小：202KB | 2021-01-09 14:55:43
ansj分词器依赖的jar包

大小：0B | 2019-04-11 20:39:15
solr和中文分词器.zip

Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了...

大小：144.16MB | 2020-08-16 03:33:13
scws中文分词器

大小：0B | 2019-02-18 05:39:37
IKAnalyzer中文分词器

IKAnalyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。

大小：0B | 2019-05-14 17:20:40
中文英文分词器

目前最流行的中文英文分词器jar、代码、api都包含了，非常齐全。

大小：0B | 2020-05-20 07:44:07
lucene中文分词器

用于Lucene当前新版本4.0以上在与IKAnalyzer一同使用使用冲突报错。运行之后发现异常：...

大小：0B | 2020-05-23 18:06:07
IK中文分词器

大小：0B | 2019-01-23 03:15:50
ANSJ中文分词器

大小：0B | 2018-12-09 01:10:42
elasticsearch中文分词器

elasticsearch中文分词器

大小：0B | 2020-06-12 13:03:41

SuPar Kanbun:繁体中文的分词器POS tagger和依赖项解析器 源码

SuPar Kanbun:繁体中文的分词器POS tagger和依赖项解析器源码