SuPar Kanbun:繁体中文的分词器POS tagger和依赖项解析器 源码
苏帕·坎邦 带有 , 和经典中文文本(汉文/文言文)的Tokenizer,POS-Tagger和Dependency-Parser。 基本用法 >> > import suparkanbun >> > nlp = suparkanbun . load () >> > doc = nlp ( "不入虎穴不得虎子" ) >> > print ( type ( doc )) < class> >> > print ( suparkanbun . to_conllu ( doc )) # text = 不入虎穴不得虎子 1 不 不 ADV v ,副詞,否定,無界 Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入 入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss
下载地址
用户评论