UD Kanbun:繁体中文的分词器POS tagger和依赖项解析器 源码
UD-看板 用于中文的Tokenizer,POS-Tagger和Dependency-Parser(汉文/文言文)。 基本用法 >> > import udkanbun >> > lzh = udkanbun . load () >> > s = lzh ( "不入虎穴不得虎子" ) >> > print ( s ) # text = 不入虎穴不得虎子 1 不 不 ADV v ,副詞,否定,無界 Polarity = Neg 2 advmod _ Gloss = not | SpaceAfter = No 2 入 入 VERB v ,動詞,行為,移動 _ 0 root _ Gloss = enter | SpaceAfter = No 3 虎 虎 NOUN n ,名詞,主体,動物 _ 4 nmod _ Gloss = tiger | SpaceAfter = No 4 穴 穴 NOUN n
下载地址
用户评论